版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 TOC o 1-5 h z 减魅金兑1海瑕昂T2Q 8乔国屏杷嗑褊3Q侨圈屏杷嚅移信WH3米侨国屏杷澎瑕11瘴4&侨圜屏梢咽邮6米6仪月奇匚毫侨莺屏梢10Q便崎匚毫侨国屏梢胜他10米仅崎匚毫侨国屏杷潼瑕标胸11&伙崎匚毫侨国屏梢推牌槟胸13副便崎匚毫侨圈屏梢烦耆涸我14a占便月奇匚毫侨藕屏梢臭isQ包月奇匚毫侨酶盗杷:禹15米便崎匚毫侨国口:禹21制式(崎匚毫侨圜屏杷赢口24Q侨国屏梢羸腊- 触24米便崎匚毫侨国屏梢羸-触27像b仅崎匚毫侨圈屏梢罹岸际彳32Q 际i 1嬷蟾俱影貂匚32*际i2装匚狼泉2照摸嫉匚343636罂件柄.国内数据治理框架.数据治理框架比拟1)国家标准数据治理框架国家
2、标准中的数据治理框架包括了数据治理 框架包含顶层设计、数据治理环境、数据治 理域和数据治理过程四大局部。顶层设计包 含数据相关的战略规划、组织构建和架构设 计,是数据治理实施的基础;数据治理环境 包含外部环境及促成因素,是数据治理实施 的保障;数据治理域包含数据管理体系和数 据价值体系,是数据治理实施的对象;数据 治理过程包含统筹和计划、构建和运行、监 控和评价以及改进和优化,是数据治理实施 的方法(见图6)。四个数据治理框架比拟显示,虽然分类视角 不同,但是模型的构成框架核心都涉及组织 架构的设计、计划与规划的制定以及核心治 理内容,模型都强调了数据治理是一个多个 环节连续的动态过程。其中,
3、DAMA、IBM 更关注于治理域,在模型层面就展现出数据 治理的关键域,主要包括数据质量管理、数 据生命周期、元数据管理等;DGI和中国的 模型更强调了数据治理的要素之间的关系与 数据治理的实施过程。中国国家标准的模型 制定中已充分参考主流的数据治理框架,并 根据中国的国情特征和大数据开展趋势进行 了相应的优化,同时打通了从治理到实施的 路径,解决了国际治理标准不易应用落地的 问题1111 o因此,本文后续分析主要依照我 国国家标准的的数据治理实践进展框架进行。数据治理 环境数据治理域数据管理体系数据价值体系内外部环境促成因素数据治理过程图6:国家标灌数据治理根架口表2:四个数据治理框架比拟包
4、括规、13员fl 组织机构、过程口 $音8分的10K/部 分。%。管计、数据治 理fi境、数据治理、数据治理过程 $局部,11 K/ 局部。包括lOKfl嫩川;0 7Kfi 要侬。包括$4K%, %11K o是指对数据资产管理 行使权力和控制的活 动集合(包括计划、 监和执行)。数据治 理由媛指/所$其! 数据管理fl嬷的执 行。数据治理在必戴 的%1执行数据管 理。是对数据相关$7卜的 决策制定fl权fi控 制。fl嚼,数据 治理是理信息和广决策的一 K。劭,%根据初定楼 f 决策,包括/ $、 f +僚、f 时魏、 f境fi及/ 福In flfij o是一种质量控制规 程,用于在管理、使
5、用、改进和保护组织 信息的过程中添加新 的严谨性和纪律性。 数据资源及其应用过 程中相关管控活动、 绩效和风险管理的集 合。用数据治理耽决耽 决数据管理的10 K f垃物口 7 K耍影 魏的N配棘从。进行妣的决策、fl 、保 护数据fi%。相关 $的蜂fi、 茶管 理3员和员士fi福 用的fi用决数据 棘从、%标准的 事的3程、 福为协蓿力 %犍德和傲 效需、巾保 3程的% 性。 提僦数据用门 J , $ 决策$% 对业务决策和蝇 撼的信B o中国数据治理就从 提理墓模和fi j指为。数据管理包括数据治 理,治理是管理的第 一分$/门以 嫖flfi要器对数据 $茹的4 o 于 邮lOKfl姨,
6、门嫂L 门数据管理和治理的 $。舞fi。数据管理和数据治理 是相A独的。数据 管理是E保福过数据 治理制定的策和/ %嬷$效k 进相关 数据土fl的进行。IBM的数据治理V; /踊数据治理的fi fi及过程。画执行fl应用 落k ;根据决策%和 管理器肝%划分 职姨fl执行了。, $数据时fi数据治理 / O二、健康医疗数据治理管理和建管数据表3:健康医疗数据分类人幼fi数据、EMR数据(fin、卜、输、护理)、像数据、$术哮蹇 数据、歇簿数据。Th数据、 茗 种数据、fl/数据、1 $产丁116数据(99,戳、。管、 APP、KBfir 数据等)。G立:执业和G力资源数据、fl保数据;3 T
7、h:数据(劭计信息中B、6#信息已)、fi控数据;门才二粟务数据(1 $眈境、门保剧$、fl/蝇掴等)、fl资和G定资产数据;,监二/日的研能、Th产、3福、flfi服务格规范、标、门保门规、色保n数据标准规范、食邕 fl ( f.、指fi等)。(一)健康医疗数据治理背景.健康医疗大数据是国家重要的基础性战 略资源,价值巨大健康医疗大数据被认定为国家重要的基础性 战略资源,自2016年以来,关于健康医疗 数据的文件陆续出台,其中2018年出台的国家健康医疗大数据标准、平安和服务管 理方法(试行)对健康医疗数据的标准管 理、平安管理、服务管理三个方面做出了规 范,推动了健康医疗大数据的开展。目前
8、, 我国已经初步建立健康医疗数据库,形成人 口健康信息化体系。根据国际四大会计师事务所之一的安永日 前的一份报告,报告以英国国民健康系统(National Health Service, NHS)为研究对 象,认为NHS持有的5500万患者记录具有 几十亿英镑的显性商业价值,管理后的NHS 数据集每年可产生96亿英镑的价值(管理 后的数据集每年价值50亿英镑,以及每年 可为患者带来46亿英镑收益)。其中以基 因数据为例,基因组概况和医学史基因组数 据被专家认为是未来药物发现和个性化医学 的关键组成局部,遗传信息和纵向数据集对 药物发现和广泛的人群健康分析具有重要价 值。然而,在没有纵向健康医疗
9、数据的情况 下,这些数据非常孤立,价值是有限的。由 于测序的本钱太高,缺乏大量的数据集,这 使得每个DNA样本的估值超过1500美元网。.健康医疗数据构成复杂,数据量增长迅 速健康医疗数据根据类型可以分为医疗服务 类、健康类、管理和运营类,以及规那么和知 识类数据四大类,其中,前三类均为业务数 据,最后一种为规那么数据,各类数据涉及的 具体内容非常繁杂(见表3) o而随着信息 化的开展,检测技术的提升,健康医疗数据 迎来爆发式增长,健康行业在数字世界中占 比显著,占比高达30%;卫健委统计信息显 示,我国健康医疗数据量正以每年48%的 速度增长,预计从2009年到2020年健康 医疗数据将增长
10、44倍。数据体量大、结构 复杂、不断新增的数据源对健康医疗数据的 应用带来新的挑战。. 健康医疗数据问题突出影响价值开发健康医疗数据在作为分散孤立的个体时,价 值很低,但是将分散的数据整合成一个数据 集,其价值将是巨大的。然而在这个价值提 升的过程中会遇到一些问题,其中最主要的 两个问题是如何将孤立的数据汇聚为有价值 的数据集合,如何对健康医疗数据进行价值 转换产生社会经济效益。管理后的海量数据,特别是连续纵向的数据 集是健康医疗数据价值的关键。虽然我国当 前针对健康医疗数据政策频出,产业应用上 健康医疗数据库也已初步建成,健康医疗数 据高速增长,但很大程度上是虚假“繁荣”, 整体的健康医疗数
11、据呈现出“数量大、质量 差”的特征,主要存在以下关键问题:健康医疗数据质量低下互联互通标准化程度低健康医疗数据开放程度较低数据平安与隐私保护仍是行业难题数据资产意识尚未形成健康医疗数据管理制度不完善,数据资 产权责不明同时,数据分析挖掘才是健康医疗数据关键 所在,目前国内对于健康医疗数据的挖掘分 析及分析平台的搭建上尚不成熟,数据分析 的平台化能力较弱;对于多元化的数据分析 整合意图较低;价值呈现与价值流转没有形 成生态循环。(二)健康医疗数据治理研究现状健康医疗数据治理已然成为数据价值开发 的关键。对于健康医疗领域数据治理的研 究,我们在Web of science核心合集中搜 索主题为健康
12、医疗相关的数据治理文献, TS=( data governance” AND health)OR TS=( data governance” AND medical)后获得共计53篇文献,通过这 53篇文献计量分析显示:医疗健康数据治 理研究开始于2010年前后,且研究热度呈 现增长的整体趋势,尤其在2017年之后出 现快速增长(见图7)。其中,美国、英国、 加拿大是发表相关研究最多的三个国家(见 图8)。2016年以前,健康医疗领域的数据 治理研究热点主要集中于比拟研究分析数据 治理的价值、单一数据信息的治理研究(临 床信息、电子病历、临床数据等)、方法学、 以及数据共享的研究。随着数据应用
13、的开展, 数据治理研究的热点发生改变,2016年以 后,数据治理的研究热点中,关于数据共享、 隐私平安、伦理、数据归属权等占据主流。 对于国内健康医疗领域数据治理的研究情图7:国外健康医疗数据治理历年文章数量变化图8:健康医疗费掂治理研究国家分布 Stacked O Stream O Expandeddata governanceethicsinformed consentgovernanceclinical informaticsqualitative researchprivacyelectronic health records electronic clinical datadata
14、sharingindigenousbig datacomparative effectiveness research data sovereignty bioethicslearning health care system analytic methods图9:健康医疗数据治理研究关键词变化16况,我们在中国知网中采用相同的检索式进 行文献检索(2019.10.12, (SU=数据治理 and SU=,医疗)or (SU=,数据治理and SU二, 健康),共计获得28篇,对这28篇文献 分析结果显示,2018年以后发表的健康医 疗数据治理文章占总体的82%,而国内这一 轮的数据治理热点的
15、兴起主要与健康医疗大 数据应用需求密切相关。通过文献关键词共 现网络分析显示,相关研究以“数据治理” 这个核心关键词组成的群组为主,重点关键 词包括“大数据”、“人工智能”、医疗 大数据”、“治理体系”为主,主要集中于 对健康医疗数据治理的体系框架模型等的研 究以及数据治理实践应用的研究,即我国当 前对健康医疗数据治理的研究主要侧重于数 据治理的方法论层面及应用现状层面的研究(见图ID o比照国际健康医疗数据治理 的研究现状,我国缺少关于数据共享、隐私 平安、伦理、数据归属权等这类数据治理的 热点研究。(曜)喇M到- 20图工。:国内健康医疗数据治理历年文章数量变化的决*dwt,vr n0 M
16、o嘲考慢型健康Q人数据堂民灌.袤修县平台基层机疔公急分因跳总长新磁发如倦蛭忻g&*i人俺缝偏历故娥控3数据I倒脩,处拜中媛字22的楣总理劲摒平安.医疗故婶可信性致I倏亨 敢炯口医儡也忠翕案皆能搜索法感沿翠队第,.机构 现信物也床:般麻德等理人1.构f做疗涔械部骅生班琳系AI深嫣作图11:国内健康医疗数据治理历年文章数量变化(三)健康医疗数据治理实践现状随着健康医疗数据重要性的凸显,而医疗数 据由于质量较低未能得到充分利用,越来越 多的医疗机构开始对健康医疗数据进行数据 治理,以期深入挖掘健康医疗数据的价值。 2017 年 8 月,Dimensional Insight 对美国 104名医院的首
17、席信息官进行调查显示,约 有44%的医院在整个医院内部已经实现了 对健康医疗数据的管理,而剩下的56%的 医院未能实现完整的数据管理或者尚未开始 实施数据管理1141 o 2017年,中国数字医疗 网HC3i组织开展了医院数据管理状况调 查活动显示,其中84%的医院在2017年 针对健康医疗数据治理的预算到达20万元 以上,50%的医院数据治理的预算金额到达 50-100万元。而2016年同期为84%的医院 在数据管理上的投入高于20万元,33%的 医院投入资金在50-100万元1151 o可以发现无论是国内国外,当前医疗机构大 多对数据治理的概念有着一定的认识,也认 可其重要性。可以发现在受
18、调查的医院中有 相当一局部医院对于数据治理都安排了资金投入,并且在数据治理上的预算不断增加, 显示出医院对于数据治理重视程度加深。从国家层面来看,美国一直重视健康医疗数 据治理,其在组织层面为促进数据治理做了 很多工作。美国护理创新中心(Center for Care Innovations, CCI)为 推动健康医疗领 域数据治理的实施,发布了一份针对健康医 疗领域的数据治理手册(1手册清楚地写 明了数据治理的实施步骤及注意要点。手册 提出了健康医疗数据治理的三个目标:最大 限度地利用数据、提高数据质量、提高数据 素养。此外,该手册提出了进行数据治理的 三个步骤:奠定基础(确定目标、高层参与
19、、 数据策略、奠定基础的工具)、组建团队(数据治理委员会、数据管家、数据服务、 组建团队的工具)、推动治理(培训沟通、 策略规程、推动治理的工具)。除此之外, AHIMA作为首个提出信息管理IG(Information Governance) 概念的组织, 也为推进健康医疗领域的数据治理做了很多 的工作,例如其提出的健康医疗信息治理治 理八大原 贝U ( Informa- tion Governance Principles for Healthcare, IGPHC):责任制 原那么(accountability)、透明度原那么(transparency)、完整性原那么 (integrity
20、)、保护原 那么(protection)、 合规性原那么(compliance)、可用性原那么 (availability)、保存原那么(retention)、处置原那么(disposition)。比照而言,中国缺乏政府整体层面的指导, 对于数据治理的组织设计工作也才处于起步 阶段,2018年11月,浙江省成立浙江省医 疗数据产业研究会,研究会致力于促进医疗 数据流通,推动医疗科技转化。2019年5月, 上海成立上海数据治理与平安产业开展专业 委员会,为上海相关政府部门提供数据治理 方面的研究与数据支撑。在健康医疗数据治 理方面,尚无整体性的数据治理机制尚未有 相应的数据治理指南等指导手册,医
21、疗机构 的数据治理以自行探索为主。(四)健康医疗数据治理存在的问题根据国家标准中的数据治理框架梳理了健康 医疗数据治理中存在的问题,主要包括顶层 设计、数据治理环境、数据治理域和数据治 理过程四个层面。顶层设计是数据治理实施 基础层面的问题;数据治理环境是数据治理 实施保障层面的问题;数据治理域是数据治 理实施对象层面的问题;数据治理过程是数 据治理实施方法层面的问题。虽然表4从四个层面梳理了健康医疗数据治 理的问题,但是实际可以总结为两个层面:方 法论层面和技术平台层面。在方法论层面,跨 业务、跨部门、跨系统的横向协同机制不顺 畅,治理效果欠佳;同时数据治理体系的中 层和基层缺乏可操作的数据
22、治理方法和标准。 在技术平台层面,身份数据解析、数据标准 化、数据匹配、数据语义等主数据、数据质 量技术应用不佳,国外产品不能适应中文数 据的特点;我国医疗机构数据治理软件多为 软件开发商按工程方式开发,产品化程度不 高,尚未有较成熟的技术和产品。健康酝疗数据治理问题问题描述战略规划虽然国家将健康医疗数据列为战略性资源,对健康医疗数据 发布了一系列文件,但是缺少针对健康医疗数据治理的相关 文件,国家层面缺少健康医疗数据治理的顶层设计与规划。组织构建国内缺少针对健康医疗数据治理的相关研究组织。架构设计目前我国尚缺少专门针对健康医疗数据治理的研究框架、理 论基础及相关方法论等。数据治理域(港健康医
23、疗数据管理体系我国健康医疗数据标准框架制定滞后、健康医疗数据质量管见下节)理不到位、健康医疗数据平安管理方法不明且缺乏相关管控 机制、缺乏元数据管理机制、尚未实现健康医疗数据生命周 期的资产化管理。健康医疗数据价值体系我国健康医疗数据流通管理机制滞后、健康医疗数据资产化 运行薄弱、当前健康医疗数据洞察仍以小范围单领域探索为 主。当前我国健康医疗数据治理过程尚未形成统筹规划、构建运行、监控评价、改进优化的完整闭环。rawwi内外部环境缺少组织引导及顶层设计规划,医疗机构自身数据治理意愿薄弱。促成因素我国缺少健康医疗数据治理相关研究及相关管理方法。表4 :健康医疗数据治理问题健康医疗数据治理是一项
24、复杂而浩大的工三、健康医疗数据治理域程,有效利用数据治理体系框架,对数据治 理工作的有效开展显得尤为重要。国家标准 GB/T34960.5-2018中对数据治理涉及到的核 心治理域提出了明确的管理要求,为管理层 数据治理实施提供了指引,本章节依照国家 标准的提出的八大数据治理域基本要求,简 单梳理目前健康医疗数据治理内容国内外现 状与相关治理方法,分析各健康医疗数据治 理域存在的问题,为相关机构组织评估健康 医疗数据治理现状,明确数据治理域和治理 过程重点,研发关键健康医疗数据治理工具 与解决方案提供参考指导。.数据标准(一)健康医疗数据管理体系1)基本要求组织应明确数据标准的内涵和范围,建立
25、数 据标准体系及其管理机制,以支撑数据的标 准化建设,保障数据在应用过程中的一致性, 至少应:a)明确数据标准的内涵和范围,制定通用的 数据规范,包括但不限于数据分类、数据类 型、数据格式和编码规那么等,保证数据应用 的过程中的一致性;b)建立数据标准的实施方案和计划,推进 数据标准化实施的落地;c)建立数据标准化管理机构和机制,明确责 权利和流程,开展数据标准化的实施;d)制定数据标准管理制度,保障数据标准 化的实施和落地;e)保证数据标准的先进性、前瞻性和技术层 面的可执行性,满足数据应用开展需要,持 续开展数据标准的更新。2)现状与问题健康医疗数据标准治理应以健康、卫生信息 标准为抓手,
26、涵盖数据、技术、平安、管理、 质量等多个角度,通过建立数据标准体系及 管理机制来保障健康医疗数据的合理高效应 用。在健康医疗领域,现国际上应用较为广泛 的标准体系包括ISO/TC 215、CEN/TC 251及 IEEE局部标准。ISO/TC 215于1998年成立, 致力于推动健康相关数据、信息与知识的采 集、交换与利用,从而为卫生信息系统的各 个方面提供支持,截至2019年9月,ISO/ TC215已发布192项健康信息学国际标准, 最新在研标准52项,包括卫生信息学互操 作性参考体系结构(IS0/AWI 23903)等口刀; 此外,美国医疗卫生信息技术标准委员会(HITSC)推出IS标准
27、体系用以解决医疗数 据共享和互操作问题,通过协调不同标准的 差异形成一系列广泛接受的、促进互操作的 规范,涉及HL7 V2、消息传递文档体系结构(C-CDA)、快速医疗互操作性资源(FHIR) 等12个局部。澳大利亚健康信息标准化组 织公布了SA IT-014标准涉及健康概念表达、 信息平安、消息与通讯、电子健康记录互操 作、远程医疗、临床决策支持等6局部。综 合来看,国外健康医疗数据标准体系以针对 数据共享和互操作标准为主进行研制。我国经过十多年的开展也已形成了比拟完善 的健康医疗数据标准体系框架。2015年提 出的形成的全民健康信息标准体系框架由基 础类、数据类、技术类、平安与隐私类和管
28、理类5大类标准组成1181 o在此之后为适应 健康医疗大数据开展与应用需求,又于2018 年提出基于大数据参考架构和全民健康信息 标准体系框架提出了健康医疗大数据标准体 系框架。新框架由6大类标准组成,较原 有标准体系新增应用与服务类标准(见图12) 1191 o在具体的标准研制上,目前我 国卫生数据类相关标准内容最为繁多,包括 数据元”00多项、值域代码270多项、数 据集74项,但对于其他类的标准研制较少, 例如平安与隐私类主要参考通用的信息平安 标准,而管理类和应用与服务类标准基本缺 失。就现有框架来看,我国标准体系框架尚缺乏 对健康医疗数据工作流中数据质量、流通、 服务、平安等审计评估
29、类标准体系模块。而 该类标准模块是有效利用健康医疗数据,实 现健康医疗数据价值的重要驱动因素。数据 标准治理不仅仅强调标准体系的建立,同时 也强调了数据标准的应用与管理,但是目前 大多数机构缺乏标准应用管理制度,也缺乏 整体性标准应用更新维护机制。.数据质量1)基本要求组织应制定数据质量管理目标,建立数据质 量管理体系及实施机制、优化数据质量并持 续改进,满足数据应用的需求,至少应:a)结合数据标准对数据质量进行分类管理, 明确不同数据之间的关系和依赖性,制定数 据质量管理目标;b)建立数据质量管理机构和机制,定义数 据质量管理的角色和职责,建立数据质量 管理方法;c)研发数据质量相关技术,支
30、撑数据质量管 理和数据质量提升;d)识别数据生存周期各个阶段的数据质量应用与服务类标准平安与隐私类标准大数据应用大数据交易数据开放共享管理类标准数据管理信息平安隐私保护技术类标准大数据处理生命周期技术工具与平台应用与服务管理系统与平台运维管理基础类标准一标准准化赢一元数据参考模型12:健康医疗大数据标准体系框架关键因素,构建数据质量评估框架,包含但 不限于数据的准确性、完整性、一致性、可 访问性、及时性、相关性和可信度等;e)采用定性评估、定量评估或综合评估等方 法,评估和持续优化数据质量。2)现状与问题数据质量管理包括对数据质量和组织的管 理,包含了数据的获取、维护、处理和分发 有关的角色建
31、立、角色部署、策略、职责和 流程。成功的数据质量管理要求组织机构全 体成员积极主动参与并承当责任,建立数据 管家计划、协调组织关系并克服组织障碍。 数据质量管理通常以数据生存周期的管理为 核心,其实施机制包括质量评估、质量设计、 质量转换和质量监控4个阶段。经典的六西 格玛管理方法、全面质量管理(QTM)等数 据质量管理方法论可转化应用至健康医疗数 据质量管理。美国信息管理协会AHIMA建立了一套健 康医疗数据的质量管理框架和质量评测框 架用于指导全美健康医疗数据质量管理。AHIMA 在 2012 年发布 DQM (Data Quality Management)模型作为健康医疗数据质 量管理
32、角色转换的工具应用于组织中的所有 数据,并扩展到临床和非临床领域。2015年, AHIMA更新了数据质量管理模型并命名为 Information Governance Principles for Health- care (IGPHC) ,该模型明确了对数 据定义、颗粒度、精确度以及数据完整性、 精确性、可访问性、一致性、及时性、相关 性、可追溯性的数据质量原那么度量。模 型新的分类和术语系统的引入因其特异性 和颗粒性增强了数据质量的一致性、完整 性和准确性。同时,AHIMA构建了评估数 据质量管理工作的检查表,从数据的应用、 收集、仓储和互操作性、分析四个方面对健 康医疗数据质量管理进行评
33、测。由于数据会 因为一个错误程序而产生新的缺陷,所以在落实改进数据 质量过程的同时,往往需要进行数据校正。 就数据校正问题,AHIMA指出其与数据质 量管理不同应被视为一次性的活动。从体系框架来看,我国在健康医疗体系数据 质量管理框架仍处在研究阶段,主要是研究 如何对国外标准进行本地化调整;从管理层 面来看,我国医疗机构的数据质量管理主要 集中在单一维度的数据质控上,例如统计数 据质量管理、病案首页数据上,尚未从医院 层面上建立覆盖数据全生命周期的数据质量 管理体系。从方法论层面来看,针对健康医 疗数据质量管理体系和路线图虽已较为明确, 但相较于成功的健康医疗数据质量管理仍存 有一定问题,主要
34、包括:对于源头化健康医 疗数据的质量管控不到位,尚且缺乏普适性 的健康医疗数据质量管理模型和治理框架等 顶层设计和实施机制;对数据管家(Datasteward)的角色重视度不够,数据 管家有责任确保组织机构应用程序有效地支 持组织机构在数据质量方面的管理目标;数 据质量管理目标与组织的卫生经济学需求不 相符合导致组织对于数据质量管理的主动性、 积极性不高。.数据平安1)基本要求组织应制定数据平安的管理目标、方针和策 略,建立数据平安体系,实施数据平安管控, 持续改进数据平安管理能力,至少应:a)明确数据平安的内外部监管和管理需求, 制定数据平安管理的目标、方针和策略,并 持续改进和优化、确保数
35、据防泄露、防篡改 和防损毁;b)建立数据平安管理机构,明确数据平安 管理的角色和责任,提升人员的意识、能力健康医疗数据治理Health data governance本期导读健康医疗大数据时代,如何走向数据资产价值变现?当我们努力解决“信息孤岛”、“信息烟囱” 的技术难题之后发现可用的数据依然乏善可陈,究其根源是在于数据治理中出现混乱或缺失。但 目前整个行业对于数据治理的认知与实践仍处于起步阶段,因此建立整体化的数据治理思考框架, 明确数据治理过程中涉及到的内容与要求,对于机构开展健康医疗数据具有重要的指导意义。OMAHA秘书处 张建楠 顾宴菊 李莹莹 赵童童 朱炸琳表5 :健康数据保护相关法
36、案6健康%口、0性.问法U HIPAA法 1974口0新“法口等:Monitoring and Research弧额的 廉0$ 韩国 瑞典6数据/* 指U(DPD)、6-p数据Z&ETU(GDPR)等后一)口齿四二牛,文法口法。等3医疗下外何指% 19940( HIPC3健康法口 1956Ud%ofl数据%&法1977U等0fl法1988口6医疗标方。法口 2010口乙一体控制健康fifi 2012。等 求法。等己4厂|3%求法口6国家医疗/DSU等口去口 6。数据法等和素质;C)建立数据平安分类分级规范,建立满足不 同业务场景、不同级别的数据平安规范、保 护机制,确保数据的保密性、完整性、可
37、用 性以及数据的可追溯性;d)构建数据平安管理视图,识别数据应用 过程中的风险,并建立数据泄露、应急响应、 沟通协作和责任追究等平安管控机制;e)建立数据应用过程中的数据授权、访问和 审计机制;f)定期开展平安审计和风险评估,对数据安 全管理能力进行监督,并持续改进和优化。2)现状与问题健康医疗数据平安管理是指在数据采集、存 储、挖掘、应用、运营、传输等多个环节中 的平安和管理,包括国家战略平安、群众生 命平安、个人信息平安的权责管理工作。健 康医疗数据大致包括个人数据、健康状况数 据、医疗应用数据、医疗资金和支付数据和 卫生资源数据五大类。基于健康医疗数据为 敏感物居,多数国家十分关注健康医
38、疗数据 的风险检测,用以保持数据的完整性和敏感 信息的隐私。数据平安法案是保障健康医疗 数据平安保护有法可依的基础。许多国家利 用数据保护法案保障健康医疗数据的平安(见表5)并通过隐私影响评估(Privacy Impact Assessment, PIA)进行健康医疗数 据平安管理。我国国家卫健委依据网络平安法等发布 的国家健康医疗大数据标准、平安和服务 管理方法(试行)明确了分级分类分域的 存储要求,对网络平安等级保护、关键信息 基础设施平安、数据平安保障措施、数据流 转全程留痕、数据平安监测和预警、数据泄 露事故可查询可追溯等重点环节提出明确的 要求,为我国健康医疗数据平安管理提供了 具体
39、指导。国家标准信息平安技术个人 信息平安规范、信息平安技术 数据安 全能力成熟模型(草案)、信息平安技 术个人信息去标识化指南(草案)、信 息平安技术 大数据平安管理指南(草案) 及信息平安技术数据出境平安评估指南(草案)等针对医疗健康数据平安管理提 供了方向。但是,我国至今还未有专门针对健康医疗数 据平安保护的法案出台,健康医疗数据平安 在相关法律法规中较为分散且模糊不明,健5.数据生存周期康医疗数据平安管理的法律依据有待明确。此 外,健康医疗数据平安管理框架的搭建应依据 新兴技术的开展与时俱进,如可穿戴设备等新 型健康医疗数据载体采集的数据难以合理分类, 其对应的数据项平安级别管控机制尚且
40、缺乏。4.元数据管理1)基本要求组织应明确元数据管理的范围和优先级,建立 元数据管理的策略和流程,开展元数据创立、 存储、整合与控制等,井持续改进和优化,至 少应:a)明确元数据的管理范围,构建元数据库;b)建立完整的数据字典、数据模型、数据架 构及其管理体系;c)建立元数据管理机制,明确元数据的管理过 程及角色、职责;d)建立元数据创立、维护、整合、存储、分发、 查询、报告和分析机制;e)建立元数据管理的质量标准和评估指标,开 展元数据绩效评估并持续改进。2)现状与问题元数据是描述数据的数据,其提供了主题域中 识别、定义和分类数据的方法1231 o元数据管 理可为数据标准、数据质量、数据认责
41、、数据 生命周期等数据治理域提供技术扩展支持。按 分层的思想组织管理元数据,可将元数据管理 方法分为集中式管理、分布式管理、联邦式管 理及基于领域本体的管理等,健康医疗元数据 管理更趋向于应用基于本体的元数据管理方法、 知识图谱与元数据管理、元数据管理自动化的方法。借助知识图谱图结构的表达能力, 可以表达关联关系、同义关系、上下位关系与 实例关系等,从而建立更加灵活的数据约束条 件,更方便表达和扩充元数据。元数据管理既可以是独立的,也可以分布在存 储库和相关的支持流程中。建立信息资源目录 元数据库对于管理数据资源具有重要意义,目 前国内这类实践主要有王霞等“以Rational rose为建模工
42、具,构建了健康医疗大数据资源 核心元数据模型,并以摘要形式进行元数据的 属性描述编制了健康医疗信息资源目录。通过 这些核心元数据,用户可以了解健康医疗大数 据资源的基本内容,发现和定位信息资源,实 现对资源的简单高效的检索、交换与管理;孟 群等闽根据我国健康医疗大数据信息资源管 理、应用需求,从资源内容、资源表示、资源 管理、资源责任和资源获取等5个维度构建了 我国健康医疗大数据信息资源目录元数据库。元数据管理核心之一是有一套统一明确的元数 据标准。在元数据标准规范方面,我国已有相 对细致的行业标准,包括国家卫生计生委办 公厅关于印发住院病案首页数据填写质量规范(暂行)和住院病案首页数据质量管
43、理与控 制指标(2016版)的通知(国卫办医发 201624号)、卫生信息基本数据集编 制规范(WS 370-2012)、卫生管理基本 数据集(WS374-2012)、病历书写规范(卫医政发201011号)、电子病历基本规 范(卫医政发201024号)和电子病历基本 架构与数据标准(卫办发2009130号) 等。但随着健康监测设备的丰富、互联网医疗 的开展,更多样化的数据源对已有的元数据管 理体系提出新的要求。因此,我国在健康医疗 元数据管理仍需基于标准建立一个元数据管理 机制,以方便在标准上扩充并关联元数据不同 的应用,切实开展元数据管理的持续改进和优 化。图13 :大数据生命周期治理流程图
44、图医疗大数据生命周期模型1)基本要求组织应定义数据生存周期,并对其不同的阶 段制定对应的管理策略,降低本钱和风险, 支撑数据资源管理和数据资产运营,至少应:a)识别数据资源和数据资产运营现状,明确 数据资源和数据资产的管理目标和策略;b)识别数据生存周期的各个阶段,明确各 个阶段之间的关联和关系,井制定相应的 管理策略;c)确保数据生存周期各个阶段的数据保密 性、完整性和可用性;d)确保数据生存周期的管理符合法律法规、 行业监管等要求,保证数据的获取合法、存 储完整、整合高效、分析有效、应用合规、 归档可靠和销毁完全等。2)现状与问题数据生存周期管理在整个健康医疗数据治理 中备受重视。健康医疗
45、大数据生命周期管理 一般包括大数据组织、现状评估、制定大数 据战略、数据定义、数据采集、数据分析、数据呈现、数据治理及持续改进(见图 13) o执行层面,系统对应的治理活动和功 能应包括与系统协调者、数据提供者、大数 据框架提供者、大数据应用提供者、数据消 费者以及平安和隐私角色之间的交互,并确 保组织在整个数据生命周期中通过业务流程 创立和修改数据时能够理解、储存、映射和 控制其数据。IBM在数据生存周期管理中强调对应业务对 象的完整性可促使组织改进其数据治理流 程,并帮助它们遵守法规要求,并由此提出 了维护数据完整性和可访问性的数据生命 周期管理策略并经由InfoSphere平台冏实 现。
46、在实际操作过程中,Richard A. Royer贝IJ 更倾向于将健康医疗数据流管理细化为数据 定位、数据获取、规范化数据、数据集成、 报告数据、数据理解和数据使用这7个价值 步骤1271 o高汉松等固依据医疗大数据生命 周期提出了医疗数据生命周期管理(Medical Data Lifecycle Management, MDLM) 型(见 图14),并建议应将健康医疗数据作为一 种资产看待并进行变更管理。在目前来说,健康医疗数据并未实现资产化, 无法资产化管理健康医疗数据生命周期。数 据健康医疗数据的复杂性决定了在数据生命周期管理中注重细节管理的重要性,虽然目 前在针对健康医疗数据治理的数
47、据流及工作 流的理解上已较为成熟,但在实际管理操作 过程中对于细节的注重和把握还不够到位。(二)健康医疗数据价值体系.数据流通1)基本要求组织应识别数据资产,明确数据权属,定义 数据开放共享、交换和交易等流通方式,保 证数据流通过程的合法合规、数据平安和隐 私,至少应:a)建立数据资产的识别方法和机制,建立数 据资产价值评估指标,包含但不限于数据的 整体性、动态性、针对性、准确性、层次性 和可度量性等,并开展数据价值的评估;b)遵循法律法规、行业监管和内部管控等 内外部要求,明确可流通的数据权属、流 通方式等;c)结合数据分级分类管理机制,采用必要的 技术手段对流通数据进行加密、脱敏等处理,
48、确保数据的准确性、可用性、平安性和保密 性;d)采用必要的技术手段,保证数据资产及 其流通过程中的平安,明确数据流通参与 方的责权利,保证数据权属合法清晰、流通 方式合规以及流通过程可靠;e)确保数据流通过程的可追溯,保存数据流 通日志或记录,包含但不限于时间戳、数据 流通方式、参与者身份以及数据内容描述等;f)建立数据流通管理机制,符合法律法规、 行业监管和内部管控要求。2)现状与问题我国强调健康医疗数据的共享开放和交换, 但并未实现以数据资产形式进行市场化流 通。作为参考,美国政府通过健康保险流 通与责任法案(HIPAA)与经济与临床 健康信息技术法案(HITECH)共建了一 套联保机制,
49、该机制旨在推动电子病历的 广泛使用、保障“受保护健康信息” (PHI) 的平安性和隐私性,促使加强信息共享,提 高美国医疗保健系统的效率和质量,并为医 疗数据的商业用途提供了强有力的法律依据。 我国健康医疗数据流通正面临着严重的数据 孤岛和数据质量问题。数据的互操作性和医 疗数据交换标准一直被强调用以解决“数据 孤岛”问题并实现数据的标准化实时平安共 享。医疗信息交换HIE平台被用来实现不同 系统间数据的高效流通(291; IHE和HL7分别 被用来解决医疗系统间共享和交换数据所提 出的标准及技术问题,其中IHE制定了异构 医疗系统间协同工作的技术框架;HL7主要 定义了临床及管理信息数据交换
50、的标准格式 及通讯协议等。作为健康医疗数据共享开放 的基础,我国区域卫生信息平台覆盖范围正 在不断地扩大,但由于一些主/客观因素, 这些现有平台中的大局部对于健康医疗数据 的共享开放普遍缺乏。健康医疗数据资产权属及利益分配机制不明 等是影响健康医疗数据开放共享长足开展的 绊脚石。国家健康医疗大数据标准、平安 和服务管理方法(试行)虽已明确了国家 和政府机构对数据的使用权力,指明了数据 治理的权威机构是国家卫生健康委员会;但 是,社会各界在识别健康医疗数据资产,明 确数据所有权及数据使用产生利益分配机制 等问题上仍缺乏共识,使得健康医疗数据资 源流通难以真正实现。成功的数据流通机制应能吸引各个组
51、织或机构积极主动参与,通过数据开放共享、数据 交换、交易等方式合理合法化共聚共享数据 资源共同释放数据价值。我国健康医疗数据 流通在现阶段因缺乏积极的主体意识显得较 为被动,相关促进健康医疗数据流通的管理 策略和协调机制包括数据交换协议(DSAs) 计划均有待进一步提出。.数据服务1)基本要求组织应明确数据服务的内涵,形成数据服务 目录,不断改进和优化数据的服务能力,至 少应:a)分析数据服务需求、现有资源和环境,明 确数据服务内涵、范围、类型、团队和服务 方式;b)明确数据服务的内容和能力,制定数据 服务目录、服务级别协议和实施方法;。建立数据服务管控流程,监督数据服务的 平安性与合规性,并
52、对实施过程进行审核和 控制;d)建立数据服务支持流程,通过标准化、 自动化等方式支撑数据服务的支付,满足 服务需求;e)构建数据服务管理机制,对数据服务的过 程、质量和平安等进行管理,并持续改进和 优化;f)开展数据服务能力评价,定期对数据服务 能力和价值进行评估、改进和优化,促进服 务创新。2)现状与问题针对用户非常明确的数据查询和处理任务 以高性能和高吞吐量的方式实现群众化的 服务是数据价值最重要也是最直接的发现 方式。截至目前,关于健康医疗数据服务 管理体系的理论研究还相对较少。理解健 康医疗数据需求有助于提供更具针对性的 健康医疗数据服务。我国健康医疗数据服 务现多集中在2C端,服务对
53、象是老百姓, 2B端的健康医疗数据服务在我国因受整 体医疗体系的制约开展相对缓慢。在2c 数据服务中,我国主要采用PaaS (平台 即服务)模式,即借助平台将可用性数据 进行分析挖掘后进行辅助决策支持等丰富 应用。由国家信息中心发起的国信优易数 据通过打造健康大数据创新服务 平台,明确了服务对象、产品目标及核心 功能模块,将区域内涉及的健康医疗数据 进行汇总、标准化、挖掘等,实现了对外 数据服务的快速、便捷、可定制等。高水 平的组织内部协调保障和领导层的统筹支 持在基于健康医疗数据服务的多样化、个 性化特点,创新健康医疗数据服务模式、 优化服务水平、强化业务监管中发挥了重 要作用。在2B的数据
54、服务中,以In- ovalon为代表的第三方医疗数据服务提供 商受益于美国较为完善的医疗体系开展迅 速。Inovalon组建了一只专业性很强的客 户服务支持团队,负责解决方案执行、合 同端对端交付、以咨询模式服务差异化客 户群体,针对不同服务要求提供了如数据 诊疗系统Data Diagnostics健康风险评 价系统CARA、用于数据采集的iPorts 预测临床洞察系统PCIStm、电子版患者评 估解决方案ePASS等数十个组件或工具 集(301 o我国健康医疗数据资产化运行基础薄弱, 对于2B端的健康医疗数据服务的标准化、 合法化开发还有待突破。组织对于健康医 疗数据服务的体系化管理未形成相
55、关的框 架,对于健康医疗数据服务目录基础资源 框架等的研究较少。.数据洞察1)基本要求组织应创立业务视角和用户视角,对数据及 其内在的规律进行分析,识别不同数据集的 关联,挖掘数据价值,获取数据洞察的能力, 至少应:a)获得业务视角和用户视角下的数据应用 的需求,进行静态和动态场景识别,获取不 同场景和应用下的数据应用模型;b)识别支撑数据洞察的有效数据源,并进 行数据抽取、数据清洗和数据转换等顶处埋, 开展规律性、交互性和关联性分析;c)融合业务、数据、算法和技术,挖掘数据 及其之间的规律,获取数据洞察结果;d)构建数据洞察的管理和应用机制,持续 改进和优化流程、提高能力和提升价值;e)建立
56、数据洞察的数据平安和隐私保护机 制,符合法律法规和行业监管等要求。2)现状与问题随着健康医疗数据治理的不断深入,健康医 疗数据洞察能力不断提升。健康医疗数据洞 察主要是从经质量治理后的临床数据、科研 数据、数据集/数据库等中将现实世界真实 数据转化为洞察的一种应用。精准医疗、健康管理、辅助科研、临床决策支持、医疗保 障监管、医药研发等在当前都是健康医疗数 据洞察极具价值的探索方向。在辅助完成医 疗任务上,数据挖掘技术的应用贯穿于疾病 预防、诊断、治疗、预后的全过程,为疾病 诊治流程管理、病患用药平安管理等提供了 许多指导。数据集和数据管理、数据分析是 实现数据洞察的基础。从数据来源看,数据 洞
57、察一般基于医院电子病历,地方政府公开 的数据集、全国某疾病数据库、药学数据库、 在线健康社区等。云计算、大数据等技术的 开展为健康医疗数据挖掘和洞察提供了便 利条件,人工智能(Artificial Intelligence, Al)技术那么被认为是加速健康医疗数据洞察, 释放数据价值的一把利器。logistic回归、 apriori算法、神经网络和随机森林以及机器 学习、深度学习等在目前较为常用。针对算 法的常用评估指标包括精确度、灵敏度、特 异度等,并常采用十折交叉验证的方法进行 测试。理解数据需求有助于实现健康医疗数 据的精确洞察,United Healthcare美国最大的健康保险公司通
58、过数据挖掘和分析洞 察改善了临床医疗、进行财务分析、监控医 疗保险欺诈和滥用行为。数据质量和专项数据集的缺乏正严重制约着 健康医疗数据洞察。健康医疗数据质量难以 保证使得数据分析结果存疑,数据价值难以 真正洞察变现;大型数据集和数据库资源目 录等基础设施建设的缺乏导致健康医疗数据 洞察目前仍以小范围、单领域探索为主,要 实现健康医疗数据的全面洞察还有很长一段 路要走。四、健康医疗数据治理工具标准映射:可以将制定的标准与实际数数据治理工具不仅仅是提升数据治理效率的 重要手段,其本身往往也是数据治理内容的 重要构成局部,随着技术的开展,工具的自 动化、智能化程度不断地提高,其在数据治 理中的作用也
59、将越来越大。在中国信息通信 研究院发布的数据资产管理实践白皮书(3.0)中详细的梳理了数据治理工具, 主要包括数据标准管理工具、数据质量管 理工具、数据平安管理工具、元数据管理工具、 数据生命周期管理工具、主数据管理工具和 数据模型管理工具。可以看到这数据治理工 具大多数与国家标准中提出的数据治理域相 对应,并且这些工具主要聚焦于数据管理体 系,在一些具体化的工具产品中,工具除了 单独呈现外,也出现了有相互组合在一起形 成包括多种功能的软件平台,出现向集成化 数据治理工具开展趋势。但就目前来看,缺 乏针对数据价值体系的管理工具,一方面可 能是因为数据价值体系中更需要的是体制机 制的协调,有些内
60、容融入到了上类的工具当 中,也有一些直接以数据应用的形式展现, 但在这之外,还可能的原因是数据治理工具 开发中缺乏对数据价值的思考。下文我们引 用数据资产管理实践白皮书(3.0)中 对于数据治理工具功能的介绍,并列举了 目前在医疗健康领域的一些数据治理工具 或平台,以方便大家对目前市场的健康医 疗数据治理工具有一个比拟清晰直观的认 识。(一)数据治理工具功能介绍31.数据标准管理工具数据标准制定及维护工具可以规范数据资产 格式、命名的准确性和口径的一致性,该工 具针对数据标准管理职能而开发,需具备以 下基础功能:据进行关联映射,即实现数据标准的落地执 行,维护标准与元数据之间的落地映射关系,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年茶叶冷链物流合同协议
- 运城师范高等专科学校《中医外科学》2025-2026学年期末试卷
- 福州英华职业学院《管理系统中计算机应用》2025-2026学年期末试卷
- 福建省三明市2025-2026学年九年级上学期期末语文试题(含答案)
- 2026年苏教版小学五年级数学上册计算培优练习卷含答案
- 2026年人教版小学四年级数学下册小数意义性质应用卷含答案
- 深度解析(2026)《GBT 4324.4-2012钨化学分析方法 第4部分:锑量的测定 氢化物原子吸收光谱法》
- 深度解析(2026)《GBT 3932.1-2006床身铣床检验条件 精度检验 第1部分卧式铣床》
- 【 物理 】机械效率课件-2025-2026学年沪科版物理八年级下学期
- 采购部价格管理制度
- 2025年全国高考物理试题及答案
- 思考快与慢课件
- 学前特殊儿童语言教育
- 学校防投掷爆炸物预案
- 2024年公路工程质量检验评定标准
- 幼教培训课件:《幼儿园区域活动与幼儿成长》
- 高等数学(上下册全套)全套教学课件
- 大学语文(第三版)课件 像山那样思考
- 兖州煤田东滩煤矿240万ta新井设计
- 游戏产业招商推广计划
- 垂直盾构施工方案
评论
0/150
提交评论