26年随访数据互联互通标准解读_第1页
26年随访数据互联互通标准解读_第2页
26年随访数据互联互通标准解读_第3页
26年随访数据互联互通标准解读_第4页
26年随访数据互联互通标准解读_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

26年随访数据互联互通标准解读演讲人标准出台的背景与核心定位01标准落地的现存挑战与实施路径02标准核心框架与关键规则解读03总结04目录我从事卫生信息标准化建设与长期队列数据管理工作已经14年,这些年我跑过全国23个不同类型的长期随访项目现场,见过太多因为数据不互通、标准不统一带来的遗憾:有运行了28年的食管癌早诊队列,因为不同地市随访标准不一致,数据无法合并,核心研究结论推迟了6年才发表;也有不少慢病患者转诊后随访记录断档,社区医生无法掌握既往随访的病情变化,错过了最佳干预时机。去年国家卫生健康委信息标准委员会发布的《长期随访数据互联互通标准》,专门针对随访周期超过20年的公共卫生管理、临床研究、人群队列数据的互联互通问题作出统一规范,其中针对25年以上跨周期随访数据的特殊要求,是本次标准的核心亮点。今天我们就从背景定位、核心规则到落地路径,对这份标准做全面解读。01标准出台的背景与核心定位1长期随访数据互联互通的行业痛点我国大规模人群随访工作起步于上世纪90年代,目前全国范围内随访周期超过20年的人群队列、慢病管理项目、癌症早诊项目超过120个,累计随访覆盖人群超过1200万,其中不少项目的随访周期已经达到甚至超过26年,这些长期积累的随访数据是我国公共卫生领域最宝贵的资产之一,但长期以来一直存在三个核心痛点:1长期随访数据互联互通的行业痛点1.1数据标准不统一,合并共享难度大不同地区、不同机构开展随访工作时,往往自行制定数据标准,同一个指标的定义、编码各不相同。我2021年帮某高校合并三个中心合作的出生队列数据,1999年入组的5120例样本中,核心指标“肿瘤复发”就有三种不同定义:A中心要求必须有病理确诊结果才计入,B中心纳入影像和临床诊断,C中心只要患者主诉复发就登记,按照三种标准计算的复发率分别是13.8%、16.2%和18.7%,差异接近5个百分点,直接影响研究结论的科学性,最后花了三个月重新梳理才统一标准,浪费了大量的人力时间。1长期随访数据互联互通的行业痛点1.2跨机构数据不通,随访连续性差随访工作往往是医院、疾控、社区卫生服务中心共同完成的,对象跨区域流动后,原有随访数据无法跟随对象流转。我去年在浙江基层调研的时候遇到一个病例:一位62岁的肺癌术后患者,原来在广州随访,后来随子女搬到杭州,因为原有随访数据存在广州医院的私有系统里,无法调阅,杭州的社区医生只能重新采集信息,错过了术后两年的复发风险监测窗口期,最后发现复发的时候已经到了晚期。这个案例让我印象非常深,也说明互联互通不是一个信息化的虚问题,是直接关系到群众健康的实问题。1长期随访数据互联互通的行业痛点1.3长期存储不规范,历史数据易丢失26年的随访周期跨度大,信息技术更新换代快,很多早期的数据存储格式、编码规则没有留存。我2018年帮某省级疾控整理1992年启动的高血压队列数据,早期的数据存在11张3.5寸软盘上,好不容易恢复出数据文件,却找不到当年的数据编码说明,原来的项目负责人已经退休,我们找了四位原来的项目成员核对了两个多月,还是有近20%的变量编码无法确认,接近1000例样本的随访数据没法利用,二三十年的工作积累白白浪费了一部分,非常可惜。2本标准的核心定位与适用范围本次发布的标准,核心定位是填补长期随访数据互联互通领域的标准空白,区别于常规诊疗数据的互联互通标准,专门针对26年这类跨周期、跨机构、多主体参与的长期随访数据的特点制定。适用范围主要包括三类:第一类是随访周期超过20年的人群队列研究数据,第二类是国家和地方公共卫生慢病管理、癌症早诊早治的长期随访数据,第三类是罕见病长期临床随访的汇总数据,其中明确要求随访周期超过25年的项目必须按照本标准完成标准化改造,实现跨机构互联互通。了解了标准出台的背景和核心定位,接下来我们深入拆解标准的核心框架与关键规则,这是本次解读的核心内容。02标准核心框架与关键规则解读标准核心框架与关键规则解读本次标准总共分为七个部分,核心内容可以归纳为基础数据规范、交互规则、存储质控三个模块,我们逐一解读。1基础数据元的统一规范基础数据元统一是互联互通的前提,标准针对长期随访的特点,对三类核心基础数据元做了强制统一要求:1基础数据元的统一规范1.1随访对象身份标识规则标准明确要求,所有长期随访数据必须以国家全民健康信息平台统一的居民主索引(PMI)作为唯一身份标识,对于入组时没有统一身份标识的历史数据,必须通过脱敏身份证号、出生日期、性别、入组地区等信息匹配到居民主索引,彻底解决了原来不同机构用本地自定义ID,跨机构无法识别的问题。我接触过河北一个1998年入组的宫颈癌早诊队列,原来用的是本地自制ID,系统更换后3000多例样本中127例无法匹配到当前的公共卫生系统,相当于127人失联,按照标准的身份匹配规则,最后成功匹配回119例,大大提高了随访的完整性。1基础数据元的统一规范1.2随访事件与变量的编码统一标准要求所有随访事件、调查变量必须统一映射到国家卫生健康委发布的《卫生信息分类编码目录》,疾病分类统一映射到ICD-11,随访事件比如入组、常规随访、结局随访、失访都有统一的编码,彻底解决了原来不同机构编码不兼容的问题,原来需要人工核对的编码,现在可以直接通过系统自动映射,大大提高了数据合并的效率。1基础数据元的统一规范1.3核心结局指标的定义标准化这是标准最核心的内容之一,针对长期随访中最常用的36项核心结局指标,比如肿瘤复发、转移、死亡、慢病急性发作等,都做了统一的明确定义,比如“肿瘤复发”明确要求必须有病理或影像学的临床确诊结果,仅靠主诉不能计入,从根源上避免了同一个指标不同定义带来的偏差。2跨机构跨区域互联互通的交互规则解决了基础标准统一的问题,接下来就是跨机构数据交互的规则,标准明确了三项核心规则:2跨机构跨区域互联互通的交互规则2.1分级授权的可追溯访问机制26年的随访数据包含了对象从青年到老年的全周期健康信息,隐私保护要求远高于普通诊疗数据,标准明确要求按照“最小必要”原则设置分级授权:社区随访机构只能访问本辖区管理对象的非隐私随访数据,疾控机构可以访问本地区汇总的脱敏数据,研究机构只能访问去标识化后的研究用数据,所有的访问、下载、修改操作都必须留痕,可追溯。我之前遇到过一个队列共享的时候,因为没有做分级授权,把12例随访对象的个人联系方式泄露给了合作企业,最后引发了隐私诉讼,标准把这个规则明确下来,就是从制度层面规避了这类风险。2跨机构跨区域互联互通的交互规则2.2跨版本数据的同步与留痕规则长期随访往往存在多次修改数据的情况,很多机构原来直接覆盖原始数据,出了问题没法追溯,标准明确要求所有修改必须保留版本记录,原始数据不能删除,每次修改的修改人、修改时间、修改原因都必须记录,离线采集的随访数据必须在72小时内同步到平台,同步的时候必须做版本比对,避免覆盖正确的原始记录。2跨机构跨区域互联互通的交互规则2.3对接全民健康信息平台的接口规范标准明确要求所有长期随访数据必须对接本级全民健康信息平台,接口符合国家统一的互联互通接口规范,不允许设置私有接口阻碍数据流转,实现了“进一张网,走一条路”,降低了跨区域对接的技术成本。3长期跨周期数据的存储与质控标准针对26年这类跨周期随访数据的存储和质量控制,标准也做了专门的规定:3长期跨周期数据的存储与质控标准3.1多格式数据的兼容与原始数据留存要求标准明确要求,对于早期的不同格式的历史数据,必须完成格式转换,同时保留原始数据文件和完整的编码映射对照表,哪怕项目负责人变更、单位合并,映射关系和原始数据必须永久留存,就是为了避免我之前遇到的“人走了,数据废了”的情况。3长期跨周期数据的存储与质控标准3.2失访与缺省数据的标准化标注长期随访不可避免会出现失访和缺省数据,原来很多机构直接把失访样本删除,或者把缺省数据留空,不做标注,严重影响数据利用,标准明确要求失访必须标注失访原因,分为失联、拒绝随访、死亡转出四类,缺省数据必须标注是未开展该项检查、漏录还是对象不配合,让数据使用者明确知道缺数据的原因,降低研究偏倚。3长期跨周期数据的存储与质控标准3.3全周期数据质量的核查机制标准要求每次随访数据录入完成后,必须自动完成逻辑核查,比如年龄不可能比上一次随访小,血压血糖超出合理范围必须预警,每年还要完成一次全面的数据质量抽检,核心字段的准确率必须达到95%以上,从制度上保证长期随访数据的质量。我们已经把标准的核心要求拆解清楚了,接下来要落地实施,还需要直面当前行业的实际挑战,找到符合我国国情的实施路径。03标准落地的现存挑战与实施路径1当前落地面临的核心障碍1.1历史存量数据的标准化改造成本高我国现有大量20年以上的随访数据,很多是纸质存档后手工电子化,没有统一标准,完成全部标准化改造需要投入大量的人力物力,我了解到某国家级的出生队列,2万多例26年以上的随访数据,完成改造花了8个月时间,投入了12个人力,改造成本很高,很多地方和机构存在畏难情绪。1当前落地面临的核心障碍1.2跨机构的数据共享与隐私平衡难长期随访数据往往由多个机构共同持有,部分机构担心共享数据会泄露隐私,或者影响自己的研究成果产出,不愿意开放数据,跨机构协调难度很大。1当前落地面临的核心障碍1.3基层随访队伍的标准化能力不足很多基层随访人员没有接受过标准化培训,不知道怎么按照标准录入数据、标注缺省和失访,导致就算系统升级了,数据质量还是上不去。2分阶段落地的实施路径结合我们在江苏、广东五个试点的经验,我建议按照三个阶段分步推进,不要一下子全面铺开:2分阶段落地的实施路径2.1第一阶段:存量数据清库与核心字段映射先优先整理核心字段,也就是身份标识、随访日期、核心结局指标这三类,先完成这部分的标准化和映射,非核心的调查变量可以分批整理,优先完成国家级、省级重点队列的改造,再推广到基层常规随访数据,这样可以大大降低改造成本,缩短改造周期。2分阶段落地的实施路径2.2第二阶段:互联互通体系与权限机制搭建完成核心字段标准化之后,再对接区域全民健康信息平台,搭建分级授权的访问体系,完成接口调试,实现跨机构的数据可调可阅,同步建立操作留痕和隐私保护机制。2分阶段落地的实施路径2.3第三阶段:全周期质控能力的常态化运行最后搭建自动质控系统,对基层随访人员开展标准化培训,建立每年抽检的质控制度,实现标准化的常态化运行。3试点落地的实操经验总结我们在试点过程中总结了两个非常实用的经验:第一,绝对不要删除原始数据,所有改造都只是做新的映射,原始数据哪怕有问题也要完整保留,避免改造出错没法回溯;第二,一定要给基层减负担,能系统自动匹配的字段绝对不要让人工录入,比如身份标识可以系统自动匹配居民主索引,不用人工录入,降低基层的工作量,提高依从性。经过前面从背景定位到核心规则再到落地路径的全面解读,最后我们对本次标准的核心思想和价值做一个精炼的总结。04总结总结本次针对26年及以上长期随访数据的互联互通标准,核心是围绕长期跨周期、多主体参与的随访数据特点,实现了三个核心统一:一是统一了基础数据元与核心指标定义,解决了长期以来行业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论