版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
26年随访数据互联互通标准演讲人2026-04-2901.标准出台的背景与现实需求02.标准落地的实施路径与保障机制目录作为一名从事慢性病长期队列与出生队列数据管理12年的从业者,我经手整理过不下10项随访周期超过20年的大型研究数据,亲眼见过太多因为数据标准不统一、跨机构不通畅导致的遗憾:2023年我参与全国肺癌长期随访数据汇交项目时,3家不同单位牵头的队列都刚好完成了26年完整随访,累积了近10万病例的有效数据,但因为同一个“肺癌确诊时间”指标就有3种定义、“高血压基线状态”用了两套诊断标准,光整理对齐就花了3个月,差点耽误了项目验收。正是这类长期积累的痛点,推动了《26年随访数据互联互通标准》的出台,今天我将从背景需求、核心原则、标准框架、落地路径四个维度,对这个标准做全面拆解,最后再做总结梳理。01标准出台的背景与现实需求ONE标准出台的背景与现实需求26年随访不是一个偶然的时间节点,我国第一批自主设计的大型长期慢性病队列、出生队列都启动于2000年前后,到2026年刚好完成第一轮完整的26年全周期随访,累积了海量的原始研究数据,这些数据是我国公共卫生与临床医学领域最珍贵的战略资源之一,而互联互通标准的出台,正是回应了当前领域发展的核心需求。1长期随访研究的发展态势当前我国长期随访研究已经从单中心、小样本走向多中心、大协作阶段:一方面,单队列的样本量已经无法满足罕见疾病、弱关联暴露因素的统计效力要求,跨队列整合数据已经成为领域共识;另一方面,26年的全周期随访数据已经可以支撑生命全周期的健康研究,比如出生队列的26年随访可以完整揭示宫内暴露对成年慢性病的影响,这类研究必须依赖跨区域、跨机构的数据整合才能扩大样本量、提升结论可靠性。我参与的几项全国性研究近年来都明确提出,没有互联互通的统一标准,就做不了真正的大样本长期随访研究。2现有互联互通存在的核心痛点在标准出台之前,跨机构长期随访数据整合几乎处处是障碍,核心痛点可以归纳为三点:2现有互联互通存在的核心痛点2.1数据元标准不统一26年的随访周期横跨了纸质记录、单机电子录入、云平台结构化采集三个阶段,不同阶段、不同机构对同一个指标的定义、编码、记录方式差异极大。我之前整理某出生队列的26年数据时发现,仅仅“出生体重”就有三种记录单位:克、公斤、斤,还有近15%的记录只标注了“巨大儿”“正常体重”“低体重”,没有具体数值,如果没有统一的转换规则,根本没办法和其他队列整合。2现有互联互通存在的核心痛点2.2安全与权属规则不清晰很多机构手握26年的随访数据,但因为没有统一的安全合规规范,怕出隐私问题、怕权属纠纷,不敢对外开放共享。我曾经碰到过一个案例:某高校课题组要整合3个队列的26年胃癌随访数据,其中某市级疾控中心因为没有明确的规则可依,担心数据泄露承担责任,审批流程拖了14个月,最后课题错过了验收时间,非常可惜。2现有互联互通存在的核心痛点2.3技术接口不兼容不同机构的信息系统建设时间差超过20年,早年的随访数据存放在单机Access数据库,中期的存放在机构局域网服务器,近年的存放在公有云平台,接口协议不统一,跨机构调阅数据需要人工导出拷贝,不仅效率低,还容易出现数据错误、泄露的风险。3标准制定的核心目标本标准的制定不是为了统一管控所有数据,而是明确三个核心目标:第一,实现跨机构、跨周期的随访数据可流转、可整合,打破信息孤岛;第二,明确数据安全、隐私保护、伦理合规的统一规则,消除数据持有机构的共享顾虑;第三,支撑26年累积随访数据的二次开发利用,释放长期队列的研究价值,服务疾病防控与临床研究。讲完了标准出台的背景与目标,接下来我们需要明确,制定26年随访数据互联互通标准,必须遵循哪些核心原则,这些原则是整个标准的灵魂,也是适配长期随访数据特点的关键。3标准制定的核心目标26年随访数据互联互通的核心遵循原则不同于常规临床数据的互联互通,26年随访数据有跨度大、来源杂、个人关联度高的特点,因此标准制定必须遵循四个核心原则:1全周期兼容原则标准不能只适配新采集的增量数据,必须兼容26年周期内所有类型的存量数据,包括早年的纸质转录数据、非结构化数据,要给旧数据留足转换映射的空间,不能要求机构推翻所有原有数据重新采集,这是我参与标准制定讨论时,所有从业者一致同意的首要原则——毕竟这些26年的数据来之不易,毁掉重来是不可能的。2权属清晰、安全优先原则互联互通不改变原有数据的所有权,数据权属仍然归原始收集机构所有,共享只是基于研究需求的授权使用,所有流转过程都必须符合《个人信息保护法》《生物安全法》以及研究伦理的要求,安全规则是底线,任何互联互通需求都不能突破安全底线。3最小必要开放原则所有数据共享都只开放研究需要的最小数据集,不需要的个人信息、无关数据一律不开放,避免过度获取个人数据,既保护隐私,也降低数据流转的风险。比如研究需求只需要26年的生存结局数据,就不需要开放研究对象的全基因组测序信息,这一原则也符合国内外伦理审查的通用要求。4分级互联适配原则根据数据的敏感程度对随访数据做分级,不同级别对应不同的互联互通权限,不能搞“一刀切”的开放或者封闭,既满足正常的研究需求,也管控敏感数据的流转风险。核心原则明确之后,接下来我来拆解本标准的核心框架与具体内容,这是整个标准的主体部分。4分级互联适配原则26年随访数据互联互通标准的核心框架与内容本标准的核心框架分为四个部分,覆盖了从数据本身到交互、安全、溯源全流程的要求:1数据元标准化规范数据元标准化是互联互通的基础,本标准针对26年随访数据的特点,明确了三方面的规则:1数据元标准化规范1.1核心数据元统一命名与定义本标准将26年随访的核心数据元分为五大类:基础人口学信息、基线暴露信息、随访结局信息、干预措施信息、质量控制信息,共梳理了326个核心必选数据元,每个数据元都明确了统一的名称、定义、编码规则、计量单位。比如之前大家定义混乱的“随访终点结局”,标准明确要求必须同时标注“结局发生日期”“诊断机构级别”“诊断依据”三个属性,不管原始研究用什么定义,都必须转换为统一的格式,从源头解决了定义不统一的问题。1数据元标准化规范1.2跨周期数据元映射规则针对26年不同阶段使用不同编码体系的问题,标准明确要求所有存量数据必须做双向映射:保留原始数据的编码与记录,同时生成符合本标准的统一编码数据元。比如职业编码,早年研究用GB/T6565-1999版,现在用2015版,标准附带了统一的映射转换表,机构只需要按照表格转换即可,不需要自己对应,我在试点整理数据时,原来人工做需要3个月的映射工作,用标准附带的映射表只花了2周,大大提升了效率。1数据元标准化规范1.3缺失数据的统一标注规范26年随访不可避免会出现失访、数据缺失的情况,标准要求不能将缺失数据直接留空,必须按照缺失原因分为三类标注:失访未获得信息、收集过程遗漏未记录、被访者拒绝提供,不同类型的缺失标注可以帮助后续研究者正确处理缺失偏倚,避免因为缺失类型混淆导致研究结论错误,这一点对于长期随访研究来说非常重要。2数据交互接口标准解决了数据本身的标准化问题之后,标准明确了跨机构数据交互的技术标准,分为三种场景:2数据交互接口标准2.1在线交互接口标准对于可联网的机构数据,要求统一采用符合我国卫生信息交换标准(HL7China)的接口协议,采用JSON结构化格式传输,接口必须满足等保2.0三级以上的安全要求,所有传输过程必须加密。2数据交互接口标准2.2非结构化数据交互标准26年随访数据中存在大量非结构化数据,比如CT影像报告、手写病历扫描件,标准要求所有非结构化数据必须附加统一的结构化索引,标注清楚数据内容、采集时间、关联对象编码,方便索引调阅。2数据交互接口标准2.3离线交互标准针对很多基层机构数据不能联网的情况,标准明确了离线交互的规则:要求采用加密的专用存储介质,数据必须做完整性哈希校验,拷贝之后双方要核对数据完整性,同时留存交互记录,解决了不能联网情况下的数据交互问题,我之前碰到的基层疾控中心26年随访数据共享,就是用离线交互的规则完成的,整个过程合规可控,机构也放心。3分级授权与安全合规标准这部分是消除机构共享顾虑的核心,标准明确了四方面的规则:3分级授权与安全合规标准3.1数据分级规则按照敏感程度将所有随访数据分为四级:一是公开级,即去除所有个人标识的汇总统计数据,可直接开放下载;二是共享级,即完成去标识化的个体level数据,供项目内研究使用;三是敏感级,即带有可识别个人身份信息的临床数据,需要严格审批;四是限制级,即关联生物样本、全基因组信息的全维度数据,仅限国家级重大项目使用。不同级别对应不同的互联要求,规则清晰。3分级授权与安全合规标准3.2授权审批流程标准明确了分级审批流程:公开级数据无需审批直接获取;共享级数据由数据持有机构的学术管理部门审批即可;敏感级数据需要省级以上卫生健康行政部门和伦理委员会审批;限制级数据需要国家级相关部门审批,流程明确,不用再层层模糊审批。3分级授权与安全合规标准3.3隐私去标识化规范标准明确了统一的去标识化要求:必须删除姓名、身份证号、手机号、具体住址等直接标识,出生日期精确到年月、住址精确到区县,避免交叉重识别,同时保留研究需要的核心信息,不会因为去标识化影响研究使用。3分级授权与安全合规标准3.4伦理审查互认规则针对26年随访的原始研究已经完成伦理审查的情况,标准明确只要二次研究符合本标准的要求,已经通过的伦理审查可以互认,不需要重复审查,这解决了我之前做课题时重复花半年走伦理审批的痛点,大大提升了研究效率。4元数据与溯源管理标准为了保证数据质量和可追溯,标准明确要求所有互联互通的数据必须附带完整的元数据,并且建立全流程溯源机制:4元数据与溯源管理标准4.1元数据采集要求每一个标准化数据集都必须附带元数据,明确数据采集时间、采集机构、采集方法、原始队列信息、质量控制结果,方便使用者判断数据质量,选择合适的数据。4元数据与溯源管理标准4.2全流程溯源机制所有数据流转过程都必须留痕,从申请、审批到获取、使用,每一个环节都要有记录,可追溯,如果出现数据泄露、违规使用的情况,可快速定位责任主体,保障数据安全。4元数据与溯源管理标准4.3质量控制元数据规范要求26年随访每一次随访的质量控制结果都必须作为元数据记录,比如本次随访的失访率、数据符合率、复核结果,这些信息对于长期随访研究的质量评估至关重要,标准把它明确下来,就是要求所有机构重视质量控制信息的留存。讲完了标准的核心框架与内容,接下来我们需要明确,这样一套标准怎么落地实施,需要哪些配套的保障机制。02标准落地的实施路径与保障机制ONE标准落地的实施路径与保障机制标准的生命力在于实施,针对我国长期随访数据的现状,本标准明确了分阶段实施的路径和配套的保障机制:1分阶段推进标准化改造按照存量整理、增量规范、试点推广的顺序推进:1分阶段推进标准化改造1.1第一阶段:存量数据标准化梳理(1-2年)要求所有持有20年以上随访周期数据的机构,用1-2年时间完成存量数据的标准化梳理与映射,生成符合本标准的标准化数据集,汇交到国家级互联互通门户,我目前就在参与第一批国家级队列的存量梳理工作,已经完成了某出生队列26年数据的标准化改造,整体效果符合预期,原来存在的大部分整合问题都解决了。1分阶段推进标准化改造1.2第二阶段:增量数据源头标准化从标准正式实施之后,所有新启动、正在进行的长期随访项目,都必须从源头按照本标准采集数据,保证增量数据从一开始就符合互联互通要求,避免产生新的信息孤岛。1分阶段推进标准化改造1.3第三阶段:试点验证与全面推广先在国家级大型队列项目试点运行,总结经验优化标准之后,再逐步推广到省级、地方级的长期随访项目,成熟一个推进一个,不搞一刀切。2建立跨机构协同管理机制建立三级协同管理机制:一是成立国家级长期随访数据互联互通管理委员会,负责标准的解释、更新和争议协调;二是各省级卫生健康部门设立专门的联络员,负责本区域内机构的协调管理;三是每个持有数据的机构设立专门的数据管理员,负责本机构数据的标准化改造和互联互通对接,责任到人。3公共技术支撑平台建设国家层面已经在建设统一的长期随访数据互联互通公共服务平台,免费向所有机构提供数据元映射工具、去标识化工具、接口测试工具,机构不需要自己开发工具,降低了标准化改造的成本和门槛,我在试点中使用平台的映射工具,原来人工需要3个月的工作,现在不到1个月就能完成,效率提升非常明显。4分层级人员培训体系建立分层级的培训体系:国家级负责培训省级和机构级的师资,省级负责培训本区域的机构数据管理员,机构负责培训一线的随访和数据录入人员,保证所有相关人员都能理解标准、掌握操作方法,让标准真正落地。总结经过前面从背景需求、核心原则、标准框架到落
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 主顶油缸标准化操作流程
- 上虞《化工总控工》技能专项训练卷
- 高血压防治与用药指南
- 2025年海南三亚中心医院招聘专业技术人员考试真题
- 2025年天台县教育局招聘事业编制教师真题
- 《数控机床加工零件》课件-数控铣技能竞赛中的技术与要领
- 2026年滨州市烟草系统事业单位人员招聘考试备考试题及答案详解
- 2026年安徽省住房和城乡建设系统事业单位人员招聘考试备考试题及答案详解
- 职业规划目标描述方法
- 2026国家税务总局河南省税务局招聘事业单位工作人员70人考试模拟试题及答案解析
- 苏科版七年级数学下册期末核心考点练习卷(含解析)
- 实测实量仪器操作使用专题培训
- 数字电子技术课件 3.4.2.1二进制译码器
- 2025年全国统一高考数学试卷(全国一卷)含答案
- 江苏省徐州市2024-2025学年高二下学期期中考试地理试卷(含答案)
- JG/T 293-2010压铸铝合金散热器
- 热力发电厂模拟试题+答案(附解析)
- 幼儿军事活动协议书
- 注射用多黏菌素E甲磺酸钠-药品临床应用解读
- 儿童阅读发展的性别差异-性别刻板印象和言语认知技能的作用及其机制
- TWHQC 1-2024 TCSTE 0667-2024 质量分级及“领跑者”评价要求 电动越野乘用车
评论
0/150
提交评论