26年随访数据安全管理规范_第1页
26年随访数据安全管理规范_第2页
26年随访数据安全管理规范_第3页
26年随访数据安全管理规范_第4页
26年随访数据安全管理规范_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

26年随访数据安全管理规范演讲人作为从1998年就加入本慢性病队列研究、全程参与了26年随访工作的数据管理员,我亲眼看着这份数据从一摞摞手写基线问卷,成长为覆盖五万余名受访者、累计超百万条随访记录的大型人群研究资源,也亲历过多次安全风险事件,更清楚这份累积了二十六年的数据,安全管理是一切研究产出的前提。不同于三五年的短期研究数据,26年随访数据的特殊性决定了它不能套用通用数据安全规范,必须建立适配长期周期特性的专属管理规则。接下来我将从长期数据的特性与管理必要性、全生命周期安全规范、风险防控应急机制、责任合规体系四个层面展开说明,最后对核心要求做总结梳理。0126年随访数据的核心特性与安全管理必要性02126年随访数据的固有属性031.1跨周期多源异构性1.1跨周期多源异构性26年的随访周期覆盖了纸质记录、单机电子录入、云端结构化存储三个技术阶段,数据来源涵盖了现场问卷、体格检查、生化检测、医院诊疗记录、医保报销数据、疾控死因监测多个维度,不同阶段的数据格式、存储介质、编码规则差异极大,早期的手写问卷与最新的区域健康大数据对接的结构化数据并存,这种异构性给统一管理带来了天然难度。041.2研究价值的不可再生性1.2研究价值的不可再生性26年累积的随访数据记录了受访者从壮年到老年的健康轨迹,对于慢性病病因研究、发病风险预测有着不可替代的价值,一旦发生数据丢失、损坏,不可能重新招募同一批人群重复随访,二十六年的时间成本永远无法弥补,这份资源的不可再生性是安全管理的核心逻辑起点。051.3敏感信息的高度集聚性1.3敏感信息的高度集聚性我们对每一位受访者的全周期信息都做了连续记录,从基础人口学信息、居住地址、联系方式,到家族病史、个人诊疗记录、生活习惯甚至经济状况,全部信息都集中存储,一旦发生泄露,对受访者个人权益造成的损害是终身性的,也会直接摧毁整个研究的社会信任基础。062.1存储介质迭代带来的物理安全风险2.1存储介质迭代带来的物理安全风险我亲历过三次存储介质的更新换代,从最早的5寸软盘到光盘,再到机械硬盘、现在的云存储,早年很多存储的原始电子备份,因为设备老化已经无法读取,2003年单位老库房年久失修雨季漏水,我和同事连夜抢运纸质问卷,一身泥水的经历让我至今印象深刻,那次也让我们意识到,长期数据的物理安全风险是动态变化的,不是一劳永逸的。072.2人员代际更替带来的管理衔接风险2.2人员代际更替带来的管理衔接风险26年里我们课题组换了三批核心研究人员,数据管理员前后换了五任,早年曾经出现过老管理员离职后,老纸质档案的索引记录交接不清,全课题组翻了半个月才找到目标批次问卷的情况,人员流动带来的管理断层,是长期数据特有的安全隐患。082.3数据开放共享带来的边界管控风险2.3数据开放共享带来的边界管控风险近年科研领域要求大型队列数据开放共享,越来越多的年轻研究者、外部合作单位申请调用数据,如果边界管控不到位,很容易出现敏感信息泄露的风险,行业内曾经发生过开放数据集脱敏不彻底,被反向识别出上千名受访者个人信息的事件,这个教训我们一直牢记,也必须在规范中明确共享的红线。3本规范的核心目标本规范的核心目标可以归纳为三点:第一,保障数据的完整性,确保二十六年累积的所有原始数据不丢失、不损坏、可溯源;第二,保障隐私安全性,严格保护受访者个人信息,杜绝任何形式的违规泄露;第三,保障利用合规性,平衡安全要求与研究价值释放,让这份数据能够合法合规服务于医学研究。明确了长期随访数据安全管理的背景与核心目标后,接下来我们展开说明全生命周期各环节的具体管理规范。091.1知情同意的全周期更新1.1知情同意的全周期更新不同于短期研究仅需一次知情同意,我们要求每一次随访更新都必须重新做安全告知,每5年对所有在访受访者重新确认知情同意,对失访后重新取得联系的受访者,第一时间更新知情内容,明确告知数据的用途、存储期限、保护措施、受访者销毁信息的权利,所有知情文件都单独加密归档,确保每一次数据采集都符合伦理要求。101.2采集环节落实最小必要原则1.2采集环节落实最小必要原则我们严格要求,研究不需要的敏感信息绝对不采集,比如不需要受访者的银行卡号、具体工作单位门牌号等信息,就绝对不设置对应采集字段,从源头减少敏感信息的存量,降低安全风险。111.3多源数据接入的前置脱敏处理1.3多源数据接入的前置脱敏处理所有外部接入的数据,包括医院诊疗记录、疾控死因数据等,在进入队列主库之前必须完成前置脱敏:直接标识符(姓名、身份证号、手机号、具体住址)单独存储于加密密钥库,与研究数据库做物理隔离,未完成前置脱敏的数据绝对不允许接入主库。122.1分级分类存储与多备份机制2.1分级分类存储与多备份机制我们将数据分为三个等级,对应不同存储要求:一级原始数据(包括原始纸质问卷、未脱敏个人信息),纸质做高清扫描加密处理,实体档案存放于专用恒温恒湿库房,电子原始数据落实“三地三备份”要求:本单位加密离线服务器一份、异地节点备份中心一份、云端离线加密存储一份,每半年做一次全量读取校验,确保所有数据都能正常读取。二级去标识化研究数据,存储于单位内部加密服务器,不连通公共网络。三级匿名化共享数据集,存储于专用共享服务器,做二次脱敏处理。132.2介质迭代迁移的双人核对机制2.2介质迭代迁移的双人核对机制每次进行存储介质迭代迁移,必须安排两名管理员全程参与,迁移前对全量数据做哈希值校验,迁移后比对全量数据的哈希值,确认数据没有丢失、没有篡改,淘汰的旧存储介质必须由有资质的单位做消磁粉碎处理,所有流程都要签字留档,我全程参与过2010年、2018年两次大的迁移,所有淘汰的老硬盘、光盘我都亲眼看着完成消磁粉碎,绝对不允许旧介质流出单位。142.3原始纸质档案的物理安全管控2.3原始纸质档案的物理安全管控我们的纸质档案库落实双人准入制度,进门需要两名授权管理员同时刷卡,24小时监控,配备防火、防水、防虫、防盗设施,每年春季对所有纸质档案做一次检查,对出现虫蛀、发霉的档案及时做修复数字化,2010年搬新库时我和同事整理了一万多份早年的基线问卷,修复了三百多份受损的原始材料,这份工作虽然繁琐,但是对长期数据来说必不可少。153.1四级权限分级授权机制3.1四级权限分级授权机制我们将数据使用权限分为四个等级,严格落实授权审批:一级超级管理员权限,仅授予两名专职数据管理员,负责系统维护与权限分配;二级课题负责人权限,仅可访问本课题经授权的去标识化数据;三级课题参与人权限,仅可使用已经清洗好的课题专用数据集,无法接触原始数据;四外部共享人员权限,仅可获取经过双重脱敏的匿名化聚合数据集。权限申请需要走课题审批、伦理审核两道流程,课题结束后立即回收权限,不允许长期持有权限。163.2全操作流程留痕溯源3.2全操作流程留痕溯源所有对数据的操作,包括登录、下载、修改、导出,都自动记录操作人、操作时间、操作内容,日志记录的保存期限长于数据本身的保存期限,任何时候都可以溯源倒查,从制度上约束违规操作行为。173.3对外共享的双重脱敏要求3.3对外共享的双重脱敏要求对外提供共享数据,必须完成两次脱敏:第一次去除所有直接标识符,第二次对准标识符做泛化处理,比如将精确出生日期转换为出生年份,将精确街道地址转换为区县级别,从技术上降低反向识别的风险,哪怕是合作单位的课题,也绝对不提供未脱敏的数据,这是不可触碰的红线。183.4成果发表的隐私审核3.4成果发表的隐私审核所有使用本队列数据产出的成果,发表前必须经过数据安全审核,绝对不允许公布任何可以识别到个人的信息,即使是个案研究,也必须取得受访者本人的书面同意才能发表。4数据留存与销毁环节安全规范对于失访超过10年且无法取得联系的受访者,我们继续留存匿名化的研究数据,原始个人信息如果没有受访者要求销毁,继续加密保存;如果受访者本人提出要求销毁所有个人数据,我们会对纸质档案做粉碎处理,对电子数据做彻底消磁删除,全程由两名管理员签字确认,留存销毁记录,完全保障受访者的合法权益。全流程的操作规范明确之后,针对长期随访数据的动态风险,还需要建立专门的风险防控与应急处置机制,才能把安全要求落到实处。191.1分级定期巡检制度1.1分级定期巡检制度我们落实三级巡检:每个月由专职管理员做一次系统安全巡检,排查异常访问记录、权限异常,检查存储设备运行状态;每季度做一次物理安全检查,排查纸质库房的环境隐患、存储介质的老化情况;每年做一次全量数据完整性校验,核对所有备份数据的一致性,我每年年底都要花一周时间参与这项工作,早年曾经在校验中发现一块老硬盘出现坏道,及时把数据导出更换了硬盘,没有造成任何损失,这就是定期巡检的价值。201.2全员常态化安全培训1.2全员常态化安全培训所有新加入课题组的研究人员、学生,第一堂课必须是数据安全培训,考核合格才能获得数据权限,每年组织全体接触数据的人员做一次安全复训,结合行业内最新的安全事件做警示,我接触过很多年轻学生,刚进来的时候觉得“不就是个数据吗,哪那么多规矩”,培训后才明白这份数据背后承载的责任,安全意识的培养必须常抓不懈。211.3第三方合作的安全审核1.3第三方合作的安全审核凡是为我们提供存储、技术服务的第三方机构,必须核验其数据安全等级保护资质,签订专门的保密协议,每年做一次安全审核,一旦发现资质不合格、安全不达标,立即终止合作,绝不将就。2常见风险的前置应对针对物理损坏风险,我们提前备有专用的档案修复设备和数据恢复工具,一旦出现纸质损坏、硬盘坏道,第一时间开展修复;针对网络入侵风险,我们的主数据库物理隔离公共网络,外部访问必须通过专用加密VPN,配备入侵检测系统,发现异常访问立即断网;针对人员违规操作风险,我们提前明确了违规的处罚标准,发现违规立即回收权限,追究责任。223.1分级响应机制3.1分级响应机制我们将安全事件分为三级:一般事件(小范围数据存储异常,不涉及泄露),由数据管理员团队处置,事后上报单位安全部门;较大事件(存在泄露风险,涉及人数不足百人),立即上报单位安全部门和伦理委员会,启动排查;重大事件(发生明确泄露,涉及人数百人以上),立即上报监管部门,按要求通知受影响的受访者,配合开展处置。233.2事后复盘整改机制3.2事后复盘整改机制任何安全事件,不管大小,处置完成后都要做全员复盘,找到管理漏洞,更新规范要求。2017年我们曾经发生过一起事件:一个年轻博士生为了方便在家处理数据,私自把去标识化的课题数据拷到了个人笔记本电脑,结果电脑在地铁被盗,我们确认数据没有直接标识符,不会定位到具体个人,没有造成泄露,但是这件事给我们提了醒,之后我们立刻更新了规定:所有去标识化以上级别的数据都必须存储在单位加密服务器,严禁下载到个人终端,从那之后再也没有发生过类似事件。所有的规范和机制,最终都要落到责任主体上,完善的责任与合规体系,是26年随访数据安全的根本保障。241.1首席负责人总责制1.1首席负责人总责制队列研究的首席科学家是数据安全第一责任人,对整个队列的数据安全负总责,负责审批重大安全管理事项,落实安全管理资源。251.2专职管理员直接负责制1.2专职管理员直接负责制两名专职数据管理员是直接责任人,负责日常安全管理、巡检、维护所有流程,对每一个环节的安全负责。261.3接触人员一岗一责制1.3接触人员一岗一责制所有接触数据的研究人员、学生,对自己使用的数据安全负直接责任,签字确认安全要求,出了问题可以直接溯源到人。271.4伦理委员会独立监督制1.4伦理委员会独立监督制本队列的伦理监督委员会每年对数据安全做一次独立审查,对存在的问题提出整改要求,不依附于研究团队,保障监督的独立性。2全流程合规要求我们严格对照国家法律法规更新规范,先后落实了《数据安全法》《个人信息保护法》《医疗卫生机构网络安全管理办法》的相关要求,2021年《个人信息保护法》出台后,我们用了三个月时间重新梳理了所有知情同意书,更新了脱敏规则,确保全流程符合法律要求;同时严格遵守流行病学研究的伦理规范,始终把受访者权益放在第一位,所有安全管理都以保护受访者权益为前提。总结回顾整套26年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论