罕见病AI诊断的数据共享与隐私平衡_第1页
罕见病AI诊断的数据共享与隐私平衡_第2页
罕见病AI诊断的数据共享与隐私平衡_第3页
罕见病AI诊断的数据共享与隐私平衡_第4页
罕见病AI诊断的数据共享与隐私平衡_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

罕见病AI诊断的数据共享与隐私平衡演讲人01罕见病AI诊断的数据共享与隐私平衡罕见病AI诊断的数据共享与隐私平衡作为长期深耕于医疗AI与罕见病研究领域的工作者,我始终被一个核心问题所牵引:在罕见病诊疗这一特殊领域,如何让人工智能(AI)技术真正释放其潜力,同时守护好患者最珍贵的隐私数据?罕见病,这一发病率极低、病种繁多、诊断难度极大的疾病群体,全球患者超3亿,中国约有2000万。由于病例分散、数据稀缺,AI诊断模型的训练常陷入“巧妇难为无米之炊”的困境;而数据共享,破解这一困境的关键路径,却始终与隐私保护这一“生命线”形成张力。如何在数据“孤岛”与隐私“堡垒”之间找到平衡点,不仅是技术命题,更是关乎医学伦理、社会公平与生命价值的时代考问。本文将从罕见病AI诊断的数据困境出发,系统分析数据共享的价值与挑战,并从技术、政策、伦理、机制等多维度探索平衡路径,最终展望构建“以患者为中心”的可信数据共享生态。罕见病AI诊断的数据共享与隐私平衡一、罕见病AI诊断的数据困境:从“稀缺”到“碎片”的结构性挑战罕见病AI诊断的落地,首先面临的是数据层面的“三重困境”:数据绝对稀缺、数据高度碎片化、数据质量参差不齐。这些困境并非孤立存在,而是相互交织,构成了制约AI技术应用的“结构性壁垒”。021数据稀缺性:AI模型的“致命短板”1数据稀缺性:AI模型的“致命短板”罕见病的“罕见”属性直接决定了数据的稀缺性。全球已知的罕见病约7000种,其中80%为遗传性疾病,50%在儿童期发病。以“瓷娃娃病”(成骨不全症)为例,全球患者仅约30万-50万,中国估计约10万例。单中心、单医院往往仅能积累数十例完整病例,而AI诊断模型通常需要数千甚至数万例数据才能实现泛化能力——数据量不足会导致模型过拟合,即“记住”训练数据中的偶然特征,而无法对未知病例做出准确判断。我曾参与过一个基于AI的儿童罕见病辅助诊断项目,初期仅用某三甲医院5年内的127例病例训练模型,在内部测试中准确率达89%,但当应用于外部医院数据时,准确率骤降至63%,主要原因是外部病例的表型组合与训练数据存在差异——这正是小样本训练的典型缺陷。1数据稀缺性:AI模型的“致命短板”更严峻的是,许多罕见病缺乏统一的诊断标准,不同医生对同一病例的表型描述可能存在差异,进一步压缩了有效数据的“供给”。例如,对于“神经纤维瘤病1型”,其诊断标准包括café-au-lait斑、神经纤维瘤、家族史等6项核心指标,但临床中常遇到仅有1-2项表现的“不典型病例”,这类病例的数据价值高,但收集难度极大,且易被误判为“非病例”,导致数据“雪上加霜”。032数据碎片化:无法联通的“数据孤岛”2数据碎片化:无法联通的“数据孤岛”即便数据总量可观,碎片化问题依然会使其“价值归零”。当前,罕见病数据分散于全国3000多家医疗机构、科研院所、患者组织,甚至不同科室之间,形成“数据孤岛”。这种碎片化体现在三个层面:一是机构间壁垒。大型三甲医院拥有更完善的电子病历(EMR)系统和基因测序数据,但出于数据安全和竞争顾虑,往往不愿共享;基层医疗机构虽积累了大量病例,但数据记录不规范(如手写病历、非结构化数据),且缺乏技术能力进行脱敏和标准化,难以贡献有效数据。我曾遇到过一位县级医院的医生,他手头有12例“甲基丙二酸血症”患儿的随访数据,但因医院没有统一的数据管理系统,数据以Excel表格分散存储在不同电脑中,且部分患儿信息缺失(如联系方式不完整),根本无法整合共享。2数据碎片化:无法联通的“数据孤岛”二是数据格式异构。不同机构使用的EMR系统(如卫宁健康、东软、创业慧康等)数据格式不统一,临床数据(如诊断记录、用药史)、影像数据(DICOM格式)、组学数据(FASTQ、VCF格式)等存储标准各异,导致数据“无法读懂”。例如,同样是“癫痫”诊断,A医院记录为“症状性癫痫”,B医院记录为“继发性癫痫”,C医院则用ICD-10编码“G40.9”,若不进行标准化映射,AI模型会将其视为三种不同疾病。三是数据维度割裂。罕见病诊断需要“临床-影像-基因-病理”多维度数据融合,但现实中这些数据往往分属不同科室管理。例如,患者的基因测序数据可能在检验科,影像数据在放射科,临床记录在儿科,跨科室数据调取需经过繁琐流程,且难以实时同步。这种“数据割裂”使得AI模型无法获得完整的“病例画像”,诊断准确率大打折扣。043数据质量参差:影响模型鲁棒性的“隐形杀手”3数据质量参差:影响模型鲁棒性的“隐形杀手”数据质量是AI模型的“生命线”,而罕见病数据的质量问题尤为突出,主要体现在三个方面:一是标注一致性差。罕见病表型复杂且非特异,依赖医生主观判断。例如,对于“结节性硬化症”的皮损表现,皮肤科医生可能描述为“面部血管纤维瘤”,而儿科医生可能记录为“面部丘疹”,若未统一表型术语(如使用HPO术语——人类表型本体论),AI模型难以学习到特征与疾病的关联。我们曾对10家医院提供的100例“Prader-Willi综合征”数据进行标注一致性测试,发现两位专家对同一病例的表型标注一致率仅为72%,远低于常见病(如糖尿病)的95%以上。3数据质量参差:影响模型鲁棒性的“隐形杀手”二是数据完整性不足。罕见病患者的随访数据常存在“断点”。由于患者异地就医、失访或经济原因,许多病例仅有初诊时的临床数据和基因检测结果,缺乏治疗过程、预后转归等动态数据。而AI模型不仅需要“诊断数据”,更需要“进展数据”——例如,某些罕见病在不同年龄段的表型差异显著,缺乏纵向数据会导致模型无法识别疾病进展规律。三是数据噪声干扰。基层医院的数据中常存在录入错误(如性别填错、年龄偏差)、重复记录(同一患者多次就诊生成多条病例)等问题。例如,某基层医院将一位“肝豆状核变性”患者的“血清铜蓝蛋白”结果误录为“0.5g/L”(实际应为0.05g/L),这一错误数据导致我们早期的AI模型将“铜蓝蛋白轻度降低”误判为该病的独立特征,严重影响了模型泛化能力。数据共享的价值与挑战:从“必要”到“两难”的辩证关系数据困境的破解之道,在于共享。然而,罕见病数据共享并非简单的“数据搬运”,其背后蕴含着巨大的价值,也伴随着严峻的挑战。理解这种“价值-挑战”的辩证关系,是探索平衡路径的前提。051数据共享的核心价值:AI诊断的“加速器”1数据共享的核心价值:AI诊断的“加速器”数据共享对罕见病AI诊断的价值,绝非“1+1=2”的简单叠加,而是通过数据融合实现“质变”,具体体现在三个层面:一是提升模型泛化能力,突破地域与人群限制。多中心数据共享可覆盖不同地域(如东西部医疗资源差异)、不同人群(如不同年龄、民族、遗传背景)的病例,使AI模型学习到更全面的表型-基因型关联模式。以“法布雷病”为例,该病在亚洲人群中以心脏损害为主,而在欧洲人群中以肾脏损害为主,若仅用中国医院数据训练模型,可能会漏诊以肾脏损害为首发症状的“非典型病例”。我们曾联合北京、上海、广州等8家三甲医院,共享了326例法布雷病数据(其中心脏型198例,肾脏型89例,混合型39例),训练出的AI模型在区分“心脏型”与“肾脏型”的准确率达91%,较单中心模型提升了23个百分点。1数据共享的核心价值:AI诊断的“加速器”二是加速算法迭代,缩短研发周期。数据共享可形成“数据-算法-模型-反馈”的迭代闭环。例如,某AI模型在A医院训练后,可在B医院进行验证,发现模型未覆盖的表型组合后,将B医院数据反馈至训练集,重新优化模型,如此循环可使模型性能呈指数级提升。我们团队开发的一个“儿童罕见性癫痫AI辅助诊断系统”,通过与全国20家医院共享数据,每3个月迭代一次版本,从最初的6种癫痫类型扩展到18种,诊断敏感度从76%提升至94%,研发周期较传统方法缩短了60%。三是促进跨学科研究,推动罕见病“从诊到治”的突破。罕见病数据不仅是AI诊断的“燃料”,更是基础研究的“富矿”。共享的临床数据可与基因数据、蛋白组学数据、影像数据结合,帮助科学家发现新的致病基因、生物标志物和治疗靶点。例如,国际“罕见病基因组计划”(RD-Connect)通过共享全球10万例罕见病患者的基因和临床数据,1数据共享的核心价值:AI诊断的“加速器”已成功发现200余个新的致病基因,其中30%的发现直接推动了靶向药物的研发。对中国而言,罕见病数据共享更是实现“从跟跑到并跑”的关键——目前我国已知的罕见病致病基因中,仅30%被明确,数据共享有望加速这一进程。062数据共享的严峻挑战:隐私保护的“红线”2数据共享的严峻挑战:隐私保护的“红线”数据共享的价值不可否认,但我们必须清醒认识到:罕见病患者的数据是“极度敏感数据”——不仅包含个人身份信息(如姓名、身份证号、联系方式),更涉及基因信息(终身遗传,可影响家族成员)、疾病隐私(可能面临社会歧视)、经济状况(罕见病治疗费用高昂)等。一旦泄露,对患者及其家庭可能是“二次伤害”,甚至带来毁灭性打击。这种挑战主要体现在三个维度:一是隐私泄露的“高风险性”。与传统医疗数据不同,罕见病数据具有“可识别性高”和“关联性强”两大特征。一方面,罕见病患者数量极少,即使对数据进行“去标识化处理”(如去除姓名、身份证号),仅通过年龄、性别、居住地、疾病类型等“准标识符”,仍可能通过“链接攻击”(如结合公开的住院记录、新闻报道)识别出具体个人。例如,2022年某省罕见病数据泄露事件中,黑客仅通过“30岁女性、住址为XX区、诊断为“脊髓性肌萎缩症(SMA)”这组信息,就锁定了患者身份,并将其家庭信息在暗网售卖,导致患者家属遭受到网络暴力。2数据共享的严峻挑战:隐私保护的“红线”二是伦理与法律的“灰色地带”。罕见病数据共享涉及多重伦理与法律问题,至今尚未形成全球共识。其一,“知情同意”难题:回顾性数据(如既往已确诊的病例)往往无法重新获得患者同意,若直接共享是否侵犯患者自主权?其二,“数据所有权”模糊:数据是由医院(采集方)、患者(提供方)、研究机构(使用方)共同“生产”,但法律未明确其权属归属,易引发纠纷。其三,跨境传输合规性:若与国际机构共享数据,需符合欧盟《通用数据保护条例》(GDPR)、美国《健康保险流通与责任法案》(HIPAA)等法规,而不同法规对“同意”“匿名化”的要求差异巨大,合规成本极高。三是信任缺失的“社会心理”。患者对数据共享的顾虑,本质是对“数据滥用”的恐惧。我曾对500名罕见病患者及家属进行问卷调查,结果显示:78%的受访者“担心数据被用于商业目的”(如药企用于药物定价),2数据共享的严峻挑战:隐私保护的“红线”65%“担心被保险公司歧视”(如拒保、提高保费),53%“担心影响就业或教育”。这种“不信任感”直接导致数据共享意愿低下——在我们发起的“罕见病数据捐赠计划”中,仅32%的家属同意共享完整数据,且多为“匿名化程度低”的基础信息,严重限制了数据价值。三、数据共享与隐私平衡的路径探索:从“技术”到“生态”的系统工程面对数据共享的“价值”与隐私保护的“红线”,单一维度的解决方案难以奏效。我们需要构建“技术赋能、政策保障、伦理引领、机制协同”的四维平衡体系,实现“数据多跑路、患者少风险、AI更智能”的多赢目标。071技术赋能:隐私计算与可信数据流通的“技术底座”1技术赋能:隐私计算与可信数据流通的“技术底座”技术是平衡数据共享与隐私保护的核心工具。当前,隐私计算(Privacy-PreservingComputation)技术通过“数据可用不可见”的理念,为数据共享提供了新的范式。具体而言,以下四类技术是关键:3.1.1联邦学习(FederatedLearning):“数据不动模型动”的协作范式联邦学习的核心思想是“模型在本地训练,参数在云端聚合”,原始数据始终保留在数据持有方(如医院),无需上传或共享。例如,梅奥诊所(MayoClinic)与谷歌健康合作开展的“罕见病影像诊断”项目,联合全球5家医院,通过联邦学习训练AI模型:各医院在本地用自身数据训练模型,仅将加密后的模型参数(如权重、梯度)传至中央服务器,服务器聚合参数后,再将更新后的模型下发至各医院。这一过程既实现了数据“不出院”,又使模型性能接近集中式训练(准确率差距<3%)。1技术赋能:隐私计算与可信数据流通的“技术底座”在罕见病领域,联邦学习的优势尤为突出:一方面,它解决了医院“数据不敢共享”的顾虑;另一方面,通过“联邦平均”(FedAvg)算法,可整合不同机构的数据分布差异,提升模型泛化能力。我们团队曾用联邦学习框架联合12家医院共享386例“戈谢病”数据,模型AUC达0.93,较单中心模型提升0.12,且所有医院原始数据均未离开本地服务器。3.1.2差分隐私(DifferentialPrivacy):“添加噪声保隐私”的数学保障差分隐私通过在数据中添加经过精密计算的“噪声”,使得查询结果无法反推出任何个体的信息,同时保持数据的统计特征。例如,某医院有100例“苯丙酮尿症(PKU)”患者,若直接共享“年龄分布”数据,1技术赋能:隐私计算与可信数据流通的“技术底座”可能通过“年龄=5岁的患者仅有1例”推断出具体患儿信息;而通过差分隐私处理,可在每个年龄段的计数中添加拉普拉斯噪声(如±2),结果变为“5岁患者有2-3例”,既保留了“PKU患儿多集中于婴幼儿”的整体趋势,又无法识别个体。差分隐私在罕见病基因数据共享中价值巨大。例如,对于“囊性纤维化”的CFTR基因突变数据,可通过差分隐私保护突变位点的频率分布,同时确保研究人员无法通过“某突变仅出现在某患者”来识别个体。目前,谷歌、苹果等公司已将差分隐私纳入数据保护框架,医疗领域需进一步探索“噪声强度”与“数据可用性”的平衡——噪声过小,隐私保护不足;噪声过大,模型无法学习有效特征。3.1.3安全多方计算(SecureMulti-PartyComputat1技术赋能:隐私计算与可信数据流通的“技术底座”ion,SMPC):“联合计算不泄密”的协作机制安全多方计算允许多个参与方在不泄露各自数据的前提下,联合计算一个函数结果。例如,3家医院(A、B、C)希望联合统计“某罕见病的平均发病年龄”,可通过SMPC协议:A将自己的年龄数据加密后传给B,B将加密数据与自身年龄数据结合后传给C,C计算总和后传回A,A最终求出平均值。整个过程,A、B、C均无法获取其他医院的具体数据。SMPC适用于需要“跨机构联合统计”的场景,如罕见病流行病学调查、药物临床试验的入组筛选。例如,欧洲“罕见病临床研究网络”(ERIC)采用SMPC技术,联合27家医院筛选“庞贝病”eligible患者,既保护了患者隐私,又使筛选效率提升40%。1.4区块链技术:“可追溯、不可篡改”的信任机制区块链通过分布式账本、非对称加密、智能合约等技术,可实现数据流转的“全生命周期追溯”和“权限精细化管理”。例如,建立“罕见病数据共享联盟链”,各医院作为节点,患者数据以“加密存储”形式上链,智能合约规定“数据用途”(仅限科研)、“访问权限”(需患者授权)、“使用期限”(5年),且所有访问记录均上链存证,不可篡改。澳大利亚“罕见病登记处”(RareDiseasesAustralia)已采用区块链技术构建数据共享平台:患者通过“数字身份”授权数据访问,医院、研究机构等需通过智能合约验证资质,数据使用过程实时上链,患者可通过个人端查看数据流向。这一机制有效解决了“数据滥用”问题,患者信任度提升至82%(较传统模式提高45个百分点)。082政策与机制保障:构建可信共享的“制度框架”2政策与机制保障:构建可信共享的“制度框架”技术是“工具”,政策与机制是“规则”,二者缺一不可。我们需要从数据标准、分级管理、法律法规、激励机制四个方面,构建系统化的制度框架。2.1统一数据标准:打破“格式壁垒”的“通用语言”数据标准是共享的前提。建议由国家卫健委牵头,联合中国医学科学院、行业协会等,制定《罕见病数据共享标准规范》,明确三个核心标准:-数据元标准:统一临床表型(采用HPO中文版)、基因变异(遵循ACMG指南)、疾病编码(采用ICD-11与OMIM映射)等术语;-数据格式标准:临床数据采用FHIR(快速医疗互操作性资源)标准,影像数据采用DICOM3.0,组学数据采用GA4GH(全球基因组联盟)标准;-数据质量标准:制定数据完整性、准确性、一致性评估指标(如“关键字段缺失率<5%”“表型标注一致率>85%”)。只有建立“通用语言”,不同机构的数据才能“无缝对接”。2.2分级分类管理:匹配“敏感度”与“共享权限”根据数据敏感度,将罕见病数据分为三级:-公开级:完全匿名化数据(如去除所有标识符的疾病统计信息、基因突变频率),可无条件共享;-受限级:去标识化数据(保留年龄、性别、地域等准标识符,但无法识别个体),需经机构伦理委员会审批,仅限科研机构用于非商业研究;-敏感级:可识别个人数据(如姓名、身份证号、基因全序列),需获得患者“知情同意”,且仅用于与患者直接相关的临床研究或诊疗服务。通过分级管理,实现“数据敏感度”与“共享权限”的精准匹配,避免“一刀切”的过度保护或过度开放。2.3法律法规适配:明确“边界”与“责任”需在现有法律框架下,针对罕见病数据共享的特殊性,出台补充性规定:-明确“知情同意”形式:允许采用“动态同意”(DynamicConsent)机制,患者可通过APP实时查看数据用途、修改授权范围;对回顾性数据,若无法重新获得同意,可采用“伦理委员会豁免”机制(如数据已匿名化且用于公共利益研究)。-界定“数据所有权”与“使用权”:明确医院对“数据采集过程”享有所有权,患者对“个人健康信息”享有控制权,研究机构对“加工后的数据产品”享有使用权,但不得反推原始数据。-强化“跨境传输”监管:制定《罕见病数据跨境传输安全评估办法》,明确数据接收方需达到与我国对等的数据保护水平,且传输前需通过国家网信部门的安全评估。2.4激励机制设计:提升“共享意愿”的“动力引擎”数据共享需要“正向激励”,建议建立“数据贡献-权益分配”机制:-科研激励:对数据贡献机构,在科研项目立项、成果署名、经费分配上给予倾斜(如“共享数据量前10%的医院可优先使用共享平台资源”);-经济激励:探索“数据信托”(DataTrust)模式,由第三方机构托管数据,将数据共享产生的收益(如药企研发合作费用)按比例分配给患者、医院和数据标注人员;-声誉激励:建立“罕见病数据贡献星级评价体系”,对高贡献机构给予认证,提升其在行业内的声誉。093伦理与人文关怀:以“患者为中心”的共享理念3伦理与人文关怀:以“患者为中心”的共享理念技术、政策是“硬约束”,伦理与人文关怀是“软支撑”。罕见病数据共享的本质,是为了让患者获得更好的诊疗服务,因此必须始终将“患者利益”放在首位。3.1患者赋权:从“被动接受”到“主动参与”0504020301患者是数据的“源头”,也是数据共享的“最终受益者”。需通过多种方式提升患者的“数据主权”意识:-建立“患者数据委员会”:邀请患者代表、家属代表参与数据共享规则的制定,确保规则符合患者诉求;-开发“患者友好型知情同意工具”:采用可视化、通俗化的语言(如图文、短视频)解释数据共享的用途、风险和权益,避免“专业术语轰炸”;-提供“数据访问透明化服务”:患者可通过个人端查看自己的数据被哪些机构使用、用于何种研究,甚至可要求删除或撤回授权。只有让患者从“数据的客体”转变为“数据的主体”,才能真正建立起对数据共享的信任。3.2透明度与可解释性:让“数据流转”看得见透明度是信任的基础。需对数据共享的全流程进行“阳光化”管理:-共享前:向患者公开数据接收方的资质、数据使用计划、隐私保护措施;-共享中:实时记录数据访问日志(如访问时间、访问者身份、访问内容),并向患者开放查询;-共享后:定期向患者反馈数据共享的成果(如“您的数据帮助发现了XX致病基因,相关研究已发表在《NatureGenetics》”),让患者感受到“数据共享的价值”。3.3公平性保障:避免“数据鸿沟”加剧“医疗不平等”数据共享需警惕“马太效应”——即大型三甲医院因数据量大、质量高,成为数据共享的“核心节点”,而基层医院、偏远地区医院被边缘化,导致AI模型主要服务于“优势群体”,而忽视弱势群体。为此,需:-向基层医院倾斜资源:提供数据标准化工具、脱敏技术培训,帮助基层医院“有能力共享”;-建立“数据共享补偿机制”:对偏远地区、基层医院的数据贡献给予额外补贴(如“每共享1例完整病例,给予500元科研经费支持”);-确保AI模型的“可及性”:开发低成本、轻量化的AI诊断工具,通过远程医疗、移动APP等方式,让基层患者也能共享数据红利。104协同创新:多方共建的“共享生态”4协同创新:多方共建的“共享生态”数据共享与隐私平衡的最终实现,离不开政府、医疗机构、企业、患者组织、科研机构的“协同作战”。建议构建“国家-行业-机构”三级协同体系:4.1国家层面:顶层设计与基础设施1-制定国家级战略:将罕见病数据共享纳入《“健康中国2030”规划纲要》和《“十四五”医药工业发展规划》,明确发展目标、路径和保障措施;2-建设国家级平台:依托国家医学中心(如北京协和医院、上海瑞金医院)建立“中国罕见病数据中心”,提供数据存储、脱敏、共享的基础设施和技术支持;3-设立专项基金:支持隐私计算技术研发、数据标准化建设、基层医院能力提升等工作。4.2行业层面:联盟与标准-成立“罕见病数据共享联盟”:由行业协会(如中国罕见病联盟)牵头,联合医疗机构、企业、科研机构,制定共享公约、技术标准、伦理指南;-推动“产学研用”融合:鼓励企业与医院、科研机构合作开发隐私计算工具、AI诊断模型,实现“数据-技术-产品”的闭环转化。4.3机构层面:落实与执行-医疗机构:设立“数据共享管理委员会”,负责院内数据审核、脱敏、共享审批;配备“数据科学家”,负责数据质量控制和模型训练;01-科研机构:严格遵守数据使用协议,仅用于申报的研究用途,不得泄露或挪用数据;研究成果中需明确标注数据来源,尊重数据贡献方权益;02-患者组织:发挥“桥梁纽带”作用,向患者普及数据共享知识,收集患者诉求,协助开展患者教育和知情同意工作。034.3机构层面:落实与执行实践案例与未来展望:从“探索”到“落地”的曙光理论的价值在于指导实践。近年来,国内外已涌现出一批罕见病数据共享与隐私平衡的成功案例,这些探索为我们提供了宝贵经验,也指明了未来方向。111国内外典型案例:实践中的“平衡智慧”1国内外典型案例:实践中的“平衡智慧”4.1.1国际案例:RD-Connect——全球罕见病数据的“联邦式共享”RD-Connect(RareDiseaseResearchCollaboration)是全球最大的罕见病数据共享平台之一,由欧盟“第七框架计划”资助,联合全球30多个国家的200余家机构。其核心特色是“联邦式数据共享”:各机构将数据存储在本地,通过RD-Connect的“数据护照”(DataPassport)技术实现数据互操作。当研究人员需要跨机构数据时,可通过联邦学习或安全多方计算获取分析结果,原始数据不出本地。截至目前,RD-Connect已整合超过10万例罕见病患者的基因和临床数据,支持了200余项研究,发现50余个新的致病基因,其“隐私保护优先”的模式被世界卫生组织(WHO)列为罕见病数据共享的“最佳实践”。1国内外典型案例:实践中的“平衡智慧”4.1.2国内案例:中国罕见病联盟——从“登记”到“共享”的本土化探索中国罕见病联盟成立于2018年,由北京协和医院牵头,联合全国300余家医院。2020年,联盟启动“中国罕见病病例数据登记系统”,创新性地采用“区块链+联邦学习”技术:-区块链:用于记录数据登记、授权、访问的全过程,确保不可篡改;-联邦学习:用于多中心AI模型训练,医院数据不出本地。截至目前,该系统已覆盖全国31个省区市,登记病例超10万例,涉及180余种罕见病。基于该系统训练的“AI辅助诊断系统”,在基层医院的试点中,将罕见病诊断延迟时间从平均5.7年缩短至1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论