《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》_第1页
《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》_第2页
《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》_第3页
《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》_第4页
《心血管疾病与肿瘤疾病中西医临床大数据分析与应用研究》_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,心血管疾病与肿瘤疾病中西医临床大数据处理分析与应用研究,国家高技术研究发展计划(863计划),汇报提纲,一、目标与任务二、课题主要技术路线三、课题任务的支撑条件四、课题年度计划五、课题组织实施六、课题预算,一、目标与任务,提高两类重大疾病的临床服务能力和水平促进中医药源于临床、回归临床的循证医学研究提高中医药在人类健康保障的贡献度,心血管及肿瘤疾病是危害人类健康的主要疾病,中国拥有这两类疾病大量的临床数据。利用大数据处理、存储和分析技术,探索符合中国实际的临床诊疗模式与规律,对两类重大疾病的防治有重大意义。在我国,中医药是贯穿心血管与肿瘤疾病诊治全过程的重要组成部分,对这两类疾病的诊治研究如果缺少了中医药数据将是不完整的。,中医药是治疗两类重大疾病重要组成部分,中医药参与度高,普遍为国民接受强调个性化的辨证论治,难以获得可重复的疗效评价规律病历数据标准化与结构化程度较低,分析和研究中西医临床大数据的必要性,2014年3月上海市级医院心血管和肿瘤疾病的诊疗情况,基于区域大数据分析和研究的必要性,现行就医模式下,两类疾病患者的就医随机分散在各大医院任何一家医院的信息都是局部或不完整的只有区域性的数据中心才能提供完整的诊疗数据,心血管疾病,肿瘤疾病,建立上海中医临床数据中心,临床大数据关键技术研究,搭建临床大数据平台,研发上海市心血管及肿瘤疾病中西医临床在线辅助决策支持系统,大数据分析与应用研究,心力衰竭大肠癌,中西医知识库及应用研究,二、课题主要技术路线,建立包含医联中心和四家中医院数据的中医临床数据中心。利用大数据关键技术搭建大数据平台,为大数据分析与应用和知识库构建提供数据支撑。通过结构化知识库的构建,向医疗专业用户提供有价值的反馈。,疗效评价的复杂性问题中医药疗效的贡献问题,诊疗方案的可推广性问题,管理决策缺乏数据支持,全国临床大数据不多上海已经形成了区域临床大数据,但是缺乏病历文本数据,清洗病历数据结构化程度低,大数据平台大数据挖掘算法并行化语义化知识库,政府,数据整合,数据分析,数据处理,临床决策,临床研究,技术方面,应用方面,临床大数据挖掘技术研究及算法并行化改造技术,面向临床大数据,利用并行化改造后的分类、聚类、回归、关联等数据挖掘技术,将支持向量机模型、向量空间模型、Logistic回归模型以及Cox比例风险等用于进行两类疾病的病例分类、疾病相似度匹配、疾病诊疗方案聚类、疾病转归影响因素分析。,面向中医诊疗效果评价的Cox比例风险模型,面向疾病转归分析的多元Logistic回归方程模型,基于粗糙集的疾病特征相似度匹配,临床数据挖掘算法,基于遗传算法的生命周期症状监测模型,基于聚类分析的慢性病种诊疗方案,慢性病跟踪预测模型,常用的数据挖掘算法,分类分析聚类分析关键词搜索序列分析关联分析预测分析偏差分析遗传算法粗糙集方法,1、临床大数据关键技术研究,利用临床观测大数据,基于RCM(罗宾因果模型),采用多元Logistic回归,构建影响因素的倾向性得分,以“控制”混杂变量,达到满足非混杂假定,进行因果性推断;在此基础上,将生存分析统计方法应用于大数据临床数据,对比研究中、西医不同诊疗手段的诊疗效果;进而发展新的适用于大数据分析的新的统计方法。,临床大数据挖掘技术研究及算法并行化改造技术,词汇二义性,临床文本分析技术病历结构化的必要性,传统非结构化病历数据,只能通过文本匹配来进行查询,无法理解相同文字但不同含义的词汇,关联查询,无法精确切分查询词,理解查询意图,临床文本分析技术基于实体链接算法的实体抽取,临床文本分析技术基于病历文本的病情正负面分析,临床文本分析技术病历结构化表示示意图,【主诉】两周内便血2次【现病史】患者2周前无明显诱因下出现大便带鲜红色液体2次,无肛门口异物感,肛门口无突出物,大便色黄,无粘胨脓液,无恶心呕吐,无胃寒发热,无尿频尿急尿痛血尿,无腹痛腹泻里急后重,至我院门诊查肠镜示“距肛9-12cm见一浸润性肿块,累及近2/3肠腔-直肠癌”,今为进一步诊治,门诊拟“直肠癌”收入我科”3.矛以西力欣、圣诺安抗感染、巴曲亭、捷凝止血,耐信制酸,潘金南、卫美佳、培尔吉、乐凡命、血必净、天晴宁、力能、氯化钾等营养支持,环磷酰苷营养细胞,开顺化痰,贝科能保肝,甲硫氨酸维B1保肝治疗,托烷司琼止吐治疗,丙帕他莫止痛。,临床文本分析技术基于时间线索的临床路径分析,研究临床大数据整合、存储、处理与挖掘技术,搭建临床大数据平台,2、搭建临床大数据平台,利用ApacheSqoop实现医联中心关系型数据库和临床大数据平台之间的数据整合利用列式存储技术实现数据格式的灵活扩充与调整,探索分布式数据管理平台的性能优化构建基于内存的临床大数据高速计算与分析引擎,实现数据查询和算法性能等方面优化在分布式引擎上,实现临床数据挖掘算法,3、建立上海市中医临床数据中心,在医联中心数据基础上,补充采集4家三级中医医院中医诊疗信息,建立上海市中医临床数据中心2013年全市4家三级中医医院共诊治:门诊病人903万人次住院病人13万人次,建设整合中西医诊疗过程的临床数据中心:,-实现上海市中、西医数据中心的整合,临床数据中心数据处理流程,3、建立上海市中医临床数据中心,数据抽取采集:将接口要求的业务数据从医院数据库迁移到前置机的整合库中,保证来自于同一个系统的业务明细子表数据能与业务主表关联。数据整合处理:初步整合“整合库”中的数据,并写入上传库。传输交换处理:将前置端上传库中的数据完整地迁移到中心端暂存库。迁移完成后,交换处理过程将清空前置端上传库中的数据,并将其转移到备份库。整合入库处理:校验并整合中心端暂存库中数据,主要处理内容:将所有数据导入业务诊疗库,清空中心端暂存库,写入备份库。,4、心血管和肿瘤疾病中西医知识库及应用研究,依托国家标准和行业规范,整合规范教材和经典案例构建知识库通过编辑界面允许专家审核修改或扩充知识库通过应用接口提供查询、检索相关知识,辅助决策支持等功能,知识库查询应用示意图,语义知识库技术架构基础知识库,以医联网结构化数据、国家标准为基础,使用D2R映射以及文本抽取等方式构建中西医基础知识库,利用众包编辑扩充知识库。使用图数据库以更好地表达与扩充概念之间的关联。利用本体推理引擎自动检测数据之间的不一致性。经过人工协作编辑、核对、审批,形成检验的知识库。使用基于自然语言的语义检索,完成问答式查询。,基于临床病例,通过信息抽取和语义标注技术生成中西医病例库病例库将包含家族史、病史、入院原因、用药、手术情况等,并记录病情与手术、用药之间的关联。支持病例语义查询:如早期具有某种症状的病人,或是与特定病例最相似的病例,语义知识库技术架构病例库,临床语义知识库检索预期结果,临床语义知识库的优势:,根据自然语言检索词,定位具体的属性和语义上的推理查询,返回精确的查询结果,5、心血管和肿瘤疾病的大数据分析与应用研究,上海市心血管和肿瘤疾病的发病及治疗总体情况研究体现中医药特色的心血管及肿瘤疾病的疗效评价研究心力衰竭及大肠癌病种的病例知识库建立及应用研究,对大数据进行分析和应用研究,包括3个方面:,基于预后评估、治疗与安全性监测等,分析研究符合中国实际的诊疗方案。基于终点事件,分析研究不同诊治方案及中医药参与的疗效评价。基于流行病学、卫生经济学评估等,为管理决策提供大数据证据。,5、心血管和肿瘤疾病的大数据分析与应用研究,6、研发上海市心血管及肿瘤疾病中西医临床在线辅助决策支持系统,通过临床决策支持引擎,帮助医护人员及时做出临床决策。推荐符合中医辨证论治规律的、遵循现代医学诊治规范的诊疗方案。覆盖38家三级医院的10000余台联网医生工作站。,研发中西医临床在线辅助决策支持系统:,-以心力衰竭和大肠癌为实例进行验证,建成两类疾病的临床病例库,病例库包含医联以及四家中医院心血管与肿瘤方面的主要病例。,建成两类疾病的中医临床知识库,兼容中医95与97两个标准,包含疾病、证候、诊治规则与处方等,数据表示支持OWL/RDF标准。,开发5类重大疾病相关模型,包括风险调查与数据评估模型、治疗与用药安全性监测模型、预后评估模型、卫生经济学评估模型、中医“证-治-效”评价模型。,建立肿瘤与心血管重大疾病大数据标准与质量体系。,1,2,3,4,5,建立1000万级人群,150TB数据量的中西医临床数据中心。,申请国家发明专利和软件著作权10项。发表论文30篇,其中SCI收录10篇。培养2名学术带头人,形成1个临床大数据分析团队,包含博士5名,硕士15名以上。,6,8,9,7,建立临床大数据处理平台1)完成医疗大数据处理及隐私保护脱敏共性技术支撑框架的研发;2)实现面向肿瘤及心血管疾病的多来源异构异质数据的接入、集成整合及分布式存储;3)实现大数据统一元数据管理及基于Hadoop的SQL访问引擎。4)实现面向心血管及肿瘤中西医结合大数据挖掘专业算法构建及核心分析运行系统。,10,首次对两类重大疾病进行1000万级病人临床数据的分析研究,首创从大数据角度研究中医药的“证治效”评价体系,首次建立区域性的临床在线辅助决策支持系统,首创面向临床的中西医大数据平台,采用基于临床数据的知识库(半)自动生成技术和基于知识库的语义标注技术,三、课题任务的支撑条件,负责制定WHOICD-11传统医学国际疾病分类标准承担国家863项目“综合性中医院信息系统研发与示范”,上海中医药大学附属曙光医院是国际标准化组织传统医学标准化技术委员会(ISOTC249)秘书处的依托单位,在中医药学的规范化、标准化方面发挥重要的作用,病案分析视图,病案检索视图,上海申康医院发展中心的医联工程项目连接了38家三级甲等医疗机构,已经建立3900万人的个人诊疗档案库。内容包括患者基本信息、处方、检验检查报告、影像、病案首页、出院小结,其中检查可调阅的诊疗记录达到了2.5亿条,处方明细20亿条,各类检验报告6000万份、病案250万份。是国内规模最大的区域医疗信息系统,项目团队主要研究大数据平台、模型与算法,搭建大数据挖掘环境,形成了较为成熟的平台、软件与大数据挖掘方法论。成果已经在医联大数据平台进行了尝试,初步实现了医联大数据的监控、处理和分析挖掘。,大数据平台监控系统,高血压疾病关联分析,将电子病历转换为一个图数据,郑XX:女,49岁,医保,上海曙光医院,床号:0903,门诊号:06289170,住院号:00367285,主任医生:梁延平,主治医生:沈秀英,住院医生:何嫣,入院诊断:,诊疗经过:患者入院后完善相关检查,予息隐米索扩宫颈,于2011.1.13在宫腔镜检查+定位取环术。HSC下见:子宫内膜轻度肥厚增生,光泽正常。宫底部一环影,部分嵌顿于子宫内膜中。两侧输卵管开口正常。定位取出一园环,完整。手术顺利,术中出血少。术后抗炎治疗。,出院情况:少量阴道流血,无腹痛、腹胀。体温正常。,出院医嘱:1.门诊随访。,转换,对不同的中文数据源进行合并,组成统一的知识库。共有621万实例,73万类别,上亿的事实。成果在ISWC以及SCI期刊上发表。其中用到的文本结构化技术与本项目相关。,获得奖项:2013年国家科技进步奖二等奖2011年上海市科学技术奖一等奖2011年中国医院协会科技创新奖一等奖2010年中国国际工业博览会银奖(计算机类最高奖项)2008年区域信息平台方案获得卫生部评比一等奖2008年上海市信息化优秀应用成果奖2011年获得科技部十一五支撑计划优秀项目团队,项目团队在临床大数据平台架构研究和应用中取得了丰硕的成果,其中“医联工程区域医疗信息共享及协同服务系统研发与规模应用”,获得2013年度国家科技进步奖二等奖。,上海中医药大学附属曙光医院-科技部和上海市(部市)共建研究型中医医院国家教育部重点学科3个国家中医药管理局重点专科专病7个国家中医药管理局中医药科研三级实验室5个上海市中医药研究院研究所4个目前承担国家863计划1项、国家科技重大专项7项,国有资产投资管理运营的责任主体和政府办医的责任主体医联数据中心覆盖上海市38家三级医院、8个区、3900万就诊人群涉及就诊记录2.5亿条,形成国内最大的临床数据库获得2013年度国家科技进步奖二等奖,“国家卫生信息共享技术及应用工程技术研究中心”依托单位国家发改委高新技术产业化示范工程企业国家863计划成果产业化基地上海大数据产业技术创新战略联盟理事长单位承建上海市健康信息网(市-区两级健康档案信息平台)、上海市医联工程、上海市公共卫生信息系统、上海市医疗保险信息系统,“985优势学科创新平台”大学国家“211工程”重点建设大学信息学院承担国家863计划、国家“973”项目多项信息学院获国家科技进步二等奖2项,上海申康医院发展中心,万达信息股份有限公司,华东理工大学,国家首批建立的四所中医药高等院校之一,上海市高校中唯一一所医科类重点特色院校。现有国家重点学科6个,数量居全国中医院校第二、上海地方高校之首。在2012年的国家一级学科评估中,中药学一级学科排名全国第一,中医学一级学科排名全国第二,中西医结合一级学科排名全国第三。,中医医院医疗质量监测中心,全国中医医院医疗质量监测中心隶属于国家中医药管理局,委托上海中医药大学组建,依托曙光医院建设及管理。中心拥有庞大的监测网络,拥有庞大的数据资源,也是国家中医药管理局中医医疗服务评估重点研究室的重要组成部分。中心定时采集全国2000家二级以上中医医院病案信息,有效数据超过700万份。作为依托单位的上海中医药大学附属曙光医院能利用中心的数据对本课题的数据源进行有效的分析。,上海市疾病预防控制中心是实施上海市政府卫生防病职能的专业机构。作为上海市公共卫生信息化建设和管理的责任单位,牵头承担上海市健康信息网工程的疾控信息化项目,建立了基于电子健康档案的常住人口的疾病管理、死亡登记、流行病学管理等六个业务信息系统。本课题可以利用上海疾控中心心血管、肿瘤、死因数据开展相关辅助研究。,上海市疾病预防控制中心,在医疗知识库构建和语义技术方面,和国外一流科研机构保持交流和合作关系:斯坦福医学院的TaniaTudorache研究员负责扩展世界著名本体编辑器Protg来支持ICD11疾病术语库的构建。欧洲科学院院士FrankVanHarmelen负责了欧盟第7框架重大项目LARKC以及后续的OpenPhacts项目,完成了开放链接生物科学数据(linkedlifescience)的发布以及用药安全管理和临床指南语义理解等。,国外科研机构,HL7China,HL7China中国委员会是HL7组织的国际会员之一,是唯一代表中国国家参与“HL7International”活动的成员。本次研究需要建立心血管疾病与肿瘤疾病大数据相关标准,不仅在国内,在国际上也没有系统的研究成果。万达信息和工程中心作为HL7China理事单位和副主席,通过HL7China开展相关国际合作研究。,中国卫生信息学会卫生信息标准专业委员会是跨部门、跨行业、开展卫生信息标准化相关活动的专业性、全国性学术团体,是中国卫生信息学会下属的二级学会,由从事卫生信息标准及其相关领域工作的单位和个人自愿结成。本次研究需要建立心血管疾病与肿瘤疾病大数据相关标准。万达信息和工程中心作为中国卫生信息学会理事单位,将在专委会指导下,开展相关研究工作,并纳入卫生行业标准的规划和程序。,中国卫生信息学会卫生信息标准专委会,四、课题年度计划(包括每年任务指标和进度安排),建立中医临床数据中心建立肿瘤与心血管重大疾病大数据标准与质量体系面向病历文本的自然语言标签算法,以及基于标签的混合语义搜索算法初步完成中医重大疾病知识库构建技术,完成基础知识库搭建基于已经收集的电子病历数据,研究中医重大疾病知识发现技术,初步实现部分大数据挖掘并行算法开展心血管疾病和肿瘤疾病这两种重大疾病的发病及治疗总体情况研究开展中医在心血管疾病和肿瘤疾病这两种重大疾病的疗效分析研究,1月6月,开展心血管和肿瘤疾病诊疗应用及临床研究需求调研,完成相应应用分析技术指标的制定;中医临床数据调研和分析;完成心血管和肿瘤疾病大数据采集的技术研究;相应疾病数据采集标准化定义与数据接口规范制定;建立相应大数据存储架构模型,实现支持大数据快速访问、索引查询等功能。,7月12月,需求调研、临床分析、技术攻关、架构设计阶段:,年度任务指标:建立临床数据中心,两类疾病的中医临床知识库,重大疾病大数据标准与质量体系,申报软件著作权2项,论文6篇,搭建心血管和肿瘤疾病大数据平台;形成病历结构化软件包,提供可配置的人机界面;形成医疗大数据挖掘软件算法包;从应用的角度挖掘中西医最优治疗路径,研发中西医临床数据分析系统,形成诊疗知识库;搭建数据查询和可视化系统,针对中西医临床数据,形成相应挖掘结果的展示平台。,1月6月,基于标签算法,进一步形成病历结构化算法与结构化语义搜索算法;大数据挖掘并行算法在Hadoop/Spark平台上测试与优化;建立心血管和肿瘤疾病相关病例知识库;研究临床诊疗辅助决策系统的建模方法,搭建相应模型库;,7月12月,临床分析、系统研发、系统集成阶段:,年度任务指标:完成两类疾病的临床病例库,开发重大疾病相关模型,建立临床大数据处理平台,申报软件著作权3项,论文10篇,汇总各子课题组的数据,包括知识及模型等;组织申报申请专利和科技进步奖励;将数据、模型及算法汇总,形成科技论文,完成结题报告。,1月6月,完整建立在线临床诊疗辅助决策系统;基于大数据平台和相应软件系统,开展心血管和肿瘤疾病的辅助诊疗等应用示范。,7月12月,应用示范和课题总结阶段:,年度任务指标:建立在线辅助决策支持系统,申报国家发明专利2项,软件著作权5项,论文14篇,应用系统集成,成果总结,五、课题组织实施方式、参与单位任务分工情况,研究团队以中青年优秀人才为骨干,在医学临床和基础研究

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论