智能基础医学 7_第1页
智能基础医学 7_第2页
智能基础医学 7_第3页
智能基础医学 7_第4页
智能基础医学 7_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能医学概论第4章医疗大数据分析导学内容与要求掌握大数据技术的概述:大数据的基本概念、医疗大数据的概念、医疗大数据主要来源和基本特征、大数据的处理流程、大数据的数据格式。掌握大数据分析的概念及技术:大数据分析概念、大数据分析的五个方面、大数据分析的主要技术。了解大数据分析平台:Hadoop、Spark、Storm、ApacheDrill。了解医疗大数据应用案例、医疗大数据发展趋势。4.1

|大数据技术概述4.1.1大数据的基本概念大数据(BigData)通俗的讲就是指目前人类可以认知的全部数据。其中所涉及的资料量规模巨大,已无法通过目前主流软件工具,获取、管理、处理、并整理成为帮助企业经营决策的资讯。大数据不是数量上的堆砌,而是具有很强的关联性结构性。IDC和EMC联合发布的“2020年的数字宇宙”报告预测到2020年,全球数字宇宙将会膨胀到40ZB,均摊每个人身上是5200GB以上。这是一个什么概念?1ZB=1024EB1EB=1024PB1PB=1024TB1TB=1024GB4.1

|大数据技术概述4.1.2医疗大数据的概念医疗大数据:是医生对患者诊疗过程产生的数据总和,包括患者基本数据、电子病历、诊疗数据、医学影像数据、医学管理、经济数据、医疗设备和仪器数据等。简言之,留存于医疗卫生领域的大数据,都称为医疗大数据。4.1

|大数据技术概述4.1.3医疗大数据的主要来源产生于医院常规临床诊治、科研和管理过程的数据,包括各种门/急诊记录、住院记录、影像记录、实验室记录、用药记录、手术记录、随访记录和医疗保险数据等,具有数据量庞大、产生速度快、数据结构复杂和价值密度低等典型大数据的特征。1.医疗大数据服务平台汇集整合了区域内很多家医院和相关医疗机构的医疗健康数据2.服务平台医疗健康大数据除了原生态医疗大数据以外,另有一些医疗健康大数据来自于专门设计的基于大量人群的医学研究或疾病监测。3.医学研究或疾病监测的大数据自我量化数据包含了血压、心跳、血糖、呼吸、睡眠、体育锻炼等信息4.自我量化大数据互联网上与医学相关的各种数据,产生于社交互联网关于疾病、健康或寻医的话题、互联网上购药行为、健康网站访问行为等。5.网络大数据生物大数据具有很强的生物专业性,主要是关于生物标本和基因测序信息的数据,其中组学大数据是重要的内容。6.生物大数据4.1

|大数据技术概述4.1.4大数据的处理流程大数据的处理流程可以定义为在适合工具的辅助下,对不同结构的数据源进行汲取和集成,并将结果按照一定的标准统一存储,再利用合适的数据分析技术对其进行分析,最后从中提取有益的知识并利用恰当的方式将结果展示给终端前的用户(可视化)。大数据处理的基本流程图分布式并行处理运算示意图4.1

|大数据技术概述4.1.5大数据的数据格式数据格式特性ABC结构化信息半结构化信息非结构化信息从IT角度来看,信息结构类型大致经历了三个阶段。必须注意的是,旧的阶段仍在不断发展,如关系数据库的使用。因此三种数据结构类型一直存在,只是在不同阶段,其中一种结构类型主导其他结构,被主导数据不被认识和无法处理。4.1

|大数据技术概述4.1.6医疗大数据的基本特征01020304Volume数据量大Variety多样性Value数据价值密度化Velocity速度快,时效高On-Line数据是在线的大数据呈现出“4V1O”的特征:4.2

|大数据分析简介4.2.1大数据分析大数据分析:大数据分析是指对规模巨大的数据进行分析,是一组能够高效存储和处理海量数据、并有效达成多种分析目标的工具及技术的集合大数据分析流程:4.2

|大数据分析简介4.2.2大数据分析的主要方面预测性分析可视化分析

大数据挖掘算法语义引擎数据质量和数据管理麻省理工学院创建了一个计算机预测模型来预测心脏病发生健康日报发行量数据可视化社区卫生服务站分布位置可视化4.3

|大数据分析的主要技术4.3.1深度学习1.深度学习的概念深度学习是一种源于神经网络理论,模拟人脑的机制进行分析学习、解释数据的机器学习技术。2、深度学习的应用:在语音、图像、自然语言理解及医疗诊疗等领域有一系列进展。自然语言理解类辅助诊断机器人Watson人脸识别判断年龄4.3

|大数据分析的主要技术4.3.2知识计算1.知识计算的概念

知识计算是从大数据中首先获得有价值的知识,并对其进行进一步深入的计算和分析的过程,也就是要对数据进行高端的分析,需要从大数据中先抽取出有价值的知识,并把它构建成可支持查询、分析与计算的知识库。2.知识计算的应用:构建知识库、构建知识图谱心房颤动知识图谱心肌炎知识图谱4.4

|大数据分析平台ApacheDrillStormHadoopSparkHadoop是一个能够对大量数据进行分布式处理的软件框架,是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。SparkSpark是一个基于内存计算的开源集群计算系统,目的是更快速的进行数据分析。Storm是一种开源软件,一个分布式、容错的实时计算系统。Storm可以非常可靠的处理庞大的数据流,用于处理Hadoop的批量数据。ApacheDrill为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会发起了一项名为Drill的开源项目。4.5

|医疗大数据应用案例4.5.1临床操作领域应用案例—IBMWatson信息管理系统大数据分析技术将使临床决策支持系统更加智能化,可以为医生提出更有效的诊疗建议,使医疗过程中大部分的工作由护士和助理医生完成,从而提高治疗效率。IBMWatson训练过程第一阶段将290多篇的高等级医学期刊文献和医疗指南、该中心所属医院一百多年临床实践中的最佳方案输入Watson第二阶段由医生给出患者的指标以及他们认为最权威的治疗方案,让Watson去理解两者之间的关系第三阶段由医生给出指标,由Watson对该指标进行病情判断,再由医生评判Watson的实际能力4.5

|医疗大数据应用案例4.5.2医药及支付领域应用案例—PDMP医学大数据分析不仅可以自动保护患者的信息,还可以自动挽救患者的生命。在PDMP(处方药监控项目)指导下指导患者用药过程4.5

|医疗大数据应用案例4.5.3医疗研发领域应用案例—百度疾病预测模型在医疗研发方面,百度通过搜索数据,构建出了疾病预测模型。流行病的发生和传染都具有一定的规律性,这些规律与气候变化、人口流动以及环境指数等因素都有十分密切的关系。百度上线的“疾病预测”产品可以结合网民搜索的大量流行病信息以及疾病爆发的规律性,实时提供多种流行病的发病指数。通过将这些信息进行汇聚从而形成了一定的统计规律,经过一定时间的积累,可以形成多种预测模型,从而预测未来疾病的活跃指数。4.5

|医疗大数据应用案例4.5.4新的医疗商业模式应用案例—网络平台和社区网络平台是一个潜在的、由大数据启动的商业模型,大量有价值的数据已经在这些平台产生。因此,这些网络互动信息平台是最好的医疗大数据来源。好大夫在线作为互联网医疗平台已经在线上诊疗、电子处方、会诊转诊、家庭医生、图文咨询、电话咨询等多个领域取得领先地位。4.6

|医疗大数据发展趋势1.行业大数据在临床诊断、远程监控、药品研发等领域发挥重要作用2.医疗云平台建设步伐加快3.医疗大数据来源多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论