卫生统计学与大数据_第1页
卫生统计学与大数据_第2页
卫生统计学与大数据_第3页
卫生统计学与大数据_第4页
卫生统计学与大数据_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学与“大数据”时代,于石成2012.09.10,绪论资料的收集资料的存贮管理资料的统计分析迎接“大数据”时代的挑战,提纲:,一、绪论,资讯革命资讯工具、硬件、软件个人电脑、互联网、云计算大量数据公开于大众的时代大数据战略-大数据及其分析将在未来10年改变每一个行业的业务功能Singapore德勤数据分析研究所(DAI)GE全球软件和分析中心(旧金山湾,400名数据科学家),数据科学家(DataScientist)收集和开发特定的软件管理大规模并行服务器产生的结构化和非结构化数据选定分析软件数据挖掘数据可视化展示,最小数据集1973年国家生命健康统计委员会(NCVHS)1975年美国医院协会(AHA)-统一账单委员会国家的管理层面对某个业务管理领域强制收集数据指标不同组织和机构之间的信息交流1980年管理信息系统的兴起,大数据和“大数据”时代不同组织和机构之间的信息交流1980年管理信息系统的兴起,1.信息系统收集数据(1)传染病与突发公共卫生事件监测信息系统(2)传染病公共卫生实验室监测信息系统(3)慢性非传染性疾病监测与信息管理系统(4)健康危险因素监测与风险评估信息系统(5)预防接种信息系统(6)生命登记信息系统(7)疾病预防控制绩效考核与爱国卫生信息系统(8)职业病网络直报信息系统2.数据的来源渠道多了,其内容大大地丰富3.数据有新的特点(1)时序性:同一个变量具有在时间上的连续性(2)来自不同系统采集的数据之间的的整合、关联和综合分析,二、资料的收集,Internet,国家级平台Intranet,省级平台Intranet,地市级平台Intranet,调制解调器,县区级工作站,乡镇卫生院,网络电话,PC工作站,PSTN,DDN,DDN,五级网络三级平台,纵向到底,安全隧道(VPN),国家传染病网络直报系统,4.数据量的无限膨胀从有限数据到海量数据的积累大数据。,管理数据库,常规工作的积累:没有抽样设计和数据的质量问题。这是我们处理管理数据库面临的新挑战。,实时存储-信息系统每时每刻实时收集着各种类型的数据。存贮方式-从集中式存贮到分布式的存贮,“逻辑上统一,物理上分布”。异地备份容灾中心,三、资料的存贮管理,(一)用户的需求改变了管理需求增加:决策者更依赖于利用数据、信息来做决策;疾病预防控制:疾病的发生发展做预测、卫生应急和突发事件的预报预警要求;监测与评估:在执行项目中,经常需要对项目的实施质量进行跟踪,就要采集项目实施的数据(监测)进行阶段性分析或终末分析(评估)。,四、统计分析的新挑战,(二)信息系统采集数据带来的问题:缺少数据收集中的正规设计;缺少数据收集的质量控制:数据缺失、错误存在。网络报告的数据,漏报(指报告不完整)、缺失(指报告的项目填写不完全)、错误存在。怎么从有偏性的样本推断总体?,(三)连续动态资料的分析,五、迎接“大数据”时代的挑战,从数据到知识:决策支持系统和商业智能(一系列以事实为支持、辅助商业决策的技术和方法)数据仓库:是一个面向主题、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理中的决策制定。联机分析(OnlineAnalyticalProcessing):将分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论