公共卫生统计学_第1页
公共卫生统计学_第2页
公共卫生统计学_第3页
公共卫生统计学_第4页
公共卫生统计学_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,公共卫生统计学,主讲人:楚基伟,.,第一节统计学概述一、统计学的概念和分类,统计学的概念统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。统计学的分类根据研究领域和研究对象,统计学可分为:数理统计、经济统计、生物统计、医学统计、卫生统计,.,公共卫生统计学的概念,公共卫生统计学(healthstatistics)是研究居民健康状况以及认识医学现象数量特征的重要工具,是运用概率论、数理统计的基本原理与方法,进行医学科研设计和资料的收集、整理、分析与推断的过程,它更侧重于协助人们对社会、人群健康问题的诊断,提出改进措施。包括:健康统计、卫生服务统计等。,.,二、统计学是如何诞生和发展的?,17世纪法国数学家Pierre-SimonLaplace(1749-1827)在研究概率数学是提到医学治疗是概率论应用的一个领域。Gauss(1777-1855)提出了正态分布。杰出的临床医学家Pierre-Charles(1787-1872)认为由概率论推导出的解析方法可帮助我们避免受假象的迷惑,获得良好的决断,并进行了许多医学研究。,.,LambertAdolphe,JacquesQuetelet(1796-1874)提出一个“平均人”的新概念。同一时期,Poisson将概率论应用于法庭判决估计,他利用“大数定律”构造了二项分布概率的99.5%置信区间。1834年伦敦统计学会的创办者们以“让别人丢弃”为座右铭,将统计学的目标定为数据收集。由于FrancisGalton爵士(1822-1911)与KarlPearson(1857-1936)等英国生物计量学派人物的努力,人们改变了对统计学的看法,统计学从一门简单的社会统计转变为应用数学的科学。,.,KarlPearson是现代统计学之父,开创了统计学方法,将描述性统计学变为推断性统计学,发展探索了生命统计的方法。1894年KarlPearson开设第一门统计学理论高级课程。KarlPearson的一篇论文被皇家学会拒绝,就与Galton,Weldon于1911年创办了Biometrika杂志。他的主要贡献是相关方法和2拟合优度检验。Greenwood是个医生,是KarlPearson的学生,与AlmorothWright爵士(1861-1947)辩论疫苗疗法的有效性和一个所谓“调理素指数”的统计测度时,引出了功能误差与数学误差之间的区别,得到医学界重视。,.,RonaldA.Fisher爵士(1890-1962)也是现代统计学的奠基人,发展了实验设计和分析的统计方法,著有StatisticsMethodsforResearchWorkersTheDesignofExperiments。1920年一位医生在美国医学会杂志上发表文章说,统计学在医学上具有重大的应用意义。统计学对科学的贡献是利用随机化做实验,消除安排处理中的偏倚性和分析中考虑数据的变异性。,.,AustinBradfordHill是Greenwood的学生,1937年应Lancet杂志的要求,撰写了一系列的关于在医学中正确使用统计学的文章,后来以书PrinciplesofMedicalStatistics的形式出版。Hill的工作为后来的临床试验确立了一种趋势,即医生的洞察和专业统计学家的统计设计要结合起来。到20世纪中叶,统计学才逐步应用于临床医学领域。直到计算机问世之后,统计学在医学上才得到了广泛的应用,医学统计学的各个分支学科得到了蓬勃的发展。,.,1.人口生命统计学的开创JohnGraunt(1620-1674)开始搜集死亡数据,编制寿命表,开创了人口统计学。WillianFarr(1807-1883)进一步改进寿命表方法,在英国创造了最早的生命统计系统。,三、统计学应用于公共卫生领域的著名研究,.,1939年Muller采用病例对照设计搜集一组肺癌病人,并配置一组其他特点与之相仿的非肺癌病人作为对照组,逐一询问吸烟否、吸烟量和时间,发现肺癌组吸烟者比率高,对照组吸烟者比率低。1938年Pearl调查了数百个家庭,分成吸烟多、吸烟少和不吸烟三个组,编制了三份寿命表,相应地绘制了三条生存曲线,发现吸烟多的一组几乎以直线下降的趋势减员,不吸烟的一组以先凸后凹的曲线趋势缓慢减员,而吸烟少的一组减员趋势则介于以上两组之间。,2.是否需要控制吸烟的争论,.,1964年Doll和Hill做出了一项出色的前瞻性研究。他们向60000名英国医生发出关于吸烟的问卷,其中40000名应答,据此将他们分成吸烟组和不吸烟组。借助英国良好的死亡登记系统追踪他们的结局,他们发现:吸烟组肺癌的年发病率为0.166,心脏病年发病率为0.599,不吸烟组肺癌的年发病率为0.007,不吸烟组心脏病年发病率为0.422。有两位在别的问题上常有分歧的统计学权威SirRonaldFisher和ProfJosephBerkson却一致向吸烟有害的研究提出挑战,提出是否肺癌与遗传有关。,.,瑞典国家双生研究即为一例。他们调查了一方吸烟、另一方不吸烟的双生子,其中,同卵双生男274对,女264对,异卵双生男733对,女653对,发现:慢性支气管炎患病率在同卵双生的吸烟者中男、女分别为14.6和13.6;不吸烟者中男、女分别为7.7和7.6;在异卵双生的吸烟者中男、女分别为12.3和14.5;而不吸烟者中男女分别为5.5和5.7;吸烟与不吸烟相比,慢性支气管炎患病的相对危险度约为1825倍。,.,狗的模拟吸烟导致与人类肺癌相似的结局、吸烟有损动脉血管、吸烟与死亡率有剂量一反应关系;戒烟时间长短对死亡率有不同影响等等。鉴于吸烟与禁烟已非单纯的生物医学问题,有的统计学家建议当局利用统计决策理论权衡公众利益、禁烟的代价和由此给社会带来的得与失,从而作出合理的决策。目前,许多发达国家已经断然采取了种种限制吸烟的措施,此中融有统计学家的贡献。全球180多个国家和地区签署了“控制吸烟的框架公约”,包括我国。他们在吸烟有害健康问题的研究中所创造的方法学也可为其他公害的研究所借鉴。,.,四、公共卫生人员为什么要学统计学?,1、统计学是公共卫生专业人员必备的素养掌握疾病与卫生问题的分布状况了解人群主要的卫生状况和需求卫生问题的危险因素识别与其他专业人员共同提出措施评价措施,.,2、现代公共卫生领域对统计学的挑战新理论、新方法层出不穷:毒理学统计遗传统计学蛋白质分子统计管理统计学,.,3、采用统计学方法,可以发现不确定现象背后隐藏的规律变异(variation)是社会和生物医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如:。,.,4、保证研究结果及表达方式的正确据国外对不同医学杂志发表论文的调查,发现有统计错误的论文的百分比最高达72%,最低也有20%。国内1984年对中华医学杂志、中华内科杂志等医学中文核心期刊595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。国际生物医学杂志编辑协会在其生物医学期刊投稿的统一要求中包含了统计学要求。,.,5、获得循证医学、循症预防的证据“良好愿望的医学”(well-meaningmedicine)转入“以证据为基础的医学”(evidence-basedmedicine,EBM)需要有统计学方法的支持。全世界的医学期刊每年大约刊登600万篇学术论文,但能作为可靠“证据”的论文并不多。,.,五、公共卫生统计方法的作用,概率论原理,数理统计方法,收集整理分析,健康状况,医学现象数量特征,它不过是个认识健康问题的工具罢了!无需怕它!,.,我们平时就在用它解决问题。学好统计的关键不过熟能生巧而已。,某班平均身高160.0cm。某病平均潜伏期为12-24小时。某地女学生近视率为21.0%,男生为18.5%,经比较,女生高于男生。,.,第二节公共卫生统计的基本概念一、总体与样本,总体:根据研究目的确定的研究对象的全体。种类:有限总体、无限总体样本:从总体中随机抽取的有代表性的一部分。要求:有代表性。,.,举例:比较两种不同的治疗方法(如西药与中药)对高血压的控制情况。药物是实验因素,性别、年龄等为非试验因素,血压是观测指标。严格地讲,除了实验因素外,影响被研究指标的非实验因素相同被称为同质。实际研究工作中,对被观测指标有影响的主要的可控制的非实验因素达到相同或基本相同就可以认为是同质。在同质的基础上被观察个体(或单位)之间的差异被称作变异。,二、同质和变异(homogeneityandvariation),.,三、抽样方法,单纯随机抽样,系统抽样,分层抽样,整群抽样多级抽样,有代表性随机的原则同质的原则样本适量原则,总体,样本,.,四、个体与变量,个体:个体即观察单位变量:个体的某项特征测量所得的指标。变异:个体间变量值的差异。参数:总体的指标。统计量:样本的指标。,.,变量类型,1、分类变量(categoricalvariable)或名义变量(nominativevariable)(二项与多项分类)2、有序变量(ordinalvariable)自然存在的次序;或按程度划分3、定量变量(quantitativevariable)离散型(discretevariable)连续型(continuousvariable),.,观察单位observations个体individuals,变量variables,Quantitativedata定量资料,Qualitativedata定性数据,Units;elements,.,三类数据间的关系,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8低血压8正常血压12轻度高血压15中度高血压17重度高血压,定量数据,等级数据,定性数据,.,三类数据的编码与计算,例:一组2040岁成年人的血压,以12kPa为界分为正常(0)与异常(1)两组,统计每组例数,8低血压418正常血压10212轻度高血压13315中度高血压16417重度高血压185,定量数据,等级数据,定性数据,.,五、参数与统计量parameterandstatistic,参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。,.,样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。概率:随机事件发生的可能性大小,用大写的P表示;取值0,1。,六、频率与概率frequencyandprobability,.,6.1概率,概率(P)必然事件P0、P1;随机事件0P1小概率事件:P0.05或P0.01的事件。小概率事件原理:现实中小概率事件一次不可能发生。频率(p):样本事件发生的可能性。,明天会下雨?,.,频率(p):样本事件发生的可能性。,抛硬币时国徽向上的可能是50%,现在请你抛10次,真的是5次国徽向上吗?,频率,概率,.,必然事件P=1随机事件0P1不可能事件P=0P0.05(5)或P0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。,6.2小概率事件,Certain,Impossible,0.5,0,1,.,6.3频率与概率间的关系1.样本频率总是围绕概率上下波动2.样本含量n越大,波动幅度越小,频率越接近概率。,.,七、误差,误差:测量值与真值、样本值与总体值之间的差值。,误差,系统误差,随机误差,随机测量误差,抽样误差,原因、特点,不可消除可以测量可以控制,.,八、统计分析过程,判断资料类型,判断资料范围,判断分布类型,选择统计指标选择推断方法,拿到任何资料都不要心慌,冷静分析即可解决。,.,8.1统计资料,统计资料A计量资料:B计数资料:无序资料有序资料-等级资料,判断资料类型是做统计分析的第一步。,.,8.2公共卫生统计中的几种资料类型,.,8.3计量资料统计分析,集中趋势:、G、M统计描述离散趋势:R、2、CV%、Q1/4统计图表统计推断参数估计:总体均数的估计(正态法)假设检验:t检验、u检验、方差检验、秩和检验等,.,8.4计数资料统计分析,实际数统计描述相对数率、构成比、相对比统计图表统计推断参数估计:总体率的估计-正态法假设检验:u检验、2检验,.,第三节公共卫生统计工作的基本步骤,确定目的,设计和计划,收集资料,整理、核对资料,统计分析,研究对象研究时间,资料来源、收集方法,按质整理、按量整理,统计描述、统计推断,1.调查设计(surveydesign)对研究对象不施加任何干预,通常建立随机抽样(randomsampling)方案。2.实验设计(experimentdesign)对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组(randomallocation)方案,一、研究设计,.,1随机化(randomization)2.对照(control)3重复(replication),二、实验设计的三个基本原则,.,搜集资料要遵循准确、完整、及时三个原则。资料搜集计划包括:选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论