案例第一章绪论_第1页
案例第一章绪论_第2页
案例第一章绪论_第3页
案例第一章绪论_第4页
案例第一章绪论_第5页
已阅读5页,还剩39页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学第一章 绪论卫生统计学教研室什么是统计学(statistics)?“A branch of mathematics dealing with the collection,analysis,interpretation,and presentation of masses of numerical data.”(Websters International Dictionary).“The science and art of collecting,summarizing,and analyzing data that are subject to random variation.

2、”(John M.Last,A Dictionary of Epidemiology,4th ed,2001).什么是统计学(statistics)?内容:收集、分析、解释和表达数据统计学:处理数据中变异性的科学与艺术目的:求得可靠的结果统计学的现实地位:合作、审稿、基金申请(NIH)、药物开发与申报(FDA)、卫生决策根据研究领域和研究对象的不同,统计学又分为:数理统计、经济统计、生物统计、卫生统计、医学统计医学统计学(medical statistics):用统计学的原理和方法研究医学中的问题。卫生统计学(health statistics):与医学统计学基本相同,但更侧重于社会、人群的卫

3、生问题。1.为什么大家认为统计学难学?特点:抽象,复杂,枯燥2.难,为什么还要学习? 实用3.怎样学习卫生统计学?多练习,难易,抓住关键点和精髓卫生统计学的学习:为什么要学习统计学?1. 采用统计学方法,发现不确定现象背后隐藏的规律。2. 用统计学思维方式考虑有关医学研究中的问题 “阳性”结果是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。3. 保证你的研

4、究论文能通过统计学审查据国外6080年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。国内1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。4. 获得循证医学证据的主要手段“良好愿望的医学”(well-meaning medicine)转入“以证据为基础的医学” (evidence-based medicine,EBM)需要有统

5、计学方法的支持。全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。工作生活中常见的统计学问题:如何判断药物的疗效?(假设检验)明天是否下雨?体育彩票能否中奖?(概率论)子女为什么象父母,其强度有多大?(相关与回归)美国的民意测验是如何进行的?(设计,抽样)中国的市场调查的可信性有多大?(现场调查)例1北京某医院某大夫使用“乌贝散”乌贼骨15g(相当于3钱),白芨15g,川贝15g,甘草15g,共研细末过120目筛,冲服治疗胃溃疡病出血107例,有效101例,有效率为 94.4。那么如果别的医院,其他大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4吗?

6、显然,不一定恰为94.4,那么是多少呢?比它高还是比它低?这就是一个求置信区间的问题。例2 北京某医院有位老大夫,用“冠心灵”治疗冠心病。其对照组用西药,观察结果如表1。 表1 冠心灵与单纯西药疗效对比 请问冠心灵是否比单纯西药有效?这就涉及到统计学中的假设检验(test of significance),俗称要算P值。显效有效无效合计单纯西医冠心灵 9 19 25 18 6 5 40 42例3 某杂志中一篇文章报道,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗?由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此

7、药的78疗效有待探讨。这就要求设立具有可比性的对照组。例4 用某药治某病,治一例有效,能说100有效吗?治疗二例有效,能说明 100有效吗?治十例,其中九例有效,能说90有效吗?显然,观察的例数将是个重要因素,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。第一节 统计学与公共卫生休戚与共 公共卫生是群体科学群体的规律对统计学天然的亲和抽样技术、群体调查;统计描述反映分布特征;统计推断,识别危险因素、评价卫生措施、进行科学决策。第一节 统计学与公共卫生休戚与共2.公共卫生是统计学的用武之地与发展动力(1)Graunt(1620-

8、1674) 寿命表,开创人口统计学(2)Snow(1813-1858) 首次详细研究了伦敦霍乱流行。应用了数学和统计学建模和分析。(3)Doll和Hill 吸烟和肺癌的创新性研究。(3)Doll和Hill 吸烟和肺癌的创新性研究(i)病例-对照研究(1948-1949)病例:伦敦20所医院的709位肺癌住院病人对照:在同一所医院寻找一位同性别、年龄差别不超过5岁的非癌症病人。发现:同性别中,病例组吸烟量较大(4)Doll和Hill 吸烟和肺癌的创新性研究(ii)纵向研究(1951-)向注册的英国医生约60000人发出关于吸烟的问卷,收回约40000份;通过死亡登记获取他们的死亡和死亡原因等信息

9、。1964年报告10年追踪结果吸烟量(支/天)01-45-2425或更多肺癌死亡率()0.070.571.392.27(5)20世纪后半叶非感染性疾病的现代统计方法: 众多危险因素的分析、生存时间的分析、疾病自然史的模型等艾滋病研究:发病率、患病率、潜伏期估计的复杂的统计学模型疾病群体遗传规律的研究:家系资料、缺失多,推动新统计方法 公共卫生不仅是统计学应用的一个重要领域,而且更成为现代统计学研究和发展的巨大动力。第二节 统计学的若干概念1、总体与样本总体(population):大同小异的对象全体目标总体(target population):试图下结论的某个总体。例如,英国成年男子为目标总

10、体。研究总体(study population):资料来源的较小的总体。例如,1951年英国全部注册医生。需要谨慎:就研究总体所下的结论未必适用于目标总体。抽样(sampling):从研究总体中抽取部分个体样本(sample):抽取的部分个体数据(data):观察所得资料推断(inference):分析样本数据,获得关于总体的知识统计推断的工具:有关概率的理论。推断的结论从来就不是完全肯定或完全否定的。关键与核心:抽样方法、样本的代表性和推断的技术 总结:总体是依据研究目的所指向的全部同质研究对象的某项或某些专业指标(变量)测量值的集合。样本是从总体中抽取的有代表性的部分同质研究对象某项或某些

11、对应研究指标的测量值子集合。抽样研究的目的在于了解或推断目的总体特征,要求样本对总体有代表性: 随机抽样足够的样本含量样本的结构特征与总体相一致2、同质与变异同质性(homogeneity) 共性,大同小异变异(variation) 个体间差异,多样性没有同质性就构不成一个总体;总体内没有变异性就无需统计学。统计学的任务:在变异的背景上,描述同一总体的同质性, 揭示不同总体的异质性。总结:同质 是指符合研究目的规定的总体特征的研究对象的条件组合。这种条件组合同时亦是随机抽样中样本对象的纳入标准和排除标准。变异 是指同质研究对象某效应指标测量值的波动性。这里的变异不是绝对的含义,而是相对的含义。

12、3、变量的类型变量(variable)个体特征的数量描述(1)定性变量 (i)分类变量(categorical variable)或名义变量(nominative variable) 分类变量的水平(level) 代码(code)用1、2、3、4、5等来表示各个水平。 二分类变量(binary variable),也称0-1变量或假变量(dummy variable) (ii)有序变量(ordinal variable) 种种可能的“取值”中自然地存在着次序(2)定量变量离散型变量 只能取整数值。 例如,一个月中的手术病人数,一年里的新生儿数。连续型变量 可以取实数轴上的任何数值。 由测量而得

13、到的大多属于连续型变量。 例如,血压、身高、体重等 “连续”:指该变量可以在实数轴上连续变动。 变通:红细胞计数也视为连续性变量。(1个、2个、3个之间的差别并不重要)变量类型的转化:只能由高级向低级转化, 不能作相反方向的转化。连续型 有序 分类 二值离散型变量常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。三类数据间的关系 例:一组2040岁成年人的血压(变量)以12kPa为界分为正常(=0)与异常(=1)两组,统计每组例数. 单纯随机抽样系统抽样分层抽样(2) 增加样本量n ;(3)选择变异程度较小的研究指标。6、设计与分析(1)业务报表等常规统计资料优点:容易得到

14、,并有一定的权威性。缺点:常常不适合特定研究的目的 危险因素记录不全 统计的“口径不一致 往往是合计数据(aggregated data)警惕:在合计资料中观察到的关系,在个体水平往往不存在。(2)统计设计:医药卫生科研设计不可或缺混杂因素(confounding factors)对无数混杂因素的存在视而不见,孤零零的考察两个变量之间的关系常常得出荒谬的结论。干预性研究(intervention study) 化学、物理学和生物学方面的干预性实验、医学临床干预试验 精心设计:控制混杂因素措施观察性研究(observational study) 不可能人为地控制许多混杂变量的数值 精心设计:抽样

15、方法、样本量多大. .统计设计和统计分析是不可分割的两项内容,在学习和应用统计学时需要将两者结合起来。7、因果与联系公共卫生领域常常要探究危险因素与疾病之间的因果关系(causality)。 第一步应当问存在不存在联系, 然而,存在联系未必有因果关系。在解释统计分析的结果以及下结论时务必对“因果”二字慎之又慎。第三节 目标与方法1.目标:基本概念、方法与技能(1)基本概念 必须正确概念 医药卫生专业人员基本素质的标志(2)常用的设计方法和经典的统计学方法学会:t检验、方差分析、非参数检验、简单 回归与相关、流行病学常用统计方法等等了解:这些方法所需设计、适用的条件和结 果的意义。知道:经典方法

16、适用条件不满足时怎么办?(3)计算实践 与概念有关的简单计算不背任何公示,会查书就是好学生复杂的统计方法:会点菜、会吃菜、不需炒菜。2.教与学的方法(1)应用是根本目的,学了不会用最大的失败 没有任何内容需要背诵,理解概念与动手实践才是根本。(2)结合生活经验、医学实际来教与学 借助实例来理解一般规律:每一个重要的概念和原理,都要尽力与一、二个实例联系起来。(3)统计学实验: 帮助医药卫生专业人士学习统计学的好方法。(4)案例讨论:从反面吸取教训 利用每一章的案例了解容易出错的内容 鼓励到医学论文中寻找统计学方面的不足与错误 (5)打星号的章节 为开拓知识、培养自学能力而设 有些内容暂不学它,将来需要时再学。教材与参考书教科书:方积乾主编,卫生统计学(第七版),人民卫生出版社,2012参考书:(1)方积乾主编,卫生统计学学习指导书,人民卫生出版社(2)钟晓妮主编,医学统计学,科学出版社,2013练习题1.下面的变量中,属于分类变量的是( ) A 脉搏 B 血型 C 肺活量 D 红细胞计数2.下面的变量中,属于定量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论