版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、卫生统计学预防医学教研室: 徐 谦办公地点: 大学城基础学院六楼1、某保健品对某团委组织的试用中,发现,服用该保健品的团员们罹患脑血管病的概率比社会随机抽样人群罹患脑血管的概率要低40多倍。因此,认为该保健品对降低脑血管病有“显效”。2、某地政府统计了该地的森林覆盖率,发现2001年度的覆盖率比1998年的覆盖率增加了3倍。3、某市民政局报告了2001年度结婚人数为12.1万对,离婚人数为3万对,并据此得出结论:离婚率为25%。问题的提出4、某市统计生产总值时,考虑到黑市存在,就把黑市的贸易额也纳入到该市生产总值里面,这样就使地处内地的该市显得比许多沿海城市都要“富”。5、在前不久计算中国城市
2、竞争力排行榜时,某市排在了香港之后的第二位,比北京、上海排名更靠前。该市统计数据的人口基数是依据户口人数统计的,大约为170万人,但实际上该市长期居住人口为700万。6、某新药要做动物实验,从笼子里随机抓取一组豚鼠注射一单位剂量,同样方法抓取第二组豚鼠注射两单位剂量,直到能确定某组有一半豚鼠致死,得出“致半死剂量. 解答 1、用青年人的应用样本与人群广泛样本比较,不具有可比性。但现在很多保健品玩 的就是这一招。还有一种是把筛选样本,在患者中选取病情良好的服用保健品,然后与 病情严重的样本比较。 2、这种手法往往是偷换了比拟前后的“森林笼罩率”的定义,例如,在1998年度的森林覆盖率统计不含小树
3、林或灌木,但在2001年度加上了小树林和灌木。 3、离婚率是应当基于全体婚姻数来比拟,而不是基于当年结婚数来比较。例如,对同性恋中爱滋病患的报道时,就经常用临床数字来取代实际统计报道。 4、当某个城市把黑市的数据加进往,与其他城市没有加黑市的数据进行比拟是分歧 理的,它使二者不具有可比性。现在国度级的经济统计部分就经常玩弄相似游戏来使中国的某些经济指标“看起来”不错。 5、这是真实的案例,这个可耻的城市就是深圳。深圳的几乎所有官方统计数字都没有把固定居住但没有深圳户口的人统计在内,这样就使深圳显得很“富有”,而事实上,深圳大批的产业工人和服务业从业职员工资程度是相当低的。主要内容第一节 统计学
4、的若干概念第二节 医学统计工作的基本步骤第三节 统计学的发展简史一统计、统计学与医学统计学的定义2统计学作为一门学科的定义是:关于数据收集、表达和分析的普遍原理和方法。10statistics? 统计学A science dealing with the collection,analysis,interpretation,and presentation Of masses Of numerical data.(Websters International Dictionary)。David Freedman统计学是对令人困惑费解的问题做出数学设想的艺术。 Last JM 其主编的流行病学辞
5、典中说,统计学是: “the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable results”。(John MLast,A Dictionary of Epidemiology).以正确的方式收集数据,如实验设计、调查设计等。描述数据的统计特征,如数据化简、统计指标的选择与计算、统计结果的表达等。统计分析及得出正确结论,如根据概率分布,对实验和观察结果存在的差异和关联作出统计推
6、断。14医学统计学的全过程可看成是一个搜集信息、处理信息、分析信息、从而提炼新的信息的过程。即从事物同质性与变异性的数量表现出发,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题的规律性,即由偶然性的剖析中,发现事物的必然性,并指导医学的理论与实践。1. 采用统计学方法,发现不确定现象背后隐藏的规律。 变异(variation)是社会和生物医学中的普遍现象。 变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。 为什么要学统计学? 最大值=6.18, 最小值=3.29, 极差=2.89。 算术均数=4.72,标准差=0.57。2. 用统计学思维方式考虑有关医学
7、研究中的问题 “阳性”结果是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。3. 保证你的研究论文能通过统计学审查 据国外6080年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。 国内1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果,相对数误用为11.2%,抽样方
8、法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。 JAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。 国际生物医学杂志编辑协会在其生物医学期刊投稿的统一要求中也包含了统计学要求。 Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:/ 10/1/20224. 获得循证医学证据的主要手段“良好愿望的医学”(well-meaning medicine)转
9、入“以证据为基础的医学” (evidence-based medicine,EBM)需要有统计学方法的支持。 全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。 统计学参与卫生决策生物医学实验室研究临床研究流行病学探索 寻求统计学家的合作公共卫生管理许多医学杂志都邀请统计学家审稿。美国国立卫生研究院(National institutes of Health,NIH)的基金申请要求合作者有统计学家,并且必须有统计设计与分析的内容。在药物开发中,制药公司要招聘统计学家指导研究设计、分析数据乃至准备报告食品与药物管理局(Food and Drug Administra
10、tion,FDA)之类机构的文件。总之,统计学思维和方法学已经渗透到医学研究和卫生决策之中。第一节 医学中统计思维的进化时期科学家发明与应用1749-1827Pierre-Simon Laplace研究概率(probability)。1745-1826Philippe Pinel应用概率研究疗效1787-1872Louis 临床疗效,对照1822-1911 Francis Galton 分布与变异时期科学家发明与应用1857-1936Karl Pearson现代统计学之父相关分析,x21880-1949Major Greenwood抽样误差 1879-1940Raymond Pearl医院统计
11、,生物统计(1890-1962 Ronald A. Fisher现代统计学奠基误差理论极大似然实验设计随机化做实验,F检验 1897-1991 Hill 爵士现代临床试验(clinical trial) 一些重要的临床试验 英国临床医学研究理事会(1946年):链霉素治疗肺结核的临床试验(随机化分组、方法有链霉素加卧床休息或单纯卧床休息。独立评价X光片子结果,链霉素组病人的生存和两方面的放射学改善都有较好)一些重要的临床试验 美国(1954年):评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎的效果(干预试验、现场试验;样本:180万儿童;花费:500多万美元。随机化分组,最后约有1/4
12、参与者得到了随机化。这项试验最终肯定了索尔克疫苗的效果) 一些重要的临床试验 德国(1960年代初),药物酞胺哌啶酮(Thalidomide,又称反应停)事件(曾引起一次胎儿畸形(四肢体短缺)的暴发,经过病例对照研究和干预研究发现危险因素是反应停)。 美国从这一事件促使有关法律文件的产生,FDA为临床试验规定了一整套制度,使之成为确定药物疗效验的标准方法。 “反 应 停” 灾 难 20世纪50年代,科学家推出一种新药,据说它能在妊娠期控制精神紧张,防止孕妇恶心,并且有安眠作用。这药名叫“反应停”(沙利度胺、酞胺哌啶酮、Thalidomide),1957年首次被用处方。到了1960年,医生们对很
13、多新生儿四肢缩短和其他畸形开始产生警觉。究其原因是孕妇服用了“反应停”。该药在1961年被禁用,但当时全世界约有8000名婴儿已经受害。经过很长一段时间法律上的交锋,开发“反应停”的医药公司同意赔偿受害者的损失。 “反应停儿童”的事件是一次惨痛的教训。它提醒人们,任何新药在用于临床之前必须经过彻底检验。事件回放分子式反应停主要畸形个人观察信访例数%例数%手臂4352.410350.7手臂与腿2328.16029.6手臂、腿、耳22.473.4手臂与耳33.7104.9耳78.5146.9腿11.242.0其他畸形33.752.5合 计42203反应停引起的主要畸形的构成比鼻 117肛门闭锁1眼
14、 2食道闭锁3小脑 3十二指肠闭锁17心脏 3十二指肠狭窄2无脑 2幽门例数合并畸形例数合并畸形203个短肢畸形病例中合并其他畸形反应停销售量与短肢畸形数的关系国家反应停销售量(公斤)短肢畸形病例数奥地利2078比利时25826英国5769349荷兰14025挪威6011葡萄牙372瑞士1136西德300995000美国2510+7* 反应停从国外购来地区1949-1959195919601961三年总计波恩2195071不来梅42024法兰克福141116格廷根311014汉堡130154185梅德尔堡242632明亨34144460蒙斯特32796126伯明翰41317利物浦82533斯特
15、林10不同大学医学院附属小儿科收治的短肢畸形病例数第三节 原理和应用 第二节 统计学与公共卫生互相推动 统计学是得力工具: 统计设计:抽样、样本量、统计方法等 统计描述:群体事件的分布特征 统计推断:找危险因素、评价效果、决策等 历史成就:John Graunt 、William Farr(寿命表);John Snow (霍乱发生原因); Doll 和Hill (吸烟与肺癌)现代公共卫生对统计学的挑战 疾病谱的变化需要新的统计方法:为了研究非感染性疾病的流行,人们发展了多因素分析、生存分析、疾病自然史的模型等现代统计方法 学科交叉结合需要新的统计学方法:如:人群药物代谢动力学与现代统计学几个分
16、支的交叉结合,包括广义线性混合效应模型、非线性混合效应模型、等级和经验Bayes方法等 遗传流行病学需要遗传统计学方法;生物信息海量数据库的统计分析;卫生经济与决策的统计学方法。 第三节 统计学的几个基本概念总体与样本 (population and sample)同质与变异(homogeneity and variation)参数和统计量(Parameter and statistic)概率(probability)变量的类型(type of variable)一、总体与样本 (population and sample)总体定义:根据研究目的确定的同质观察单位的全体。更确切地说,它是同质的
17、所有观察单位中某种观察值的集合。(1)包含全部性质相同的个体。 如:用某中药治疗“非典”病人。 所有生产的乳制品(奶粉、牛奶)(2)数字信息总体目标总体(target population):研究结果所要推论到的总体。 研究总体(study population):来源于目标总体中的一个较小的总体,如关于吸烟与肺癌的研究以英国成年男子为目标总体;1951年英国全部注册医生只是成年男子中的一部分,是研究总体。例如调查某地2000年7岁正常男童的身高,观察对象是该地2000年全体正常7岁男童,观察单位是每个男童,观察值是测得的身高值,该地2000年全体7岁正常男童的身高值就构成了一个总体。同质:
18、同一地区 同一年份 同一年龄的 正常男童有限与无限总体有限总体(finite population):明确规定了空间、时间、人群范围有限个观察单位。如:某单位2005年7月食物中毒发生的暴露人群,病人登记资料及恶心呕吐症状反应结果。无限总体(infinite population):总体的概念是设想或抽象的,没有时间和空间范围 的限制,观察单位的全体数只是理论上存在。如:空气中的细菌数对革兰氏染色反应结果;研究保列治治疗慢性前列腺增生症的疗效。样本定义:从总体中随机抽取的一部分有代表性的观察单位,对这一部分观察单位实施定量或定性测量,从而获得某项或某些指标观察值的集合。统计的目的在于以样本去推
19、断总体,利用概率来探讨样本与总体之间的关系。抽样的要求:(1)进行随机化抽样和分组;(2)样本中应包含足够的观察单位数;(3)样本各种构成分布应基本上与总体保持一致。二、同质与变异 (homogeneity and variation)同质:一些个体处于同一总体,就是指他们大同小异,具有同质性指事物的性质、影响条件或背景相同或非常相近 。变异:同一总体内的个体存在差异又是绝对的,这种现象称为变异。如同性别,同年龄的大学生具有同质性,属于同一总体,但他们的身高、体重又存在变异。例 如同性别与同年龄的中国小学生和韩国小学生的平均身高是否不同?从以上两个总体中抽取一份样本,各得一个平均数,数值不同,
20、能否说明其身高不同?如果再从中国抽取一份样本,再得一个平均数,数值也与前不同。这说明同一总体的个体大同小异造成的,还是韩国与中国两个总体均数不同造成的?例如欲研究北京市7岁男童的身高何体型:条件:(1)具有北京市城市正式户口五年以上;(2)年龄为7周岁;(3)性别为男性。又如:生物种系具有多样性,人群具有健康水平差异,疾病具有严重程度的差别,治疗具有疗效的差别,孪生兄弟或姊妹具有心理上的差别等;变异( variation)定义:在一定条件下,人群(或动物群体)某种生物学指标数量或属性的不同。同一总体内的个体存在差异又是绝对的,如同性别,同年龄的大学生具有同质性,属于同一总体,但他们的身高、体重
21、又存在变异。例如:同质:高血压患者、用某药治疗变异:疗效各不相同统计学的任务就是在相对同质的基础上对个体的绝对的变异现象进行分析研究,揭示同质事物的内在的本质和规律。没有变异,就没有统计学。三、参数和统计量 (Parameter and statistic)参数:描述总体特征的有关指标。如总体平均数( )、总体率() 、总体标准差()等。固定的常数(用希腊字母表示) 。统计量:由总体中随机抽取样本而计算的相应指标称为统计量。如样本均数 、样本率、样本标准差。参数附近波动的随机变量(用英文字母表示) 。如为了了解健康成年女子每升血液中的白细胞数,对一群成年女子进行检验,可以求得样本均数,这就是一
22、个统计量。四、频率和概率两个概念 确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。 随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。 随机事件的特征:随机性;不同随机样本试验中,某随机事件的出现与否具有变动性;规律性:大量重复的随机样本试验中,某随机事件发生的可能性的大小是确定的。 在数理统计学中,用频率和概率来说明随机事件或随机变量分布的规律。频率 frequency样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现
23、m次,则事件A出现的频率为f (A)=m/ n。 概 率概念:描述随机事件发生可能性大小的数值,常用P来表示。概 率 大 小 P的大小在01之间。 P越接近1,表示某事件发生的可能性越大。严格说P1,表示事件必然发生, P0,表示事件不可能发生,它们是确定性的,不是随机事件,但它们可以看作是随机事件的特例。如抛掷硬币必然事件 P = 1随机事件 0 P 1不可能事件 P = 0 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件CertainImpossible0.501频率与概率间的关系:样本频率总是围绕概率上下波动;观察单位数较少时,频率的波
24、动性大,用于估计概率是不可靠的;样本含量n越大,波动幅度越小,频率越接近概率。三、变量的类型 定性变量(qualitative ) 定量变量(quantitative)定性变量 分类变量。如:职业:工、农、商、学、兵 等。为便于输 入计算机也可以采 用代码1、2、3、4、5等来表示各 个水平,为代码,不能进行计算。 有序变量或等级变量。 计数资料(enumeration data)定义:将全体观测单位按照某种属性或类别分组计数,然后再分别清点各组观察单位的个数。它包括:(1)二分类:如检查某小学学生大便中的蛔虫卵,以每个学生为观察单位,结局可以是阳性或阴性,得出每组的人数。(2)多分类:如观察
25、某人群的血型,以人为观察单位,结果可分为A、B、O、AB型,多项间互不相容。计数资料的特点:没有度量衡单位;资料数据均为整数;统计指标常用相对数,如率、构成比;统计分析方法有 检验。 等级资料(ranked data)定义:将观察单位按某一属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。 例如:临床治疗效果按照痊愈、有效、无效与恶化等级分组,然后清点各组病人数。 等级资料称为有序分类资料,各类之间有程度的差别,介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。等级资料的特点: 每一个观察单位没有确切值;各组之间有性质上的差别或程度上的不同;等级资料的分析方法
26、常用秩和检验。定量变量 离散型变量:整数值 连续型变量:实数轴上的任何数值计量资料(measurement data)定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。计量资料的特点(1)有度量衡单位;如:调查某幼儿园儿童的生长发育状况,测量每个儿童的身高(cm)、体重(kg)、血压(kPa)等(2)多为连续性变量值;(3)统计指标常为集中趋势与离散趋势(4)统计分析方法有t检验、方差分析、相关与回归。各类变量之间可以互相转化有时为了数据分析的方便,人们将一种类型的变量转化为另一种类型。定量 有序 分类 二值离散型变量常常通过适当的变换或连续性校正后借用
27、连续型变量或有序变量的方法来分析。 例:一组2040岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数 8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压等级数据定量数据定性数据住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866
28、.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitative data 定量资料Qualitative data 定性数据Units;elements三类数据的编码与计算(1) 例:一组2040岁成年人的血压以12kPa为界分为正常(0)与异常(1)两组,统计每组例数 8 低血压 4 1 8 正常血压 10 2 12 轻度高血压 13 3 15 中度高血压 16 4 17 重度高血压 18 5定量数据等级数据定性数据三类数据的编码与
29、计算(2)1.定量数据:允许计算均数、标准差等(可采用t、F检验等,可当做有序或定性数据处理)2.定性数据:编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验等) 调查14名男子的婚姻状况分类编码频数(frequency)单身13已婚25离异32分居443. 有序数据:允许基于顺序的计算,如计算中位数、百分位数(可当做定性数据处理)变量的类型等级资料试区分以下资料属于哪种类型?1.某地一批人的血红蛋白值资料 比色法测得的具体值(如105g/L),为何类资料? 根据测得值进行分类(如“贫血”),为何类资料? 1.某地一批人血红蛋白值资料比色法测得的具体值:如105g/L为计量资料 根据测得值进行分类:如“贫血”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年青海柴达木职业技术学院单招综合素质考试题库附答案详解(典型题)
- 2026年阿勒泰职业技术学院单招职业倾向性测试题库带答案详解(精练)
- 2026年阜阳职业技术学院单招职业倾向性测试题库及答案详解(考点梳理)
- 2026年随州职业技术学院单招综合素质考试题库及答案详解(典优)
- 2026年鹤壁汽车工程职业学院单招职业技能测试题库附答案详解(研优卷)
- 2026年长沙电力职业技术学院单招综合素质考试题库附答案详解(黄金题型)
- 2026年防城港职业技术学院单招职业技能测试题库附答案详解(夺分金卷)
- 2026年青海省黄南藏族自治州单招职业适应性测试题库带答案详解(培优b卷)
- 2026年雅安职业技术学院单招职业适应性考试题库有答案详解
- 2026年驻马店幼儿师范高等专科学校单招职业适应性测试题库带答案详解(综合卷)
- 国防科技大学宣讲ppt
- 大连周水子国际机场
- 闽教版小学英语五年级下册校本作业
- 拜仁慕尼黑足球俱乐部
- 自制中外对比旧约历史年代对照表
- 晚归检讨书阅读
- 结构化面试答题套路90结构化面试题型及答题套路
- GB 20922-2007城市污水再生利用农田灌溉用水水质
- FZ/T 43008-2012和服绸
- 浓密池专项施工方案
- 基于性能导航之飞行学院-pbn运行介绍
评论
0/150
提交评论