




已阅读5页,还剩142页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社区人群健康研究的统计学方法,杨双波流行病与卫生统计学教研室,社区预防医学第四篇社区人群健康研究的统计学方法,2,统计学是一门运用概率论和数理统计的基本原理研究数据收集、整理和分析的方法学,医学统计学方法是统计学在医学领域中的应用。,社区预防医学第四篇社区人群健康研究的统计学方法,3,北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱,甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%,别的医院,其他大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?,为什么要学医学统计学?,社区预防医学第四篇社区人群健康研究的统计学方法,4,北京某医院有位老大夫,用“冠心灵”治疗冠心病,其对照组用西药,观察结果如下表:表1-1冠心灵与单纯西药疗效对比试验用药显效有效无效合计单纯西药925640冠心灵1918542,冠心灵是否比单纯西药有效?,社区预防医学第四篇社区人群健康研究的统计学方法,5,某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为3周左右。问此药治疗玫瑰糠疹的确有效吗?,由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到3周左右有些患者也会自愈。,此药的78疗效有待探讨!,社区预防医学第四篇社区人群健康研究的统计学方法,6,1.医学领域中大量实际问题与统计学有关,医学统计学的意义,对实验结果、疗效、诊断试验等的评价临床参考值和标准值的制订新药临床评价门诊及住院病人次的预测危险因素分析疾病监测,社区预防医学第四篇社区人群健康研究的统计学方法,7,2.科学研究离不开统计设计与分析3.阅读科技文献需要统计学知识4.统计分析是撰写科研论文的重要甚至是必要内容之一,医学统计学的意义,社区预防医学第四篇社区人群健康研究的统计学方法,8,统计学的基本概念与步骤,数值变量资料的统计描述,分类变量资料的统计描述,主要学习内容(9学时),社区预防医学第四篇社区人群健康研究的统计学方法,9,统计学的基本概念与步骤,第一讲,社区预防医学第四篇社区人群健康研究的统计学方法,10,统计学的基本概念,一、同质和变异三、参数与统计量五、变量七、频率与概率,二、总体与样本四、随机六、误差,社区预防医学第四篇社区人群健康研究的统计学方法,11,同质:是根据研究目的给研究单位确定的相同性质。变异:是指在同质的基础上个体间的差异。,例:研究长沙市2009年7岁男孩身高的正常值范围?,同质:同长沙市、同7岁、同男孩、同无影响身高的疾病。,变异:长沙市2009年7岁男孩身高有高有矮,社区预防医学第四篇社区人群健康研究的统计学方法,12,统计学研究的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。,社区预防医学第四篇社区人群健康研究的统计学方法,13,总体:是指根据研究目的所确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某项观察值的集合。分为有限总体和无限总体两类。,社区预防医学第四篇社区人群健康研究的统计学方法,14,观察单位:一个人变量:红细胞数同质:同某地、同2002年、同成年男子、同正常。总体:1)某地所有的正常成年男子2)某地所有的正常成年男子的红细胞数,例:调查某地2002年正常成年男子的红细胞数的正常值范围,社区预防医学第四篇社区人群健康研究的统计学方法,15,样本:是指从总体中随机抽取部分观察单位某项观察值的集合。由于直接研究总体通常是不可能的,故一般采用抽样研究。抽样必须遵循随机化原则。,社区预防医学第四篇社区人群健康研究的统计学方法,16,根据研究范围,总体与样本是一个相对的概念。注意:随机抽样(无主观性)样本含量:样本中包含的研究单位数。例如:某药治疗高血压患者30名样本含量(n)为30,社区预防医学第四篇社区人群健康研究的统计学方法,17,为什么要样本?,没法找到总体中每个观察单位需要花费大量的人力、物力财力和时间有些研究具有破坏性,只能研究从总体中抽取的一部分观察单位,社区预防医学第四篇社区人群健康研究的统计学方法,18,社区预防医学第四篇社区人群健康研究的统计学方法,19,统计学的分析思路,总体,抽样研究,统计推断,统计学研究的目的就是要用样本统计量推断总体参数,样本,社区预防医学第四篇社区人群健康研究的统计学方法,20,随机:,简单随机抽样分层抽样整群抽样等距抽样(机械抽样),就是总体中每一个观察单位都有相等的机会被抽取到样本中来的原则。,社区预防医学第四篇社区人群健康研究的统计学方法,21,单纯随机抽样(简单随机抽样),最简单、最基本的抽样方法从总体N个对象中,利用抽签或其他随机方法抽取n个总体中每个对象被抽到的概率相等,社区预防医学第四篇社区人群健康研究的统计学方法,22,社区预防医学第四篇社区人群健康研究的统计学方法,23,系统抽样(机械抽样),按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。将总体各个个体单位按某种标志排列、连续编号根据总体数N和确定的样本数n,计算抽样距离(N/n)用单纯随机方法在第一组中确定一个起始号从此起始点开始,每隔K(K=N/n)个单位抽取一个作为研究对象,社区预防医学第四篇社区人群健康研究的统计学方法,24,社区预防医学第四篇社区人群健康研究的统计学方法,25,整群抽样,将总体分成若干群组,抽取其中部分群组作为观察单位组成样本分类单纯整群抽样被抽到的群组中的全部个体均作为调查对象二阶段抽样通过再次抽样后调查部分个体,社区预防医学第四篇社区人群健康研究的统计学方法,26,社区预防医学第四篇社区人群健康研究的统计学方法,27,分层抽样,将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。分类按比例分配分层随机抽样:各层内抽样比例相同最优分配分层随机抽样:各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,社区预防医学第四篇社区人群健康研究的统计学方法,28,社区预防医学第四篇社区人群健康研究的统计学方法,29,多级抽样,将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以上抽样方法结合使用,在大型流行病学调查中常用。方法从总体中抽取范围较大的单元(一级抽样)从一级单元中抽取范围较小的单元(二级抽样)依此类推,社区预防医学第四篇社区人群健康研究的统计学方法,30,在收集医学研究的资料时,首先要根据研究目的确定观察单位,然后对观察单位的某个特征变量进行观察或测定。观察结果或测定值称为变量值。,社区预防医学第四篇社区人群健康研究的统计学方法,31,变量:指观察单位的某种特征。能够反应观察单位的变异性。如:性别、身高、体重、红细胞计数等变量值(或观察值):对变量的测量的具体数值大小。资料:由变量值构成。,社区预防医学第四篇社区人群健康研究的统计学方法,32,变量分为数值变量计量资料分类变量两分类计数资料多分类无序分类有序分类等级资料,社区预防医学第四篇社区人群健康研究的统计学方法,33,数值变量其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位。所得的资料称为计量资料。,社区预防医学第四篇社区人群健康研究的统计学方法,34,分类变量其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组,然后汇总各组个数所得到的数值。,社区预防医学第四篇社区人群健康研究的统计学方法,35,1.无序分类变量二项分类变量多项分类变量无序分类变量构成的资料称为计数资料。2.有序分类变量(多项分类变量)有序分类变量构成的资料称为等级资料。,社区预防医学第四篇社区人群健康研究的统计学方法,36,资料的相互转化,计量计数(xa“+”;xR甲=R丙乙组的变异度最大,甲组与丙组谁的变异度大呢?极差不能说明。,社区预防医学第四篇社区人群健康研究的统计学方法,100,2.四分位数(quartile)间距:包括中间50%的变量值。Q=QU-QL=P75-P25特点:较稳定,但仍未考虑倒每个观察值的变异度。它常用于反映偏态分布资料的离散程度。,社区预防医学第四篇社区人群健康研究的统计学方法,101,3.方差(variance)和标准差(standarddeviation)方差和标准差的含义R甲=R丙=8,但可以看出,甲组的变异程度较丙组的大,极差不能反映出。因此,应全面考虑每个变量值的离散情况。先就总体而言:离均差:(x-)的绝对值越大,说明资料越分散,但由于:(x-)=0不能反映变异程度的大小离均差平方和:(x-)2该值越大,说明变异程度越大。但它还受变量值个数N的影响。,社区预防医学第四篇社区人群健康研究的统计学方法,102,离均差平方和的均方:2=(x-)2总体方差标准差=(x-)2总体标准差由于变异度越大,则2越大,故越大,说明个体变异越大,均数的代表性就越差。,N,N,社区预防医学第四篇社区人群健康研究的统计学方法,103,计算实际工作中,经常得到的是样本资料,是未知的,只能用X来估计。若用(x-x)2(x-)2,nN。对样本来讲由于(x-x)2(x-)2按前面的公式计算的2和比实际的2和偏小。英国统计学家W.S.Gosset用(n-1)代替n进行校正。自由度:=(n-1),社区预防医学第四篇社区人群健康研究的统计学方法,104,s2=(x-x)2样本方差s=(x-x)2样本标准差s=x2-(x)2/n用于小样本s=fx2-(fx)2/f用于大样本,n-1,n-1,n-1,f-1,社区预防医学第四篇社区人群健康研究的统计学方法,105,例:甲组2628303234X甲=30R甲=8乙组2427303336X乙=30R乙=12丙组2629303134X丙=30R丙=8s=(x-x)2s甲=(26-30)2+(28-30)2+(30-30)2+(32-30)2+(34-30)2/4=3.16s丙=(26-30)2+(29-30)2+(30-30)2+(31-30)2+(34-30)2/4=2.92,n-1,社区预防医学第四篇社区人群健康研究的统计学方法,106,例:s=fx2-(fx)2/f=2666824-(18600)2/130=6.58(cm),f-1,130-1,社区预防医学第四篇社区人群健康研究的统计学方法,107,标准差的应用用于反映正态分布资料的变异程度,S越大,变异程度越大,均数的代表性越差。与均数结合,用于描述正态分布的特征,估计频数的分布用于估计医学参考值范围用于计算变异系数用于计算标准误,标准误与均数结合用于均数的假设检验和参数的估计。,社区预防医学第四篇社区人群健康研究的统计学方法,108,4.变异系数(CoefficientofVariation,CV)CV(%)=S100%应用:比较度量衡单位不同的多组资料的变异度比较均数相差悬殊的多组资料的变异度,x,社区预防医学第四篇社区人群健康研究的统计学方法,109,例:某地7岁男孩身高均数为123.10cm,标准差为4.71cm;体重均数为22.29kg,标准差为2.26kg,试比较身高与体重的变异程度。身高:CV(%)=4.71/123.10100%=3.83%体重:CV(%)=2.26/22.29100%=10.14%,社区预防医学第四篇社区人群健康研究的统计学方法,110,应用离散趋势指标的注意事项,1.极差适合于任意分布的资料,用于资料的粗略描述。四分位数间距常用于描述偏态分布以及一段或两无确切数值资料的离散趋势。2.方差和标准差属同类资料,适合与正态分布或近似正态分布的资料,但两者的度量衡单位不同,标准差与原始数据的度量衡单位相同,方差的度量衡单位是原始数据的度量衡单位的平方。3.变异系数适合于正态分布或者近似正态分布的资料,主要用于均数相差较大或度量衡单位不同的观测值变异程度的比较。,社区预防医学第四篇社区人群健康研究的统计学方法,111,1.反映定量资料平均水平的指标是A.频数B.参数C.百分位数D.平均数E.统计量2.()分布的资料,均数等于中位数A.对称分布B.正偏态分布C.负偏态分布D.对数正态分布E.正态分布3.描述偏态分布资料的变异程度,以()较好A.极差B.四分位数间距C.方差D.标准差E.平均偏差,社区预防医学第四篇社区人群健康研究的统计学方法,112,分类变量资料的统计描述,第三讲,社区预防医学第四篇社区人群健康研究的统计学方法,113,什么是分类变量资料?用什么指标进行描述?,例:甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿50人,何地较为严重?若甲地易感儿童667人,而乙地易感儿童250人。,甲地麻疹发病率为100/667100%=15%乙地麻疹发病率为50/250100%=20%,用相对数能较好地反映分类变量资料的特征。,社区预防医学第四篇社区人群健康研究的统计学方法,114,一、常用相对数二、应用相对数时的注意事项三、率的标准化法,社区预防医学第四篇社区人群健康研究的统计学方法,115,一、相对数,相对数:是两个有关联的数值或指标之比。常用的相对数有:率构成比相对比,社区预防医学第四篇社区人群健康研究的统计学方法,116,率(rate),率:是指在一定观察时间内,某现象实际发生数与可能发生该现象的总数之比,用以说明某现象发生的频率或强度。,K为比例基数,如100%、1000等。比例基数的选择主要依习惯而定或使计算结果能保留12位整数。,社区预防医学第四篇社区人群健康研究的统计学方法,117,构成比(constituentratio),构成比:是指事物内部某一部分的观察单位数与事物内部各组成部分的观察单位数总和之比,用以说明事物内部各部分所占的比重或分布。,常用百分数表示,故又称百分比。,社区预防医学第四篇社区人群健康研究的统计学方法,118,各部分构成比之和为100%。此消彼长。,构成比的两个特点:,社区预防医学第四篇社区人群健康研究的统计学方法,119,例2001年对某地中小学学生进行HbsAg检查,结果见下表,试计算各级学生HbsAg检出率及阳性者构成比,率和构成比不是同一指标,在应用时应注意加以区分。,社区预防医学第四篇社区人群健康研究的统计学方法,120,相对比,相对比:指两个有关指标之比,说明两个指标的比例关系。,两个指标可以是绝对数、相对数、平均数,可以是性质相同或性质不同,但两个指标互不包含。,社区预防医学第四篇社区人群健康研究的统计学方法,121,例某地2003-2005年不同性别新生儿数见下表,试计算该地不同年份新生儿性别比。,社区预防医学第四篇社区人群健康研究的统计学方法,122,二、应用相对数的注意事项,计算相对数时分母不宜过小正确区分构成比和率,不能以构成比代替率正确计算平均率对率和构成比进行比较时,应注意资料的可比性率的标准化样本率或构成比进行比较时要作假设检验。,社区预防医学第四篇社区人群健康研究的统计学方法,123,如:用某药治疗某病患者,5例中有3例治愈,计算治愈率为3/5100%=60.0%,如果有4例治愈,则其治愈率为80%。显然,这个结果是不稳定的。在分母例数很少的情况下,个别的偶然因素会导致结果的变化,只有分母例数较大时,计算的相对数才比较稳定。在例数较少时,通常直接用绝对数表示。如果要用相对数表示,则需列出其总体率的置信区间。,社区预防医学第四篇社区人群健康研究的统计学方法,124,某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,得以下资料,据此得出结论:“母亲年龄在2429岁时,畸形儿最多,占总数的92.2%,表明该年龄段易发生畸形儿,符合一般规律”。试分析该结论是否合理?,某地畸形儿与母亲分娩年龄的关系,社区预防医学第四篇社区人群健康研究的统计学方法,125,2001年某地中小学学生HBsAg检出率及构成比,社区预防医学第四篇社区人群健康研究的统计学方法,126,在进行率或构成比比较时,除了要比较的因素外,其他影响的因素应基本一致。例如,分析比较两医院病死率的时,应注意两个医院的条件应基本相同,如果上级医院的病死率高于基层医院的病死率,并不能说明上级医院医疗水平不如基层医院,这是因为许多疑难病人均由基层医院转入上级医院所致。,社区预防医学第四篇社区人群健康研究的统计学方法,127,当比较两个总率时,若其内部构成不同,需要进行率的标准化。,社区预防医学第四篇社区人群健康研究的统计学方法,128,率的标准化,社区预防医学第四篇社区人群健康研究的统计学方法,129,在进行两个内部构成不同的总率比较时,采用统一的标准进行校正,然后计算校正后的标准化率,再进行比较的方法称为率的标准化法。,三、率的标准化法,社区预防医学第四篇社区人群健康研究的统计学方法,130,计算标准化率时,首先要选定一个比较的“标准”。如,对年龄构成进行标化时,可选用全国、全省等大范围人口构成资料作标准,也可将比较组的合并人口或以其中任一组的人口构成作标准。原则上,选定的标准人口应有代表性、较稳定,容易获得,便于比较。根据获得的资料和选定的标准不同,标准化法可分为直接法和间接法。,社区预防医学第四篇社区人群健康研究的统计学方法,131,直接法,适用情况:已知被标化组各年龄组的实际率Pi,用标准人口数或标准人口构成进行计算。,其中为第i组标准人口数,为标准组总人数,为第i组的实际率,为第组标准人口构成。,社区预防医学第四篇社区人群健康研究的统计学方法,132,甲社区标准化后的患病率,乙社区标准化后的患病率,社区预防医学第四篇社区人群健康研究的统计学方法,133,如根据选定的标准人口构成做标准,,社区预防医学第四篇社区人群健康研究的统计学方法,134,间接法,适用情况:已知被标化组的死亡总数及年龄别人口数,但不知道各年龄组的实际死亡率。,标准化死亡比,社区预防医学第四篇社区人群健康研究的统计学方法,135,标准化死亡比:被标化组实际死亡数与预期死亡数之比,称为标准化死亡比(standardmortalityratio),简称为SMR。若SMR1,表示被标化人群的死亡率高于标准组;反之,若SMR1,表示被标化人群的死亡率低于标准组。,社区预防医学第四篇社区人群健康研究的统计学方法,136,例某地观察了吸烟者与不吸烟者各年龄组人数如下表,同时观察期内吸烟者中有432人死于肺癌,不吸烟者中有210人死于肺癌,试计算吸烟者与不吸烟者的标准化死亡率。,社区预防医学第四篇社区人群健康研究的统计学方法,137,吸烟者的肺癌标准化死亡比,非吸烟者的肺癌标准化死亡比,社区预防医学第四篇社区人群健康研究的统计学方法,138,吸烟者的肺癌标准化死亡率,非吸烟者的肺癌标准化死亡率,社区预防医学第四篇社区人群健康研究的统计学方法,139,率的标准化应注意的问题,(1)当各比较组内部构成(如年龄、性别等)不同时,应对率进行标准化后,再作比较。(2)标准化率只表明各标化组率的相对水平,而不代表其实际水平。(3)两总率各分组对应的率有明显交叉时,则不能用标准化率进行比较。(4)如为抽样研究资料,两样本标准化率的比较也应作假设检验。,社区预防医学第四篇社区人群健康研究的统计学方法,140,1.某地某年肝炎发病人数占同年传染病人数的10.1%,这是一种()指标。A.率B.构成比C.发病率D.集中趋势E.时点患病率2.计算某地某年肺癌发病率,其分母应为()。A.该地体检人数B.该地年平均就诊人数C.该地年平均人口数D.该地平均患者人数E.该地易感人群,社区预防医学第四篇社区人群健康研究的统计学方法,141,3.一种新的治疗方法可以延长生命,但不能治愈其病,则发生下列情况()。A.该病患病率将增加B.该病患病率将减少C.该病发病率将增加D.该病发病率将减少E.与患病率和发病
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 饮料合作加盟合同范本
- 公司聘用文秘合同范本
- 隔热夹芯板采购合同范本
- 公司代签合同范本
- 香港公司股权合同范本
- 基地鱼塘租售合同范本
- 新款合同范本模板
- 衣物袋采购合同范本
- 仓库旧料回收合同范本
- 车辆安全协议合同范本
- XXX加油站风险分级管控台账
- 甘12J8 屋面标准图集
- 购买设备合同
- GB/T 28288-2012足部防护足趾保护包头和防刺穿垫
- GB/T 19666-2019阻燃和耐火电线电缆或光缆通则
- GA/T 1241-2015法庭科学四甲基联苯胺显现血手印技术规范
- 小学和初中科学教学衔接
- 《循证医学》治疗性研究证据的评价和应用
- “李可中医药学术流派论治厥阴病”-课件
- 通用技术作品设计报告
- JJF 1847-2020 电子天平校准规范-(高清现行)
评论
0/150
提交评论