第2章-数值变量资料的统计分析_第1页
第2章-数值变量资料的统计分析_第2页
第2章-数值变量资料的统计分析_第3页
第2章-数值变量资料的统计分析_第4页
第2章-数值变量资料的统计分析_第5页
已阅读5页,还剩133页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生学(第7版)第九章数值变量资料的统计分析,1,第2章,数值变量资料的统计分析,卫生学(第7版)第九章数值变量资料的统计分析,2,第一节数值变量资料的统计描述,一、数值变量资料的频数分布二、平均水平指标三、离散程度指标,卫生学(第7版)第九章数值变量资料的统计分析,3,例.某地用随机抽样方法检查了140名成年男子的红细胞数(x1012/L),检查结果见下表。,卫生学(第7版)第九章数值变量资料的统计分析,4,频数表的编制步骤:,求极差决定组数、组段和组距列出组段:划记计数,卫生学(第7版)第九章数值变量资料的统计分析,5,表某地140名正常男子红细胞数的频数分布表,卫生学(第7版)第九章数值变量资料的统计分析,6,图1某地140名正常男子红细胞数的频数分布图,频数分布图,卫生学(第7版)第九章数值变量资料的统计分析,7,(1)对称分布:若各组段的频数以频数最多组段为中心,左右两侧大体对称,就认为该资料是对称分布,卫生学(第7版)第九章数值变量资料的统计分析,8,正偏态负偏态,返回,(2)偏态分布:,卫生学(第7版)第九章数值变量资料的统计分析,9,二、平均水平指标(掌握描述集中趋势指标的概念、计算和应用条件),1.算术均数(arithmeticmean,)2.几何均数(geometricmean,G)3.中位数(median,M),卫生学(第7版)第九章数值变量资料的统计分析,10,1、算术均数,算术均数:简称均数(mean)定义:是一组变量值之和除以变量值个数所得的商。总体均数:样本均数:x,均数适用于资料呈对称分布,尤其是正态分布或近似正态分布的资料。,卫生学(第7版)第九章数值变量资料的统计分析,11,计算方法,(1)直接计算法,公式:,例.有9名健康成人的空腹胆固醇测定值(mol/L)为:5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93,求算术平均数。,x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9=4.83(mol/L),卫生学(第7版)第九章数值变量资料的统计分析,12,(2)加权法(利用频数表),公式:,k:频数表的组段数f:频数:组中值,其中i=1,2,k。,卫生学(第7版)第九章数值变量资料的统计分析,13,例.某地用随机抽样方法检查了140名成年男子的红细胞数(x1012/L),检查结果见下表。,卫生学(第7版)第九章数值变量资料的统计分析,14,表某地140名正常男子红细胞数的频数分布表,卫生学(第7版)第九章数值变量资料的统计分析,15,2、几何均数(geometricmean),定义:用G表示,是将n个观察值x的乘积再开n次方的方根(或各观察值x对数值均值的反对数)。,适用条件:1.当一组观察值为非对称分布、其差距相差较大;2.呈倍数关系的等比资料或对数正态分布(正偏态)资料(如抗体滴度资料);3.不能有0;不能同时有正、负值。,卫生学(第7版)第九章数值变量资料的统计分析,16,几何均数计算公式:(1)直接法,几何均数:变量对数值的算术均数的反对数。,计算几何均数的观察值应大于零,卫生学(第7版)第九章数值变量资料的统计分析,17,例有7份血清的抗体效价分别为1:2,1:4,1:8,1:16,1:32,1:64,1:128,求平均抗体效价。,7份血清的平均抗体效价为:1:16,卫生学(第7版)第九章数值变量资料的统计分析,18,(2)加权法(当观察例数多时采用),公式:,卫生学(第7版)第九章数值变量资料的统计分析,19,例有60人的血清抗体效价,分别为:7人1:5,11人1:10,22人1:20,12人1:40,8人1:80,求平均抗体效价。,50人的血清平均抗体效价为1:21。,卫生学(第7版)第九章数值变量资料的统计分析,20,3、中位数,其适用情况:适合各种类型的资料,尤其适合于当资料呈明显的偏态分布;资料一端或两端无确定数值(如大于或小于某数值);资料的分布情况不清楚。,(一)中位数(median)定义:用符号M表示,中位数是把一组观察值,按从小到大顺序排列,位置居中的数值(n为奇数)或位置居中的两个数值的均值(n为偶数)。,卫生学(第7版)第九章数值变量资料的统计分析,21,计算公式:,n为奇数时,n为偶数时,卫生学(第7版)第九章数值变量资料的统计分析,22,例7名正常人的血压(舒张压)测定值(mmHg)为:72,75,76,82,77,81,86,求中位数。,若又观察了一个人的血压,为87(mmHg),此时?,从小到大排列:72,75,76,77,81,82,8677,(77+81)/2=79(mmHg),卫生学(第7版)第九章数值变量资料的统计分析,23,百分位数示意图,(二)百分位数(percentile),把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。,中位数是第50百分位数,用P50表示。,X%,卫生学(第7版)第九章数值变量资料的统计分析,24,公式:,卫生学(第7版)第九章数值变量资料的统计分析,25,表某地140名正常男子红细胞数的频数分布表,P254.40+0.20 x(140 x25%19)/254.528M=P504.7625,卫生学(第7版)第九章数值变量资料的统计分析,26,1.极差(range,R)2.四分位数间距(interquantilerange,IQR)3.方差(variance,S2)4.标准差(standarddeviation,S)5.变异系数(coefficientofvariation,CV),离散程度指标,卫生学(第7版)第九章数值变量资料的统计分析,27,例:设甲、乙、丙三人,采每人的耳垂血,然后作红细胞计数,每人数5个计数盘,得结果如下(万/mm3),甲,乙,丙,卫生学(第7版)第九章数值变量资料的统计分析,28,全距,用R表示:即一组变量值最大值与最小值之差,亦称极差。对于上例中数据,有,简单,但仅利用了两端点值,稳定性差。,1、全距(Range),R5.953.82=2.13(x1012/L),R越大,变异度越大;R越小,变异度越小。,卫生学(第7版)第九章数值变量资料的统计分析,29,2、四分位数间距(quartilerange),四分位数间距:Q=P75-P25下四分位数:QL=P25上四分位数:QU=P75,比全距稳定;可用于一端或两端无确切数值的偏态资料。未考虑每一个观察值。,卫生学(第7版)第九章数值变量资料的统计分析,30,3、方差,1.方差(variance)是离均差平方和的均数,是描述所有观察值与均数的平均离散程度的指标,反映一组数据的平均离散水平。,离均差平方和SS,自由度,卫生学(第7版)第九章数值变量资料的统计分析,31,样本标准差用表示,其度量单位与均数一致,所以最常用。,公式:,4标准差(standarddeviation),卫生学(第7版)第九章数值变量资料的统计分析,32,利用频数表计算标准差的公式为:,卫生学(第7版)第九章数值变量资料的统计分析,33,例对以下数据:75,76,72,69,66,72,57,68,71,72,用直接法计算标准差。,卫生学(第7版)第九章数值变量资料的统计分析,34,例.利用表中的数据和频数表法计算标准差。,卫生学(第7版)第九章数值变量资料的统计分析,35,标准差意义和应用,标准差的意义:全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好)标准差的应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围,卫生学(第7版)第九章数值变量资料的统计分析,36,5、变异系数,变异系数(coefficientofvariation,CV)常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。,卫生学(第7版)第九章数值变量资料的统计分析,37,例1:某地7岁男孩身高的均数为123.10cm,标准差为4.71cm;体重均数为22.29kg,标准差为2.26kg,比较其变异度?,卫生学(第7版)第九章数值变量资料的统计分析,38,例2:某地不同年龄女童的身高资料如下,比较不同年龄身高的变异程度。,表某地不同年龄女童身高(cm)的变异程度,卫生学(第7版)第九章数值变量资料的统计分析,39,小结,卫生学(第7版)第九章数值变量资料的统计分析,40,第二节正态分布和参考值范围的估计,一、正态分布二、正态分布的特征和曲线下面积分布的规律三、医学参考值范围,卫生学(第7版)第九章数值变量资料的统计分析,41,卫生学(第7版)第九章数值变量资料的统计分析,42,卫生学(第7版)第九章数值变量资料的统计分析,43,卫生学(第7版)第九章数值变量资料的统计分析,44,一、正态分布,定义:以均数为中心,左右完全对称的频数分布。当X服从正态分布记作XN(,2)其中为总体均数,2为总体方差,卫生学(第7版)第九章数值变量资料的统计分析,45,数学形式:,正态分布的概率密度函数,Wheref(x):probabilitydensityfunctione2.71828=3.1415,卫生学(第7版)第九章数值变量资料的统计分析,46,标准正态分布,用N(0,1)表示,即u值的均数为0,标准差为1。,标准正态变换,卫生学(第7版)第九章数值变量资料的统计分析,47,正态分布,标准正态分布,卫生学(第7版)第九章数值变量资料的统计分析,48,Theshadedregionsareequivalentinarea.,ZN(0,1),xN(m,s2),卫生学(第7版)第九章数值变量资料的统计分析,49,二、正态分布的特征,正态曲线(normalcurve)在横轴上方,且均数所在处最高;正态分布以均数为中心,左右对称;正态分布有两个参数,即均数与标准差(与),标准正态分布的均数和标准差分别为0和1;正态分布的面积分布有一定的规律性。,卫生学(第7版)第九章数值变量资料的统计分析,50,XN(,2).,卫生学(第7版)第九章数值变量资料的统计分析,51,图2正态曲线面积分布示意图,卫生学(第7版)第九章数值变量资料的统计分析,52,正态曲线下的面积特点,横轴上曲线下的面积为1标准正态曲线下,横轴上对称于0的面积相等从-到u;,已知时,进行标准正态变换后再查表,未知时,用样本的均数和标准差代替95%,99%的面积公式:,卫生学(第7版)第九章数值变量资料的统计分析,53,计算正态曲线下面积实例,例.,mmol/L,,试估计该地正常女子血清甘油三脂在1.10mmol/L以下者占正常女子血清甘油三脂总人数的百分比。,查附表9-8,在表的左侧找到0.1,在表的上方找到0.04,两者的相交处为0.4443=44.43%。即该地正常女子血清甘油三脂在1.10mmol/L以下者,估计占总人数的44.43%。,mmol/L,,将X=1.10代入标准正态变量变换公式,得:,卫生学(第7版)第九章数值变量资料的统计分析,54,是指正常人的解剖、生理、生化、免疫等各种数据的波动范围。参考值范围在诊断方面可用于划分正常人或异常人的界限。,三、医学参考值范围,参考值范围(referenceranges),卫生学(第7版)第九章数值变量资料的统计分析,55,制定参考值的基本步骤,1、从正常人总体中抽样,样本量足够大;2控制测量误差;3判定是否需要分组确定参考值范围;4.决定取单侧还是双侧;5.选定合适的百分界限;6对资料的分布进行正态性检验;7根据资料的分布类型选定适当的方法进行参考值范围的估计。,卫生学(第7版)第九章数值变量资料的统计分析,56,1、正态分布法2、百分位数法,计算医学参考值范围的常用方法:,卫生学(第7版)第九章数值变量资料的统计分析,57,根据正态分布原理,95%的参考值范围,双侧为:x1.96S单侧上限为:x+1.645S单侧下限为:x1.645S,1.正态分布法:,卫生学(第7版)第九章数值变量资料的统计分析,58,假定正常成年女性红细胞数(1012/L)近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:正常成年女性的红细胞数95%参考值范围。,例,因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该指标过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:下限为:X-1.96S=4.18-1.96(0.29)=3.61(1012/L)上限为:X+1.96S=4.18+1.96(0.29)=4.75(1012/L)95%的正常成年女性红细胞数所在的范围是3.614.75(1012/L)。,卫生学(第7版)第九章数值变量资料的统计分析,59,2.百分位数法:,双侧参考值范围:95%:P2.5P97.599%:P0.5P99.5单侧参考值范围:95%:下限P上限:P95,卫生学(第7版)第九章数值变量资料的统计分析,60,对某地630名50岁60岁的正常妇女检查了血清甘油三脂含量,见下表,试估计其血清甘油三脂含量的95%单侧参考值范围。,例:,P95=203.2(mg/dl),卫生学(第7版)第九章数值变量资料的统计分析,61,小结计量资料的统计描述,集中趋势指标算术均数、几何均数、中位数(百分位数)离散趋势指标极差、四分位数间距方差、标准差、变异系数各类指标的含义、计算方法、应用条件。,正态分布正态曲线下面积分布规律医学参考值范围估计,卫生学(第7版)第九章数值变量资料的统计分析,62,统计推断,参数估计假设检验,卫生学(第7版)第九章数值变量资料的统计分析,63,第三节数值变量资料的统计推断,一、均数的抽样误差与标准误二、t分布三、总体均数的置信区间估计四、假设检验的基本思想和步骤,卫生学(第7版)第九章数值变量资料的统计分析,64,一、均数的抽样误差与标准误,1、概念抽样误差:由于抽样引起的样本统计量与总体参数之间的差异。,卫生学(第7版)第九章数值变量资料的统计分析,65,例如,从总体均数为4.83/L、标准差为0.52/L的正态分布总体N(4.83,0.522)中,随机抽取10人为一个样本(n=10),并计算该样本的均数、标准差。如此重复抽取100次(g=100),可得到100份样本,可得到100对均数和标准差S。,正态总体=4.83=0.52,1.4.58,0.382.4.90,0.453.4.76,0.4999.4.87,0.59100.4.79,0.39,S,卫生学(第7版)第九章数值变量资料的统计分析,66,标准误,已知,未知,样本均数的标准差,用于衡量抽样误差的大小;,卫生学(第7版)第九章数值变量资料的统计分析,67,标准误的特点:,当样本例数n一定时,标准误与标准差呈正比;当标准差一定时,标准误与样本含量n的平方根呈反比。,通过增加样本含量n来降低抽样误差。,卫生学(第7版)第九章数值变量资料的统计分析,68,从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n)。,即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。-中心极限定理,抽样实验,二、t分布,卫生学(第7版)第九章数值变量资料的统计分析,69,随机变量XN(m,s2),标准正态分布N(0,12),u变换,均数,标准正态分布N(0,12),Studentt分布,自由度:n-1,t分布,卫生学(第7版)第九章数值变量资料的统计分析,70,t分布,卫生学(第7版)第九章数值变量资料的统计分析,71,t分布的特征,以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于时,t分布即为u分布。,卫生学(第7版)第九章数值变量资料的统计分析,72,t分布特点:单峰分布,一簇曲线,曲线在t0处最高,并以t0为中心左右对称与正态分布相比,曲线最高处较矮,两尾部翘得高随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。,t分布曲线,卫生学(第7版)第九章数值变量资料的统计分析,73,t分布曲线下面积(附表P302),双侧t0.05/2,92.262单侧t0.025,9单侧t0.05,91.833双侧t0.05/2,1.96单侧t0.025,单侧t0.05,1.64,t,=u,卫生学(第7版)第九章数值变量资料的统计分析,74,三、总体均数的置信区间估计,1、点(值)估计:用样本均数直接作为总体均数的估计值,未考虑抽样误差。2、区间估计:根据样本均数,按一定的可信度计算出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间。,参数估计有两种方法:,估计正确的概率(1)称为可信度或置信度(confidencelevel),常取95或99,卫生学(第7版)第九章数值变量资料的统计分析,75,参数估计有两种方法:(1)点值估计:即直接用样本均数作为总体均数的估计值。(2)区间估计:总体均数95%置信区间的涵义为由样本均数确定的总体均数所在范围包含总体均数的可能性为95%。,三、总体均数的置信区间估计,卫生学(第7版)第九章数值变量资料的统计分析,76,u0.05/2=1.96,双侧1-置信区间为:,1.已知(u分布法),总体均数的95%置信区间为:,总体均数的区间估计的计算方法,卫生学(第7版)第九章数值变量资料的统计分析,77,2.未知,n样本例数较小,95%CIfor:,按t分布原理,95%的t值在t0.05/2,之间,即,卫生学(第7版)第九章数值变量资料的统计分析,78,3.未知,但n足够大(u分布法),总体均数的95%置信区间为:,卫生学(第7版)第九章数值变量资料的统计分析,79,2.总体均数的可信区间,小样本总体均数的可信区间,例,卫生学(第7版)第九章数值变量资料的统计分析,80,4.大样本总体均数的可信区间(1),大样本总体均数的可信区间,卫生学(第7版)第九章数值变量资料的统计分析,81,正常值范围估计与可信区间估计,正常值范围概念:绝大多数正常人的某指标范围。(95%,99%,指绝大多数正常人)计算公式:用途:判断观察对象的某项指标是否正常.,可信区间概念:总体均数所在的数值范围(95%,99%指可信度)计算公式:用途:估计总体均数,卫生学(第7版)第九章数值变量资料的统计分析,82,小结,均数的抽样误差标准误:计算公式、意义和特点t分布及其特征总体均数可信区间含义估计方法与医学参考值的区别,卫生学(第7版)第九章数值变量资料的统计分析,83,习题,1.有100个健康成年男子,用甲方法进行血钙值测定,得均数为10毫克/100毫升,标准差为2毫克/100毫升。(1)根据此资料可否推测所有健康成年男子血钙值总体均数可能的所在范围?(2)现有一成年男子血钙值为8毫克/100毫升,问此人血钙值是否正常?(3)另有120个健康成年男子,用乙方法进行血钙值测定,得均数为12毫克/100毫升,标准差为1.8毫克/100毫升。问甲、乙两方法均数差别有无显著性?,卫生学(第7版)第九章数值变量资料的统计分析,84,四、假设检验的基本思想和步骤,假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。,卫生学(第7版)第九章数值变量资料的统计分析,85,例,某地抽查了26名男性管理人员的空腹血糖均数x为4.84mmol/L,标准差s为0.85mmol/L。已知大量调查的一般健康成年男性空腹静脉血糖均数为4.70mmol/L。能否据此认为该地抽查的26名健康男性管理人员的空腹血糖均值与一般健康成年男性空腹静脉血糖均值不同?,卫生学(第7版)第九章数值变量资料的统计分析,86,差异的原因:(1)由于抽样误差造成的.(实际上,但由于抽样误差不能很好代表)(2)该地男性管理人员的空腹血糖与一般健康成年男性空腹静脉血糖不同(),假设检验的目的就是判断差异的原因:求出由抽样误差造成此差异的可能性(概率P)有多大!若P较大(P0.05),认为是由于抽样误差造成的。原因(1),实际上若P较小(P0.05),认为不是由于抽样误差造成的。原因(2),实际上,卫生学(第7版)第九章数值变量资料的统计分析,88,假设检验的基本思想,假设检验的基本思想是利用小概率反证法思想。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小(小概率事件(P0.05)是指在一次试验中基本上不大会发生的事件。),则认为假设不成立,若可能性大,则还不能认为假设不成立。,卫生学(第7版)第九章数值变量资料的统计分析,89,假设检验的基本步骤,第一步:提出检验假设,建立检验水准;第二步:选定统计方法,计算出统计量的值;第三步:确定P值,作出推断结论。,卫生学(第7版)第九章数值变量资料的统计分析,90,1、建立检验假设和设定检验水准,无效假设或零假设,H0:=0,双侧检验0,0或0,H1:,备择假设,单侧检验,卫生学(第7版)第九章数值变量资料的统计分析,91,x0,sx,t=,x0,4.844.70,s/n,0.85/26,=,=,=0.844,2、计算统计量,=0,0,=0.05,H0:,H1:,卫生学(第7版)第九章数值变量资料的统计分析,92,3、确定P值,作出统计推断统计,P0.05,按检验水准,不拒绝H0,差异无统计学意义(差异无显著性),还不能认为不同或不等。P0.05,按检验水准,拒绝H0,接受H1,差异有统计学意义(差异有显著性),可以认为不同或不等。P0.01,按检验水准,拒绝H0,接受H1,差异有高度统计学意义(差异有高度显著性),可以认为不同或不等。,卫生学(第7版)第九章数值变量资料的统计分析,93,2.060,-2.060,=26-1=25t0.05/2,25=2.060t=0.8440.05接受H0结论:健康男性管理人员的空腹血糖均值与一般健康成年男性空腹静脉血糖均值相同。,t,=25,1.708,卫生学(第7版)第九章数值变量资料的统计分析,94,第四节t检验和u检验,t检验和u检验就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n较小,样本来自正态分布,两样本相应的总体方差相等,则用t检验。,卫生学(第7版)第九章数值变量资料的统计分析,95,一、样本均数与总体均数的比较二、配对资料的比较三、两个样本均数的比较四、假设检验应注意的问题,卫生学(第7版)第九章数值变量资料的统计分析,96,适用条件,1、资料服从正态分布或近似正态分布2、两样本均数比较时还要求两总体方差相等,卫生学(第7版)第九章数值变量资料的统计分析,97,1.已知或未知但n足够大时样本均数与总体均数比较2.两大样本比较,u检验,t检验,1.未知且n较小时,样本均数与总体均数比较2.两小样本比较3.配对资料的比较,卫生学(第7版)第九章数值变量资料的统计分析,98,t检验:,t=,x,s,0,x,一、样本均数与总体均数比较,推断样本所代表的未知总体均数与已知总体均数0有无差别。,卫生学(第7版)第九章数值变量资料的统计分析,99,例,已知健康人群尿素氮均值为4.882mmol/L。随机抽查16名脂肪肝患者的尿素氮(mmol/L)测定值为5.74,5.75,4.26,6.24,5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4.37,4.59,5.18,6.96。问脂肪肝患者的尿素氮(mmol/L)测定值的均是否高于一般?,卫生学(第7版)第九章数值变量资料的统计分析,100,H0:=0H1:0=0.05,单侧检验,2、选定检验方法和计算统计量,x=5.997s=1.920,1、建立检验假设和设定检验水准,卫生学(第7版)第九章数值变量资料的统计分析,101,按=0.05检验水准,拒绝H0,接受H1,认为脂肪肝患者的尿素氮高于一般。,3、确定P值,作出统计推断,1.753,自由度v=n-1=16-1=15查t界值表(单侧)t0.05(15)=1.753,统计量t=2.321.753P0.05,,卫生学(第7版)第九章数值变量资料的统计分析,102,配对设计三种情况,自身比较:同一受试对象处理前后或不同部位测定值的比较。同一受试对象(或样品)分别接受两种不同的处理。成对设计:将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。,二、配对资料的比较,卫生学(第7版)第九章数值变量资料的统计分析,103,例,用某药治疗9例高胆固醇血症患者,观察治疗前后血浆胆固醇变化情况,如下表,问该药是否对患者治疗前后血浆胆固醇变化有影响?,卫生学(第7版)第九章数值变量资料的统计分析,104,表5-1用某药治疗前后血浆胆固醇变化情况,血浆胆固醇(mmol/L)治疗前治疗后(1)(2)(3)(4)=(2)-(3)110.106.693.4126.785.401.38313.2212.670.5547.786.561.2257.475.651.8266.115.260.8576.025.430.5988.086.261.8297.565.062.50,病人编号,差值d,卫生学(第7版)第九章数值变量资料的统计分析,105,t=,d0,s,d,d,=,s/,n,d,卫生学(第7版)第九章数值变量资料的统计分析,106,H0:d=0H1:d0=0.05(单侧检验),9-1,=,d0,d,Sd,Sd/,n,1.57,0.94/9,=4.86,t=,=,=,d=d/n=14.14/9=1.57,卫生学(第7版)第九章数值变量资料的统计分析,107,t=4.86v=n-1=9-1=8查t界值表得t0.05,8=1.860,t0.005(8)=2.355,t=4.862.355,P0.005按=0.05检验水准,拒绝H0,接受H1,认为该药降低胆固醇的作用有高度统计学意义。,卫生学(第7版)第九章数值变量资料的统计分析,108,三、两个均数的比较,目的:比较两总体均数是否相同。条件:假定资料来自正态总体,12=22,大样本(n50)-u检验小样本-正态分布资料t检验,卫生学(第7版)第九章数值变量资料的统计分析,109,其中,均数差的标准误,1.两个小样本均数的比较,卫生学(第7版)第九章数值变量资料的统计分析,110,例,从40-59岁有无肾囊肿的女性中分别抽取10与12人,测定她们的尿素氮水平(mmol/L)见表,问两组女性尿素氮水平有无不同?,无肾囊肿4.054.185.933.144.302.417.606.612.985.934.184.05有肾囊肿4.544.633.647.755.076.445.626.144.816.42,H0:1=2H1:12=0.05,t=1.46v=10+12-2=20t0.05/2,20=2.086p0.05接受H0,拒绝H1,还不能认为两组女性尿素氮水平有无不同。,卫生学(第7版)第九章数值变量资料的统计分析,111,u0.051.96,u0.012.58,2.两大样本均数的比较(u检验):,卫生学(第7版)第九章数值变量资料的统计分析,112,例某地随机抽取正常男性264名,测空腹血中胆固醇浓度的均数为4.404mmol/L,标准差为1.169mmol/L;随机抽取正常女性160名,测得空腹血中胆固醇浓度的均数为4.288mmol/L,标准差为1.106mmol/L,问男、女胆固醇浓度有无差别?,卫生学(第7版)第九章数值变量资料的统计分析,113,建立假设,确定检验水准H0:12H1:120.05选择检验方法,计算检验统计量u值(n1,n250),卫生学(第7版)第九章数值变量资料的统计分析,114,(3)查u界值表(t界值表中自由度为的一行),u=1.020.05,按=0.05水准,不拒绝H0,差异无统计学意义;尚不能认为正常男女血中胆固醇浓度均数不同。,卫生学(第7版)第九章数值变量资料的统计分析,115,假设检验应注意的问题,(1)资料必须合乎随机化抽样原则;(2)选用的假设检验方法应符合其应用条件;(3)实际差别大小与统计意义的区别,要正确理解假设检验的结论;(4)确定是选用单侧检验还是双侧检验;(5)判断结论时不能绝对化,应注意无论“接受”或拒绝检验假设,都有判断错误的可能性。,卫生学(第7版)第九章数值变量资料的统计分析,116,假设检验中的两类错误,拒绝了实际正确的无效假设H0称为犯了第类错误(typeIerror),用表示;接受了实际上错误的无效假设H0称为犯了第类错误(typeerror)。概率用表示。,假设检验建立在小概率原理上的判断,无论拒绝还是不拒绝H0,都有可能犯错误。,卫生学(第7版)第九章数值变量资料的统计分析,型错误和型错误,在统计学中将1-称为检验效能(poweroftest),其意义是当两个总体存在差异时(即备择假设H1成立时),所使用的统计检验能够发现这种差异(拒绝无效假设H0)的能力。,卫生学(第7版)第九章数值变量资料的统计分析,118,第五节方差分析,一、方差分析的基本思想二、方差分析的应用条件三、方差分析的主要内容四、多个样本均数的两两比较,卫生学(第7版)第九章数值变量资料的统计分析,119,方差分析的基本思想是把全部观察值之间的变异(即总变异),按设计和需要分为两个或多个部分,其自由度也分解为相应的部分。每一部分有一定意义,其中至少有一部分表示各组均数间的变异,另一部分表示误差。然后再计算变异间的比值F。若F值接近1,可认为处理因素无作用;若F值远大于1,且大于或等于F界值表中的某界值时,可认为处理因素有作用。,方差分析的基本思想,卫生学(第7版)第九章数值变量资料的统计分析,120,方差分析的应用条件,(1)各样本是相互独立的随机样本(2)各样本都来自正态总体(3)各个总体方差相等,卫生学(第7版)第九章数值变量资料的统计分析,121,方差分析的主要内容,根据资料设计类型的不同,有以下两种方差分析的方法:1.对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单向方差分析。2.对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即双向方差分析。,卫生学(第7版)第九章数值变量资料的统计分析,122,多个样本均数的两两比较,经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。,卫生学(第7版)第九章数值变量资料的统计分析,123,小结一、数值变量资料常用统计方法一览表二、表达假设检验的结果时,应给出的信息三、数值变量资料数据处理及分析中常见差错的类型,卫生学(第7版)第九章数值变量资料的统计分析,124,数值变量资料常用统计分析方法一览表,数值变量资料常用统计分析方法一览表,卫生学(第7版)第九章数值变量资料的统计分析,125,数值变量资料常用统计分析方法一览表(续1),卫生学(第7版)第九章数值变量资料的统计分析,126,表达假设检验的结果时,最好同时给出以下信息:选用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论