版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室1第三章第三章 总体均数的估计和假设检验总体均数的估计和假设检验 流行病与卫生统计学教研室流行病与卫生统计学教研室谭盛葵谭盛葵 副教授副教授2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室2第一节第一节 均数的抽样误差和标准误均数的抽样误差和标准误 一、均数的抽样误差一、均数的抽样误差 抽样研究的目是用样本统计量推断总体抽样研究的目是用样本统计量推断总体参数,在统计学上称为参数,在统计学上称为统计推断统计推断。统计推断的主要内容:统计推断的主要内容: 总体均数的可信区间估计总体均数的可信区间估计 假设检验(
2、显著性检验)假设检验(显著性检验)2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室3(一)抽样误差的概念(一)抽样误差的概念 总体总体样本样本统计推断统计推断抽样抽样抽样误差抽样误差2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室4 由于总体中存在个体变异,(所以)由由于总体中存在个体变异,(所以)由抽样得到的样本指标与总体指标之间存在差抽样得到的样本指标与总体指标之间存在差异,这种差异称异,这种差异称抽样误差抽样误差。 在抽样研究中,抽样误差是在抽样研究中,抽样误差是不可避免不可避免的,的,但其大小可以但其大小可以控制和估计控制和估计的。的。2022-
3、4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室5 例如例如:某大学有:某大学有2000020000名同质学生,空腹名同质学生,空腹血糖值血糖值(mmol/L(mmol/L)4.6554.655。某医生对这些。某医生对这些学生作次抽样调查,每次抽学生作次抽样调查,每次抽100100个学生,个学生,平均空腹血糖值平均空腹血糖值X1 1、X2 2、XN N。(二)均数的抽样误差(二)均数的抽样误差2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室6X1X2X3X44_3_2_1_xxxx2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室7n n=100
4、=100,4.6234.623n n=100=100,4.4124.412n n=100=100,4.6614.661n n=100=100,5.0225.022n n=100=100,4.6824.682n n=100=100,4.0894.089n n=100=100,4.1934.193 n nN N=100=100, N N4.7544.754 单位单位(mmol/L(mmol/L)2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室8 这些均数不相等,但其分布有一定规这些均数不相等,但其分布有一定规律:大多数集中在总体均数附近,离总体律:大多数集中在总体均数附近,离总
5、体均数越远,样本均数的个数越少。均数越远,样本均数的个数越少。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室9 由于总体观测单位间存在个体差异,由于总体观测单位间存在个体差异,随机抽样所得的样本均数与总体均数、样随机抽样所得的样本均数与总体均数、样本均数与样本均数之间存在差异。由于抽本均数与样本均数之间存在差异。由于抽样引起的差异称为样引起的差异称为均数的抽样误差均数的抽样误差。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室102022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室112022-4-23 流行病与卫生统计学教研室流行病与
6、卫生统计学教研室12样本均数的抽样分布特点样本均数的抽样分布特点: 1、各样本均数未必等于总体均数;各样本、各样本均数未必等于总体均数;各样本均数间存在差异;均数间存在差异;2、样本均数分布很有规律,在正态总体中,、样本均数分布很有规律,在正态总体中,随机抽取例数为随机抽取例数为n的样本,样本均数服从正的样本,样本均数服从正态分布;态分布;3、样本均数间相差较小,其变异范围较原、样本均数间相差较小,其变异范围较原变量值的变异范围缩小;变量值的变异范围缩小; 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室134、在正态总体中随机抽样,抽取一定的样、在正态总体中随机抽样,抽取
7、一定的样本也为正态分布;本也为正态分布;5、在偏态总体中随机抽样,当、在偏态总体中随机抽样,当n足够大时足够大时(n60),也近似正态分布;),也近似正态分布; 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室14 如果把如果把100100(N N)个)个样本均数样本均数看着看着100100(N N)个)个“变量值变量值”,可求其标准差,即,可求其标准差,即样本均数的标准差样本均数的标准差,它说明样本均数间,它说明样本均数间的变异程度,即样本均数的抽样误差。的变异程度,即样本均数的抽样误差。二、标准误及其计算二、标准误及其计算2022-4-23 流行病与卫生统计学教研室流行
8、病与卫生统计学教研室15 样本均数的标准差称为标准误样本均数的标准差称为标准误(standard error),standard error),用用X X表示。标准误表示。标准误越大,样本均数的抽样误差越大。标准误越大,样本均数的抽样误差越大。标准误可按下式计算:可按下式计算:nX_2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室16 总体标准差总体标准差()()往往不可知,所以用往往不可知,所以用样本标准差样本标准差(s)(s)代替,得总体标准误的估计代替,得总体标准误的估计值值样本标准误样本标准误s sx:nssx_2022-4-23 流行病与卫生统计学教研室流行病与卫
9、生统计学教研室17随着随着 n S 稳定稳定 Sx 0均数的标准误与标准差成正比,均数的标准误与标准差成正比,与样本例数与样本例数n n的平方根成反比。的平方根成反比。因此,减少抽样误差因此,减少抽样误差最有效最有效的办法:的办法:增加样本增加样本例数例数2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室18例例4.1 已知已知n=144, =5.381012 /L, S=0.441012 /L 求其标准误。求其标准误。 037.014444.0nSSx(1012 /L) X2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室19 例例15.115.1的资料:
10、某地的资料:某地150150名名3 3岁女孩身高岁女孩身高为为92.8cm92.8cm,标准差为,标准差为4.6cm4.6cm,求其标准误。,求其标准误。 按式按式15.215.2计算,得标准误为:计算,得标准误为:)(38. 01506 . 4_cmnssx2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室203、标准误的应用、标准误的应用 (1)反映抽样误差大小反映抽样误差大小:标准误越大标准误越大,抽样误差越大;抽样误差越大;(2)反映均数的可靠性:越大,样本均数的抽样误差反映均数的可靠性:越大,样本均数的抽样误差越大,(用样本均数推算总体均数的)可靠性差;越大,(用样
11、本均数推算总体均数的)可靠性差;反之,越小,均数抽样误差越小,(用样本均数推反之,越小,均数抽样误差越小,(用样本均数推算总体均数的)可靠性好。算总体均数的)可靠性好。(3)用于进行假设检验(见下节)用于进行假设检验(见下节) 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室21标准差,标准误有何区别和联系标准差,标准误有何区别和联系? ? 标准差和标准误都是变异指标,但它们之标准差和标准误都是变异指标,但它们之间有区别,也有联系。间有区别,也有联系。区别区别: : 概念不同:概念不同:标准差是描述观察值标准差是描述观察值(个体值个体值)之之间的变异程度,间的变异程度,S越
12、小,均数的代表性越好;越小,均数的代表性越好;标准误是描述样本均数的抽样误差,标准误是描述样本均数的抽样误差,Sx越小,越小,均数的可靠性越高;均数的可靠性越高;2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室22与样本含量的关系不同与样本含量的关系不同: 当样本含量当样本含量 n 足够大时,足够大时,标准差趋向稳定;而标准误随标准差趋向稳定;而标准误随n的增大而减小,甚的增大而减小,甚至趋于至趋于0 。联系联系: 标准差、标准误均为变异指标,当样本含量标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。不变时,标准误与标准差成正比。用途不同:用途不同:标准
13、差与均数结合估计参考值范围,标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。数的可信区间,进行假设检验等。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室23第二节第二节 t t分布分布 一、一、t t分布的概念分布的概念 将任何一个正态分布将任何一个正态分布N N(,)变换)变换成成u u分布分布N N(0 0,1 1),变换方法是将变量值),变换方法是将变量值X X变换为变换为u u(标准正态离差):(标准正态离差):Xu2022-4-23 流行病与卫生统计学教研室流行
14、病与卫生统计学教研室24 在研究样本均数的抽样分布时,把样在研究样本均数的抽样分布时,把样本均数本均数X X看作看作“变量值变量值”,其与,其与的离差用的离差用标准差(标准误)为单位表示:标准差(标准误)为单位表示:_XXu2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室25 实际工作中,常用实际工作中,常用s sx x估计估计X X ,为与为与u u变换区别,称为变换区别,称为t t变换变换。nsXsXtX_2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室26 从一个正态总体中抽取一系列从一个正态总体中抽取一系列n n相等相等的样本,每一个样本可计算一
15、个的样本,每一个样本可计算一个t t值值, ,因因此可计算一系列此可计算一系列t t值,值,t t值的频数分布称值的频数分布称为为t t分布分布。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室27二、二、t t分布的特征分布的特征 以以0 0为中心,左右对称。为中心,左右对称。 t t分布曲线形态与分布曲线形态与n n(确切说与自由(确切说与自由度度v v)大小有关。)大小有关。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室28 v v越小越小,t t分布曲线与标准正态曲线出分布曲线与标准正态曲线出入越大(曲线越扁平);入越大(曲线越扁平); v v
16、越大越大, t t分布曲线越接近标准正态曲分布曲线越接近标准正态曲线;线; 当当v v时时, t t分布曲线为标准正态曲分布曲线为标准正态曲线。线。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室29不同自由度下不同自由度下t分布图分布图2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室3015-12022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室31三、三、t界值表(附表界值表(附表2) 对应每一自由度取值,就有一条对应每一自由度取值,就有一条t分分布曲线,每条曲线都有自身曲线下布曲线,每条曲线都有自身曲线下t值的值的分布规律,由于计算
17、分布规律,由于计算t值较为繁杂。为此,值较为繁杂。为此,统计学家已制成统计学家已制成t值表,通过查表即获得值表,通过查表即获得相应的相应的t值。值。 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室322022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室332022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室34查表须注意:查表须注意: (1)t值有正负值,由于值有正负值,由于t分布是以分布是以0为中为中心的对称分布,故表中只列正值,查表时,心的对称分布,故表中只列正值,查表时,不管不管t值正负只用绝对值查表得概率值;值正负只用绝对值查表得概
18、率值; (2)t界值表中,横标目为自由度界值表中,横标目为自由度v,纵标,纵标目为概率(或目为概率(或a)。一侧尾部面积称单侧)。一侧尾部面积称单侧概率。两侧尾部面积之和为双侧概率。即概率。两侧尾部面积之和为双侧概率。即t值值表中插图阴影部分。表中插图阴影部分。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室352022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室36()表中数字表示当()表中数字表示当v v和和a a确定时,对应确定时,对应的的t t界值其中与单侧概率相对应的界值其中与单侧概率相对应的t t界值用界值用t ta,va,v表示,与双侧概率相对
19、应的表示,与双侧概率相对应的t t界值用界值用t ta/2,va/2,v表示。表示。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室37 0 0 2.52.5-t-t0.050.05t t0.050.05随机样本算得随机样本算得t t值,值,有有9595个个t t满足:满足:-t-t0.050.05,v vtttt0.050.05,v v随随v v变化变化, ,记作记作t t0.05,v0.05,v2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室38u u曲线下面积为曲线下面积为9595双侧双侧界值界值是?是? 0 0 2.52.5常量常量1.961.9
20、6 记作记作u u0.050.05-1.96-1.961.961.962022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室39()当()当一定时,越小,一定时,越小,t t值越大;值越大;()当一定时,()当一定时,越大,越大,t t值越小;值越小; 时,时,t tu u;注:所有的注:所有的t分布的曲线均比正态曲线低。说分布的曲线均比正态曲线低。说明在同样的曲线下面积,明在同样的曲线下面积,t值值u值。例如,中值。例如,中间间95%面积,在横轴上的区间:面积,在横轴上的区间: |u|=1.96; 而而 |t|1.96 2022-4-23 流行病与卫生统计学教研室流行病与卫生统
21、计学教研室40()当()当一定时,一定时, 双侧双侧2 2单侧单侧 即即 双侧双侧t t/2/2,单侧单侧t t,。单侧:单侧:t0.025,10=2.228双侧:双侧:t0.05,10=2.228二者相等二者相等2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室41/2/22(/2)双侧双侧单侧单侧2.2282.2282.2282022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室422022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室432022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室44第三节第三节 总体均数估计总体均数
22、估计 一、可信区间的概念一、可信区间的概念统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计区间估计用样本指标用样本指标来估计总体来估计总体指标指标 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室452022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室46 2 2、区间估计区间估计(ICIC):按一定的概率):按一定的概率 (1 1)估计总体均数所在范围(可信区)估计总体均数所在范围(可信区间)。间)。1 1称为置信度,常用称为置信度,常用9595或或9999。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室47 总体
23、均数的区间估计:总体均数的区间估计:按预先给定的按预先给定的概率概率(1 )所确定的包含未知总体均数的一所确定的包含未知总体均数的一个范围。个范围。 如给定如给定 =0.05,该范围称为参数的该范围称为参数的95%可信区可信区间或置信区间;间或置信区间; 如给定如给定 =0.01,该范围称为参数的该范围称为参数的99%可信区可信区间或置信区间。间或置信区间。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室48可信区间通常是由两个数值即可信限或可信区间通常是由两个数值即可信限或置信限构成的一范围,其中较小的值称可信置信限构成的一范围,其中较小的值称可信下限();较大的值为可信
24、上限()。下限();较大的值为可信上限()。注:注:可信区间不包括可信上下限两个值,可信区间不包括可信上下限两个值,用圆括号表示该开区间。用圆括号表示该开区间。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室49 例例 某年级学生某年级学生N N600600人,预防医学人,预防医学成绩成绩(不知)。抽样(不知)。抽样n n100100, x x 75.0075.00。估计。估计?。?。 75.00 75.00 可能性可能性70.0070.0080.0080.00 可能性可能性 点估计,点估计,区间估计区间估计65.0065.0085.0085.00 可能性可能性2022-4
25、-23 流行病与卫生统计学教研室流行病与卫生统计学教研室50二、总体均数的区间的计算方法:二、总体均数的区间的计算方法:1 1、单一总体均数的可信区间、单一总体均数的可信区间(1 1)当)当未知,且未知,且n n较小(较小(n30n6 0 , 故故 可可 采采 用用 正正 态态 近近 似似 的的 方方 法法 按按 公公 式式 (3 -8 ) 计计 算算 可可 信信 区区 间间 。 今今 X=3 .6 4 、S=1 .2 0 、n=2 0 0 、XS=0 .0 8 4 9 , 取取 双双 尾尾 0 .0 5 得得0.05 / 21.96u。 3 .6 41 .9 60 .0 8 4 9(3 .4
26、 7 , 3 .8 1 )(m m ol/L ) 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室68例例: : 随机抽查随机抽查150150名名3 3岁女孩身高,得岁女孩身高,得X X92.8cm92.8cm,s sx x0.38cm0.38cm,估计估计3 3岁女孩身高均岁女孩身高均数的数的9595可信区间。可信区间。 X X 1 1. .9696S Sx x92.892.8 1 1. .96960.380.38 92.192.193.5(cm)93.5(cm)2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室692. 两两 总总 体体 均均 数数 之
27、之 差差 的的 可可 信信 区区 间间 : 从从 相相等等 , 但但不不 等等 的的 两两 个个 正正 态态 总总 体体N ( 1, 2)和和N ( 2, 2)进进 行行 随随 机机 抽抽 样样 。 则则 两两 总总 体体 均均 数数 之之 差差(12)的的 双双 侧侧1可可 信信 区区 间间 为为 1212/2,()XXXXtS1212(1)(1)2nnnn2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室702022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室712022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室72 例例3-4 为了解氨
28、甲喋呤为了解氨甲喋呤(MTX)对外周血对外周血IL-2水平的影响,某医生将水平的影响,某医生将61名哮喘患者随机分为名哮喘患者随机分为两组。其中对照组两组。其中对照组29例例( ),采用安慰剂;实验,采用安慰剂;实验组组32例例( ),采用小剂量氨甲喋呤,采用小剂量氨甲喋呤(MTX)进行治进行治疗。测得对照组治疗前疗。测得对照组治疗前IL-2的均数为的均数为20.10 IU/ml ( ),标准差为,标准差为7.02 IU/ml ( );试验组;试验组治疗前治疗前IL-2的均数为的均数为16.89 IU/ml ( ),标准差,标准差为为8.46 IU/ml ( )。问两组治疗前基线的。问两组治疗
29、前基线的IL-2总总体均数相差有多大?体均数相差有多大? 1n2n1X2X2S1S2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室73第一步:第一步: 1222(29 1) 7.02(32 1) 8.4611()2.002329 32 229 32XXS 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室74第第二二步步:以以0.05,2932259查查 t 界界值值表表 查查附附表表 2 得得,0.05/2,602.000t,代代入入公公式式(3-11),则则 两两总总体体 IL-2 均均数数之之差差(12)的的双双侧侧 95%可可信信区区间间为为 (2
30、0.1016.89)2.0002.00230.79, 7.21 (IU/ml) 故故两两组组治治疗疗前前基基线线的的 IL-2 总总体体均均数数之之差差的的 95%可可信信区区间间为为(-0.79, 7.21)(IU/mL)。 能否下:两组能否下:两组IL-2的总体均数的总体均数“不同不同”或或“有差别有差别”的结论?的结论?2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室75三、可信区间的确切涵义三、可信区间的确切涵义1 1、含义:、含义:从总体中作随机抽样,进行重复抽样从总体中作随机抽样,进行重复抽样的试验中,平均有的试验中,平均有1 1a a的可信区间包含了总体参的可
31、信区间包含了总体参数,有数,有a a的可信区间不包括总体均数。即犯错误的可信区间不包括总体均数。即犯错误的概率为的概率为a a,而,而a a是小概率事件,对一次试验的可是小概率事件,对一次试验的可能性小,因此,实际应用中就认为总体均数在算能性小,因此,实际应用中就认为总体均数在算得的可信区间内。得的可信区间内。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室76 95%95%的可信区间的理解:的可信区间的理解: (1 1)所要估计的总体参数有)所要估计的总体参数有95%95%的可能在我们所的可能在我们所估计的可信区间内。估计的可信区间内。 (2 2)从正态总体中随机抽取)从
32、正态总体中随机抽取100100个样本,可算得个样本,可算得100100个样本均数和标准差,也可算得个样本均数和标准差,也可算得100100个均数的可个均数的可信区间,平均约有信区间,平均约有9595个可信区间包含了总体均数。个可信区间包含了总体均数。 (3 3)但在实际工作中,只能根据一次试验结果估)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数计可信区间,我们就认为该区间包含了总体均数 。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室772、可信区间的两个要素:、可信区间的两个要素: 准确度:准确度:反映在可信度反映在可信度(1)的大小
33、。的大小。1越越接近接近1,就越准确。如可信度,就越准确。如可信度99%比比95%准确。准确。 精确度:精确度:反映在区间的长度。长度越小越好。反映在区间的长度。长度越小越好。 在例数在例数n确定的情况下,二者呈反比关系:确定的情况下,二者呈反比关系: 准确度准确度, 精确度精确度(范围变宽范围变宽)。 要兼顾准确度和精确度,一般取要兼顾准确度和精确度,一般取95%可信区间。可信区间。 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室783、可信区间与参考值范围区别、可信区间与参考值范围区别 (1)意义不同)意义不同 正常值范围是指绝大多数观察正常值范围是指绝大多数观察值在
34、某个范围;值在某个范围; 可信区间是指按一定的可信度估可信区间是指按一定的可信度估计总体均数(参数)的所在范围;计总体均数(参数)的所在范围; (2)计算公式不同)计算公式不同 可信区间可信区间 xsux正常值范围正常值范围 sux2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室79(3 3)应用不同)应用不同可信区间可信区间:估计总体均数估计总体均数参考值范围:判断某项指标是否正常参考值范围:判断某项指标是否正常2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室80 假设检验(假设检验(hypothesis test)hypothesis test)也称
35、显著性也称显著性检验(检验(significance test)significance test)。由于存在抽样误。由于存在抽样误差,从总体中随机抽样所得的样本均数与总体差,从总体中随机抽样所得的样本均数与总体均数之间存在误差,从同一总体中抽取的样本均数之间存在误差,从同一总体中抽取的样本均数之间也有误差。均数之间也有误差。第四节第四节 t检验检验一、假设检验原理一、假设检验原理 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室81例例 3-5 某医生测量了某医生测量了3636名从事铅作业的血红名从事铅作业的血红蛋白含量,算得其均数为蛋白含量,算得其均数为130.83g/
36、L130.83g/L,标准差,标准差为为25.74g/L25.74g/L。问从事铅作业工人的血经蛋白是。问从事铅作业工人的血经蛋白是否不同于正常成年男性平均值否不同于正常成年男性平均值140g/L140g/L?2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室82例例 3-53-50=140g/L已知总体已知总体X=130.83g/LS=25.74g/L未知总体未知总体=2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室83 完全由抽样误差引起,比较的均数完全由抽样误差引起,比较的均数来源于同一总体;来源于同一总体;_x2_1_xx 的原因的原因假设检验计算
37、假设检验计算 的概率判断。的概率判断。 来自于不同的总体,均数之间存在本来自于不同的总体,均数之间存在本质差别。质差别。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室840X差异完全由抽样误差引起差异完全由抽样误差引起2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室850X差异完全由抽样误差引起差异完全由抽样误差引起2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室860X来自于不同的总体来自于不同的总体2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室870X来自于不同的总体来自于不同的总体2022-4-23 流行
38、病与卫生统计学教研室流行病与卫生统计学教研室88假设检验基本思路:假设检验基本思路: 首先对未知或不完全知道的总体提出一首先对未知或不完全知道的总体提出一个假设,然后借助一定的分布,观察实测样个假设,然后借助一定的分布,观察实测样本情况是否属于小概率事件。如果实测样本本情况是否属于小概率事件。如果实测样本属于小概率事件,则认为这个假设是错的,属于小概率事件,则认为这个假设是错的,拒绝这个假设;反之,不拒绝原来的假设。拒绝这个假设;反之,不拒绝原来的假设。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室89 假设检验是利用小概率反证法思想,从问假设检验是利用小概率反证法思想,
39、从问题的对立面(题的对立面(H H0 0:u u= =u u0 0 )出发间接判断要解决)出发间接判断要解决的问题(的问题(H H1 1:u uu u0 0)是否成立。然后在)是否成立。然后在H H0 0成立成立的条件下计算检验统计量,最后获得的条件下计算检验统计量,最后获得P P值来值来推推断此假设应当拒绝或不拒绝,以便研究者了解断此假设应当拒绝或不拒绝,以便研究者了解在假设条件下,差异由抽样误差引起的可能性在假设条件下,差异由抽样误差引起的可能性大小。大小。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室90二、假设检验的一般步骤二、假设检验的一般步骤 1、建立假设和确
40、定检验水准、建立假设和确定检验水准 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 3、确定、确定P值和作出推断结论值和作出推断结论 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室911、建立假设和确定检验水准、建立假设和确定检验水准 基本步骤基本步骤(1)两个假设)两个假设 无效假设:无效假设: H0:u=u0 备择假设:备择假设: H1: uuuu0 02022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室92对于假设检验,对于假设检验,须注意:须注意:检验的假设是针对总体而言,而不是针对样本;检验的假设是针对总体而言,而不是针对样本;
41、H H0 0和和H H1 1是相互联系、对立的假设,后面的结论是是相互联系、对立的假设,后面的结论是根据根据H H0 0和和H H1 1作出的,因此,两者不是可有可无,而作出的,因此,两者不是可有可无,而是缺一不可;是缺一不可; H H0 0是无效假设,其假设通常是:某两个总体参数是无效假设,其假设通常是:某两个总体参数相等,或两个总体参数之差等于相等,或两个总体参数之差等于0 0等等。等等。 H H1 1的内容反映了检验的单双侧。的内容反映了检验的单双侧。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室93单侧检验:单侧检验:在比较两种药物的疗效时,根据在比较两种药物的疗
42、效时,根据专业知识可认为新药不会比旧药差,只关心专业知识可认为新药不会比旧药差,只关心新药是否比旧药好(至多相同,绝对排除出新药是否比旧药好(至多相同,绝对排除出现相反的可能性),可用单侧检验。现相反的可能性),可用单侧检验。 (2)确定单侧或双侧检验确定单侧或双侧检验 根据专业知识和研究目的而定根据专业知识和研究目的而定2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室94双侧检验:双侧检验:在比较两种药物的疗效时,事先在比较两种药物的疗效时,事先不能确定哪种药的疗效较好,只关心两药的不能确定哪种药的疗效较好,只关心两药的疗效有无差别,要用双侧检验。疗效有无差别,要用双侧检
43、验。 双侧检验若有差别,单侧检验肯定有差别;双侧检验若有差别,单侧检验肯定有差别;反之,单侧检验若有差别,双侧检验不一定反之,单侧检验若有差别,双侧检验不一定有差别。有差别。 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室95 甲均数与乙均数相比甲均数与乙均数相比: : 可能高可能高, ,也可能低也可能低 双侧检验双侧检验 肯定不会低(或高)肯定不会低(或高) 单侧检验单侧检验H H1 1 :0 0 0 0 1 1 2 2 1 1 2 22022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室962022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教
44、研室97 (3) 确定检验水准(显著性水准)确定检验水准(显著性水准) 一般一般0.05,发生第一类错误的概率,发生第一类错误的概率,即即H H0 0实际成立,但拒绝实际成立,但拒绝H H0 0的概率的概率。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室98 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 不同设计、不同的资料类型和不同的推不同设计、不同的资料类型和不同的推断目的,选用不同的检验方法。断目的,选用不同的检验方法。 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室993、确定、确定P值值 P值值是指由所规定的总体作随机抽样
45、,是指由所规定的总体作随机抽样, 获得等于及大于(或等于及小于)现有样本获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。获得的检验统计量值的概率。 手工计算:手工计算:一般是通过查界值表获得。一般是通过查界值表获得。 统计软件:统计软件:直接给出精确的直接给出精确的P P值值2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室1004、作出推断结论、作出推断结论(含统计结论和专业结论)(含统计结论和专业结论)统计结论:统计结论: 拒绝拒绝H0,接受,接受H1,差异有统计学意义。差异有统计学意义。 专业结论:专业结论:可认为可认为 不同或不等。不同或不等。当当 P
46、时,时, 将获得的事后概率将获得的事后概率P P与事先规定的与事先规定的概率概率进行比较。进行比较。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室101当当P时,时, 统计结论:统计结论: 不拒绝不拒绝H0,差异无统计学意义,差异无统计学意义专业结论:专业结论: 还不能认为还不能认为 不同或不等。不同或不等。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室102假设检验的特点:假设检验的特点:1、统计检验的假设是关于总体特征的假设;、统计检验的假设是关于总体特征的假设;2、用于检验的方法是以检验统计量的抽样分布、用于检验的方法是以检验统计量的抽样分布为
47、理论根据的;为理论根据的;3、作出的结论是概率性的,不是绝对的肯定或、作出的结论是概率性的,不是绝对的肯定或绝对的否定。(无论是拒绝绝对的否定。(无论是拒绝H0或不拒绝或不拒绝H0,都都有可能发生错误)有可能发生错误) 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室103假设检验中假设检验中值与值与P值的区别:值的区别:1 1、假设检验中、假设检验中值是检验水准,是拒绝或不值是检验水准,是拒绝或不拒绝拒绝H H0 0的概率标准。的概率标准。的大小是人为选定的,的大小是人为选定的,一般取一般取0.050.05。2 2、P P值是指在值是指在H H0 0所规定的总体中作随机抽
48、样所规定的总体中作随机抽样, ,获得等于或大于获得等于或大于( (等于或小于等于或小于) )现有样本统计量现有样本统计量的概率。通过的概率。通过P P值与值与值的比较来确定拒绝或值的比较来确定拒绝或不拒绝不拒绝H H0 0。 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室104t t检验适用条件检验适用条件: 未知未知 两样本较小(两样本较小(n n1 1与与n n2 25050) 两样本均数比较时,两样本的总体方差相两样本均数比较时,两样本的总体方差相等(即方差齐)等(即方差齐) 上述都要求:资料服从对称或正态分布。上述都要求:资料服从对称或正态分布。三、三、t t检验
49、和检验和u u检验检验 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室105 u u检验适用条件检验适用条件: 已知已知,x x与与比较比较 两大样本(两大样本(n n1 1与与n n2 25050)均数比较)均数比较 上述两种情况都要求:资料服从对称上述两种情况都要求:资料服从对称或正态分布。或正态分布。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室106t t检验和检验和u u检验类型检验类型 1 1、样本均数与总体均数的比较、样本均数与总体均数的比较t t检验检验 2 2、配对设计差值均数与总体均数、配对设计差值均数与总体均数0 0的比较的比较
50、 t t检验检验 3 3、两样本均数的比较、两样本均数的比较t t检验检验 4 4、两样本几何均数的比较、两样本几何均数的比较t t检验检验 5 5、两大样本均数比较、两大样本均数比较u u检验检验 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室1071 1、单样本、单样本t t或或U U检验检验 样本均数代表的未知总体均数样本均数代表的未知总体均数和已和已知总体均数知总体均数0的比较的比较0理论值、标准值、理论值、标准值、稳定值稳定值X2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室108 样本均数与已知样本均数与已知总体均数总体均数(一般为(一般为
51、理理论值、标准值或大量观测所得的稳定值论值、标准值或大量观测所得的稳定值)的比较,目的是推断样本所代表的总体与的比较,目的是推断样本所代表的总体与已知总体是否相等。根据已知总体是否相等。根据是否已知和样是否已知和样本含量本含量n n的大小的大小, ,选用选用u u检验或检验或t t检验。检验。2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室109 t t检验适用条件检验适用条件: 未知未知 两样本较小(两样本较小(n n1 1与与n n2 25050) 两样本均数比较时,两样本的总体方差相两样本均数比较时,两样本的总体方差相等(即方差齐)等(即方差齐) 上述都要求:资料服从
52、对称或正态分布。上述都要求:资料服从对称或正态分布。t t 检验检验2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室110nsXSXtXt t检验计算公式为检验计算公式为: :2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室111例例 3-53-5 某医生测量了某医生测量了3636名从事铅作业的血名从事铅作业的血红蛋白含量,算得其均数为红蛋白含量,算得其均数为 =130.83g/L=130.83g/L,标准差为标准差为25.74g/L25.74g/L。问从事铅作业工人的血经。问从事铅作业工人的血经蛋白是否不同于正常成年男性平均值蛋白是否不同于正常成年男性
53、平均值140g/L140g/L?X2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室112例例 3-53-50=140g/L已知总体已知总体 =130.83g/LS=25.74g/L未知总体未知总体=X2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室113检验步骤:检验步骤: 例3-5建立假设和确定检验水准建立假设和确定检验水准 H0:=0=140g/L H1:0=140g/L 双侧双侧=0.052022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室114选定检验方法和计算检验统计量选定检验方法和计算检验统计量本例本例n=36n=36, =1
54、30.83g/L=130.83g/L,S=25.74g/LS=25.74g/L, 0 0=140g/L=140g/L,按式按式(3-15)(3-15) 138. 236/74.2514083.130ns/xt0v=n-1=36-1=35X2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室115例4.6确定确定P值值 以以v=35查附表查附表2,t界值表,得:界值表,得: (v一定时,一定时,t值越大,值越大,P值越小值越小) 。ptttt05.002.0138.2438.2;030.235,02.035,05.035,02.035,05.0故双尾概率因为2022-4-23 流
55、行病与卫生统计学教研室流行病与卫生统计学教研室116 查查t t值表时,先查值表时,先查P=0.05P=0.05时的界值。时的界值。 当当P0.05P0.05P0.05时,需继续往时,需继续往P P更大的一侧查,更大的一侧查,直到最大的直到最大的P P值为止。值为止。 如使用统计软件,会给出确切的概率值。如使用统计软件,会给出确切的概率值。注意注意2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室117作出推断结论作出推断结论( (统计结论和专业结论统计结论和专业结论) ) 今今0.02P0. 05,按,按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计学意义差
56、异有统计学意义(统计结论统计结论),可认为从事铅作业的男性工人平均血红蛋可认为从事铅作业的男性工人平均血红蛋白量低于正常成年男性白量低于正常成年男性(专业结论专业结论)。 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室118t0.05,v 0.05 不拒绝不拒绝H0 无无统计学意义统计学意义 t0.05 ,v 0.05 拒绝拒绝H0,接受,接受H1 有有统计学意义统计学意义 t0.01 ,v 0.01 拒绝拒绝H0,接受,接受H1 有有统计学意义统计学意义t值、值、P值与统计结论的关系(值与统计结论的关系(0.050.05)t值值 P值值 结论结论 差异的统计学意义差异的
57、统计学意义2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室119例例 : 根据大量调查已知健康成年男子的脉搏均根据大量调查已知健康成年男子的脉搏均数为数为72次次/分。分。某医生在某山区随机调查了某医生在某山区随机调查了3030名名健康男子,求得脉搏均数为健康男子,求得脉搏均数为74.274.2次次/ /分,标准分,标准差为差为6.56.5次次/ /分。能否认为该山区的成年男子的分。能否认为该山区的成年男子的脉搏均数与一般脉搏均数与一般男子的脉搏均数相等男子的脉搏均数相等?2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室120例例0=72次次/分分已知总
58、体已知总体 =74.2次次/分分S=6.5次次/分分未知总体未知总体=X2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室121检验步骤:检验步骤: 例建立假设和确定检验水准建立假设和确定检验水准 H0:=0=72次次/分分 H1:0=72次次/分分 双侧双侧=0.052022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室122选定检验方法和计算检验统计量选定检验方法和计算检验统计量本例本例n=30n=30, =74.2=74.2,S=6.5S=6.5, 0 0=72=72,按式按式(5-1)(5-1) 854. 130/5 . 6722 .74ns/xt0v=
59、n-1=30-1=29X2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室123 查查t t值表时,先查值表时,先查P=0.05P=0.05时的界值。时的界值。 当当P0.05P0.05P0.05时,需继续往时,需继续往P P更大的一侧查,更大的一侧查,直到最大的直到最大的P P值为止。值为止。 如使用统计软件,会给出确切的概率值。如使用统计软件,会给出确切的概率值。注意注意2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室124作出推断结论作出推断结论( (统计结论和专业结论统计结论和专业结论) ) 今今P0. 05,按,按=0.05水准,不拒绝水准,不拒
60、绝H0,差异无统计学意义差异无统计学意义(统计结论统计结论),尚不能认为,尚不能认为该山区的成年男子的脉搏均数高于一般男该山区的成年男子的脉搏均数高于一般男子的脉搏均数子的脉搏均数(专业结论专业结论)。 2022-4-23 流行病与卫生统计学教研室流行病与卫生统计学教研室125例例: : 15 15例长期服用某种避孕药的妇女例长期服用某种避孕药的妇女, ,其血清其血清胆固醇含量的均数为胆固醇含量的均数为6.5mmol/L,6.5mmol/L,标准差为标准差为0.7mmol/L,0.7mmol/L,一般健康妇女血清胆固醇含量的一般健康妇女血清胆固醇含量的均数为均数为4.4mmol/L,4.4mm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理就业指导与职业发展
- 护理教学中的问题导向学习
- 护理工作标准化流程汇报
- 护理实习科研入门
- 口腔护理与社区健康
- 护理心理学与心理评估
- 动脉粥样硬化预防措施效果评价
- 客户关系策略及沟通技巧总结
- 快消品企业会计工作常见问题及解答
- 基于云计算的大规模数据处理研究
- 天鹅到家月嫂培训课件班
- 2025-2030TPU材料在运动鞋领域应用拓展与性能优化方向
- 2025年上海市安全员-C3证(专职安全员-综合类)证模拟考试题库答案
- 电影欣赏社团课件
- 电气设备安装及调试合同协议书范本6篇
- 北京车牌结婚过户协议书
- 数字音频原理及应用 第4版 习题答案
- 矿业项目进退场交接措施
- 【城市轨道交通客运组织优化研究-以天津地铁为例11000字(论文)】
- 喝酒划拳活动方案
- T/CHES 59-2021组合式金属防洪挡板安装、验收及维护规范
评论
0/150
提交评论