第三节数值变量的统计推断_第1页
第三节数值变量的统计推断_第2页
第三节数值变量的统计推断_第3页
第三节数值变量的统计推断_第4页
第三节数值变量的统计推断_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三节第三节数值变量资料的统计推断数值变量资料的统计推断学习要点:1.1.掌握均数的抽样误差与标准误的概念;掌握均数的抽样误差与标准误的概念;2.2.熟悉熟悉t t分布的概念与特征;分布的概念与特征;3.3.掌握总体均数的区间估计;掌握总体均数的区间估计;4.4.熟悉假设检验的基本原理和熟悉假设检验的基本原理和步骤;步骤;5.5.掌握掌握t t检验和检验和Z Z检验的方法;检验的方法;6.6.了解两类错误和假设检验的注意事项。了解两类错误和假设检验的注意事项。统计推断(statistical inference) 用样本的信息推论总体的特征。 参数估计参数估计统计推断统计推断 假设检验假设检验

2、1414岁女生岁女生 ( (身高身高) )cm89.155120人cmx82.154 均数的抽样误差均数的抽样误差-由于抽样造成的样由于抽样造成的样本均数与总体均数、样本均数之间的差异。本均数与总体均数、样本均数之间的差异。一、均数的抽样误差与标准误一、均数的抽样误差与标准误根据中心极限定理:1 .1 .从正态总体中抽样,抽取样本含量为从正态总体中抽样,抽取样本含量为n n的样的样本,样本均数本,样本均数 服从正态分布。即使是从偏服从正态分布。即使是从偏态总体中抽样,在样本含量足够态总体中抽样,在样本含量足够(n50)(n50)大时大时, , 也近似正态分布。也近似正态分布。2.2.从均数为从

3、均数为 ,标准差为,标准差为 的正态或偏态总体的正态或偏态总体中抽样样本例数为中抽样样本例数为n n的样本,新样本组成的数的样本,新样本组成的数据中,样本均数为据中,样本均数为 ,标准差,标准差XxnXX样本样本1 1样本样本2 2样本样本k k总体均数总体均数1X2XkXkxxxk21标准误:样本均数的标准差。标准误:样本均数的标准差。反映各均数间的离散程度。标准误标准误 的意义的意义: : 描述抽样误差的大小描述抽样误差的大小, , 越小越小, , 说明说明抽样误差越小,样本均数越接近总体均数,抽样误差越小,样本均数越接近总体均数,用用 代表代表 的可靠性越高。的可靠性越高。xXx标准误的

4、计算标准误的计算均数的标准误均数的标准误 例例: :某地某地1414岁健康女生身高的标准差岁健康女生身高的标准差5.30cm5.30cm及每个样本包含的例数及每个样本包含的例数1010,求标准误,求标准误 )(68. 110/30. 5cmxnx应用时,用样本标准差应用时,用样本标准差 来代替总体来代替总体标准差标准差 ,则标准误的估计值为:,则标准误的估计值为:nSSxSnx?减少抽样误差的有效途径?减少抽样误差的有效途径均数标准误的用途:均数标准误的用途:可用来衡量样本均数的可靠性。可用来衡量样本均数的可靠性。与样本均数结合,可用于估计总体均与样本均数结合,可用于估计总体均数的置信区间;数

5、的置信区间;可用于进行均数的假设检验。可用于进行均数的假设检验。二、二、 t 分布分布Z 变换(将正态分布转化为标准正态分布)变换(将正态分布转化为标准正态分布)t 变换变换 xSXtXuxxuZZt t 分布特征:分布特征:(1 1) 单峰分布,以单峰分布,以0 0为中心左右对称。为中心左右对称。(2 2) t t 分布是一簇曲线,其形状受分布是一簇曲线,其形状受的影响。的影响。t 分布与标准正态分布(分布与标准正态分布(Z 分布)区别:分布)区别: * t 分布曲线峰部较矮,尾部稍翘。分布曲线峰部较矮,尾部稍翘。 * n(自由度(自由度=n-1 )越大,)越大,t 分布与分布与Z 分分布布

6、 越接近;当越接近;当= 时,时, t 分布分布=Z 分布。分布。 全国全国14岁女生岁女生(身高身高)=155.40cm120人人120人人120人人1x2x3x120人人nxxxxSxt),(xN(t 分布)xxxSxt),(xN(t 分布)xu),(N)1 ,0(N(u 分布)xu),(N)1 ,0(N(u 分布)ZZt分布的特征:t界值表界值表:(表10-10 P292)t t界值表的特征:界值表的特征: 自由度相同时自由度相同时 t t, 越大,概率越大,概率P P越小;越小; 双侧概率双侧概率P P为单侧概率为单侧概率P P的两倍。的两倍。 自由度为自由度为 ,概率为,概率为 (检

7、验水准)(检验水准)时,时, t 的界值记为的界值记为 t,或或 t/2, 。t 界值表的查法:界值表的查法: t t, = =? 通常取通常取0.05或或0.01 ( t 越大,概率越大,概率 P 越小)越小)2.2623.250=9, t0.05,9 = t0.01,9 =1.962.58 当当n50,为大样本,为大样本( t 分布分布= Z 分布)分布),可用可用Z来代替来代替t,=, t0.05, = t0.01, =)96. 1(05. 0u)58. 2(01. 0u 三、三、 总体均数的置信区间估计总体均数的置信区间估计 统计描述统计描述统计分析统计分析 参数估计参数估计-用样本指

8、标估用样本指标估 统计推断统计推断 计总体指标计总体指标 假设检验假设检验 点估计点估计-用用 估计估计参数估计参数估计 区间估计区间估计-按一定的概率估计总体均按一定的概率估计总体均 数落在某个范围数落在某个范围这个范围称之为:这个范围称之为: 总体均数的置信区间总体均数的置信区间 CI ,为开区间用(),为开区间用()表示。如(表示。如(140.2,144.3),说明总体均数在),说明总体均数在140.2144.3之间,但不包含上限(之间,但不包含上限(144.3)及)及下限(下限(140.2)两个值。)两个值。x总体均数置信区间(可信区间)的计算总体均数置信区间(可信区间)的计算1) 已

9、知已知 95%置信区间置信区间 99%置信区间置信区间xx96. 1xx58. 2xux, 2/xx96. 1xx58. 2xux, 2/Z 总体均数置信区间(可信区间)的计算总体均数置信区间(可信区间)的计算2)小样本或)小样本或 未知未知-按按 t 分布分布 95%置信区间置信区间 99%置信区间置信区间 xStx,05. 0 xStx,01. 0),(1)(,2/,2/,2/,2/xxxStXStXsXttttPxStx,05. 0 xStx,01. 0),(1)(,2/,2/,2/,2/xxxStXStXsXttttP 总体均数置信区间(可信区间)的计算总体均数置信区间(可信区间)的计

10、算3)大样本)大样本-按按u 分布分布 95%置信区间置信区间 99%置信区间置信区间xSx96. 1xSx58. 2xSux, 2/xSx96. 1xSx58. 2xSux, 2/Z区间估计的选择区间估计的选择已知:利用已知:利用Z分布曲线分布曲线未知,且样本量较小:利用未知,且样本量较小:利用t分布曲线分布曲线未知,但样本量较大:利用未知,但样本量较大:利用Z分布曲线分布曲线例例: 随机抽取某地健康男子随机抽取某地健康男子2020人,测得该人,测得该样本的收缩压均数为样本的收缩压均数为118.4mmHg118.4mmHg,标准差,标准差S S为为10.8mmHg10.8mmHg,试估计该地

11、男子收缩压总体,试估计该地男子收缩压总体均数的均数的95%95%置信区间。置信区间。此为小样本,应按此为小样本,应按 t t 分布。分布。收缩压收缩压过高过低均为异常,故取过高过低均为异常,故取双侧双侧。95%95%置信区间:置信区间: 代入数据代入数据 () 即即(113.3,123.5)xStx,05. 0191201n093.219,05.0t2010.82.093,118.42010.82.093-118.4xStx,05. 0191201n093.219,05.0t2010.82.093,118.42010.82.093-118.4置信区间的两个要素:置信区间的两个要素:1.准确度:

12、反映在准确度:反映在1-的大小上。的大小上。2.精确度:反映在区间的长度上。精确度:反映在区间的长度上。在样本含量一定的情况下二者是矛盾的。在样本含量一定的情况下二者是矛盾的。常用的常用的95%置信区间。置信区间。xSx96. 1 Sx96. 1 xSx96. 1 Sx96. 1 均数置信区间与参考值范围的区别均数置信区间与参考值范围的区别 95%置信区间:置信区间: 从从 至至 范围有范围有95%的的可能性包含了总体均数。可能性包含了总体均数。95%正常值范围:正常值范围: 一组观察值中,有一组观察值中,有95%个体(频数)的观察个体(频数)的观察值在值在 至至 范围内。范围内。xSx96.

13、 1xSx96. 1Sx96. 1Sx96. 1xSx96. 1xSx96. 1Sx96. 1Sx96. 1练习1: 随机抽取某地健康男子随机抽取某地健康男子100人,测得该样本的收人,测得该样本的收缩 压 均 数 为缩 压 均 数 为 1 1 8 . 4 m m H g , 标 准 差, 标 准 差 S 为为10.8mmHg,试估计该地男子收缩压总体均数的,试估计该地男子收缩压总体均数的95%置信区间。置信区间。2: 随机抽取某地健康男子随机抽取某地健康男子36人,测得该样本的收人,测得该样本的收缩 压 均 数 为缩 压 均 数 为 1 1 8 . 4 m m H g , 标 准 差, 标

14、准 差 S 为为10.8mmHg,试估计该地男子收缩压总体均数的,试估计该地男子收缩压总体均数的95%置信区间。置信区间。3: 某地健康男子收缩压标准差为某地健康男子收缩压标准差为10,随机抽取某,随机抽取某地健康男子地健康男子36人,测得该样本的收缩压均数为人,测得该样本的收缩压均数为118.4mmHg,标准差,标准差S为为10.8mmHg,试估计,试估计该地男子收缩压总体均数的该地男子收缩压总体均数的95%置信区间。置信区间。4:随机抽取某地健康男子随机抽取某地健康男子36人,测得该样本的收缩人,测得该样本的收缩压均数为压均数为118.4mmHg,标准差,标准差S为为10.8mmHg,试估

15、计该地男子收缩压试估计该地男子收缩压95%正常值范围。正常值范围。四、假设检验的基本思想和步骤四、假设检验的基本思想和步骤(一)假设检验的基本思想(一)假设检验的基本思想利用反证法的思想利用反证法的思想例例 某地抽样调查了某地抽样调查了280280名健康成年男性的血名健康成年男性的血红蛋白含量,其均数为红蛋白含量,其均数为136.0g/L136.0g/L,标准差为,标准差为6.0g/L6.0g/L。已知正常成年男性血红蛋白的均数为。已知正常成年男性血红蛋白的均数为140.0g/L140.0g/L。试问能否认为该地。试问能否认为该地抽样调查的抽样调查的280280名名成年男性的血红蛋白含量与正常

16、成年男性的成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同?血红蛋白含量的均数不同?差异的原因:差异的原因: (1)(1)由于抽样误差造成的由于抽样误差造成的.(.(实际上实际上 ,但,但由于抽样误差由于抽样误差 不能很好代表不能很好代表 ) )(2)(2)该地成年男性的血红蛋白含量与正常成年男性该地成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同的血红蛋白含量的均数不同( )( ) 0000000 =140.0g/Ln=280 =136.0g/L S=6.0g/L已知总体未知总体x 假设检验的目的就是假设检验的目的就是判判断差异的原因断差异的原因: 求出由抽样误求出由

17、抽样误差造成此差异的可能性差造成此差异的可能性(概率概率P)有多大有多大 !n=28050,可近似看成Z分布,因此可用Z分布下的曲线面积来估计总体均数的可信区间。 在我们假设的前提下,Z值应该在-1.961.96之间xsxu16.11280/6136140 xsxuZZ 假设检验的目的就是假设检验的目的就是判断差异的原因判断差异的原因: 求出由抽样误差造成此差异的可能性求出由抽样误差造成此差异的可能性(概率概率P)有有多大多大 !若若 P 较大较大(P0.05),认为是由于抽样误差造成的,认为是由于抽样误差造成的 原因(原因(1),实际上),实际上 =0 若若 P 较小较小(P0.05),认为

18、不是由于抽样误差造成的,认为不是由于抽样误差造成的 原因(原因(2),实际上),实际上0(二)假设检验的基本步骤(二)假设检验的基本步骤1、建立假设建立假设 H0:(无效(无效假设)假设) =0 H1:(备择假设)(备择假设) 0 0 或或 02 2、确定检验水准、确定检验水准 =0.05=0.053 3、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量4 4、确定、确定P P值,作出推断结论值,作出推断结论 (推断的结论统计结论专业结论)(推断的结论统计结论专业结论) P P0.050.05,按,按0.050.05检验水准,不拒绝检验水准,不拒绝H H0 0,差异无统计学,差异无统

19、计学 意义意义( (差异无显著性差异无显著性) ),还不能认为,还不能认为不同或不等。不同或不等。 P0.05P0.05 ,按,按0.05 检验水准,拒绝检验水准,拒绝H H0 0,接受,接受H H1 1, 差异有统计学意义差异有统计学意义( (差异有显著性差异有显著性) ) ,可以认为,可以认为不不同或不等。同或不等。 P0.01P0.01,按,按0.05 检验水准,拒绝检验水准,拒绝H H0 0,接受,接受H H1 1, 差异有差异有高度高度统计学意义统计学意义( (差异有差异有高度高度显著性显著性) ) ,可以认,可以认为为不同或不等。不同或不等。140g/L 单、双侧检验的选择:单、双

20、侧检验的选择: 1 1、根据专业知识、根据专业知识 事先不知道会出现什么结果事先不知道会出现什么结果 双侧双侧 事先知道只能出现某种结果事先知道只能出现某种结果 单侧单侧 2 2、问题的提法、问题的提法 相同或不同相同或不同 双侧双侧 高低或大小高低或大小 单侧单侧* *通常用双侧通常用双侧( (除非有充足的理由选用单侧之外除非有充足的理由选用单侧之外, , 一般选用保守的双侧较稳妥一般选用保守的双侧较稳妥) ) 确定确定P 值:值: (用求出的(用求出的t 值与查表查出的值与查表查出的t 值比较)值比较) 查查t 值表:值表: 91101,10nn ( t 越大,越大,P 越小越小) (1)

21、 求出求出t=1.833,P0.05 (2) 求出求出t=4.18, P0.01 (3) 求出求出t=2.96, 0.01P0.05 (简写为简写为P0.05) (4) 求出求出t=3.25, P=0.01Pt0.050.013.2502.2621.833P0.054.18P0.01P0.052.96250. 3,262. 29 ,01. 09 ,05. 0tt 假设检验的思路是:假设检验的思路是: 首先对未知或不完全知道的总体提出一首先对未知或不完全知道的总体提出一个假设,然后借助一定的分布,观察实测样个假设,然后借助一定的分布,观察实测样本情况是否属于小概率事件。一般把概率本情况是否属于小

22、概率事件。一般把概率P0.05P0.05的事件称为小概率事件,小概率事件的事件称为小概率事件,小概率事件在一次观察中可以认为是不会发生的,如实在一次观察中可以认为是不会发生的,如实测样本情况属于小概率事件,则认为原先的测样本情况属于小概率事件,则认为原先的假设是错的,拒绝这个假设;如实测样本情假设是错的,拒绝这个假设;如实测样本情况不属于小概率事件,则不拒绝原来的假设。况不属于小概率事件,则不拒绝原来的假设。当然,小概率事件在一次观察中还是可能发当然,小概率事件在一次观察中还是可能发生的,若我们恰好碰上,则假设检验的结论生的,若我们恰好碰上,则假设检验的结论就是错误的,不过因为小概率事件发生的

23、概就是错误的,不过因为小概率事件发生的概率小,所以犯这种错误的概率也小。率小,所以犯这种错误的概率也小。假设检验的步骤假设检验的步骤建立检验假设建立检验假设H0和备择假设和备择假设H1确定检验水准确定检验水准选定检验方法和计算检验统计量选定检验方法和计算检验统计量确定确定P值,作出推断结论值,作出推断结论第四节第四节 t t 检验和检验和 Z Z 检验检验t t 检验应用条件:检验应用条件: 当当n n较小时,要求样本取自正态分布的较小时,要求样本取自正态分布的总体总体, ,总体标准差未知;总体标准差未知; 两小样本均数比较时,要求两样本总两小样本均数比较时,要求两样本总体方差相等(体方差相等

24、( 1 12 2= = 2 22 2)。)。Z Z 检验应用条件:检验应用条件: 当当n50n50;已知总体标准差已知总体标准差一、样本均数与总体均数比较的一、样本均数与总体均数比较的t t检验检验(即:样本均数代表的(即:样本均数代表的未知总体均数未知总体均数和和 已知总体均数已知总体均数0 0的比较的比较,又称为单样本,又称为单样本的的t t检验)检验)nSXSXtX00例例9-15 已知某小样本中含已知某小样本中含CaCO3CaCO3的真值是的真值是20.7mg/L20.7mg/L。现用某法重复测定该小样本。现用某法重复测定该小样本1515次,次,CaCO3CaCO3含量(含量(mg/L

25、mg/L)分别为:)分别为:20.9920.99,20.4120.41,20.6220.62, 20.7520.75,20.1020.10,20.0020.00,20.8020.80,20.9120.91,22.6022.60,22.3022.30,20.9920.99,20.4120.41,20.5020.50, 23.0023.00,22.6022.60。问该法测。问该法测得的均数与真值有无差别?得的均数与真值有无差别?(1)(1)建立假设、确定检验水准建立假设、确定检验水准H H0 0:= = 0 0 即测值与真值之间相等即测值与真值之间相等 H H1 1:0 0 即即测值与真值之间不相

26、等即即测值与真值之间不相等=0.05=0.05 (2 2)选定检验方法,计算检验统计量)选定检验方法,计算检验统计量n=15100n=150.051.70 P0.05, P0.05,按按=0.05=0.05检验水准,不拒绝检验水准,不拒绝H H0 0,无统计学意义。尚不能认为该法测得的均无统计学意义。尚不能认为该法测得的均数与真值不同。数与真值不同。141151 n145. 214,05. 0t141151 n145. 214,05. 0t例:根据全国儿童体质检测指标例:根据全国儿童体质检测指标2.52.5岁男童的身高均岁男童的身高均数为数为91.3cm91.3cm,标准差,标准差2.6cm2

27、.6cm,今随机测得,今随机测得3636名名2.52.5岁岁山区男童的平均身高为山区男童的平均身高为89.6cm89.6cm。问山区。问山区2 2男童身高的男童身高的均数是否比一般男童低?均数是否比一般男童低?1、建立假设、建立假设 2、确定检验水准、确定检验水准 3、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量=0.05(单侧)(单侧)H0:= 0H1:0=91.3 =2.6 n=36 x=89.64、确定、确定P值,判断结果值,判断结果 U0.05,单侧,单侧=1.6453.92,故,故P0.05,按,按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,可以认为山区,可以认

28、为山区2.5岁男童身高低于一般男童岁男童身高低于一般男童92. 3366 . 23 .916 .89nxuZ练习(1)1:全国资料显示,健康男性的收缩压均数为全国资料显示,健康男性的收缩压均数为120mmHg,今随机抽取某地健康男子,今随机抽取某地健康男子100人,人,测得该样本的收缩压均数为测得该样本的收缩压均数为118.4mmHg,标准,标准差差S为为10.8mmHg,试求该地区男子收缩压与全,试求该地区男子收缩压与全国水平有所不同。国水平有所不同。2:全国资料显示,健康男性的收缩压均数为全国资料显示,健康男性的收缩压均数为120mmHg,随机抽取某地健康男子,随机抽取某地健康男子36人,

29、测得人,测得该样本的收缩压均数为该样本的收缩压均数为118.4mmHg,标准差,标准差S为为10.8mmHg,试求该地区男子收缩压与全国水,试求该地区男子收缩压与全国水平有所不同。平有所不同。3:全国资料显示,健康男性的收缩压均数为全国资料显示,健康男性的收缩压均数为120mmHg,标准差为,标准差为10mmHg,随机抽取某地,随机抽取某地健康男子健康男子36人,测得该样本的收缩压均数为人,测得该样本的收缩压均数为118.4mmHg,标准差,标准差S为为10.8mmHg,试求该,试求该地区男子收缩压与全国水平有所不同。地区男子收缩压与全国水平有所不同。练习(练习(2)根据大量调查,已知健康成年

30、男子脉根据大量调查,已知健康成年男子脉搏的均数为搏的均数为7272次次/ /分,某医生在一山区分,某医生在一山区随机调查了随机调查了3636名健康成年男子,求得名健康成年男子,求得其脉搏均数为其脉搏均数为74.274.2次次/ /分,标准差为分,标准差为6.06.0次次/ /分,能否据此认为该山区成年分,能否据此认为该山区成年男子的脉搏均数高于一般成年男子的男子的脉搏均数高于一般成年男子的脉搏均数?脉搏均数?练习(练习(3)已知正常儿童采用注射接种法,注射麻已知正常儿童采用注射接种法,注射麻疹疫苗后产生的平均滴度为疹疫苗后产生的平均滴度为1:50,某医,某医生改进方法后,随机抽取生改进方法后,

31、随机抽取25名儿童采用名儿童采用气溶胶免疫法进行接种,计算出其平均气溶胶免疫法进行接种,计算出其平均数滴度为数滴度为1:55,滴度对数的标准偏差为,滴度对数的标准偏差为lg1.1,问气溶胶免疫法与注射接种法效,问气溶胶免疫法与注射接种法效果是否有差异?果是否有差异?样本与总体均数假设检验的步骤样本与总体均数假设检验的步骤1、确定是单侧还是双侧检验、确定是单侧还是双侧检验2、确定是、确定是t检验还是检验还是Z检验检验3、计算、计算t值或值或Z值值4、查阅、查阅t界值或界值或Z界值表界值表5、确定、确定P值,判定结果值,判定结果二、配对设计的均数比较二、配对设计的均数比较常见的配对设计主要有以下情

32、形:常见的配对设计主要有以下情形:自身比较:同一受试对象处理前后。自身比较:同一受试对象处理前后。同一受试对象分别接受两种不同的处理。同一受试对象分别接受两种不同的处理。 同一受试对象的两个部位测定同一个指标同一受试对象的两个部位测定同一个指标将条件近似的观察对象两两配成对子,对子将条件近似的观察对象两两配成对子,对子 中的两个个体分别给予不同的处理。中的两个个体分别给予不同的处理。配对配对t t检验的基本原理:检验的基本原理: 假设两种处理的效应相同,即假设两种处理的效应相同,即 1 1= = 2 2 ,则则 1 1-2 2=0=0,即可看成是差值的样本均数即可看成是差值的样本均数 所代表的

33、未知总体均数所代表的未知总体均数 d d 与已知总体均数与已知总体均数 0 0=0=0的比较,此时,我们可套用前述的比较,此时,我们可套用前述t t检验检验的公式。的公式。nSdSdtdd00例例10-16 应用某药治疗应用某药治疗8 8例高血压患者,观察患者例高血压患者,观察患者治疗前后舒张压变化情况,如表治疗前后舒张压变化情况,如表10-1010-10,问该药是,问该药是否对高血压患者治疗前后舒张压变化有影响?否对高血压患者治疗前后舒张压变化有影响?表表10-10 用某药治疗高血压患者前后舒张压变化情况用某药治疗高血压患者前后舒张压变化情况 H0: 该药对舒张压无影响。该药对舒张压无影响。

34、 H1: 该药对舒张压有影响。该药对舒张压有影响。0d0d05. 002.4816.35 .4016.318836232150.4836222nSdSdtmmHgnnddSmmHgnddddd0d0d05. 002.4816.35 .4016.318836232150.4836222nSdSdtmmHgnnddSmmHgndddddPt0.050.012.365P0.014.023.499确定确定P P值,判断结果值,判断结果 自由度自由度n n-1-18-18-17 7,查表,查表10-1010-10t t界值表,界值表,t t0.05,70.05,72.3652.365,今,今4.024.

35、022.3652.365,故故P P0.050.05,故按,故按0.050.05水准,拒绝水准,拒绝H H0 0,接,接受受H H1 1,认为差异有高度显著性。,认为差异有高度显著性。配对假设检验的步骤配对假设检验的步骤1、确定是否是配对资料、确定是否是配对资料2、求出两对子之间统计量的差值、求出两对子之间统计量的差值3、求出差值的均数和标准差、求出差值的均数和标准差4、确定是单侧还是双侧检验、确定是单侧还是双侧检验5、确定是、确定是t检验还是检验还是Z检验检验6、计算、计算t值或值或Z值值7、确定、确定P值,判定结果值,判定结果练练 习习用克矽平雾化吸用克矽平雾化吸入治疗矽肺患者入治疗矽肺患

36、者10例,结果如下例,结果如下表,能否认为治表,能否认为治疗会引起血清粘疗会引起血清粘蛋白的下降?蛋白的下降?H0:d=0H1:d50;n2=16750,运用运用Z检验检验建立假设,确定检验水准建立假设,确定检验水准 H H0 0:1 12 2 H H1 1:112 2 0.050.05选择检验方法,计算检验统计量选择检验方法,计算检验统计量u u值值 438. 0167292. 0175254. 0438. 0425. 02222212121nSnSxxuZ(3)(3)查查Z Z 界值表界值表(t t 界值表中自由度为界值表中自由度为 的一行的一行 ),),Z=0.4381.96Z=0.43

37、80.05P0.05,按,按 =0.05 =0.05水水准,不拒绝准,不拒绝H H0 0,差异无统计学意义;尚不能,差异无统计学意义;尚不能认为正常男女新生儿血中甘油三酯浓度均数认为正常男女新生儿血中甘油三酯浓度均数不同。不同。,96. 105. 0u2、两个小样本均数的比较、两个小样本均数的比较2121XXSXXt)11(21221nnSScXX2) 1() 1(212222112nnSnSnSc22122222121212nnnxxnxxScV=n1+n2-22121XXSXXt)11(21221nnSScXX2) 1() 1(212222112nnSnSnSc22122222121212

38、nnnxxnxxScV=n1+n2-2例例10-18 两组雄性大鼠分别饲以高蛋白和低蛋白两组雄性大鼠分别饲以高蛋白和低蛋白饲料,观察每只大鼠在实验第饲料,观察每只大鼠在实验第2828天到天到8484天之间所天之间所增加的体重,见表增加的体重,见表10-11 10-11 。问用两种不同饲料喂。问用两种不同饲料喂养大鼠后,体重的增加有无差别?养大鼠后,体重的增加有无差别?表表10-11 用两种不同蛋白质含量饲料喂养大鼠后体重增加的克数用两种不同蛋白质含量饲料喂养大鼠后体重增加的克数n1=1250;n2=750,小样本,小样本,使用使用t检验检验建立假设,确定检验水准建立假设,确定检验水准H H0

39、0:1 12 2H H1 1:1 12 20.050.05选择检验方法,计算检验统计量选择检验方法,计算检验统计量t t值值73959,1017/707/, 7177832,12012/1440/,12 222222211111xnxx nxnxxn本例17) 1() 1(891. 105.1010112005.10)71121 (12.44612.44627127707739591214401778322122221nntSSxxc确定确定P P 值,判断结果值,判断结果 查查t t界值表,界值表,t t0.05,170.05,172.1102.110,今,今1.8911.8912.1102

40、.110,故,故P P0.050.05,故按,故按0.050.05水准,不拒绝水准,不拒绝H H0 0,尚不能认为两种饲,尚不能认为两种饲料喂养大鼠后体重的增加是不同的。料喂养大鼠后体重的增加是不同的。PP=?t=1.891P=0.05P=0.05tP=0.01P=0.01t=2.110t=2.898两样本均数假设检验的步骤两样本均数假设检验的步骤1、首先了解两个样本的大小、首先了解两个样本的大小2、确定是、确定是t检验还是检验还是Z检验检验3、求出均数差值的标准差、求出均数差值的标准差4、确定是单侧还是双侧检验、确定是单侧还是双侧检验5、计算、计算t值或值或Z值值6、确定、确定P值,判定结果

41、值,判定结果在两样本均数比较中,如果一个样在两样本均数比较中,如果一个样本量大于本量大于50,另一个样本量小于,另一个样本量小于50,采用什么方法呢?采用什么方法呢?练 习某地抽样了某地抽样了25-29岁正常人群的红细胞,岁正常人群的红细胞,其中男性其中男性180人,得到均数为人,得到均数为4.651012/L,标准差为,标准差为0.601012/L;女性女性500人,得到均数为人,得到均数为4.251012/L,标准差为标准差为0.501012/L,问该地男性红细,问该地男性红细胞数是否高于女性?胞数是否高于女性?均数假设检验的步骤均数假设检验的步骤确定资确定资料性质料性质样本与总体样本与总

42、体比较比较两样本比较知道总体标准差或样本量 50,Z检验不知总体标准差且样本量 50 ,t检验样本量50,Z检验样本量50,t检验假设过程中注意单侧和双侧的选择四、假设检验应注意的问题四、假设检验应注意的问题1 1、假设检验应有严格的抽样设计、假设检验应有严格的抽样设计2 2、要注意选用的假设检验方法的应用条件、要注意选用的假设检验方法的应用条件3 3、正确区分差别有无统计意义与有无专业、正确区分差别有无统计意义与有无专业上的实际意义上的实际意义4 4、结论不能绝对化、结论不能绝对化5 5、假设检验的单侧检验与双侧检验的选择、假设检验的单侧检验与双侧检验的选择 注意:两型错类和检验效能注意:两

43、型错类和检验效能型错类型错类:“弃真值弃真值”拒绝实际上成立的拒绝实际上成立的H0型错类型错类:“存伪值存伪值”接受实际上不成立的接受实际上不成立的H0型错类的大小为型错类的大小为, 型错类型错类的大小一般较难的大小一般较难计算,当计算,当n固定时,固定时,越大越大越小,反之亦然。越小,反之亦然。检验效能(检验效能(1-):):若两总体确有差异,有若两总体确有差异,有1-的把握得出差异有统计学意义的结论的把握得出差异有统计学意义的结论习 题 从一个数值变量资料的总体中抽样,从一个数值变量资料的总体中抽样,产生抽样误差的原因是产生抽样误差的原因是A. 总体中的个体值存在差别总体中的个体值存在差别B. 总体均数不等于零总体均数不等于零C. 样本中的个体值存在差别样本中的个体值存在差别D. 样本均数不等于零样本均数不等于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论