医学统计学总体均数的估计与假设检验ppt课件.ppt_第1页
医学统计学总体均数的估计与假设检验ppt课件.ppt_第2页
医学统计学总体均数的估计与假设检验ppt课件.ppt_第3页
医学统计学总体均数的估计与假设检验ppt课件.ppt_第4页
医学统计学总体均数的估计与假设检验ppt课件.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 总体均数的估计与假设检验,1,第三章 总体均数的估计与假设检验, 均数的抽样误差与标准误 t分布 总体均数的估计 假设检验的一般步骤 检验 u 检验 两均数的等效检验 正态性检验 两样本方差齐性检验 假设检验时应注意的问题 利用总体均数的可信区间进行假设检验 课堂讨论,2,一、 均数的抽样误差与标准误( ),其分布特点如下: (1)原始总体呈正态分布,则样本均数抽样分布也呈正态分布,甚至原始分布为偏态分布,若n足够大(n60),则样本均数也逼近正态分布。 (2)样本均数的总均数等于原始总体均数。,反复从总体中抽取n 一定的样本,得到无数样本均数,也构成一个总体。,某变量值总体分布,某变

2、量值n相同的样本均数总体分布,3,一、 均数的抽样误差与标准误( ),均数的抽样误差: 抽样引起的样本均数与总体均数之间或样本均数 之间的差别。 标准误: 即样本均数的标准差。表示样本均数对总体均数的离散程度。,4,5,例4.1某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm,资料,求标准误?,6,若X或 X服从正态分布 N( , 2),则可作正态变量 X或 X的 u 代换。,则 u 服从标准正态分布 N(0,1),二、 t 分布,7,实际工作中, 往往未知,S 代替, 此时就不是u代换,而是 t 代换。,无数t点所组成的分布,称t分布。,8,t 分布的特征: (1

3、)以 0 为中心,两侧对称的单峰分布 (2)与 u 分布比较,峰值较低,两边上翘 (3)有一个参数 ,当 ,t分布u分布,9,P804,10,(1)点估计: X (2)区间估计: 按一定的概率(1 - )估计总体均数所在范围(或称可信区间),常用95%和99%的概率估计。 1)当未知时,三、 总体均数的估计,11,12,例2.12 11名18岁男大学生身高得均数172.25厘米,标准差3.31厘米,试估计该地18岁男大学生总体身高均数的95%可信区间。 本例n=11,则=10,查t界值表得:双侧t0.0510=2.228,13,2) 未知,但n足够大时;,例某地110名18岁男大学生身高均数为

4、172.73厘米,标准差为4.09厘米,试估计该地18岁男大学生总体身高均数的95%可信区间。 本例n=110,双侧u0.05=1.96,14,3)当已知时。,关于可信区间的准确性和精密度 准确度反映在可信度(1 - )的大小上; 精密度反映在可信区间的长度上。,15,16,四、 假设检验的一般步骤,例: 据大量调查知,健康成年男子脉搏的均数为72次分,某医生在山区随机调查了25名健康男子,其脉搏均数为74.2次/分,标准差为6.0次/分,能否认为该山区成年男子的脉搏高于一般人群?,分析两均数不等的原因有两种可能性: (1)仅仅由于抽样误差所致; (2)除抽样误差外还由于环境条件的影响。,17

5、,如何判断? 统计上是通过假设检验来回答这个问题。 (1)建立假设: H0: (检验假设或无效假设) 总体参数相等 为什么称其为无效假设? H1: (备择假设) 总体参数不等,18,(2)确立检验水准 指拒绝实际上成立 H0 的所犯错误的概率(I 类错误)。通常 = 0.05,但并不绝对。 为什么检验水准通常取0.05? (3)选定检验方法和计算检验统计量 如:、F、X2 等,19,(4)确定P值,作出推断结论 P值是指由所规定的总体中(本例 = 0)作随机抽样,获得等于或大于现由样本计算得到的检验统计量值的概率。即 P( t或u、F、 X2 等)。 若:P 时,则拒绝H0,接受H1 P 时,

6、则不拒绝H0,20, 应用: 用于两均数比较的假设检验; 资料要求: (1)资料随机取自正态总体; (2)两总体方差齐性(相等)。,五、 t 检验,21,1、样本均数与总体均数比较,例4.4 据大量调查知,健康成年男子脉搏的均数为72次/分,某一身在山区随机调查了25名健康男子,其脉搏均数为74.2次/分,标准差为6.0次/分,能否认为该山区成年男子的脉搏高于一般人群?,22,H0: = 0 H1: 0 单侧: = 0.05,23, 125 24 查t界值表(P804),得单侧 t0.05,24 = 1.711 因: t =1.833 t0.05,24 所以:P 0.05,结论:按照 = 0.

7、05水准,拒绝H0 ,故可认为该山区健康成年男子脉搏高于一般人群。,24,上例如用双侧检验,查表得双侧 t0.05,24 = 2.064 则: t =1.833 0.05。结论相反。 单侧检验效率要高于双侧检验。 如何选择单侧或双侧检验? 主要根据专业知识而定。 如某指标只高不低或只低不高。,25,2、配对设计的两均数比较 同源配对 观察指标测自同一受试对象或标本。 异源配对 观察指标测自不同受试对象或标本,但不同受试对象或标本配成对子,每对除处理因素不同外,其它非处理因素一致或基本一致。 统计分析是比较配对差值与总体均数 0 的差别进行的,26,27,H0: d= 0 H1: d 0 = 0

8、.05,28, 1=11 n为对子数或差值个数 t0.10,11 = 1.796 , t0.20,11 = 1.363, 故 0.20 P 0.10。,29,例:某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和E缺乏组,过一定时期将大白鼠杀死,测得其肝中A的含量如下表,问不同饲料的大白鼠肝中维生素A含量有无差别?,30,(3)成组设计两样本均数的比较,31, 122 本例 t= 1.80.05,H0: 1= 2 H1: 12 = 0.05,32,(4)成组设计的两样本几何均数的比较 一般

9、认为此类资料呈对数正态分布,因此,需将原始资料取对数后,再作两组对数值均数的t检验。,33,分别,H0: 两株的总体几何均数相等 H1:两株的总体几何均数不等 = 0.05 将两组数据分别取对数,X1=lgA,X2=lgB (A、B 分别代表两组原始数据),注意:这里直接比较的是 lgG1 与 lgG2 ,但间接说明 了 G1 与 G2 的差别。,34,应用: 当已知;或未知,但n足够大时(此时t分布接近u 分布)。用于两均数的比较。 常用于两大样本均数的比较。 其它资料要求同t检验。,六、 u 检验,35,例2.18 某地抽样调查了部分健康成人的红细胞数,其中男性360人,均数为4.6601

10、012/L,标准差为0.575 1012/L ;女性255人,均数为4.178 1012/L,标准差为0.291 1012/L,试问该地男、女平均红细胞数有无差别?,36,七、两均数的等效检验,是推断两种处理效果是否相近或相等的统计方法。,为什么推断两种处理效果是否相近或相等不能用前面所述的假设检验方法?,等效检验的假设 H0: | 1- 2| H1: | 1- 2| 为等效界值,若两总体均数差值在范围内为等效,超过则为不等效。,37,检验水准、自由度及结果判断同t检验。,两样本均数等效检验公式为:,38,注意事项, 值的选定在等效检验中十分重要,一般把专业上或公认的有意义的两种处理措施的差值

11、作为等效检验的 值。 如:血压的值为5mmHg,白细胞为500个/mm3。 要求样本:,39,H0: | 1- 2| H1: | 1- 2| = 0.05, 122=234 0.02 P 0.05,40,八、 正态性检验,41,1、图示法,42,P-P图,43,Q-Q图,44,(2)峰度系数,(1)偏度系数,2、偏度系数和峰度系数检验,45,(2)峰度系数,= -0.165/0.457= -0.361 P 0.5,H0: r 1=0; r 2= 0 H1: r1 0 ; r2 0 = 0. 10或0.2(宜稍大以减少型错误),(1)偏度系数,=0.156/0.230=0.678 P 0.5,4

12、6,3、柯尔莫柯罗夫-斯米尔诺夫(Kolmogorov-Smirnov)检验,一般作为小样本的正态检验方法,例抽样调查某地20名3岁女孩身高(cm)的原始数据如下: 80.1 89.3 92.4 97.1 97.0 82.5 89.1 92.6 96.2 96.7 84.4 91.3 94.7 99.5 97.9 87.3 90.5 94.8 100.1 100.7 检验样本所属的总体是否呈正态分布? 本例经计算 X=92.71 S=5.89,47,抽样调查某地 20名3岁女孩身高(cm)资料如下:,检验统计量为:dmax= 0.0869, 查表得:P0.8,48,九、 两样本方差齐性检验,S

13、21 较大, S22 较小。,(方差不齐的Levene检验:不依赖总体分布的具体形式),49,例:由X光片上测得两组病人的肺门横径右侧(cm),算得结果如下,试检验两个方差的齐性。 肺癌病人:n1=10,X1=6.21,S1=1.79cm 矽肺0期病人:n2=50,X2=4.34,S2=0.56cm, 1 1= 10 1= 9, = 21= 50 1= 49 查附表3,P806(齐性检验用双尾界值) 得:F0.10/2,(9,49) F0.10/2,(9,48) =2.08, 所以 P 0.10,H0: 两总体方差相等 H1:两总体方差不等 = 0.10,=1.792/0.562=10.22,

14、50,一般同质的两组资料方差相差不大,若两样本方差相差一倍左右,要注意方差不齐的可能。 问题: 若方差不齐,将如何处理? (1)采用适当的变量变换,使达到方差齐性; (2)采用秩和检验; (3)采用近似法 t检验: Cochran 乙文 P0.01。是否可认为乙文中两样本均数差值较甲文大?为什么?,十、 假设检验时应注意的问题,53,(3)结论不能绝对化 统计的结论是按着概率大小作出判断,若取 = 0.05,此时拒绝H0 ,仍有0.05的概率犯错误;同样,不拒绝H0 ,也可产生错误。 第一类错误: 拒绝实际上成立的H0所犯的错误。P= 第二类错误: 不拒绝实际上不成立的H0所犯的错误。P=,而

15、未知。,54,样本含量一定时,增大,则减少,减少则增大,所以, 的确定并不是越小越好,一般取0.05较合理。,怎样才能同时减少、?,55,(4)结论时,尽可能明确概率范围 (5)统计结论应与专业结论相结合。,56,十一、 利用总体均数的可信区间进行假设检验,(1)样本均数与总体均数比较,例2.14 据大量调查知,健康成年男子脉搏的均数为72次分,某一身在山区随机调查了25名健康男子,其脉搏均数为74.2次/分,标准差为6.0次/分,能否认为该山区成年男子的脉搏高于一般人群?,单侧总体均数的95%可信区间:,不包括 0 =72, P0.05,57,(2)配对设计的两均数比较,58,H0: d=

16、0 H1: d 0 = 0.05,包括 d= 0 , P0.05,总体均数的95%可信区间:,59,(3)成组设计两样本均数的比较,60,H0: 1= 2 H1: 1 2 = 0.05,总体均数的95%可信区间:,包括 1- 2 = 0 , P0.05,61,H0: 0 = H0: d= 0 H0: 1 - 2 =0,62,抽样调查得甲地100名健康男工人的血胆固醇(mg/100ml)得 X =180,S=30,假定血胆固醇呈正态分布,问: (1) 甲地全体健康男工人的血胆固醇平均数估计在什么范围? (2) 乙地抽样查得男工人血胆固醇 X=190,S=35,n=125,甲乙两地男工人血胆固醇是否相同?,63,某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作观察指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论