总体均数的估计和假设检验.pps_第1页
总体均数的估计和假设检验.pps_第2页
总体均数的估计和假设检验.pps_第3页
总体均数的估计和假设检验.pps_第4页
总体均数的估计和假设检验.pps_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 总体均数的估计和假设检验,温州医学院环境与公共卫生学院 叶晓蕾,2,一.均数的抽样误差与标准误,1.均数的抽样误差: 由于抽样引起的样本均数与总体均数之差 。,2.均数的标准误:,(1)意义: 说明抽样误差的大小。反映样本均数的可靠程度。 大,抽样误差大,用 估计的可靠程度较小。,3,(2)计算:,从上式可知,标准误与标准差成正比,与样本含量的平方根成反比。在实际工作中,可以通过增大样本含量来减少抽样误差。,例:某市随机抽查12岁男孩100人,得身高均数139.6cm, 标准差6.85cm,计算标准误。,4,二.t分布,1. t分布概念:,2. t 分布的用途:主要用于总体均数的区间估计及t检验等。,在实际工作中,由于未知,用S代替,则:,t分布又称Student-t分布(Students t-distribution).,5,3. t分布的图形和特征:,图形:,特征:(1)以 0 为中心,两侧对称的单峰分布 (2)与 u 分布比较,峰值较低,两边上翘 (3)有一个参数 ,当 ,t分布u分布,6,单尾概率(one-tailde probability),其对应的t界值用t,表示; 双尾概率(two-tailde probability),其对应的t界值用t/2,表示。,P.696,7,t值表的特点: 在相同自由度时,t值越大,概率P越小; 在相同概率P时,自由度越大,t值越小; 在相同t值时,双尾概率为单尾概率的两倍,即t0.05/2,18= t0.025,18=2.101。,8,三.总体均数的估计,1. 点估计(point estimation): ,概念:,按一定的概率(1 - )估计总体均数所在范围(或称可信区间, confidence interval, CI ),常用95%和99%的概率估计。,2. 区间估计(interval estimation):,可信区间又称置信区间。,9,(3) 未知但n较大,可按正态分布原理,(2) 未知时,按t分布原理,(1)已知时,按正态分布原理,计算:,10,抽样调查某地100名12岁男孩身高,得均数为139.6cm,标准差为6.85cm,试估计该地12岁男孩身高均数的95%可信区间。,例:,即该地12岁男孩身高均数的95%可信区间为: 138.3141.0 (cm),=0.05 u0.05=1.96,该地12岁男孩平均身高139.6cm(95%CI:138.3141.0)。,11,四. 假设检验的意义和基本步骤,1.假设检验的意义: 假设检验(hypothesis test) 又称显著性检验(significance test)。,12,例3.4 :根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查25名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?,造成 与0不等的原因:(1)抽样误差 ,即=0 (2)非同一总体,即0,已知总体 未知总体,13,2.假设检验的一般步骤,(1)建立假设,确定检验水准 H0: (无效假设) 总体参数相等 H1: (备择假设) 总体参数不等 通常 = 0.05 (2)选定检验方法和计算检验统计量(test statistic) 如:、F、X2 等 (3)确定P值,作出推断结论,14,建立检验假设,确定检验水准 ,H0: (无效假设) 总体参数相等 H1: (备择假设) 总体参数不等,双侧检验 单侧检验,怎样选择双侧检验或单侧检验?,1.根据专业知识;,2.H0和H 1缺一不可。,2.根据研究目的。,在建立检验假设时,应当注意:,1.检验假设应针对总体而言,不能针对样本。,单侧检验与双侧检验:,一. 检验假设:,15,二. 检验水准 (size of a test): 又称显著性水准。,为型错误的概率大小(详后),是预先规定的概率值,即小概率事件的标准。 在实际工作中通常取 = 0.05。但并非一成不变,可根据研究目的给予不同设置。,16,确定P值,作出推断结论,根据计算出的检验统计量,查相应的界值表即可得P值,将P值与事先规定的概率进行比较而得出结论。 若:P 时,则拒绝H0,接受H1,有统计学意义(统计结论),可认为不同或不等(专业结论)。 若: P 时,则不拒绝H0,无统计学意义(统计结论) ,还不能认为不同或不等(专业结论)。,17,t检验和u检验,(一)用途与应用条件,样本含量比较大(如n50), 或n虽小但已知(很少见)。,样本来自正态分布的总体; 两总体方差相等。,应用条件:,两个均数的比较。,t检验:,u检验:,用途:,t-test或称Students t-test; u-test或称Z-test,18,(二) t检验,样本均数与总体均数的比较 单样本t检验(one sample t-test) 配对设计的均数比较配对t检验(paired t-test for dependent samples) 成组设计的两样本均数的比较 成组t检验(two-sample t-test for independent samples),19,t检验计算公式,=n-1,=n-1,= n1+n2-2,(单样本t检验),(配对t检验),(成组t检验),20,例,(1)H 0:=0 H 1:0 = 0.05 (2)计算t值:,(3)确定P,作出统计结论:根据=n-1=24查t界值表,得0.05P0.10,按= 0.05水准,不拒绝H0,差异无统计学意义,尚不能认为该山区成年男子脉搏均数高于一般成年男子的脉搏均数。,21,同一受试对象处理前后结果比较。,22,同一受试对象分别用两种不同处理结果比较。,23,例,为研究女性服用某避孕新药后是否影响其血清总胆固醇含量,将20名女性按年龄配成10对。每对中随机抽取一人服用新药,另一人服用安慰剂。经过一定时间后,测得血清总胆固醇含量(mmolL),结果如下表。问该新药是否影响女性血清总胆固醇含量? 新药组与安慰剂组血清总胆固醇含量(mmol/L),成对的两个受试对象分别用两种不同的处理结果比较。,24,(1)H 0:d= 0 H 1:d 0 = 0.05,(3)确定P,作出统计结论:根据=n-1=9查t界值表,得0.10P0.20,按= 0.05水准不拒绝H0,无统计学意义,尚不能认为该新药对女性血清总胆固醇含量有影响。,(2)计算t值:,25,SPSS,26,27,28,29,3.成组设计的两样本均数的比较 成组t检验(two-sample t-test for independent samples):,例:,30,某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。 X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12 X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18,31,SPSS,32,33,34,例 某医生研究野木瓜用于手术后的镇痛疗效,以哌替啶作为对照,观察两药的镇痛时间(h),得到如下结果,问野木瓜与哌替啶的镇痛时间是否不同?,野木瓜与哌替啶的镇痛时间(h),35,(1)H 0:12 H 1:12 = 0.05,(2)计算t值:,(3)确定P,作出统计结论: 根据=56查t界值表,得P0.001,按= 0.05水准拒绝H0,接受H1,有统计学意义,可认为野木瓜与哌替啶的镇痛时间不同,野木瓜比哌替啶的镇痛时间长。,36,关于t检验的几点说明:,(1)t检验对统计资料的要求: 样本随机取自正态总体;两样本总体方差相等 在实用上,与上述条件略有偏离, 对结果亦影响不大。 (2) 正态性检验: (3) 两样本方差齐性检验,37,总体方差不等的两小样本均数的比较:,常用方法:1.近似t检验(t检验) 2.数据变换 3.秩和检验,近似t检验(t检验) (1)Cochran & Cox 法 (2)Satterthwaite 法 (3)Welch法,对临界值进行的校正,对自由度进行的校正,38,常用的变量变换方法,39,(三)u检验,40,例 抽样调查了农村高碘地区100名小学生和非高碘地区105名小学生的智商,得结果如表,问两个不同地区小学生智商水平是否不同?(假定两组受教育年限、学校规模、师资水平等相近),高碘区和非高碘区儿童智力比较,(1)H0:12 H1:12 = 0.05,(2)计算u值:,查u界值表,得P0.001。按= 0.05水准,拒绝H0,接受H1。有统计学意义,可认为两组儿童智力水平不同,高碘区较低。,(3)确定P,作出统计结论:,请记:u0.05/2=1.96 u0.01/2=2.58 ; u0.05=1.64 u0.01=2.33,41,六.假设检验时应注意的问题,(1)选用的方法应符合其应用条件 (2)正确理解差别有无显著性的统计意义 (3)结论不能绝对化: 总体有无本质差异;抽样误差(个体差异,样本含量);检验水准;两类错误。 第一类错误(typeerror) 第二类错误(typeerror) (4)结论时,尽可能明确概率范围,42,假设检验中的两类错误,1- 称为检验效能(power of a test),或把握度。,43,P 值的表达,传统表达 P 0.05 记为“NS”, P0.05 记为“*”, P0.01 记为“*”,提倡表达 提倡报告精确的P值,利用统计软件计算得到P=0.000时,宜改为P0.001,44,P 值大小只能说明统计学意义的“显著”,不说明实际效果的“显著”。对于P 值的解释一定要结合专业知识。,P 值的解释,当观察例数很少时,临床疗效“显著”的,P 值可能很大(统计“不显著”)。 反之,当观察例数很大时,临床疗效“不显著”的(如新药比对照药有效率仅提高了0.1%),P 值可能很小(统计“显著”)。,结果,45,46,47,48,案例讨论,某医生应用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮患者14人。治疗前后血清Sil-2R(U/ml)数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论