中国医科大学研究生医学统计学第三讲总体均数估计_第1页
中国医科大学研究生医学统计学第三讲总体均数估计_第2页
中国医科大学研究生医学统计学第三讲总体均数估计_第3页
中国医科大学研究生医学统计学第三讲总体均数估计_第4页
中国医科大学研究生医学统计学第三讲总体均数估计_第5页
已阅读5页,还剩80页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲总体均数的估计与假设检验(第三章)第一节均数的抽样误差

与标准误统计推断(statisticalinference):

样本总体

(1)参数估计(2)假设检验推断统计推断:由样本信息推断总体特征;即:以样本统计量推断总体参数。抽样误差:由个体变异产生的、随机抽样造成的样本统计量与总体参数的差别。造成抽样误差的原因:1)抽样

2)个体差异性质:(1)原分布正态新分布正态

原分布偏态新分布近似正态

(2)原分布~N(μ,σ2)

新分布~N(μ,)原分布x~N(167.7,5.32)总体

……X=新分布~N(167.69,1.692)标准误(standarderror,简写为SE)::样本统计量的标准差称为标准误。

是表示样本统计量抽样误差大小的统计指标。均数标准误:说明均数抽样误差的大小,计算公式:

或实质:样本均数的标准差。降低抽样误差的途径有:①通过增加样本含量n;②通过设计减少S。均数的标准误:(1)意义:(2)应用:

标准差:(1)意义:(2)应用:第二节t分布一、t分布的概念

3.实际工作中,由于未知,用代替,则不再服从标准正态分布,而服从t分布。二、t分布的图形与特征

图3-3不同自由度下的t分布图t分布特征:

-tt0第三节总体均数的估计一、参数估计用样本统计量推断总体参数。总体均数估计:用样本均数(和标准差)推断总体均数。2.区间估计按预先给定的概率(1

)所确定的包含未知总体参数的一个范围。

总体均数的区间估计:按预先给定的概率(1

)所确定的包含未知总体均数的一个范围。1.单一总体均数的可信区间常用u值表参考范围(%)

百分范围%单侧双侧951.6451.960992.3262.579三、可信区间的确切涵义1.95%的可信区间的理解:(1)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。(2)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数

2.可信区间的两个要素(1)准确度:用可信度(1

)表示:即区间包含总体均数

的理论概率大小。当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好。(2)精确度:即区间的宽度区间愈窄愈好,如95%的可信区间比99%的可信区间要好。当n确定时,上述两者互相矛盾。提高准确度(可信度),则精确度降低只提高可信度(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。相反,在实际应用中,95%可信区间更为常用。在可信度确定的情况下,增加样本含量可减小区间宽度(减小),提高精确度。四、总体均数可信区间与参考值范围的区别第四节假设检验的基本原理和步骤假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。单侧检验和双侧检验

(根据研究目的和专业知识选择)

双侧检验:如要比较A、B两个药物的疗效,无效假设为两药疗效相同(H0:μA=μB),备择假设是两药疗效不同(H1:μA≠μB),可能是A药优于B药,也可能B药优于A药,这就是双侧检验。单侧检验:若实际情况是A药的疗效不劣(差)于B药,则备择假设为A药优于B药(H1:μA>μB),此时,备择假设成立时只有一种可能(另一种可能已事先被排除了),这就是单侧检验。备注:单侧检验和双侧检验中计算统计量t的过程是一样的,但确定概率时的临界值是不同的。

(3)检验水准

,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取

=0.05。可根据不同研究目的给予不同设置。2.计算检验统计量

根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。

3.确定P值P的含义是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。若,则结论为按照检验水准,不拒绝H0,差异无统计学意义(统计结论)。

例3-5

g/L

对一个样本均数与一个已知的或假设的总体均数

0作比较,它们之间差别可能有两种原因造成:

由于抽样误差所致,

由工作环境的原因,两个总体均数间有本质差异。第五节t检验t检验和u检验的应用条件:1.t检验应用条件:样本含量n较小时(如n<60)(1)正态分布(2)方差齐性2.u

检验应用条件:样本含量n较大,或n虽小但总体标准差已知

(1)正态分布

(2)方差齐性单样本检验

σ已知:σ未知但n较大σ未知但n较小一、单样本t

检验即样本均数(代表未知总体均数

)与已知总体均数

0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算:例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?

(1)建立检验假设,确定检验水准H0:

=

0

=140g/L,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等H1:

0=140g/L,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值不等

=0.05

(2)计算检验统计量(3)确定P值,作出推断结论

二、配对t检验配对t检验适用于配对设计的计量资料。配对设计类型:①两同质受试对象分别接受两种不同的处理;②同一受试对象分别接受两种不同处理;③同一受试对象(一种)处理前后。检验统计量计算公式例3-6为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-3第(1)~(3)栏。问两法测定结果是否不同?表3-5两种方法对乳酸饮料中脂肪含量的测定结果(1)建立检验假设,确定检验水准H0:

d=0,即两种方法的测定结果相同H1:

d≠0,即两种方法的测定结果不同

=0.05(2)计算检验统计量(3)确定P值,作出推断结论查附表2的t界值表得P<0.001。按

=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果不同,哥特里-罗紫法测定结果较高。三、两样本t检验

又称成组t检验,适用于完全随机设计两样本均数的比较,此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。适用范围:完全随机设计两样本均数的比较检验方法:依两总体方差是否齐性而定。例3-7

为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名2型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-6,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?若两总体方差不等

若变量变换后总体方差齐性——可采用t检验(如两样本几何均数的t检验,就是将原始数据取对数后进行t检验);

若变量变换后总体方差仍然不齐——可采用t′检验或Wilcoxon秩和检验。第六节假设检验注意事项一、两类错误

和检验功效(一)Ⅰ型错误(typeⅠerror)1.定义:Ⅰ型错误是指拒绝了实际上成立的H0,即“弃真”的错误。(用α表示)。

2.确定:研究者可根据不同研究目的来确定α水平。如规定α=0.05,当拒绝H0时,理论上100次检验中平均有5次发生此类错误。α表示检验有意义的水准,故亦称检验水准。(二)Ⅱ型错误(typeⅡerror)1.定义:Ⅱ型错误是指接受了实际上不成立的H0,即“存伪”的错误。(用

表示)。

2.确定:

只有与特定的H1结合起来才有意义,但

的大小很难确切估计。仅知n确定时,且的唯一办法是

客观实际

统计推断拒绝H0(接受H1)不拒绝H0H0成立

(真)H0不成立(假)α=P(拒绝H0H0真)1-β=P(拒绝H0

H0假)1-α=P(不拒绝

H0H0真)

β=P(不拒绝H0

H0假)小结:I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是

(其值等于检验水准)

II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是

(其值未知)

但n

一定时,

增大,

则减少。1-

:检验效能(power):当两总体确有差别,按检验水准

所能发现这种差别的能力。二、假设检验应注意的问题要有严密的研究设计不同的资料应选用不同检验方法正确理解“显著性”一词的含义结论不能绝对化统计“显著性”与医学/临床/生物学“显著性”可信区间与假设检验各有不同作用,要结合使用不同的资料选用不同检验方法应根据分析目的、设计类型、资料类型、样本含量大小等选用适当的检验方法。

1.t检验理论上要求样本来自正态分布总体。资料的正态性可用正态性检验加以分析。(1)单样本t检验(σ未知但n较小)

(2)配对t检验(配对设计的计量资料)

(3)两独立样本t检验(完全随机设计的计量资料)a.t检验(n1,n2较小且σ12=σ22)

b.

近似t检验,即t'检验(n1,n2较小,且σ12≠σ22)

2.非正态分布资料经数据变换后为正态分布资料。(习题7)3.如果数据变换后仍为非正态分布,则可选用非参数检验。4.u检验(σ已知或σ未知但n较大)如n>60单样本u检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论