版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学第五章总体均数的区间估计
和假设检验[学习目标]
掌握:均数抽样误差和标准误的概念、计算公式和应用;t分布的概念、特征和与z分布的区别与联系;总体均数可信区间的概念和计算公式;假设检验的步骤及注意问题。熟悉:标准差与标准误的区别与联系。了解:统计学中两种类型错误的概念。
第一节均数的抽样误差与标准误一、标准误的意义及其计算
1.均数的抽样误差医学研究中常常从总体中随机抽取样本进行研究,目的是由样本的信息去推断总体。通常情况下样本均数
不可能与总体均数μ正好相等,这种由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差(samplingerror)。2.均数标准误中心极限定理:样本量n足够大(一般n≥100)的情况下,无论原始变量是什么分布,样本均数的分布近似正态分布。样本均数的标准差称为标准误。标准误愈大,说明用样本均数代表总体均数的可靠性小。反之,用样本均数代表总体均数的可靠性大。
标准误的计算:
二、均数标准误的应用
1.反映抽样误差的大小,衡量样本均数的可靠性。均数标准误越小,说明样本均数间的离散程度越小,用样本均数估计总体均数越可靠;反之,均数标准误越大,说明样本均数间的离散程度越大,用样本均数估计总体均数的可靠性越小。2.进行总体均数的区间估计。3.用于均数的假设检验。
第二节t分布一、t分布的概念对正态变量X采用z变换,z=(X-μ)/σ,则一般的正态分布N(μ,σ2)即变换为标准正态分布N(0,1)。样本均数服从正态分布,同样可作正态变量的z变换,即:
z=(-μ)/
第二节t分布一、t分布的概念实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,此时就不是z变换而是t变换了,即
t=(-μ)/
t分布于1908年由英国统计学家W.S.Gosset以“student”笔名发表,故又称studentt
分布(Students’t-distribution)。
第二节t分布二、t分布曲线的特征1.以0为中心,左右对称的单峰分布;2.t分布曲线是一簇曲线,其形态与自由度ν的大小有关。自由度ν越小,则t值越分散,曲线越低平;自由度ν逐渐增大时,t分布逐渐逼近z分布(标准正态分布),当ν趋近于∞时,t分布即为z分布。t分布示意图
第三节总体均数的区间估计参数估计(parameterestimation)是指用样本统计量估计总体参数,是统计推断的一个重要内容。估计总体均数的方法有两种,即点值估计(pointestimation)和区间估计(intervalestimation)。第三节总体均数的估计一、点值估计用相应样本统计量直接作为其总体参数的估计值。
其方法简单,但未考虑抽样误差的影响,无法评价参数估计的准确度,并不常用。第三节总体均数的区间估计二、区间估计按一定的概率(1-α
)估计总体均数所在的范围,得到的范围称可信区间(confidenceinternal),亦称置信区间。(1-α
)称为可信度,常取为95%和99%。总体均数1-α(如95%)可信区间的含义是:总体均数µ被包含在该区间内的可能性是1-α
(95%),没有被包含的可能性为
(5%)。
总体均数可信区间的计算1.总体标准差σ已知95%的可信区间总体标准差σ未知但样本含量n较大(n≥100)95%的可信区间总体标准差σ未知但样本含量n较小95%的可信区间
可信区间的注意事项1.标准误越小,估计总体均数可信区间的范围也越窄,说明样本均数与总体均数越接近,对总体均数的估计也越精确;反之,标准误越大,估计总体均数可信区间的范围也越宽,说明样本均数距总体均数越远,对总体均数的估计也越差。
可信区间的注意事项2.可信区间具有两个要素:一是准确度,即可信区间包含μ的概率(1-α)的大小,一般而言概率越大,估计的准确度越高,反之越低。二是精密度,反映区间的长度,区间的长度越小,估计的精密度越好,反之越差。在样本量一定的情况下,二者是相互矛盾的,若考虑提高准确度,则区间变宽,精确度下降。
可信区间的注意事项3.标准误和标准差虽然都是说明离散程度的指标,但两者所代表的意义、计算方法及应用范围是不一样的。
第四节假设检验的意义和步骤一、假设检验的原理和思想假设检验(hypothesistest)是统计推断的另一个重要方面。样本统计量与总体参数之间的差别,或样本统计量之间的差别是由于抽样误差造成的,还是本质不同所引起的,用一种方法来进行检验判断,这种方法叫假设检验。第四节假设检验的意义和步骤一、假设检验的原理和思想假设检验(hypothesistest)是统计推断的另一个重要方面。样本统计量与总体参数之间的差别,或样本统计量之间的差别是由于抽样误差造成的,还是本质不同所引起的,用一种方法来进行检验判断,这种方法叫假设检验。第四节假设检验的意义和步骤例:
据大量调查得知,健康成年男子脉搏的均数为72次/分钟,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏与一般健康成年男子的脉搏数不同?本例中两均数不等的原因有两种,①由于个体之间存在差异,山区成年男子脉搏不同于一般,这种差别是抽样误差造成的;②由于环境条件的影响,山区成年男子的脉搏确实高于一般。第四节假设检验的意义和步骤首先假设样本均数与总体均数之间的差别是由抽样误差引起的,然后推断由抽样误差导致出现这种情况的概率有多大。如果出现这种情况的概率不小,那就有可能出现,不能拒绝这种假设。如果推断由抽样误差导致出现这种情况的概率很小,由于小概率事件在一次抽样中是不可能发生的,因此只好拒绝这个假设,拒绝了第一种可能,只能接受第二种可能。第四节假设检验的意义和步骤二、假设检验的步骤
1.建立检验假设,确定检验水准
假设有两种:
一是无效假设(nullhypothesis),或称零假设,用H0表示;二是备择假设(alternativehypothesis),用H1表示。
检验水准用α表示,它是判断差异有无统计学意义的概率水准,实际工作中常取
α=0.05。第四节假设检验的意义和步骤二、假设检验的步骤2.计算检验统计量
根据分析目的、设计类型和资料类型选用适当的检验方法,计算相应的统计量。3.确定P值,作出推断结论
P值是指在零假设成立的条件下随机抽样,获得等于及大于(或小于)现有统计量的概率。第五节Ⅰ型错误和Ⅱ型错误假设检验中作出的推断结论可能发生两种错误:①拒绝了实际上是成立的H0,这叫Ⅰ型错误(typeⅠerror)或第一类错误,也称为α错误。②不拒绝实际上是不成立的H0,这叫Ⅱ型错误(typeⅡerror)或第二类错误,也称为β错误。真实情况拒绝
不拒绝
成立Ⅰ型错误(α
)推断正确(1-α
)不成立推断正确(1-
β)Ⅱ型错误(
β)1-α称为可信度,其意义是两总体确无差别,接受H0的可信度大小。1-β称为检验效能(poweroftest)或把握度,其意义是两总体有差别,按α水准发现它们有差别的能力。Ⅰ型错误与Ⅱ型错误示意图(以单侧t检验为例)第五节Ⅰ型错误和Ⅱ型错误两类错误的区别与联系联系:
样本含量一定时,α增大,则β减小;α减小,则β增大;要想同时减小α和β,需增大样本含量。区别:1.一般α为已知,可取单侧或双侧,如0.05,或0.01。2.一般β为未知,只取单侧,如取0.1或0.2。第六节应用假设检验注意的问题1.要有严密的研究设计选择检验方法必须符合资料的适用条件假设检验单、双侧的选择正确理解P值的意义统计推断结论不能绝对化可信区间与假设检验的区别与联系学习小结1.标准差是衡量个体变异大小的指标,而标准误是衡量抽样误差大小的指标,其实质是样本均数的标准差。2.统计推断的方法有参数估计和假设检验。参数估计的方法有点值估计和区间估计。区间估计准确度和精密度是矛盾的,一般计算95%的可信区间。假设检验的基本思想是反证法和小概率事件原理。3.假设检验的主要步骤:①建立检验假设,确定检验水准;②计算检验统计量;③确定P值,做出推断结论。假设检验的结论包括统计学结论和专业结论两部分。4.假设检验无论是拒绝还是不拒绝H0,都可能犯错误。“弃真”的错误称为Ⅰ型错误,亦称假阳性错误,“取伪”的错误称为Ⅱ型错误,亦称假阴性错误。ThankYou!
第六章t检验
医学统计学目录第一节样本均数与总体均数比较的t检验第二节配对设计资料均数的t检验第三节两样本均数比较的t检验第四节两样本几何均数比较的t检验第五节两样本方差齐性检验与检验一、两样本方差齐性检验二、检验1.掌握:t检验的应用条件;各类型t检验的检验目的和步骤。2.熟悉:方差齐性检验目的和步骤。3.了解:方差不齐时的t'检验。
学习目标重点:1.各类型t检验的检验目的及应用条件;2.各类型t检验分析与计算过程;难点:1.各类型t检验的检验目的及应用条件;2.两样本均数比较的t检验。重点及难点
t检验(ttest)是小样本(如n≤100)计量资料比较均数时最常用的假设检验方法之一,它以第五章讨论的t分布为理论基础,因t分布别名为Studentt分布,故t检验又称Student’st检验。t检验的应用条件为:
①样本来自的总体应符合正态分布或近似正态分布;②两样本均数比较时要求两样本的总体方差相等,即具有方差齐性。当样本含量较大时,则分布接近z分布,t值近似等于z值,故将其称之为z检验或u检验。
第一节样本均数与总体均数比较的
t检验第六章第一节又称为单样本t检验(onesamplettest)。样本均数与已知总体均数比较的目的是推断该样本是否来自已知总体均数所代表的总体,或者该推断样本均数所代表的未知总体均数与已知总体均数是否有差别。此时已知的总体均数一般为理论值、标准值或经大量观察所得的稳定值等。第六章第一节单样本t检验的计算公式为:ν=n-1例6-1现对例5-4资料进行t检验。
(1)建立检验假设,确定检验水准
H0:μ=μ0=72
H0:μ≠μ0
α=0.05第六章第一节(2)计算t值
n=25,s=6.5,=74.2,=72,代入公式(6-1)(3)确定P值,作出推断结论
按v=25-1=24,查附表2,t界值表,得t0.10/2,24=1.711,现t<t0.10/2,24
,故P>0.10。按α=0.05的水准,不拒绝H0,差异无统计学意义。即根据本资料还不能认为该山区健康成年男子脉搏数与一般健康成年男子脉搏数不同。
第六章第一节当总体标准差已知或样本含量较大(n>100)时,可以选用单样本检验,其检验过程大致与单样本检验相同,因只需在t界值表中的最后一行(自由度∞栏)查找z界值,故比检验方便,其检验统计量值计算公式为:或若z<zα或z<zα/2,则P>α;若z≥zα或z≥zα/2
,则P≤α。第六章第一节
例6-2某托儿所三年来随机测得21~24月龄的47名男婴平均体重11kg。查得近期全国九城市城区大量调查的同龄男婴平均体重11.18kg,标准差为1.23kg。问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标)
(1)建立检验假设,确定检验水准H0:,即该托儿所男婴的体重发育状况与全国九城市的同期水平相同H1:,即该托儿所男婴的体重发育状况与全国九城市的同期水平不同第六章第一节(2)计算z值
本例因总体标准差已知,故可用z检验。本例n=47,=11,=11.18,=1.23,代入公式(6-12)(3)确定P值,做出推断结论
查z界值表(附表2,t界值表中为∞一行),得z0.20/2=1.2816,现z<z0.20/2,故P>0.20。按水准,不拒绝H0,差异无统计学意义。还不能认为该托儿所男婴的体重发育状况与全国九城市的同期水平不同。第六章第一节第二节配对设计资料均数的t检验第六章第二节配对设计(paireddesign)是把受试对象按某些特征相近的原则配成对子,再将每对的两个体按随机化方法分配到实验组和对照组,或接受两种不同的处理,并观察比较结果的差异。
配对设计异体配对
自体配对
同一样品两种测试方法的比较。自身对照:治疗前后的比较。动物:同种属、同性别、同体重病人:同性别、同病情、同年龄第六章第二节
配对资料的t检验(pairedsamplest-test)先求出各对子的差值d的均值,若两种处理的效应无差别,理论上差值d的总体均数应为0。所以这类资料的比较可看作是样本均数与总体均数0的比较。要求差值的总体分布为正态分布。t检验的公式为:
ν=n-1公式中,为差数的均数,Sd为差数的标准差,为差数均数的标准误。第六章第二节
例6-3
某医生研究饮食中维生素E缺乏与肝脏中维生素A含量的关系,将20只同种属的大白鼠,按性别相同,年龄、体重相近配成10对,并将每对中的两只大白鼠随机分到正常饲料组和维生素E缺乏组,两周后将大白鼠杀死,测得各大白鼠肝脏中维生素A的含量如表6-1。问两组大白鼠肝脏中维生素A含量是否有差别?(1)建立检验假设,确定检验水准
H0:,即不同饲料组的鼠肝中维生素A含量无差别H1:,即不同饲料组的鼠肝中维生素A含量有差别第六章第二节(2)计算t值本例n=10,Σd=8.17,Σd2
=9.0403,=Σd/n=8.17/10=0.817(μmol/g
)(3)确定P值,作出推断结论
ν=n-1=10-1=9,t界值表,得t0.001/2,9=4.781,现t>t0.001/2,9,故P<0.001。按α水准,拒绝H0,接受H1,差异有统计学意义。可认为不同饲料组的大白鼠肝脏中维生素A含量有差别,正常饲料组大白鼠肝脏中维生素A含量的较高。
第六章第二节第三节两样本均数比较的检验两本均数比较的t检验亦称为成组t检验,又称为独立样本t检验(independentsamplest-test)。适用于比较按完全随机设计而得到的两组资料,比较的目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。两样本含量可以相等也可以不相等,实际应用时不作具体要求,但在总例数不变的前提下,两样本含量相等时统计检验效率高。本检验要求:两总体分布为正态分布,且方差齐同。第六章第三节
假定有两个符合正态分布的总体和,分别用随机抽样方法自上述总体中分别抽取样本含量为n1和n2的样本,则两个样本均数差值服从正态分布,则根据前章所学标准误定义,经数理统计可以证明:(6-5)
(6-6)
式中为两样本合并的方差,其计算公式为第六章第三节如果n1=n2,则或第六章第三节例6-4
随机抽取14名慢性支气管炎病人与11名健康人并测得各自尿中17酮类固醇(μmol/24h)排出量如下。试比较两组人的尿中17酮类固醇的排出量有无不同。
病人X1:10.0518.7518.9915.9413.9617.6720.5117.2214.6915.109.428.217.2424.60健康人X2:17.9530.4610.8822.3812.8923.0113.8919.4015.8326.7217.29
第六章第三节(1)建立检验假设,确定检验水准H0:,即病人与健康人的尿中17酮类固醇的排出量相同
H1:,即病人与健康人的尿中17酮类固醇的排出量不同(2)计算t值本例n1=14,ΣX1=212.35,ΣX12=3549.0919
n2=11,ΣX2=210.70,ΣX22=4397.6486。第六章第三节代入公式(6-6)得按公式(6-10)第六章第三节
(3)确定P值作出推断结论
ν=14+11-2=23,查t界值表,得t0.05/2,23=2.069,现t<t0.05/2,23,故P>0.005。按α水准,不拒绝H0,差异无统计学意义。尚不能认为慢性支气管炎病人与健康人的尿中17酮类固醇的排出量不同。实际工作中,当两样本含量n1和n2均大于50时,t分布非常接近z分布,近似可按下式计算在z值:
第六章第三节
例6-5某地对40~50岁年龄组的男、女不同性别的健康人群随机测定了β脂蛋白,其中男性193人,得均数为3.97g/L,标准差为1.04g/L,女性128人,得均数为3.58g/L,标准差为0.90g/L。问该人群男、女之间β脂蛋白有无差别?
(1)建立检验假设,确定检验水准H0:,即该地40~50岁人群的β脂蛋白男、女之间无差别H1:,即该地40~50岁人群的β脂蛋白男、女之间有差别
第六章第三节
(2)计算z值本例n1=193,=3.97,S1=1.04,n2=128,=3.58,S2=0.90。代入公式(6-11)。(3)确定P值,做出推断结论查附表2,t界值(ν=∞),得z0.001/2=3.29,现z>z0.001/2,故P<0.001。按水准,拒绝H0,接受H1,差异有统计学意义。故可认为该地40~50岁健康人群男、女之间β脂蛋白有差别,男性β脂蛋白含量高于女性。第六章第三节
第四节两独立样本几何均数比较的t检验
比较两样本几何均数的目的是两样本几何均数所代表的未知总体几何均数有无差异。适用于:①等比级数资料,如血清抗体滴度或效价;②对数正态分布资料,如某些传染病的潜伏期,人体血铅含量等。两样本几何均数比较的t检验公式与两样本均数比较的t检验公式相同。只需将观察X用lgX来代替就行了。
第六章第四节例6-6
将20名犬咬伤病人(无狂犬疫苗免疫史)随机分为两组,分别注射精制疫苗和纯化Vero细胞狂犬病疫苗(PVRV),6周后测定两组狂犬病毒抗体滴度的倒数(即稀释度)结果如下。问两种狂犬疫苗的平均抗体滴度有无差别?精制苗(10人):100,200,200,400,800,800,1600,1600,3200,3200PVRV(10人):100,100,100,200,200,200,200,400,800,600第六章第四节(1)建立检验假设,确定检验水准
H0:,即两组对数值的总体均数相等。
H1:,即两组对数值的总体均数不等。
α=0.05
第六章第四节(2)计算t值将两组数据分别取对数,记为x1,x2
。
x1:2.000,2.301,2.301,2.602,2.903,2.903,3.204,3.204,3.505,3.505x2:2.0002.0002.0002.301,2.301,2.301,2.301,2.602,2.903,3.204用变换后的数据计算,s1,,s2得:=2.8428
,
s1=0.5271
,=2.3913
,s2=0.4026
,n1=10,n2=10第六章第四节
(3)确定P值作出推断结论
ν=10+10-2=18,查t界值表,得t0.05/2,18=2.011,现t>t0.05/2,18,故P<
0.05。按α=0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为两种疫苗平均抗体滴度不同,精制疫苗高于PVRV。
第六章第四节第五节两独立样本方差齐性检验与检验一、方差齐性检验
在进行t检验时,均要求各样本数据服从正态分布或近似正态分布;两样本均数比较的t检验,除要求两组资料应服从正态分布外,还要求两样本资料所对应总体的方差相等,即方差齐性(homogeneityofvariance)。因此,在讲解例题过程中,通常假定所得样本数据服从正态分布。但实际工作中,在使用t检验方法之前,应对样本数据的分布进行正态性检验(normalitytest),若是两样本均数比较的检验,还要对两总体方差是否相等进行检验,即方差齐性检验。
第六章第五节方差齐性检验的应用条件是两样本均来自正态分布的总体。两样本方差齐性检验原理:两样本方差和分别是两总体方差和的无偏估计,假定两总体方差相等,即,由于存在抽样误差的原因,两样本方差和很少会相等,但相差不会很大,当两样本方差相差较大时,需作方差齐性检验,求得的P值小于预先设定的检验水准,则有理由认为两总体方差不相等。方差齐性检验常用F检验,其计算公式为:第六章第五节,式中为较大的样本方差,为较小的样本方差,分子的自由度为,分母的自由度为,相应的样本例数分别为n1和n2。F值是两个样本方差之比,如仅是抽样误差的影响,它一般不会离1太远,反之,F值较大,两总体方差相同的可能性较小。第六章第五节例6-7
为了探讨血清SIL-2R含量对白血病的诊断意义,随机抽取白血病患者13人和正常对照11人,测得血清SIL-2R含量(pmol/L)如下。试检验两样本的总体方差是否相等。白血病组:630.21,602.13,589.27,638.17,592.30,690.11,869.23,723.33,653.26,523.17,516.33,613.37,638.39对照组:179.21,180.22,183.30,160.17,187.23,185.26,165.31,185.21,178.33,191.36,181.32第六章第五节(1)建立检验假设,确定检验水准H0:,即两总体方差相等。
H1:,即两总体方差不等。
α=0.05(2)计算F值
对以上数据分别进行计算,可得S1=90.41,S2=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年小学数学生活化教学中的折扣问题案例
- 精神类药品安全管理制度
- 急性胰腺炎处理管理培训指南
- 规范穿脱防护用品要点
- 肝炎病毒感染的防控措施培训
- 2025年公务员(责任意识提升)试题及答案
- 肾上腺皮质功能减退康复训练方案
- 老年人旅游团夕阳红专列旅游
- 产科肿瘤患者的护理
- 2026年基于战略落地的绩效管理体系设计与推行
- 2026年吉林省长春市辅警考试试卷含答案
- 瓮福达州化工有限责任公司招聘(四川)笔试备考题库及答案解析
- 智慧安全油库试点建设指南(试行)
- 2026年及未来5年中国广东省民办教育行业市场调研及投资规划建议报告
- 2025年山东高考思想政治真题试卷完全解读(含试卷分析与备考策略)
- 广西中烟工业有限责任公司2026年招聘51人备考题库附答案详解
- 2026年能源发展行业全球海洋能分析报告
- 安全生产连带考核制度
- 工业和信息化部所属单位招聘54人备考题库及答案详解(新)
- 云南省公路工程试验检测费用指导价
- 2025-2026学年辽宁省沈阳市浑南区七年级(上)期末英语试卷(含答案)
评论
0/150
提交评论