医学统计学-参数估计与假设检验_第1页
医学统计学-参数估计与假设检验_第2页
医学统计学-参数估计与假设检验_第3页
医学统计学-参数估计与假设检验_第4页
医学统计学-参数估计与假设检验_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计与假设检验医学统计学第一节参数估计抽样误差和抽样分布样本均数的抽样分布和抽样误差样本频率的抽样分布和抽样误差点估计和可信区间总体均数、总体率的点估计总体均数、总体率的可信区间内容总体(population):调查研究的事物或现象的全体个体(item

unit):组成总体的每个元素样本(sample):从总体中所抽取的部分个体样本容量(sample

size):样本中所含个体的数量总体、个体和样本我们想研究某年某地区10万名13岁⼥孩的身⾼情况。直接法:调查这10万名⼥孩,测量她们的身⾼,然后进⾏统计分析。随机抽样:如随机抽样调查200个⼉童,测量她们的身⾼,通过分析这200个⼉童的身⾼来推断该地区10万名13岁⼥孩的身⾼情况。案例总体:该地区10万名13岁⼥孩身⾼观察值的全体个体:每个13岁⼥孩的身⾼观察值样本:随机抽样所得200名13岁⼥孩的身⾼观察值样本容量:200抽样实验:通过样本信息了解总体的情况。即通过分析200名13岁⼥孩身⾼来估计10万名13岁⼥孩的身⾼情况。也就是用样本均数去估计总体均数。案例误差泛指实测值和真实值之差。按其产⽣原因与性质可分为:系统误差和随机误差。系统误差由受试对象、研究者、仪器设备、研究⽅法等确定性原因造成,有倾向性,可避免。随机误差由多种⽆法控制的偶然因素引起的。⽆倾向性,不可避免。误差产生的原因抽样误差由于⽣物固有的个体变异,从某⼀总体中随机抽取⼀个样本,所得样本统计量与相应总体参数往往是有差异的,这种差异称为抽样误差(sampling

error)。抽样误差是⼀种随机误差抽样误差产⽣的根本原因是个体变异,产⽣的直接原因是抽样。抽样误差由于抽样误差存在,从同⼀总体中随机抽取若⼲份样本,所得样本统计量是不⼀致的,差异⽆法避免但其存在⼀定的分布规律。抽样分布样本均数抽样分布和抽样误差【例6-1】假定某年某地所有13岁⼥⽣的身⾼服从总体均数为155.4cm,总体标准差为5.3cm的正态分布。用计算机从该总体中随机抽样,每次抽取5例组成⼀份样本,重复抽样100次,计算每份样本的平均身⾼。正态分布总体样本均数的抽样分布正态分布总体样本均数的抽样分布正态总体⋯样本1样本2样本3样本4⋮样本100正态分布总体样本均数的抽样分布Histogramof

yyFrequency152153154155156157158159010203040𝑁(155.4,

5.3+)正态分布总体的样本均数抽样分布具有以下特点:样本均数恰好等于总体均数极其罕见;样本均数围绕总体参数,中间多,两边少,左右基本对称,呈正态分布;样本均数之间存在差异;样本均数的变异小于原始变量值间的变异正态分布总体样本均数的抽样分布用计算机从正偏态分布的总体中随机抽取样本量为5、10、30和50的样本各1000份,计算样本均数并绘制4个直方图。非正态分布总体样本均数的抽样分布非正态分布总体样本均数的抽样分布Histogramofy1 Histogramof

y20246802468y1y2Frequency0100200

300400

500Frequency050150250350Histogramof

y30246802468y3y4Frequency0100 200 300400Histogramof

y4Frequency050100150200中心极限定理从正态总体𝑁(𝜇,

𝜎+)中随机抽取例数为n的多个样本,样本均数服从正态分布;即使是从非正态总体中随机抽样,当n⾜够⼤时(n>30),

样本均数也近似正态分布,且样本均数的均数等于原分布的均数。均数抽样误差由固然存在的个体变异和抽样造成的样本均数与样本均数之间的差异,以及样本均数与总体均数之间的差异称为均数的抽样误差。样本均数的标准差样本均数的标准差通常称为均数的标准误(standarderror

of

mean),可用于反映均数抽样误差的⼤小。根据数理统计学原理,若随机变量𝑋均数为𝜇,⽅差为𝜎+,

则样本均数的标准差,即均数的标准误为:𝜎= 𝜎0̅ 𝑛又根据正态分布原理,若随机变量𝑋~𝑁(𝜇,

𝜎+),则样76本均数𝑋6~𝑁(𝜇,𝜎+)。样本均数的标准差标准差是描述个体值的变异。标准误是描述统计量的变异。均数的标准误,就是样本均数的标准差,用以表达样本均数分布的离散程度。标准误小,表明抽样误差小,统计量较稳定,与估计的参数较接近。样本均数的标准差实际应用中,总体标准差𝜎

通常未知,需要用样本标准差𝑆来估计标准误。此时,均数标准误的估计值为:𝑆0= 𝑆̅ 𝑛标准误的⼤小与原变量的标准差成正比,与样本含量的平⽅根成反比,因此,实际应用中可通过增加样本含量来减小均数的标准误,从⽽降低抽样误差。样本均数的标准差标准差标准误性质描述个体值的变异描述统计量的变异,表示抽样误差的大小算式𝑆

=∑𝑋+−(∑

𝑋)+/𝑛𝑆 = 𝑆0̅ 𝑛𝑛−

1控制方法个体变异或自然变异,不可通过统计方法来控制。增大样本量而减小用途求参考值范围求可信区间【例6-2】2000年某研究所随机调查某地健康成年男⼦27⼈。得到⾎红蛋白量的样本均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。0̅ 𝑛27𝑆 = 𝑆 = 15 =

2.89𝑔/L样本均数的标准差t分布T分布的概念76若随机变量𝑋~𝑁(𝜇,

𝜎+),则样本均数𝑋6~𝑁 𝜇,

𝜎+ 。所以𝑧

=𝑋6

𝜇𝜎76服从标准正态分布𝑁(0,1)。T分布的概念在实际资料中,由于𝜎

通常未知,故标准化转换演变为:𝑡

=𝑋6

𝜇𝑆76服从自由度𝑣

=

𝑛

1的𝑡分布.T分布曲线的特点𝑡分布曲线是单峰分布,它以0为中⼼,左右对称。𝑡分布的形状与样本例数𝑛有关。自由度越小,则𝑆76越⼤,𝑡

值越分散,曲线的峰部越矮,尾部则偏⾼。当𝑛

时,𝑆逼近𝜎,

𝑡分布逼近正态分布。𝑡分布不是⼀条曲线,⽽是⼀簇曲线。T分布曲线的特点𝑡分布的密度曲线下面积有⼀定的规律性。T分布在𝑡界值表中,横标目为自由度,纵标目为尾部概率。⼀侧尾部面积称为单侧概率(one-tailedprobability),

两侧尾部面积之和成为双侧概率(two-tailed

probability)。当自由度𝑣和𝛼确定时,与单侧概率对应的𝑡界值用𝑡J,K表示,与双侧概率对应的𝑡界值用𝑡J/+,K表示。T分布在𝑡界值表中看出,在相同自由度时,|t|值越⼤,概率P越小。抽样分布和抽样误差样本统计量抽样分布误差含义及误差产⽣的原因样本均数抽样分布和抽样误差正态分布总体样本均数抽样分布规律非正态分布总体样本均数抽样分布规律均值标准误的含义和计算t分布小结参数估计统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。点估计(point

estimation)参数估计区间估计(interval

estimation)点估计用样本统计量直接来估计总体参数的值。优点:表达简单缺点:未考虑抽样误差,⽆法评估参数估计的准确程度。样本统计量:𝑋6,𝑆,𝑃总体参数: 𝜇,𝜎,𝜋用样本统计量直接来估计总体参数的值。【例6-4】2000年某研究所测到某地27例健康成年男性⾎红蛋白量的样本均数为125g/L,试估计其总体均数。𝑥̅ →

𝜇即认为2000年该地区所有健康成年男性⾎红蛋白量的总体均数为125g/L。点估计在区间估计中,预先给定的概率(1-𝛼),称为可信度(confidence

level),常取95%或者99%。通过可信度,计算得到的区间范围,称为可信区间(confidenceinterval,

CI).可信区间有两个数值界定的可信限构成。较小的数值为下线(lower

limit,

L),交⼤数值为上限(upper

limit,

U),⼀般表示为(L,

U).区间估计95%可信区间的含义:从总体中随机抽样,做100次抽样,每个样本可算的⼀个可信区间,得到100个可信区间。平均有95个可信区间包括𝜇(估计正确),只有5个可信区间不包括𝜇(估计错误)。总体均数可信区间的含义𝜎已知按照标准正态分布原理计算,由𝑍分布,标准正态曲线下有95%的𝑍值在±1.96之间。−1.96

<𝑋6

𝜇𝜎0̅<

1.96𝑋6

1.96𝜎0̅ <𝜇<𝑋6

+

1.96𝜎0̅95%的双侧可信区间:(𝑋6−

1.96𝜎0̅,𝑋6

+

1.96𝜎0̅)99%的双侧可信区间:(𝑋6−

2.58𝜎0̅,𝑋6

+

2.58𝜎0̅)通式:

(1-𝛼)%的双侧可信区间是𝑋6

±𝑍T⁄U𝜎0̅总体均数可信区间的计算𝜎未知,但样本例数⾜够⼤(n>50)时由𝑡分布可知,自由的越⼤,

𝑡分布越逼近正态分布,此时𝑡曲线下有95%的𝑍值在±1.96之间。−1.96

<𝑋6

𝜇𝑆0̅<

1.96𝑋6

1.96𝑆0̅ <𝜇<𝑋6

+

1.96𝑆0̅95%的双侧可信区间:(𝑋6

1.96𝑆0̅,𝑋6

+

1.96𝑆0̅)99%的双侧可信区间:(𝑋6

2.58𝑆0̅,𝑋6

+

2.58𝑆0̅)通式:

(1-𝛼)%的双侧可信区间是𝑋6

±𝑍T⁄U𝑆0̅总体均数可信区间的计算𝜎未知,但样本例数较小时由𝑡分布原理可知,此时某自由度的𝑡曲线下有95%的𝑍值在±𝑡W.WX/+,K之间。−𝑡W.WX/+,K

<𝑋6

𝜇𝑆0̅<

𝑡W.WX/+,K𝑋6

𝑡W.WX/+,K𝑆0̅ <𝜇<𝑋6

+

𝑡W.WX/+,K𝑆0̅95%的双侧可信区间:(𝑋6

𝑡W.WX/+,K𝑆0̅,𝑋6

+

𝑡W.WX/+,K𝑆0̅)99%的双侧可信区间:(𝑋6

𝑡W.WY/+,K𝑆0̅,𝑋6

+

𝑡W.WY/+,K𝑆0̅)通式:

(1-𝛼)%的双侧可信区间是𝑋6

±

𝑡J/+,K𝑆0̅总体均数可信区间的计算【例6-3】某医⽣测得25名动脉粥样硬化患者⾎浆纤维蛋白原含量的均数为3.32

g/L,标准差为0.57g/L,试计算该种病⼈⾎浆纤维蛋白原含量总体均数的95%双侧可信区间。𝑿[±

𝒕𝜶,𝒗𝑺𝒙[𝟐=𝟑.𝟑𝟐±𝟐.𝟎𝟔𝟒∗𝟎.

𝟓𝟕𝟐𝟓=(𝟑.𝟎𝟖,𝟑.

𝟓𝟔)【例6-4】某地随机调查了140名成年男⼦的红细胞数。其均值为4.77,标准差为0.38,试计算该地成年男⼦红细胞总体均数的95%、99%双侧可信区间。本例属于⼤样本(>50),可采用正态近似的⽅法计算可信区间。𝑋6

±𝑍Jj+𝑆0̅95%CI:(4.71,

4.83)99%CI:(4.69,

4.85)可信区间95%可信区间99%可信区间公式(𝑋6−1.96𝑆0̅,𝑋6+1.96𝑆0̅)(𝑋6−2.58𝑆0̅,𝑋6+2.58𝑆0̅)范围窄宽(精密度)估计错误的概率大小(准确度)(0.05)(0.01)可信区间估计的优劣:准确性:

反映可信度(1-𝛼)的⼤小,其值越接近1越好。精确性:可信区间的宽度衡量。宽度越小越好,小结样本量的作用n越大,CI越小,𝑛

∞,

𝐶𝐼

0n越大,参考值范围越稳定用途估计总体均数估计绝大多数观察对象某项指标的分布范围区别点含义总体均数的可信区间 参考值范围按预先给定的概率确定的位置参 “正常人”的解剖,生理,数𝜇的可能范围 生化等某项指标的波动范围。总体均数的波动范围 个体值的波动范围计算公式6U𝜎未知但n>50:𝑋

±

𝑍T

𝑆⁄ 0𝜎已知:

𝑋6

±

𝑍T⁄U𝜎0̅ 正态分布:𝑥̅

±

𝑧J/+𝑆̅ 偏态分布:𝑃0~𝑃YWW–0𝜎未知:𝑋6

±

𝑡J/+,K𝑆0̅前面涉及的都是双侧可信区间。但有些情况下,我们所关⼼的仅仅是单侧的可信限。单侧可信区间与双侧可信区间的计算公式基本相同,只需将公式中的抽样分布的双侧界值换成单侧界值,同时只取下限或上限。CI

X

t S上限

X单侧可信区间实际中有时需要计算两个总体均数差值的双侧100 1

−𝛼 %可信区间的计算公式为(𝑥Y̅ −𝑥̅+)±

𝑡J/+,K𝑆0̅o–0̅U其中𝑣

=

𝑛Y

+

𝑛+

2为自由度,

𝑆0̅o–0̅U

为两样本均数之差的标准误。两总体均数差值的置信区间1 22

1 1

XSX

Sc

n1 n2

21 2(n

1)S2

(n

1)S

2

1 1 2 2

n

n

2Sc【例6-5】评价复⽅缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度⾼⾎压的有效性,将123名患者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,试验组平均下降15.77

mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准差为13.55mmHg。试估计两组收缩压平均下降差值的95%可信区间。由公式计算:(54

1)

13.172

(48

1)

13.5522

178.22154

48

2Sc

X1

X

2S

178.221

1

1

2.6483

54 48

(

X1

X

2

)

t

/2,

SX

X

(15.77

13.17)

1.984

2.6483

0.991 2(

X1

X

2

)

t

/

2,

SX

X

(15.77

13.17)

1.984

2.6483

11.491 2【例6-5】某医师观察某新药治疗肺炎的疗效,将肺炎病⼈随机分为对照组和新药值。两组的退热天数试验资料如下表。试估计两药平均退热天数之差的95%可信区间。分组N𝑿[S对照组375.20.9新药组353.80.85.2−3.8 ±

1.99437−1

0.9++ 35−1

0.8+ 1 + 137+35−

2 37 35两药平均退热天数之差的95%可信区间是(1.00,

1.80)样本频率抽样分布和抽样误差【例6-3】假定⼝袋内有形状,重量完全相同的⿊球和白球,已知⿊球比例为20%(即总概率𝜋

=

0.2)。有放回地重复摸球50次(𝑛p

=

50),计算摸到⿊球的百分比(样本频率𝑃)。重复实验100次,绘制样本频率分布图。二项分布总体样本频率的抽样分布二项分布总体样本频率的抽样分布Histogramof

xxFrequency0.00.10.20.30.4051015样本频率抽样误差样本频率抽样误差从同⼀总体随机抽出观察单位相等的多个样本。样本率与总体率及各样本率之间都存在差异,称为频率的抽样误差。样本频率的标准误表示样本频率抽样误差⼤小的指标即为频率的标准误。样本频率抽样误差根据⼆项分布原理,若随机变量𝑋~𝐵(𝑛,

𝜋),

则样本频率𝑃

=

7⁄r的总体概率为𝜋,标准误为:s𝜎 =𝜋(1−

𝜋)𝑛样本频率的标准误越小,用样本频率估计总体概率的可靠性越好。反之,用样本频率估计总体概率的可靠性就越差。样本频率抽样误差在实际⼯作中,总体概率𝜋⼀般是未知的,常用样本频率𝑃

=

7⁄r

来近似的代替,得到频率标准误的估计值为:s𝑆 =𝑃(1−

𝑃)𝑛样本频率的标准误与样本含量𝑛

的平⽅根成反比,增加样本含量可以减少样本频率的抽样误差。样本频率抽样误差【例6-3】某年某市随机调查了50岁以上的中老年妇⼥776⼈,其中患有骨质酥松症者322⼈,患病率为41.5%。试计算该样本频率的抽样误差。s𝑆 =𝑃(1−

𝑃)

= 0.415(1−0.415)=

0.018𝑛 776本例标准误的估计值较小,说明用样本患病率来估计总体患病率的可靠性较好。总体概率的可信区间与样本含量𝑛,阳性概率𝑃的⼤小有关,可根据𝑛和𝑃的⼤小选择以下两种⽅法:1. 正态近似法当样本含量𝑛⾜够⼤,且𝑃和1

𝑃不太小,则样本率的分布近似正态分布。(𝑃−𝑍J/+𝑆s,𝑃+

𝑍J/+𝑆s)𝑃为样本率,𝑆s为率的标准误的估计值。总体概率可信区间的计算【例6-5】某区疾病预防控制中⼼2002年对该乡镇250名小学⽣进⾏贫⾎的检测,结果发现有86名贫⾎者,检出率为34.40%,求贫⾎检出率95%的可信区间。0.05

2

2

p250p

Z S

p

Znp(1

p)

0.3440

1.960.3440(1

0.3440)

(0.2851,

0.4029)【例6-5】为了解某医院剖宫产情况,在该医院随机抽查106⼈,其中施⾏剖宫产者62⼈。试估计该医院剖宫产率95%的可信区间。n=106,X=62,

P=62/106=58.5%.58.5%±

1.96Xt.X%(Y–Xt.X%)YWu该医院总体剖宫产率95%的可信区间为(49.1%,67.9%).2. 查表法当𝑛较小,如

𝑛

50,特别是𝑃和1

𝑃接近0或者1时,应按照⼆项分布的原理估计总体率的置信区间。当阳性例数X

>

r

,用𝑛

𝑋查表,获得总体阴性率可+信区间,再用1减去总体阴性率可性区间,即为总体阳性率可信区间。总体概率可信区间的计算【例6-6】某医院对24名前列腺癌患者实施开发⼿术治疗,术后有合并症者2⼈,试估计该医院该⼿术合并症发⽣概率的95%,99%的可信区间。本例n=24,

X=2。P221,附表6得总体率的95%可信区间是(1%,27%),

99%可信区间是(0%,33%)。总体概率可信区间的计算【例6-6】某医院用某疗法治疗某病10⼈,其中7⼈有效。试估计该医院该疗法有效率的95%的可信区间。本例n=10,

阳性例数X=7>5。用n-X=3差表,P221,附表6得总体阴性率的95%可信区间是(7%,65%)

。用1减去此区间的上下限,得疗法有效率的95%可信区间为(35%,

93%)。总体概率可信区间的计算两总体率差值的区间估计在⼤样本情况下,可采用正态近似法对两总体率差值进⾏可信区间估计,其计算公式为:(𝑃Y−𝑃+)±

𝑧J/+𝑆so–sU𝑆so–sU1 1y= 𝑃y(1

𝑃y)( + ),

𝑃 =𝑛Y 𝑛+ 𝑛Y+

𝑛+𝑋 +

𝑋Y +𝑋Y和𝑋+分别表示两组中某事件发⽣的例数。【例6-7】某医院⼝腔科医⽣用极固宁治疗牙本质过敏症,以双氟涂料作对照,进⾏了1年的追踪观察,结果见表6-1所示,试估计两组有效率差别95%的可信区间。表6-1 治疗牙本质过敏症两组有效率的比较组别总牙数有效数有效率(%)试验组776179.22对照组693855.07合计1469967.81(8.96%,39.34%)第二节假设检验假设检验(Hypothesis

testing):对总体的某种规律提出⼀个假设(例如假设总体均数为⼀定值,总体均数相等,总体服从某种分布),通过样本数据提供的信息来推断,运用“小概率原理”

决定是否拒绝这⼀假设。假设检验假设检验的原理小概率原理:概率很小(接近于零)的事件在⼀次随机抽样中不太可能出现,故可以认为小概率事件在⼀次抽样中是不会发⽣的。概率论:如果⼀件事情发⽣的概率很小,那么在进⾏⼀次试验时,我们说这个事件是“不会发⽣的”。从⼀般的常识可知,这句话在⼤多数情况下是正确的,但是它⼀定有犯错误的时候,因为概率再小也是有可能发⽣的。例如假设在5000粒中药丸中只有⼀粒是被⾍蛀过的。现从中随机取⼀粒,则取得“被⾍蛀过的药丸”的概率是1/5000.

这个概率是很小的,因此也可以将这⼀事件看作在⼀次抽样中是不会发⽣的。若从中随机抽取⼀粒,恰好是被⾍蛀过的,这种情况发⽣了,我们自然可以认为原来的假设有问题。也就是说⾍蛀率应该不是1/5000.从⽽否定了假设。小概率原理假设检验的思维逻辑【例6-8】某市抽取400名小学⽣进⾏视⼒⼲预⽅法研究。⼲预组和对照组各200⼈。研究前首先作基线调查,发现⼲预组屈光度的均数为-0.34D,

标准差为0.12D;

对照组屈光度的均数为-0.57D,

标准差为0.36D。试问在基线时,⼲预组和对照组屈光度的总体均数有⽆差别?假设检验的思维逻辑样本均数分别为-0.34D和-0.57D,

总体均数相等吗?造成这种差别的原因可能有两种:两总体均数相等

--

样本均数不同,乃抽样误差两总体均数不相等

--

样本均数不同,并非抽样误差是碰巧还是必然的原因?需要进⾏假设检验!假设检验的原理反证法:当⼀件事情的发⽣只有两种可能A和B,为了肯定其中的⼀种情况A,但又不能直接证实A,这时否定另⼀种可能B,则间接的肯定了A。假设检验的基本步骤建立检验假设,确定检验⽔平。零假设(Null

hypothesis),又称原假设,记为HW:

⼲预组小学⽣和对照组小学⽣屈光度的总体均数相等。HW:𝜇Y=

𝜇+对立假设(Alternativehypothesis),又称备选假设,记为HY:

⼲预组小学⽣和对照组小学⽣屈光度的总体均数不相等。HY:𝜇Y≠

𝜇+确定检验⽔平𝛼=

0.05,0.01𝛼是在统计推断时,预先设定的⼀个小概率值。是当HW为真时,允许错误的拒绝HW的概率。假设检验的基本步骤2. 选择并计算检验统计量选择适宜的统计量t.oUUÄt.ÅÇUUtt Utt𝑧

=76o–76UoÄ UÉU ÉUno nU分⼦:样本均数之差分母:样本均数之差的标准差利用样本数据计算统计量的数值𝑧=

–W.|}–(–W.X~)=8.57𝑃值的意义𝑝值的意义:在零假设成立的条件下,出现“统计量当前值及更不利于零假设的数值”的概率为𝑃.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论