医学统计学方法_第1页
医学统计学方法_第2页
医学统计学方法_第3页
医学统计学方法_第4页
医学统计学方法_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学方法

一、基本概念和基本步骤

统计学的几个基本概念

总体与样本

总体(population):根据研究目的确定的同质的研究对象,其某项变量值的全体。

某省2000年14岁男孩的身高

总体

141m蛔

(某部用工痫的疗效)

抽样(sampling):从研究总体中随机抽取一部分有代表性的个体的方法。

样本(sample):从研究总体中随机抽取的一部分有代表性的个体(其某项变量值的全体)。

统计推断(inference):利用样本信息推断总体特征。

同质与变异

同质(homogeneity):除了试验因素外,影响被研究指标的非实验因素相同被称为同质。一个总体中

有许多个体大同小异,存在共性,这些个体处于同一总体。

某省2000年14岁男孩的身高

变异(variation):在同质基础上个体间的差异。

主鼻性是统计学的根本需要

误差

误差观察值与实际值的差别为误差。观察过程中由于不认真仔细,造成错误地判断、记录或录入计算

机所致的观察值与实际值之差为一过失误差;仪器若未经校准,使观察值统•地都偏低或偏高则为系统误

羞;由于偶然的因素使同一个样品的测定值在不同的观察者之间或者相同观察者的若干次观察值之间不完

全相同,则被称作随机测觉误差;从同一总体中抽样.得到某变量值的统计量之间或与总体参数之间的差别,

被称为抽样误差。

抽样误差(samplingerror)

定义:由个体变异产生,由抽样引起的总体指标(参数)与样本指标(统计量)以及样本指标之间的

差异

特点:不可避免

目的:减小抽样误差

方法:减小个体间的差异;增大样本含量

参数与统计量

参数(parameter):是由总体中个体值计算出来的用于描述总体特征的指标。

其大小是客观存在的,然而往往是未知的。

统计量(statistic):是由样本中个体值计算出来的用于描述样本特征的指标。

统计学关心的常常是总体参数的大小,其依据却是统计量及其性质。

概率(Probability)

定义:描述随机事件发生可能性大小的数值(0

取值范围:不可能事件必然事件

估计方法:当〃足够大时,用频率估计概率

小概率事件:某随机事件发生可能性很小

含义:在一次试验或观察中某随机事件发生可能性很小

资料类型

变量:根据研究目的,对研究对象的某个或某些特征(研究指标或项目)实施观测,这些特征(指标或

项目)称为变量(variable)

资料(数据):变量的取值(变量值)

计曾

/定量资料(身高:怵窗-特点,有荤位;

资料

二分奘(性别》

类型

f无序

I宸性济相弟分臾1+型:A.B.O.AB)

育序(板流给果〉-»+,++»+++)

计教

医学统计工作的基本步骤

mom透m”江及»L条叁佗

【例题】下面的变量中,属于分类变量的是

A.脉搏

B.血型

C.肺活量

D.红细胞计数

E.血压

[正确答案JB

二、定量资料的统计描述

rlB+att

IMI

峰a-

s*mE,______

-----—|aw

统计描述:利用统计表、图以及统计指标描述资料的数量特征及其分布规律

,

*

as,一®一集崛一嚣*分

«

cmn_mm.'Mm

描述数值变量资料的集中趋势指标——平均数

平均数:它是一类指标,统计中常用的平均数包括:算术平均数、几何平均数、中位数。

平均数的选取:根据资料的分布类型

(-)算术平均数

算术平均数简称均数,总体均数一4,样本均数一2

1.适用条件:对称分布,特别适用于正态或近似正态分布资料

2.计算方法:

(1)直接法一观察单位较少

公式:MM

某市10名4岁女孩的身高(cm)分别为:112.9,108.0,99.8,102.5,116.3,105.6,100.7,103.2,

104.9,98.9,试求其均数。

广空*三空=金305128ca

(2)频表法一观察单位较多时

工四十,与4■…4■仙

就:

人+片…+八

5x1405+..+4x2345

5+...+4

(二)几何均数

儿何均数(geometricmean)用G表示。

1.适用条件:观察值呈倍数关系或对数正态分或多用于描述抗体的平均滴度等。

2.计算方法:

(-)直接法一观察单位较少

公式:

(7=¥勺叼…0

电日=叱-4-Q_阿,+W上++H/_£也%

MJUM

,Tlgjqa

M

例题某地5例微丝蝴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度分别为1:10,1:20,

1:40,1:40,1:160,求抗体的平均滴度。

解:平均指标选用几何均数(观察值呈倍数关系)

首先取观察值的倒数

.一1sT(lg10+320+3烟+340+3160)_48

5份血清抗体效价的平均滴度为1:34.8

(2)加权法一频数表资料

公式:

Q-+工1g匕+…+/+。)_也~<(二

例题:69例类风湿关节炎(RA)患者血清EBV-VCATgG抗体滴度的分布如下,求其平均抗体滴度。

某医院预防保健科用流脑疫苗为75名儿童进行免疫接种,1个月后测定其抗体滴度如下表所示,试求

其平均滴度。

75名儿童的平均抗体滴度计算表

抗体滴度滴度倒数XIgX频数fflgX

1:440.602142.4084

1:880.903198.1279

1:16161.20412125.2861

1:32321.50512030.1020

1:64641.80621221.6744

1:1281282.1072510.5360

1:2562562.408249.6328

合计一—75107.7676

.yyigXI1077676

O=(能第M35

J』八

(三)中位数

中位数(median)用M表示,是一组观察侑按山小到大的顺序排列后,位于中间位置上的那个数值。

1.适用条件:

(1)变量值中出现个别特小或特大的数值

(2)资料的分布呈明显的偏态

(3)变量值分布一端或两端无确定数值,只有小于或大于某个数值(〈90)。

(4)资料的分布不清

2.计算方法:

(1)当样本含量为奇数时,1f

1,8,2,4,12—1,2,4,8,12

M==4„.=&=4

(2)当样本含量为偶数时,

1,8,2,4,12,3—1,2,3,4,8,12

_(&+式)_(

M=—i-2—31)_?5

222

(四)百分位数

百分位数(percentile)用匕(第x百分位数)表示,也是一种位置指标,观察值按由小到大的顺序

排列后,•个百分位数P*将全部变量值分为两部分,其中有x%的变量值比它小,(100-x)%变量值比它大。

P50=M

适用条件同中位数

频数表法:

L:第X百分位数所在组段的组下限

i:组距

6:第x百分位数所在组段对应的频数

江:为小于L的各组段的累计频数

例题测得某地200名正常人发汞值(Ug/g),试计算其平均水平及是百分位数。

某地200名正常人发汞值频数分布

组段(Ug/g)频数f频率(%)累计频数累计频率(%)

(1)(2)(3)(4)(5)

0.3〜2010.02010.0

0.7〜5025.07035.0

1.1〜4623.011658.0

1.5〜3015.014673.0

1.9〜2512.517185.5

2.3-168.018793.5

2.7〜63.019396.5

3.1〜42.019798.5

3.5〜21.019999.5

3.9〜4.310.5200100.0

合计200100.0——

•岛-

=1.14-^-(200x5Q«-7U)

=1如3心

Ja

=1.94-^(200x75K-l4Q

=1.964(MMQ//£)

三、定量资料的离散趋势

(变异程度)指标

离散趋势

(-)极差(全距)

1.定义:也羞(R)=最大值-最小值极差越大变异程度越大。

例:甲乙两组球员身高资料如下:

甲组:184,186,188,190,192

7=188mq=192—184=8cm

乙组:180,184,188,192,196

。=188CM&=1%-180=1金融

甲乙两组的集中趋势相同(有相同的平均水平),但离散程度不同(乙组大于甲组)。也就是说,即

考虑集中趋势,又要考虑离散趋势,这样才能全面对数值变量资料进行描述。

2.应用范围:适用于任何分布类型的资料,描述偏态分布资料。

3.优缺点

优点:计算简单、概念清晰。

缺点:

(1)只考虑了最大值与最小值,容易受个别极端值的影响,且不能反应组内其它变量值的变异情况。

(2)受样本含量影响,不稳定(一般样本含量越大越有机会观察到偏小或偏大的数据)。

(-)四分位数间距

1.定义:Q=/-0

2.应用范围:适用于任何分布类型的资料,主要利中位数一起描述偏态分布资料。

3.优缺点

优点:要比极差稳定

缺点:仍未考虑到全部观察值的变异程度

(三)方差

0r■华田总|防差票.芝&本方差

NM-1

公式的由来

(四)标准差

.J工(A蜡

由于方差的单位是原单位的平方,因此为了应用方便,对方差进行开方得到1"-I,该公式

就是样本的标准差。

标准差的简化公式

方差和标准差主要应用于正态分布

(五)变异系数

1.应用条件:反映资料的相对变异程度。常用于比较度量衡单位不同或均数相差悬殊的两组(或多组)

资料的变异度。

cr=-Kitm

2.公式:x

例比较单位不同的几组资料的离散程度

某年某市城区120名5岁女孩身高均数为110.15cm,标准差为5.86cm,体重均数为17.71kg,标准差

为1.44kg,比较其离散程度。

步高CT--IOOK-5.32%

UOLIS

144

体重CK—二一XL00K-&13%

17.71

例比较均数相差悬殊的几组资料的离散程度

某年某市城区120名5岁女孩体重均数为17.71kg,标准差为1.44kg,同年该地120名5个月女孩体

重均数为7.37kg,标准差为0.77kg,比较其离散程度。

xi(n%-&i3K

IT71

4月妞itttcr■要x10侬■10L48%

737

«<NH»

【例题】正态分布资料宜用()来描述其集中趋势

A.算术平均数

B.标准差

C.几何均数

D.变异系数

E.四分位数间距

「正确答案』A

【例题】变异系数越大说明

A.标准差越大

B.标准差越小

C.均数越大

D.均数越小

E.以均数为准变异程度大

『正确答案』E

【例题】数列8,-3,5,0,1,4,-1的中位数是

A.2

B.0

C.2.5

D.0.5

E.1

r正确答案』E

【例题】原始数据呈倍数关系的资料,宜用()描述其分布的集中趋势

A.算数均数

B.几何均数

C.极差

D.中位数

E.百分位数

「正确答案』B

【例题】离散程度指标中,最容易受极端值影响的是

A.极差

B.标准差

C.变异系数

I).方差

E.四分位数间距

[正确答案』A

正态分布

正态分布是医学和生物学中最常见,也是最重要的•种连续性分布,如正常人的身高,体重,红细胞

数,血红蛋白等。我们可以从频数表和频数图对正态分布进行研究。

120名正常成年男子红细胞计数的频数表(X107D

组段频数频率(%)累计频数累计频率(%)

(1)(2)(3)(4)(5)

3.20〜21.721.7

3.50〜54.275.9

3.80〜108.31714.2

4.10-1915.83630.0

4.40〜2319.25949.2

4.70〜2420.08369.2

5.00-2117.510486.7

5.30〜119.211595.9

5.60〜43.311999.2

5.90-6.2010.8120100.0

合计120100.0——

频数分布以均数为中心,向两侧逐渐减少,并且基本对称

长方形的面积等于频率

0.T

&8

as

利用正态分布曲线特点来描述正态分布的特征

(­)正态分布的概念和特征

1.概念

如果随机变量x的分布服从概率密度函数则称x服从正

态分布,记作*~M3•0,U为X的总体均数,。为总体标准差。

2.正态分布的特征

(1)在直角坐标的横轴上方呈钟形曲线,两端与x轴永不相交,且以x=u为对称轴,左右完全对称。

fkA=­

(2)在x=u处,f(x)取最大值,其值为叮*/并且*越远离u,f(x值越小。

(3)正态分布有两个参数:一个为位置参数u,一个为形态参数。。

3.正态分布曲线下的面积分布规律

3-G/+G-»68.27%

口-1&5《"+1仪劝

(^-I96o;/f+I96a)->95«

@-2.谢/+2580)->99%

-2.680-1,990-4|i。1・90。2・58。-2.68-l,»-1Q1L9S2.S8

3+L96O;#+258<7)F?

(-)标准正态分布

正态分布是一个分布组族,对应于不同的参数口和。会产生不同位置、不同形状的正态分布,为了应

用方便,我们将正态分布转化成标准正态分布。

“=--

'懈场域14~阳0.1)

由于我们实际面对的大多是正态分布,因此可采用如下的方法求其曲线下面积:

*x——姑声—

正态分布的应用

例:调查某单位101名正常成年女子的血清总胆固醉,得其均数£=406E»«Z,

标准差s=0.654«MW//£O试估计该单位正常女子血清总胆固醇在4.00mmol/L以下者及5.OOmmol/L

以下者各占正常女子总人数的百分比。

K-/XX-X

CTS

X4.00-4.06…

—=--------------=-0.09

0.654

工00-4.06—

Uj——-------------------------------=1.44

0.654

【例题】下列关于正态分布描述错误的是

A.是医学和生物学中常见的一种连续型分布

B.正态分布曲线的对称轴是尸〃这条直线

C.正态分布曲线有两个参数,〃为形态参数,”为位置参数

D.正态分布曲线是一簇曲线

E.正态分布曲线下的总面积为1

『正确答案』C

【例题】在正态曲线下,区间S+L%5-+2586所包含的面积为

A.1%

B.1.5%

C.97%

I).2%

E.95%

「正确答案』D

【例题】下列关于标准正态分布的说法中错误的是

A.标准正态分布曲线下总面积为1

B.标准正态分布是总体均数为0,总体标准差为1的正态分布

C.标准正态分布的曲线是一簇曲线

D.标准正态分布是对称分布

E.不同的正态分布都可以通过变换转化为标准正态分布

『正确答案』C

四、定量资料的统计推断-总体均数的估计和假设检验

计量资料

总体均数的参数估计:

一%

m总触诗

假设检验:

(四)假设检验的原理和步骤

(五)t检验

(-)均数的抽样误差和标准误(衡量抽样误差大小的指标)

例若某市1999年18岁男生身高服从均数〃、标准差”的正态分布。从该正态分布"(167.7,5.32)

总体中随机抽样,共抽了100次,每次样本含量e=10人,得到每个样本均数及标准差如下图

1999年某市18岁男生身高167.7,5.32)的抽样示意

X〜-X~N50;)

其中为了与反映观察值离散程度的标准差b相区别,统计学中把样本均数的标准差/称为样本均数的

标准误,简称为标准误(standarderror)o

标准误是描述均数的抽样误差大小的统计指标。

拍桧谶塞<------>标僧微

£T八£

可证明均数标准误的计算公式为

b3

/二忑”忑

公式估计*就*公式

与样本含2¥方《皿眦.

均数标准误的用途

1.可用来衡量样本均数的可靠性

标准误一抽样误差一均数间的差异(样本和总体)一样本均数估计总体均数

小小小可靠

2.与样本均数结合,可用于估计总体均数的置信区间

3.可用于进行均数的假设检验

(二)t分布

1.£分布的概念

正态分布

实际工作中,由于胃未知,用4代替,这样U不再服从标准正态分布,而服从t分布,即

X旦岸包

1={"=.,%」="—1y为自由度(degreeoffreedon)

S.Sfwt

统计量力的分布称为t分布。力分布与自由度有关,不同的自由度对应着不同的t分布曲线。

2.f分布的图形与特征

力分布的图形:6分布是一簇曲线,自由度不同,曲线的形状不同,力分布的图形与自由度有关。当v

,t分布趋近于标准正态分布,但当自由度较小时,t分布与标准正态分布的差异较大。其图形如下图

不日自由度下的粉布图

t分布特征:

(1)单峰分布,以0为中心,左右对称

(2)自由度v越小,峰部越矮,而尾翘得越高

(3)当v-8,“,分布逼近u分布(标准正态分布),将标准正态分布看做t分布的特例。

不同自由度下的吩布图

力界值表简介:

横标目为自由度,纵标目为概率月表中数字表示自由度为认―为a(单侧或双侧概率)时,力的界值,

单侧常记为Q,双侧常记为《儿。

由于t分布是以o为中心的对称分布,表中只列出正值,查表示不管t正负都用绝对值。

概率

自由度单尾0.250.10.050.0250.010.0050.00250.0010.0005

双尾0.50.20.10.050.020.010.0050.0020.001

11.0003.0786.31412.70631.82163.657127.321318.309636.619

20.8161.8862.9204.3036.9659.92514.08922.32731.599

30.7651.6382.3533.1824.5415.8417.45310.21512.924

40.7411.5332.1322.7763.7474.6045.5987.1738.610

50.7271.4762.0152.5713.3654.0324.7735.8936.869

60.7181.4401.9432.4473.1433.7074.3175.2085.959

70.7111.4151.8952.3652.9983.4994.0294.7855.408

80.7061.3971.8602.3062.8963.3553.8334.5015.041

90.7031.3831.8332.2622.8213.2503.6904.2974.781

概率

自由度单尾0.250.10.050.0250.010.0050.00250.0010.0005

双尾0.50.20.10.050.020.010.0050.0020.001

100.7001.3721.8122.2282.7643.1693.5814.1444.587

110.6971.3631.7962.2012.7183.1063.4974.0254.437

120.6951.3561.7822.1792.6813.0553.4283.9304.318

130.6941.3501.7712.1602.6503.0123.3723.8524.221

1466921.3451.7612.1452.6242.9773.3263.7874.140

150.6911.3411.7532.1312.6022.9473.2863.7334.073

160.6901.3371.7462.1202.5832.9213.2523.6864.015

17).689.3331.7402.1102.5672.8983.2223.6463.965

概率

自由度单尾0.250.10.050.0250.010.0050.00250.0010.0005

双尾0.50.20.10.050.020.010.0050.0020.001

180.6881.3301.7342.1012.5522.8783.1973.6103.922

190.6881.3281.7292.0932.5392.8613.1743.5793.883

200.6871.3251.7252.0862.5282.8453.1533.5523.850

210.6861.3231.7212.0802.5182.8313.1353.5273.819

220.6861.3211.7172.0742.5082.8193.1193.5053.792

230.6851.3191.7142.0692.5002.8073.1043.4853.768

240.6851.3181.7112.0642.4922.7973.0913.4673.745

250.6841.3161.7082.0602.4852.7873.0783.4503.725

概率

自由度单尾0.250.10.050.0250.010.0050.00250.0010.0005

双尾0.50.20.10.050.020.010.0050.0020.001

260.6841.3151.7062.0562.4792.7793.0673.4353.707

270.6841.3141.7032.0522.4732.7713.0573.4213.690

280.6831.3131.7012.0482.4672.7633.0473.4083.674

290.6831.3111.6992.0452.4622.7563.0383.3963.659

300.6831.3101.6972.0422.4572.7503.0303.3853.646

310.6821.3091.6962.0402.4532.7443.0223.3753.633

320.6821.3091.6942.0372.4492.7383.0153.3653.622

概率

自由度单尾0.250.10.050.0250.010.0050.00250.0010.0005

双尾0.50.20.10.050.020.010.0050.0020.001

330.6821.3081.6922.0352.4452.7333.0083.3563.611

340.6821.3071.6912.0322.4412.7283.0023.3483.601

350.6821.3061.6902.0302.4382.7242.9963.3403.591

360.6811.3061.6882.0282.4342.7192.9903.3333.582

370.6811.3051.6872.0262.4312.7152.9853.3263.574

380.6811.3041.6862.0242.4292.7122.9803.3193.566

390.6811.3041.6852.0232.4262.7082.9763.3133.558

400.6811.3031.6842.0212.4232.7042.9713.3073.551

500.6791.2991.6762.0092.4032.6782.9373.2613.496

600.6791.2961.6712.0002.3902.6602.9153.2323.460

曝率

自由度单尾).250.10.050.0250.010.0050.0025C).0010.0005

双尾).50.20.10.050.020.010.005C).0020.001

700.6781.2941.6671.9942.3812.6482.8993.2113.435

800.6781.2921.6641.9902.3742.6392.8873.1953.416

900.6771.2911.6621.9872.3682.6322.8783.1833.402

1000.6771.2901.6601.9842.3642.6262.8713.1743.390

5000.6751.2831.6481.9652.3342.5862.8203.1073.310

10000.6751.2821.6461.9622.3302.5812.8133.0983.300

oo0.67451.28161.64491.962.32632.57582.8073.09023.2905

ADJQSJB=L6S6

^aOS/2.38=2.024

阴影以外面积(概率)双侧,一般表达式为:

式Tg<tO5J=\-a

FC-2024<t<2024)=0.95

(三)总体均数的置信区间估计

京T"

'-■m*C

参数估计:用样本指标(统计量)去估计总体指标(参数)

参数估计有两种方法:点值估计和区间估计。

(1)点值估计(pointestimation):直接用样本统计量去估计总体参数。

总体均数的点值估计就是直接用样本均数去估计总体均数(就是把样本均数看作是总体均数)。

缺点:没有考虑到抽样误差

(2)区间估计(intervalestimation):结合样本统计量和标准误可以确定一个具有较大概率(可

信度)的包含总体参数的区间,该区间称为总体参数的1-。可信区间。

预先给定的概率称为可信度用1-。表示,常用的可信度为95%或99虬如没有特别说明,一般取双侧

95%o

区间估计的计算方法(根据资料的条件选用不同的方法):

(1)总体标准差。未知,且样本含量较少时(〃<50)。一般按照力分布的原理用下式作区间估计

总体均数的1-a置信区间为(京

例随机抽查某地30名20岁青年男性,测得其心率均数为73次/分,标准差为7次/分,试估计该地

20岁青年男性心率总体均数的95%置信区间?

加.*=30j=--1=30-1=29,a=0.0涵

=20451fs^.£+401111f

77

(73-2.045百.73+2045京)=(7047工0

估计该人群用此批号结核菌素,该地20岁青年男性心率总体均数的95%置信区间为(70.4,75.6)次/

分。

(2)。未知,但样本例数〃足够大,按正态分布原理。

总体均数的95%可信区间分别为:

(3-

和”.相当于s>・诙四|1K同

双3=1.96=双眈阖》

HLa1141m;HHt3

双儡%iin=258

wr9。枷,眄("j

例随机抽取某地200名40岁以上正常成人,测定其空腹血糖值,求得x=4.91mmol/L,S=0.72mmol/L,

试估计该地40岁以上正常成人空腹血糖值的总体均数的95%置信区间。

本例,x=20Qt=49L8=0.72.a=Q05,由于〃较大,且总体标准差。未知,因此选用公式

a5其中~,代入数据可得:

(491-1.9632r.491+1.96=r〉=(4.8L5.01)

J200y200

可信区间的确切含义(95%)-(套圈游戏)

意味着从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的

可信区间。在这100个可信区间中,有95个可信区间包含了总体均数,另外5个没有包含总体均数。但在

实际工作中,我们只抽一次样,获得一个样本,也就算得一个可信区间,如由一个样本算得的某地成年男

子红细胞均数的95%可信区间为5.31~5.45x10°/£根据小概率事件不太可能在一次试验中发生的原理,

我们就认为该区间包含了总体均数,但是该结论会冒5%犯错误风险。

可信区间的两个要素

准确度:反映在可信度上,可信度越大,准确度越高。

精密度:精密度反映在可信区间的宽度上,宽度越小,精密度越高。

在样本含量固定的情况下,增加可信度(1—a),a变小,t变大,可信区间变大——不能同时增加

准确度和精密度。

但是在可信度(1—a)固定的情况下,增加样本含量,可缩小可信区间,提高精密度。

(四)假设检验

例据大量调查得知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男

子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?

题意分析见下图:

Afi估计

"耒知——酢为叫估计他

«■t----♦«川•-------'

假设检验的基本思想:

先提出假设,然后在某假设成立的前提下看实际抽到的样本是否属于小概率事件,若属于小概率事件,

则拒绝该假设,若不属于小概率事件,则不拒绝该假设。

如何提出假设?可根据了二口।的两种可能性(互相对立的):

第一个假设:设"=外(只是由于抽样误差使得用),我们把〃=外这个假设称为检验假设或无

效假设,"•用(hypothese)表示。具体表示方法为"一吗

第二个假设:设/W%(不只是由于抽样误差使得外,主要原因是两者本来就不同),我们把

为这个假设称为备择假设,用片表示。

具体表示方法为名”外

假设检验的基本步骤:

1.(选择检验方法)建立假设,确定检验水准。

选择检验方法:根据资料的类型和分析目的选择适当的检验方法

iEMRtt%;,=%

SMRft牍*外

检验水准a=0.05(单侧或双侧)

2.计算统计量-决定第3步的产值

由选定的检验方法根据样本数据计算相应的统计量。

3.确定P值,做出统计推断

通过第2步计算的统计量获得。

(五)f检验

力检验的应用条件:资料类型一计量资料;比较的指标一均数。样本含量较小(比如n<50),样本来

自正态总体,在做两个样本均数比较时,还要求两样本相应的总体方差相等(小样本、正态性和方差齐)。

)样本均数与总体均数的比较

二)配对t检验

三)两个独立样本均数的比较

-)单样本t检验(未知总体与已知总体)

例据大量调查得知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年

男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?

题意分析见下图:

检验方法的选择:

1.资料类型:脉搏-计量资料

2.比较的指标:均数

3.脉搏服从正态分布

4.未知总体与已知总体比

假设检验

1.建立假设,确定检验水准。

检验水准a=0.Q5(单侧)

2.计算统计量

74.2-72.0

=1.692ittOngdA

6.5/岳

v=M-1=25—1=24

3.确定尸值,做出统计推断

见下图:

按。=0.05水准,不拒绝/%,差异无统计学意义,尚不能认为该山区健康成年男子的脉搏均数高于一般

健康成年男子的脉搏均数。

二)配对t检验

配对t检验适用于配对设计的计量资料(数值变量资料)。

①配对的两个受试对象分别接受两种处理之后的数据;

②同一样品用两种方法(或仪器等)检验的结果;

③同一受试对象两个部位的数据。

配对t检验要求差值服从正态分布,其目的是推断两种处理(或方法)的结果是否有差别。

例对24名儿童接种卡介苗,按同年龄、同性别配成12对,每对中的2名儿童分别接种两种结核菌素,

一种为标准品,另一种为新制品,分别注射在儿童的前臂,72小时后记录两种结核菌素的皮肤反应平均直

径,见下表,问儿童皮肤对两种不同结核菌素的反应性是否有差别?

123456789101112

对子号

AB;ABABABABABABABABABABAB

随机数字92641075031112

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论