总体均数的估计和假设检验_第1页
总体均数的估计和假设检验_第2页
总体均数的估计和假设检验_第3页
总体均数的估计和假设检验_第4页
总体均数的估计和假设检验_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于总体均数的估计和假设检验一.均数的抽样误差和标准误2.表示方法:标准误Standarderror1.抽样误差(Samplingerror)

由于抽样造成的样本均数与总体均数的差异、或样本均数之间的差异。抽样误差是不可避免的,但可以控制。

是说明样本均数抽样误差的大小的指标,反映了样本均数间的离散程度。也反映了样本均数与总体均数的差异;第2页,共70页,2024年2月25日,星期天3.标准误的计算公式

σ

σχ=

σχ:总体标准误

√n

S

Sχ=

Sχ:样本标准误,

√n

为σχ的估计值

4.标准误的意义1)表示抽样误差的大小2)与均数结合表示样本均数对总体均数的代表性(x±Sx

)第3页,共70页,2024年2月25日,星期天设:x1,x2,x3,……服从正态分布N(μ,σ)则:服从标准正态分布N(0,1)x1–μσx2–μσ,,x3–μσ……若:x1,x2,x3,……服从正态分布N(μ,σx)x1–μσxx2–μσxx3–μσx,,……服从标准正态分布N(0,1)则:若:σx未知,用Sx代替x1–μSxx2–μSxx3–μSx,,……则:服从t分布第4页,共70页,2024年2月25日,星期天二.t-分布t-distribution1.t-

分布的概念

从正态总体N(μ,σ)中进行无数次样本含量为n的随机抽样,每次均可得到一个x和s,

x-μ通过t=

公式转换,可得无数个t值,

s/√nt值分布即为含量为n的t值的总体或称t分布。第5页,共70页,2024年2月25日,星期天

t-分布(t-distribution

)主要用于总体均数可信区间的估计和t-检验等。它最早由英国统计学家W.S.Gosset于1908年以“student”笔名发表,故又称studentt分布(student’st-distribution),t-检验又称为t-test或者student’stest。第6页,共70页,2024年2月25日,星期天

1)以0为中心,左右对称

2)t-分布曲线的形状与自由度有关

3)t-分布曲线下面积为1

t-分布曲线下面积分布可由t值表中查出

-4-3-2-10+1+2+3+4f(t)=(χ-μ)/σχ=∞(u-d)=5=1--自由度分别为1、5、∞的t-分布2.

t-

分布特征第7页,共70页,2024年2月25日,星期天

t-分布曲线下面积分布从t值表(P696)查出:

双侧P(t≤-tα/2,

)+P(t≥tα/2,

)=α 单侧P(t≤-tα·

)=α

或P(t≥tα·

)=α-t0+tα/2α/2第8页,共70页,2024年2月25日,星期天2.区间估计intervalestimation

三、总体均数的估计1.点估计pointestimation

用样本均数作为总体均数的估计值(1)可信区间的概念confidenceinterval,CI

按一定的概率(可信度,1-α)估计包含总体均数所在范围,亦称总体均数的可信区间第9页,共70页,2024年2月25日,星期天1)当σ未知时(2)总体均数可信区间的计算:

P(-tα/2·

<t<tα/2·

)=1-α

χ-μP(-tα/2·

<<tα/2·

)=1-α Sχ故总体均数:μ的(1-α)双侧可信区间为:

χ-tα/2·

Sχ<μ<χ+tα/2·

Sχχ±tα/2·

·Sχ或

χ±tα/2·

·S/√n第10页,共70页,2024年2月25日,星期天2)当σ未知但n足够大时3)当σ已知x-u/2

·σχ<μ<x+u/2

·σχ

x±u/2

·σχ

x±u/2

·σ/√n x-u/2·sχ<μ<x+u/2

·sχ

x±u/2

·sχ

x±u/2

·s/√n第11页,共70页,2024年2月25日,星期天总体均数95%可信区间

(95%confidenceinterval,95%CI)x±t0.05/2·

·Sχx±1.96

·sχx±u

0.05/2

·sχ,x±u

0.05/2

·σχx±t0.01/2·

·Sχx±2.58

·sχx±u

0.01/2

·sχ,x±u

0.01/2

·σχ总体均数99%可信区间

(99%confidenceinterval,99%CI)x±1.96

·σχx±2.58

·σχ第12页,共70页,2024年2月25日,星期天例1:某地随机抽取100名1岁婴儿测定其血红蛋白x=123.7g/L,S=11.9g/L,试估计该地1岁婴儿的血红蛋白的平均浓度。x±1.96

·sχ=x±1.96

·S/√n95%CI123.7±1.96×11.9/√100=123.7±1.96×1.19=(121.4,126.0)g/L99%CI123.7±2.58×11.9/√100=123.7±2.58×1.19=(120.6,126.8)g/L第13页,共70页,2024年2月25日,星期天例2:某地随机抽取25名1岁婴儿测定其血红蛋白x=123.7g/L,S=11.9g/L,试估计该地1岁婴儿的血红蛋白的平均浓度。x±tα/2·

·Sχ

=x±tα/2·

·S/√n95%CI99%CIt0.05/2,24=2.064t0.01/2,24=2.797123.7±2.064×11.9/√25=123.7±2.064×2.38=(118.8,128.6)g/L123.7±2.797×11.9/√25=123.7±2.797×2.38=(117.0,130.4)g/L第14页,共70页,2024年2月25日,星期天单侧可信区间:>x-t0.05·

·Sχ<x+t0.05·

·Sχ95%CI:>x-t0.01·

·Sχ<x+t0.01·

·Sχ99%CI:下侧:上侧:随机抽取10个午餐肉罐头测定其亚硝酸盐含量均数为17.6mg/kg,标准差为1.64mg/kg,估计该批午餐肉罐头平均含量的95%CI。例3:<x+t0.05·

·Sχt0.05·9=1.833=17.6+1.8331.64/10=18.55(mg/kg)下侧95%CI:第15页,共70页,2024年2月25日,星期天(3)可信区间的解释1)可信区间的涵义95%CI:从总体中随机抽取含量为n的样本100个,算得100个可信区间,平均有95个可信区间包含总体均数μ(可信度为95%)。2)可信区间的两个要素准确度accuracy:反映在可信度1-

的大小精密度precision:反映在区间的长度

第16页,共70页,2024年2月25日,星期天例4:某地调查正常成年男子144人的红细胞计数,得:x=5.38×1012/L,S=0.44×1012/L.(1)95%被调查者的红细胞计数是多少?x±1.96

·

s

=5.38±1.96×0.44=(4.52,6.24)×1012/L(2)该地95%正常成年男子的红细胞计数是多少?x±1.96

·sχ=5.38±1.96×0.44/√144=(5.34,5.42)×1012/L(3)该地有一成年男子的红细胞计数为6.2×1012/L,该结果是否正常?x±1.96

·

s临床参考值=4.52~6.24×1012/L第17页,共70页,2024年2月25日,星期天四.假设检验hypothesistest

先对总体的参数或分布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。1.假设检验的基本原理第18页,共70页,2024年2月25日,星期天﹡假设检验的基本原理

抽样误差所致P>0.05

(来自同一总体)

?

假设检验回答环境条件影响P<0.05

(来自不同总体)两均数两率不等第19页,共70页,2024年2月25日,星期天2.假设检验的基本步骤1)建立检验假设,确定检验水准H0(无效假设):假设两组资料的总体均数相等。表示为H0

:μ=μ0

,或μ1=μ2

H1(备择假设):μ

μ0

(双侧检验)或μ>μ0

(单侧检验)或μ<μ0

(检验水准):通常取

=0.05第20页,共70页,2024年2月25日,星期天样本均数(其总体均数为

)与未知总体均数

0的比较目的H0H1双侧检验是否≠0=0≠0单侧检验是否>0=0>0

是否<0=0<0两样本均数所代表的未知总体均数

1与2的比较目的H0H1双侧检验是否1≠2

1=2

1≠2单侧检验是否1>2

1=2

1>2

是否1<2

1=2

1<2第21页,共70页,2024年2月25日,星期天

根据资料类型及统计推断的目的选用合适的检验方法计算出统计量(t值、u值、

2值等)。

根据自由度,查不同统计量的界值表(t值表、

2值表等),确定现有统计量的概率P值

当:

t<t0.05(υ) P>0.05 t0.01(υ)>t≥t0.05(υ)0.01<P≤0.05t≥t0.01(υ)P≤0.012)选定检验方法和计算检验统计量3)确定P值,作出推断结论第22页,共70页,2024年2月25日,星期天

推断结论:

当 P>

按所取检验水准不拒绝H0 P

按所取检验水准拒绝H0第23页,共70页,2024年2月25日,星期天(一)t检验t-testorStudent’stest

五.t检验和u检验目的:推断样本所代表的未知总体均数μ与已知的总体均数μ0有无差别单样本t检验(样本均数与总体均数比较)

onesample/groupt-testμ0:理论值、标准值或经过大量观察所得的稳定值等第24页,共70页,2024年2月25日,星期天条件:理论上要求样本来自正态分布总体

x-μ0

公式:t=Sχ

x-μ0

=,

=n–

1S/√n第25页,共70页,2024年2月25日,星期天例:某医生在一山区随机抽查了25名成年健康男子的脉搏,得脉搏均数为74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分,能否据此认为该山区成年男子的脉搏均数与一般成年男子的脉搏均数不同?已知:一般健康成年男子脉搏

0=72次/分山区健康成年男子脉搏x=74.2次/分

S=6.0次/分

?推断:

是否等于

0第26页,共70页,2024年2月25日,星期天1.建立检验假设,确定检验水准H0:=0=72次/分H1:≠0=72次/分

=0.052.选定检验方法,计算检验统计量

x-μ0

t=Sχ

x-μ0

=S/√n

74.2–72=6/√25=1.833

=n–

1=25–1=243.确定P值,推断结论t0.05,24=2.064P>0.05P>

不拒绝H0山区健康成年男子脉搏均数与一般健康男子相同第27页,共70页,2024年2月25日,星期天目的:推断两种处理的效果有无差别或推断某种 处理有无作用(二)配对t检验paired/matchedt-test配对方法:两个同质受试对象接受两种不同的处理2.同一受试对象分两部分接受两种不同的处理3.同一受试对象处理前与处理后的结果条件:样本来自正态总体第28页,共70页,2024年2月25日,星期天

d–0 d t= =

=n-1SdSd/√n

∑d2–(∑d)2/n Sd= n-1

公式:d:每对数据的差值d:差值的样本均数Sd

:差值的标准差Sd:差值均数的标准误n:对子数第29页,共70页,2024年2月25日,星期天例1:

为研究女性服用某避孕新药后是否影响其血清总胆固醇含量,将20名女性按年龄配成10对。每对中随机抽取1人服用新药,另一人服用安慰剂。经过一定时间后测定血清总胆固醇含量(mmol/L)得下表结果。问该新药是否影响女性血清总胆固醇含量?第30页,共70页,2024年2月25日,星期天新药组与安慰剂组血清总胆固醇含量(mmol/L)配对号新药组安慰剂组差值dd2(1)(2)(3)(4)=(2)-(3)(5)=(4)214.46.2-1.83.2425.05.2-0.20.0435.85.50.30.0944.65.0-0.40.1654.94.40.50.2564.85.4-0.60.3676.05.01.01.0085.96.4-0.50.2594.35.8-1.52.25105.16.2-1.11.21∑---4.38.85第31页,共70页,2024年2月25日,星期天1.建立检验假设,确定检验水准H0:

d=0新药对女性血清总胆固醇含量无影响H1:

d≠0新药对女性血清总胆固醇含量有影响

=0.052.计算检验统计量d=-0.43,∑d=-4.3,∑d2=8.85,n=10

∑d2–(∑d)2/n Sd= n-1

8.85–(-4.3)2/10 = 10-1

=0.882第32页,共70页,2024年2月25日,星期天

d–0 d t= = SdSd/√n

-0.43 ==-1.542 0.882

/√10

=n–1=10–1=93.确定P值,推断结论0.20>P>0.10P>

不拒绝H0新药对女性血清总胆固醇含量无影响(H0:d=0)第33页,共70页,2024年2月25日,星期天例2:同时用A、B两种测声计对10个场地的噪声进行进行测定,结果如下表。两种测声计的测定结果是否相同?

A、B两种测声计的测定结果场地测声计A测声计B差值dd2187861126566-1137477-394959500565605256555324763621188883399615924105455-11∑--955第34页,共70页,2024年2月25日,星期天假设:H0:

d=0两种测声计的测定结果相同H1:

d≠0两种测声计的测定结果不同

=0.05∑d=9,∑d2=55,d=9/10=0.9n=10

∑d2–(∑d)2/n Sd= n-1

55–(9)2/10 = 10-1

=2.2828

d–0 d t= = =

SdSd/√n

0.92.2828/√10=1.247

=n–1=10-1=90.40>P>0.20两种测声计的测定结果相同第35页,共70页,2024年2月25日,星期天例3:

用克矽平雾化吸入治疗矽肺患者7人,治疗前后患者血清粘蛋白有无变化?

克矽平治疗前后的血清粘蛋白(㎎/L)患者号治疗前治疗后差值dd2(1)(2)(3)(4)=(2)-(3)(5)=(4)21653431961273363713693733736129643026416573433090065637193617735023529∑--1805432第36页,共70页,2024年2月25日,星期天假设:H0:

d=0治疗前后血清粘蛋白相同H1:

d≠0治疗前后血清粘蛋白不同

=0.05∑d=180,∑d2=5432,d=180/7=25.7n=7

∑d2–(∑d)2/n Sd= n-1

5432–(180)2/7

7-1

==11.6

d–0 d t= = =

SdSd/√n

25.711.6/√7=5.86

=n–1=7-1=60.002>P>0.001治疗前后血清粘蛋白不同,治疗后会降低第37页,共70页,2024年2月25日,星期天条件:两样本来自正态总体;两总体方差相等

S12(较大)F=S22(较小)3.两样本t检验two-sample/groupt-test目的:推断两样本均数分别代表的总体均数

μ1与μ2有无差别。方差齐性检验的方法:F检验

1=n1-1

2=n2-1第38页,共70页,2024年2月25日,星期天x1–x2Sx1–x2t==(n1-1)+(n2-1)=n1+

n2-2

Sx1-x2=

11n1n2Sc2(

+)

(n1-1)s12+(n2-1)s22

n1+n2-2Sc2=Sx1–x2:合并标准误Sc:合并标准差[∑x12–(∑x1)2/n1]+[∑x22–(∑x2)2/n2](n1-1)+(n2-1)Sc2=第39页,共70页,2024年2月25日,星期天例:

为研究肥胖与脂质代谢的关系,测定了肥胖儿童与正常儿童血中过氧化脂质(LPO),结果如下表。能否认为肥胖与脂质代谢有关?两组儿童血中LPO含量(mol/L)

分组nx±S肥胖组309.36±0.83正常组307.58±0.64第40页,共70页,2024年2月25日,星期天方差齐性检验H0:

12=22

,肥胖组与正常组LPO的总体方差相等

H1:

12≠22

,肥胖组与正常组LPO的总体方差不等

=0.10假设:

S12(较大)F=S22(较小)

0.832=0.642=1.682

1=n1-1

2=n2-1

1=30–1=29

2=30

–1=29F0.1(30,29)=1.85P>0.1肥胖组与正常组LPO的总体方差相等F值表(P698)查出:第41页,共70页,2024年2月25日,星期天两组LPO均数比较的t检验假设:H0:

1=2

两组儿童的LPO总体均数相等H1:

1≠2

两组儿童的LPO总体均数不等

=0.05

(n1-1)s12+(n2-1)s22

n1+n2-2Sc2==0.549√

Sx

-x2=

11n1n2Sc2(

+)

(30

-1)

0.832+(30

-1)

0.642

30+30

-2=

1130300.549×(

+)

√==0.191第42页,共70页,2024年2月25日,星期天x1–x2Sx1–x2t=

9.36–7.580.191==9.302=(n1-1)+(n2-1)

=

n1+

n2-2=30+30–2=58P<0.001两组儿童的LPO总体均数不等第43页,共70页,2024年2月25日,星期天

条件:两样本来自正态总体,总体方差不等时:

x1-x2

公式:

t’=

s12

s22

+n1n2sx12·t,1+sx22·t,2

t’

=

1=n1-1

sx12+sx22

2=n2-1

(二)近似t检验-t’检验

separatevarianceestimationt-test第44页,共70页,2024年2月25日,星期天例:由X线胸片上测得两组病人肺门横径右侧距R1值(cm)结果如下表。比较两组的R1值是否不同?

两组病人的R1值(cm)

例数xS1.肺癌106.211.792.矽肺0期504.340.56方差齐性检验

S12(较大)F=S22(较小)假设:H0:

12

=2

2

H1:

12≠22

,=0.101.7920.562==10.217

1=n1–1=9

2=n2–1=49F0.10(9,50)=2.07P<0.10两组病人R1值的总体方差不同第45页,共70页,2024年2月25日,星期天t’检验1.假设:H0:

1=2

两组病人R1值总体均数相同H1:

1≠2两组病人R1值总体均数不同

=0.05S12S22

+n1n2t’=√X1-X2

1.7920.562

+1050=√6.21

–4.34=3.2722.计算统计量t’值第46页,共70页,2024年2月25日,星期天sx12·t,1+sx22·t,2sx12+sx22

t’0.05=

1=n1–1=9,

2=n2–1=49

t0.05,9=2.262,t0.05,50=2.009t0.01,9=3.250,t0.01,50=2.6783.计算t界值的校正值t’界值1.792/10×2.262+0.562/50×

2.009

1.792/10+0.562/50

=t’0.05=2.2571.792/10×3.250+0.562/50×

2.678

1.792/10+0.562/50

=t’0.01=3.239t’=3.272,P<0.01两组病人R1值总体均数不同4.确定P值5.推断结论第47页,共70页,2024年2月25日,星期天(三)两样本几何均数比较的t检验条件:对数正态分布的资料例:24名甲型流感病毒血凝抑制抗体滴度的健康人随机分为两组,比较甲型流感病毒活疫苗不同免疫方法的效果(结果为滴度的倒数)

不同免疫方法的血凝抑制抗体滴度

X1:鼻腔喷雾组X2:气雾组

504040103035302560701015302025302570401035251530第48页,共70页,2024年2月25日,星期天计算:X㏒x1=1.5757S㏒x1=0.1814X㏒x2=1.3153S㏒x2=0.2323方差齐性检验S12(大)S22(小)F=0.232320.18142==1.640P>0.10H0:

12=22

两组滴度倒数总体方差对数相等

H1:

12≠22

两组滴度倒数总体方差对数不等

=0.10假设:两组总体方差对数相等第49页,共70页,2024年2月25日,星期天t检验H0:㏒G1=㏒G2两组滴度倒数总体均数对数相等H1:㏒G1≠㏒G2两组滴度倒数总体均数对数不等

=0.05假设:(n1-1)s12+(n2-1)s22

n1+n2-2√11(+)n1n2X1-X2t=11×(0.18142+0.23232)

12+12

-2√

11(+)12121.5757–1.3153

==3.0610.01>P>0.005两组滴度倒数总体均数对数不等第50页,共70页,2024年2月25日,星期天

条件:当n较大(n>50)时;或n虽小,但总体标准差

已知时1.单样本u检验onesampleu-test

x-

0u=(n较大时)

s/nx-

0u=(0已知时)

0/n(四)u检验u-test公式:第51页,共70页,2024年2月25日,星期天

x1-x2 x1-x2 u= =Sχ1-χ2S12S22 + √n1n2——2.两样本的u检验twosampleu-test条件:两样本含量较大时(n1>50、n2>50)

P值的确定:当n较大时,可用

=∞查t值表公式:第52页,共70页,2024年2月25日,星期天

u<1.96P>0.05 2.58>u≥1.96 0.01<P≤0.05 u≥2.58P≤0.01 u<1.65P>0.05 2.33>u≥1.650.01<P≤0.05 u≥2.33P≤0.01常用单双侧u值(

=∞)

α 单侧 双侧

0.10 1.282 1.645

0.05

1.645

1.960 0.02 2.054 2.326

0.01

2.326

2.578双侧:单侧:P值的确定第53页,共70页,2024年2月25日,星期天例1:

随机抽取某大学学生208名进行心理健康调查(SCL-90量表),计算得因子总分均数为144.9,标准差为35.8。已知全国的均数为130.0,该大学学生的调查结果是否与全国水平相同?H0:=0=130该校的总分均数与全国相同H1:≠0=130该校的总分均数与全国不同

=0.05假设:

x-μ0

=Sχ

x-μ0u

=S/√n144.9-130.0=35.8/√208=5.999P<<0.001u0.001=3.29该校的总分均数与全国水平不同第54页,共70页,2024年2月25日,星期天例2:

某地对241名正常成年男子面部上颌间隙进行了测定,结果如下表。不同身高(cm)正常男性上颌间隙是否不同?

某地241名正常男性上颌间隙(cm)身高nxS161~1160.21890.2351172~1250.22820.2561第55页,共70页,2024年2月25日,星期天假设:H0:

1=2

不同身高正常男子上颌间隙相同H1:

1≠2不同身高正常男子上颌间隙不同

=0.05

x1-x2 x1-x2 u= =Sχ1-χ2S12S22 + √n1n2——0.2189–0.22800.235120.25612+116125√==-0.288u

0.50=0.6745P>0.50不同身高正常男子上颌间隙相同第56页,共70页,2024年2月25日,星期天(一)等效检验基本步骤

六.两均数的等效检验在等效检验中,规定μ1

μ2

,为正。当μ1-

μ2

时,两总体均数等效。当μ1-

μ2

时,两总体均数不等效。若X1

-X2

,则样本信息不支持等效假设,不必要进行两总体均数的等效检验。第57页,共70页,2024年2月25日,星期天1.给定等效界值

,建立检验假设,确定检验水准H0:μ1-

μ2

时,两总体均数不等效H1:μ1-

μ2

时,两总体均数等效

=0.052.选定检验方法,计算检验统计量3.确定P值,推断结论P

,拒绝H0,接受H1,有统计学意义。两总体均数等效第58页,共70页,2024年2月25日,星期天第59页,共70页,2024年2月25日,星期天1.值的选定在等效检验中非常重要,须在等效试验前予以确定。

血压值为0.67kPa(5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论