(七)ch4假设检验 数理统计_第1页
(七)ch4假设检验 数理统计_第2页
(七)ch4假设检验 数理统计_第3页
(七)ch4假设检验 数理统计_第4页
(七)ch4假设检验 数理统计_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章假设检验

主要内容:

1.假设检验的基本思想与步骤

2.单个总体均值、单个总体频率、*单个总体方差的假

设检验

3.两个总体均值、两个总体频率、两个总体方差的差

异显著性假设检验

4./检验(总体分布的假设检验,*同质性检验)

§4.1假设检验的基本思想与步骤

—.引例

例:工厂生产一种灯管,灯管的寿命。~N(〃,40000),

其中〃=1500(小时),现试用新工艺(假定灯管的平均

寿命不会降低)。

新工艺生产的25只灯管的寿命:芮,吃,…,马5,其平均值

为:x=1575(小时)。

需要区分两种情况:

(1)新工艺使”>1500,从而±>1500;

(2)新工艺下〃=1500,偶然的原因使土>1500.

原假设(或零假设):"。:〃=150,

备择假设(对立假设):匕:〃>150.

根据样本或样本统计量对原假设?做出接受或拒绝的判

断,叫做对统计假设X。作检验。

二.检验方法

设新工艺生产的灯管的寿命J~N(〃,4000叭

X,X2,…广25是J的沏.样本,若/真,即〃=1500,

则由乂,匕,・・・/25独立,与4同分布知

X,〜^(1500,40000),(1=1,2<..,25),

工日T7……40000、

于是,X~N(1500,^一),即”N(1500,4()2)

X-1500……、

--------------N(OJ).

40

由Uo.i=1.645(P242表3)得P{一,:。。>1.645}=0.05

即P{X>1565.8}=P{X>1500+1.645x40}=0.05(1)

J1500

类似的,由“0.02=2.326得P{~>2.326}=0.01,

艮[1P{X>1593.04}=P{X>1500+2.326x40}=0,01(2)

根据(1)式得检验H0的方法:

若上>1565.8,则拒绝"°;若TV1565.8,则接受“°。

拒绝域叱={(占,马,…户2£)|工>1565.8},简记无>1565.8.

根据(2)式得检验的方法:

若工>1593.04,则拒绝“°;若±41593.04,则接受申。

拒绝域%={(巧,/,…,吃5)I元>1593.04),简记

x>1593.04.

三.两类错误

拒绝真的"。(“弃真”)的错误称为第一类错误。允许犯

第一类错误的概率可以达到的数值叫做显著性水平(或信

度),记做a。

检验(1)cc=0.05检验(2)cc=0.01

接受不真的(“取伪”)的错误称为第二类错误。

一般的,/真时P{丫>C}=a,得水平为a的检验方法:

若工〉C,则拒绝a。;若工WC,则接受“°。

样本容量确定以后,犯两类错误的概率不可能同时减小。

U1假设检验的思想(小概率原理)

检验问题:原假设备择假设居

名真用不真

接受H。判断正确“取伪”:第二类错误

拒绝?“弃真”:第一类错误判断正确

检验方法:若样本落入拒绝域,则拒绝X。

?真时,P{样本落入拒绝域}=a(小概率)

五.假设检验的基本步骤

1.根据实际情况提出假设

2.确定检验用的统计量和拒绝域的形式;

3.选取适当的水平a(通常可取0.10,0.05,0.01等等),

确定拒绝域W;

4.根据样本观察值确定接受H。还是拒绝H。。

§4.2单个总体均值〃的假设检验

总体X的均值为〃,方差为。2。检验类型:

(D双侧检验“0:〃=〃0,"1:〃工〃0,

(n)右侧检验Ho:〃=〃0,Hi://〉外,

(H。<〃o,H[)

(in)左侧检验/:〃=〃0,H]:〃V〃o・

(H。:〃—〃0jH]:〃V〃0)

〃。是指定的值。

设巧户2,…"〃为X的iid.样本,即巧,芍,…户〃独立、与X

同分布。样本均值为不样本方差为§2。

--大样本方法(样本容量〃之50)

n>50,由中心极限定理有

2七一”近似一工一〃近似

i=i

〜N(0,l)或一—7=〜N(0,1)

7nb2(Jytn

对于三种检验类型,当"。真时,〃=〃。。

Y-//近似近似rr2

一誓~N(0,l)或土〜N(〃。,一)

ay/nn

1.b?已知的情形

G)对于检验问题(I),当Ho真时,〃工取值与〃0

相差很多的可能性比较小。拒绝域的形式:

w={("”…户〃)||无一〃0>c},

给定显著性水平由于用臭时,

y-H近似

(*)V=^pr〜N(0,l),有P{\U\>u}=a,

ay/na

所以,|U|>%时,拒绝Ho;I。区%时,接受“o.

(2)对于检验问题(n),当“°真时,工的取值比〃。大

很多的可能性比较小。拒绝域的形式:工-〃o>C

H。真时,P{V>u2a}=P{^^>u2a}=a,

••ay/n

所以,U>%时,拒绝H0;时,接受"o・

注:检验?:"K4,"1:〃>〃o可以归结为检验

Hq:〃=“),〃1:〃>〃o的原因:

X-//近似

一〜N(o,l)

a7n

给定显著性水平a,对于任何〃<〃o,

产一X-Ll+U—U(]

P{->%}=P{f—『°}>的"

07na7n

ft

=pj*>u2a+>%。}=a,

(j7na/yjnb7n

取。=4华,则U>的a时,拒绝“0・

b7n

(3)对于检验问题(III),当“°禀时,工的取值比〃。小

很多的可能性比较小。拒绝域的形式:工-〃0<C

“0真时,P[u<-u2a}=P{^rr^<-u2a}=a

・・ayjn

所以,UV-〃2a时,拒绝H。;UN-〃2a时,接受“。.

注:检验吗:〃N4。,H1:ju<〃o可以归结为检验

r—//近似

=的原因:一g~N(O,l)

a7n

给定显著性水平a,对于任何〃

a工一〃o1a工一〃+〃一人】

P/<3=?{"F}

=P^~rr<-u2a+^7^}<P(上:<i2a}=a,

b7na/yinayIn

取(/=£:半,则U<—4a时,拒绝H0。

ayin

双侧检验(I)的拒绝域:F5工

右侧检验(II)的拒绝域:U>u2a

左侧检验(III)的拒绝域:U<-u2a------------------

2./未知的情形

用s代替(*)中的b得。=与留,仍然有

S/y/n

检验问题(I)的拒绝域:|U>〃a;

检验问题(II)的拒绝域:U>%a;

检验问题(III)的拒绝域:U<-ulao

例1:从某林地的全部林木组成的总体抽取了〃=60株林

木组成的样本。样本的树高观测数据由P79例3.1给出,

试以显著水平a=0.05检验该林地总体林木平均高〃是否

为22米。

解:“o:〃=22,

〃=60大样本,,未知。

〃()=22,x=22,1533,s=2.5197,n=60,

〃了一〃022.1533-22

所以,=0.47,

一s/4n-2.5197/^60

Ua=〃0.05=L96,

\U\<ua,所以,接受a。,认为林木平均图〃是22米。

练习:某厂生产一种电阻元件,平均电阻为2.64欧姆。

采用新工艺后,测得100个元件平均电阻为2.62欧姆,

标准差=0.06欧姆。试以显著水平a=0.01,检验是否有

(1)新工艺使平均电阻〃明显增大

(2)新工艺使平均电阻〃明显减小。

二,小样本方法:总体X~N(//Q2)

巧,%2,…,乙为X的iid.样本,即巧,/,…,/独立、与X同

2

分布,有&,.=〃,D(XZ)=<T,i=l,2,…”

殓=〃,D(x)=—o对于三种检验类型,当?真时,

n

2—

〃=〃°,有工〜N(〃0,J)或U=^^~N(0,l)

nb7n

1./已知时,与前面的讨论相似,有

检验问题(D的拒绝域:|U|>%;

检验问题(II)的拒绝域:U>u2a;

检验问题(III)的拒绝域:U<-u2ao

2.未知时,

(1)对于检验问题(I),当“0真时,〃土取值与〃0

相差很多的可能性比较小。拒绝域的形式:I工-4me

给定显著性水平a,由于修真时,

T二£^“〃一)(ch2定理3)

s7n

有尸所以,

|7乜5-1)时,拒绝H。;卬区[5-1)时接受4.

(2)类似的,对检验问题(口),

时,拒绝H。;丁V&5-1)时接受4・

对检验问题(III),

TVT2a5T)时,拒绝%;TNT2a5-1)时接受

例3:元件寿命(单位:小时)X〜Ng,),测得16只

寿命如下:159,280,101,212,224,379,179,264,

222,362,168,250,149,260,485,170。问是否可以

认为元件平均寿命大于225(小时)(a=0.05)

解:“O:〃4225,Hx://>225

〃。=225,x=241.5,5=98.7259,n=16,

1(1)=%』(15)=1・753

6X-〃o241.5-225

=0.6685,

-s/4n-98.7259/716

<t2a(n-l),接受“0,认为元件平均寿命不大于225

小时。

例4(P104例4.2)设某种杨树树高近似正态分布,今测

得20株树的平均高为%=15m,标准差为s=2.4m。试

以显著水平a=0.05检验树高总体均值〃是否为17m。

解:“o:〃=17,

属于小样本,正态总体,〃未知的情形。

s/yjn2.4/V20

%(〃-1)=£。05(19)=2.093,

因为|7|=3.727>ta(n-l)=2.093,

所以,拒绝H。,认为树高总体的均值不是17m。

关于概率p值:

上例中,若取显著水平a=0・01,则

勿5—1)=z001(19)=2.861,|T|=3.727>ta(n-l)=2.861

所以,在水平a=0.01下做检验,仍拒绝8°,认为树高总

体均值不是17m;

若取显著水平。=0.001,则

1)=%a。](19)=3.883,\T\=3.727<ta(n-l)=3.883

所以,在水平a=0.001下做检验,应接受H。,认为树高

总体均值是17mo

使口(19)=3.727的a值叫做相应于3.727的概率p目

若0<a<p,则接受“0;若a>p,则拒绝口)。

a=0.001a=pa=0.01a=0.05

_______Q_____________Q_________A_________•.

/ex(19)=3.8833.7272.8612.093

由ZO1(19)=2.861,ro.ooi(19)=3.883,

士仔、+

应用R内rh插法:3-.-8-8-3----3-.7-2-7=--0-.0-0-1----p—,

3.883-2.8610.001-0.01

解得:p=0.0024,即ho。2’(19)=3.727,

所以,若0vav0.0024,则接受名;

若a>0.0024,则拒绝为。

/*注:Excel:插入T函数八一类别:统计T选择函数:

TDISTTX:3.727;Deg_freedom:19;Tails:2(双侧)

T输出0.00142901*/

a<pa=pa>p

接受”)

§4.3单个总体频率W的假设检验

检验类型:

⑴双侧检验"o:W=Wo,”I:WHWO,

(II)右侧检验H0:W=W0,

(HI)左侧检验H.:W=W.,Hr:W<W.,

其中0<Wo<1是指定的值。

只讨论大样本方法(〃之50)

(o1、

总体X有分布:,W未知,为户2,…芭,为X

[1-WW)12

的iid.样本,则口户2,…/独立、与X同分布。

由中心极限定理有,样本中具有某特点的单元数

〃近似

m=^x,-B(n,W)〜N(nW,nW(l-W))

<=i〃充分大

m-nW近似

所以,~N(O,1)

对三种检验类型,当/真时,w=w(”

近似

人w-W.

U〜N(O,1),

VW0(l-W0)/n

其中,卬=型是样本频率。

n

于是,“°真时,w比叽大很多或比W。小很多的可能性比

较小。

给定显著水平a,查表3(P242)有

P{\U\>ua}=a]P{U>u2a}=a;P{U<-ula]=a.

所以假设检验拒绝域为:

检验类型拒绝域

(I)

\U\>ua

(II)U>u2a

(III)UV—〃2a

例:(P108例4.9)设造林成活率不低于80%认为达标。

用重复抽样方式对3个队的造林各调查400株,结果为:

第一队成活300株,第二队成活307株,第三队成活336

株。试以显著水平a=0.05检验各队造林成活率是否达

标。

解:记造林成活率为W,则检验问题为:

Ho:WNW°=O.8O(合格),兄:亚〈小=0.80(不合格),

归结为检验:"oW=Wo=0.80,HY:W<WO=O.8O,

叫一

检验统计量为,i=1,2,3

甘+「300/400-0.8―厂

其中,q=-------=—2.5,

1、0.8x0.2/400

307/400-018

。2==-1.625,

VOx0.2/400

336/400-0,8

=2,

70.8x0.2/400

CC--0.05,〃2a="o10=,

U]=-2.5<一〃2a拒绝"o;3=-1.625>一〃2a接受“0;

=2>-u2a=-1.645接受H..

认为第一队未达标,第二、三队达标。

/*考研同学请自学:

单个正态总体X~N(〃,0*2)方差的假设检验

(I):cr2=.

22

(Il)H():a<,Hl:a>a1

CT2O2

(III)HO:>CT,Hx:a<a^

检验的统计量:I"r

5)

检验的拒绝域:

/、(n-l)y22—-l)s?2

⑴-^<力;为/2(〃—1)或^>Z^Z2(^-1)

db。

(7Z-1)522

(ID^>^(n-l)

(ni)”半匕L(I)*/

b。

§4.4两总体均值与频率的差异显著性检验

一'两总体均值的差异显著性检验

设总体X1和X]的均值分别为//.和〃2,方差都是M.

检验问题:

(I)双侧检验&:从=〃2,"1:41工〃2,

(II)右侧检验H[}:〃1=〃2(H0:从<〃2),“1:>〃2,

(III)左侧检验“°:从(4:从之〃2),

(一)大样本方法(样本容量/,%之50)

X

设X]的iid.样本与1户12,…#1〃与2的iid.样本

“21户22,…户2%独立;样本均值分别为%,元2,样本方差分

别为S;应。

由中心极限定理知,FX-a11~近似N(0,l),

*%

2

]R近似a

其中,x=—yx,于是,片~一),

x%普lf%

近似"2

同理,工2~N(4〃一),

-%

1〃2

其中,x2=一yx2fo而工i与我独立,所以,

n2M

近似11

片一工2〜N(〃]—〃2,(—1—K)

nxn2

对三种类型的检验问题,当H。真时有四=〃2,

近似]]

工一工2〜N(0,(一+一)/),

于是,

可见,用真时,对类型⑴,|U|很大的可能性比较小;

对类型(ID,U很大的可能性比较小;

对类型(HI),U很小的可能性比较小。

(1)〃已知时,对给定的显著水平。有

P[\U\>ua}=a;P{U>w2a}=a;P[U<-u2a}=a.

所以检验拒绝域:

(I)=|U|>%;(H):U>〃2a;(HI):U<-U2a.

(2)/未知时,有

阴_(%―1)S;+(%―1月

n}+%-2

是"的无偏估计。这是因为:

E&2=E{(%T)S;}+E{("2-1应}

〃]+〃2-2〃]+〃2—2

♦,£($)+£⑷)

%+%-2zi|+n2-2

——―--a2+———--a2=a2.

%+%―2%+%—2

即,是"的无偏估计,用,代替(*)中的有?真

时,

近似

—“2

U=〜N(0,1)

〃[N50

+〃2250

名+%一2%n2

对给定的显著水平a有,检验拒绝域:

(I):\U>ua;(II):U>u2ai(III):U<-u2a

例1:(P112例4.11)在杉树两个不同部位采集球果,观

测球果的长度(设两个部位球果长度方差相同),所得数

据整理得:

部位球果数样本均值(cm)样本标准差(cm)

东南部%=317无1=7.641=1.09

西北部n2=269x2=7.87s2=1.09

试以显著性水平。=0.05检验

(1)两个部位球果长度有无显著差异;

(2)东南部球果长度是否明显低于西北部。

解:设两个部位球果平均长度分别为小和〃2。

(1)HQ:,H]:工〃25

大样本,方差b?未知,

七一”2

U三

(々―1)9;+(4-l)S;

%%-2\nxn2

7.64-7,87

==-2.541,

316xl.092+268xl.0921

V317+269-2)317+269

%=〃O.O5=L96,|U|>%

故拒绝认为两个部位球果长度差异显著。

(2)H。•=〃2,H1*RiV〃2

%。=〃o.io=L645,U<-u2a,

所以拒绝“0,认为东南部球果长度明显低于西北部。

(-)小样本方法

设总体X「N("[,b2),X「N(H2,2),

检验问题:(I)双侧检验以0:〃1=〃2,81:〃尸〃2,

(II)右侧检验Ho:从=〃2(“0:<〃2),"1:41>〃2,

(III)左侧检验4:〃1=〃2(|"。:从〃2),氏<%,

x

X1的iid.样本X”巧2,%与i的血・样本

工21户22户,,工2〃2独立,片,无2分别是妈的样本均值,

s;,s;分别是X],%的样本方差。

22

因为与±2~N(〃2,J)独立,

nxn2

所以,工[一无2~N(从一〃2,(-------1--------),)

/n2

对三种类型的检验问题,当H。真时有四=〃2,

2

片.工2〜N(0,3+—)(T),

%n2

于是,U=一/二手~Ng1)(*)

V%

(1)/已知时,对给定的显著水平。有

P[\U\>ua}=a;P{U>u2a}=a;P[U<-u2a}=a.

检验拒绝域:(I):|U0%;(II):U>u2ai(HI):U<-u2a.

(2)/未知时,由于X-N3"2),X2〜N(〃2,b2)

利用Ch2定理4有,对三种类型的检验问题,当?真时,

片一x

T=2~1(%+-2)

(丐-1)$;+(%-1应11+1

nx+n2-2

(教材PU1(4.38)有误)

于是,给定显著水平a有

P[\T\>ta(nx+n2-2)}=a,

P{T>t2a(ni+n2-2)}=a,

P[T<-t2a(n1+n2-2)}=a.

检验拒绝域为:

(D|丁乜(%+〃2-2);(n)T>t2a(n1+n2-2)i

(ill)TV—£2a(“I+%—2).

例2:某次测验满分60分。随机抽取15名男生、12名女

生,成绩如下:

男生:49,48,47,53,51,43,39,57,56,46,42,

44,55,44,40;

女生:46,40,47,51,43,36,43,38,48,54,48,

34o

假定男女生成绩都服从正态分布,且等方差。问男、女生

成绩有无显著差异(取显著水平a=0.05)?

解:Xr^X2分别表示男'女生成绩,

X「N(〃”2),>2〜N(〃2,2),

检验问题:%:〃1=4"1:〃尸〃2

nv=15,n2=12,xx=47.6,x2=44,(%—l)s;=469.6,

(n2-1)52=412,

T____________巧一“2___________________

一.4-1)S;+(%-1对H+x

\n{+n2-2n[n2

47.6-44.1

=।f—=L?65,

469.6+412J.1

\TS+12-2\15+12

《(%+%-2)=%,05(25)=2.06,因为|TK2.06,故接受

H()9即认为男、女生成绩无显著差异。

二、两总体频率的差异显著性检验

设总体占频率为(1=1,2),检验问题:

(I)双侧检验"o:Pi=PiH/PL,

(II)右侧检验"o:Pl=P2“1:Pl>P2,

%:Pl<P2・

(HI)左侧检验Ho:Pl=P2

只考虑大样本情况:

0

天有分布,(i=l,2),

11-PiPi)

设X1的iid.样本巧]2,…,/”与的iid.样本

“21,”22,,一,”2〃2独工°

叼=2勺是K的样本中具有某特点的样本单元数。

j=l

由中心极限定理知:

近似

叫〜N(%P[,/P](1一0J

充分大

于是,生

类似的,些?N(P2,

n2

这里啊=次均是X2的样本中具有某特点的样本单元

j=l

数。由于也与外独立,所以,

nxn2

丐m2近似N(nnP1(1-P1)*P2(1-P2)、

-------------〜N(Pl_P2,-----------------+-----------------)

nxn2叫n2

对三种类型的检验问题,当“。真时有,Pi=p2=p,有

mfji近似11

外〜N(0,(一+一)p(l-p)),

nxn2%n2

m{m2

于是,U仝%%〜N(0,1),

\%n2

P未知,可用p的无偏估计p=叫土如近似代替上式中的

P,这里

E(p)=---{E(mx)+E(m2)}=--—(%P]+%。2)

n{+n2nx+n2

“0真时有,Pi=P2-P所以,E(p)=p,即力是p的无

偏估计。

对显著水平a有,检验拒绝域为:

(I):\U\>uai(II):U>u2ai(III):U<-u2a.

例3:例114例4」3)对200粒种子温水浸种,其中130

粒发芽;对400粒不经温水浸种,其中200粒发芽。试问,

这两种处理方法对种子发芽率有无显著差异(显著水平

a=0.05)?

解:记两种处理方法下的种子发芽率分别为P1和P2,检

验问题:“0:P[=02,"1:Pi,02

nx=2009n2=400,mx=1309m2=200,

m.+m130+200八”

p«---------2=------------=0.55,

nx+n2200+400

nn

U={2

(-+-)p(l-p)

nxn2

130/200-200/400

=3.482,

1

+)x0.55x(1-0.55)

400

Ua=“0.05=1・96,

IU|>%,故拒绝修,认为两种处理方法对种子发芽率有

显著差异。

§4.5两个正态总体方差齐性检验

总体X]~X2~N(〃2届),Mi,〃2,和

为未知参数。考虑假设检验问题:

设X1的iid.样本打,占2,…,天/与乂2的iid.样本

吃1,/2,…,马.独立,样本方差分别为S;和¥。¥是b:的

无偏估计(i=l,2)o

当?真时,b;=6,s;与s;应相差不多,从而

$2

F=^-

很大或很小的可能性比较小。

检验的拒绝域形式为:尸vq或厂>。2。

而"o真时,2b2,

且有(“I—?.〜21/_1)与52-产~/(〃2—1)独

bc

立(Ch2定理1),所以

给定显著水平a,查厂分布表确定臼,。2使,

P{F<c[或方>c2]=a.

均分两侧风险,有尸{耳〈力}=,且尸{户>。2}=,,

所以,=几”2(〃1一1,〃2-1)=

g/2(〃2-1,/一1)

所以,检验的拒绝域为:

N[L

------;-------7;或;^>"。/2(〃1-1,〃2一1)°

S2Ez/2(〃2-1,"1—1)S2

练习:某次测验满分60分。随机抽取15名男生'12名

女生,成绩如下:

男生:49,48,47,53,51,43,39,57,56,46,42,

44,55,44,40;

女生:46,40,47,51,43,36,43,38,48,54,48,

34o

假定男女生成绩都服从正态分布。问男、女生成绩的方差

有无显著差异(取显著水平a=0.10)?

解:检验吗:0;=(7;,

nx=15,n2=12,s;=33.54,s;=37.45,

例:(PH5例4.14)设林木胸径近似正态分布,独立地从

甲、乙两块林地中抽出若干林木,测得胸径数据如下:

甲:4.5,8.0,5.0,2.0,3.5,5.5,5.0,7.5,5・5,7・5;

乙:3.0,5.0,2.0,4.0,5.0,5.0,3.0,3.0.

试判断,甲、乙两块林地林木胸径总体的方差4和犬是

否相等?(a=0.10)

解:检验4:(7;=解H、•b]*b?

nx=10,n2=8,=3.544,s;=1.357,

s甲3.544.

F=—^-=-------=2.612>1A,

s;1.357

Ez/2(%一1,%一1)=居.05(%7)=3.68,

玛〜2(/T,%T)=K.95(/7)=———=--=0.304

小0.05(7严)3・29

因0.304vb<3.68,所以,接受“°,即认为甲、乙两块

林地林木胸径总体的方差相等(无显著差异)。

练习:在水平a=0.05下检验两块林地胸径的均值是否相

等:

H\:内丰出

%=5.4,x2—3.75,

P127.5

(1)方差齐性检验:/:CT;=b;,"i:CT;W<7;

取a=0.10

(2)检验问题:80:从=〃2Hi:内手出(a=0.05)

n1=40,n2=20,xi=248.3,x2=249.55,

si=3243.96,si=2932.79

考研同学请自学:

(IT)

(III)Hx:af<b;

检验的拒绝域:(ID

(III)条<-------------

§2E(〃2-1,〃1-1)

§4.6总体分布的假设检验(拟合优度检验)

一.理论分布为已知的只取有限个值的离散型分布

a

4:总体X服从分布任小…m}

[PlPl・・・Pm

Hi:总体X不服从此分布

巧,/,…"〃为X的样本,巧,马,…户〃中有匕个值是

%(,=12・・・,机)。〃充分大时,应有匕/〃aPi,即匕«np.o

称4=叫为〃「类”的理论值,而匕称为经验值。

・・•

X的取值6。2

■■■n

理论频数纥6=npiE2=np2Em=Pm

实际频数匕羽1%■■■4

记%2=之9二型,称为皮尔逊的拟合优度/统计量。

言Ei

皮尔逊1900年证明:

若“0真,则〃―8时,/趋于力2(帆一1)。有

显著水平为a的拒绝域:/>/(,”1)。

例:(P128习题8)后的前800位小数中,数字0,1,2.......

9出现的次数如下:

数字0123456789

频数匕74928379807377757691

数字分布是否服从离散型均匀分布?(。=0.05)

解:”。:数字分布服从离散型均匀分布,

兄:数字分布不服从离散型均匀分布

理论值E.=nPi=800x0.1=80(/=0,1,2,…,9)

/=.(匕一石厅=(74-80)21(92-80)21।(91—80)2

%-ME.-808080

I-UI

=5.125<16.919=^05(10-1)

接受数字分布服从离散型均匀分布.

练习:袋中装有红、白、蓝三种颜色的球。从中有放回地

取球100次,结果取到52个红球、21个白球、27个蓝球。

是否可以认为红、白、蓝三种颜色球的比例是5:2:3?

(a=0.05)

二.一般分布的情形(离散型取值无穷可数、连续型)

H。:总体X服从某分布,HQ总体X不服从此分布

总体分布为连续型:将总体X取值范围划分为有限的机

个区间AnA2<--,Amo与,与,…,上〃为X的iid.样本,

巧,号…,”〃中有匕个值落入A(i=12…,⑼。若"o真,

记Pi=P{XeAJ,理论上“1,/,…,/中有纥个值落入

这里Ej=呐,(i=l,2<>m)o

X的取值区间■■■

■■■En

理论频数均4=rip]E2=np2m=Pm

实际频数匕匕V2■■■4

若总体分布中有七个参数是估计值,则

m(v.-Fj2近似.

/=力----------〜-k-

心5(d

1=1Ei

显著水平为a的拒绝域:力2>/5一左一1);

例:(PU6例4.15)200株落叶松胸径数据分组整理如下:

胸径分组(cm)组中值七频数匕频率力

[10,14)1230.015

[14,18)16140.07

[18,22)20220.11

[22,26)24520.26

[26,30)28590.295

[30,34)32310.155

[34,38)36150.075

[38,42)4040.02

检验落叶松胸径是否服从正态分布(a=0.05)

解:总体X服从正态分布N(〃Q2),

H1:总体X不服从正态分布N3b2)

1m18

A-----

口=x=x.一v.=26.46;

Z1-X

Ifn18

(qJ2=s2=—77t(占一元A匕=同£(看一无H匕

n—[i=li=l

=33.07«5.7512

若真,则可计算理论频率进而计算理论频数瓦:

理论胸径分组理论频率P]理论频数E]实际频数匕

(-oo,14)0.01533

[14,18)0.05611.214

[18,22)0.14829.622

[22,26)0.24949.852

[26,30)0.26352.659

[30,34)0.17434.831

[34,38)0.07314.615

[38,+8)0.0224.44

其中,

14-2646

Ps=P[X<14}=①。(;)=①。(一2・17)=0.015,

E]=npi=200x0.015=3;

-尸

p2=P{14<X<18}=P{X<18}{X<14}

=①o(18—2646)―0015士①0(—L47)—0.015=0.056,

5.751

E2=np2=200x0.056=11.2;

2二寸(匕一£)=(3-3)2।(14-11.2)2।।(4-4.4)2

ME.-311.24.4

=3.99<Z(;05(8-2-1)=11.07,接受名。

§4.8同质性检验*(列联表中的独立性检验)(不考)

一.2x2列联表

例1.

1000人按性别和是否色盲分类如下:

正常色盲总计

男nn—442〃12=38n19=480

女%=514=6%=520

总计ti.i=956ri.2=44n=1000

此表称为2x2列联表。

假设检验问题为:

“0:性别和色盲这两个特性狸立

(在色盲问题上男、女是同质的),

H1:性别和色盲这两个特性不独立

(在色盲问题上男、女不同质)

若“。真,则在是否色盲上男女无差别。由此,

儿I=956

正常人比例:

T-iooo,

色盲人比例:凡2=44

n-1000

于是,男、女正常或色盲的人数的理论值如下:

正常色盲

□_几i

□22n

EH-%•£12-U

nn

95644

=480x三~=458.88=480x——=21.12

10001000

口_n

石21_・lE=%.工

n22n

95644

=520x^-=497.12=520x——=22.88

10001000

可以证明,“。真时,在大样本情况下,有

(〃”―£]])2।(〃]2-旧12)2

Z2

区2

+

93P+3P^7⑴

421心22

由此若“。真,理论值吗与实际值均应当很接近,步的

取值应比较小,所以,/取值太大时拒绝“。.

检验的拒绝域的形式:/>c.

给定显著水平a,查表9(P259)得P{/>;d(l)}=a,

即检验的拒绝域为:z2>z^(l)o

(442—458.88)2(38-21.12了

例1中,%1

458.8821.12

(514-497.12)2(6—22・88/

+497.12.22.88=27.138

取a=0.01,则%:.。式1)=6.635,取>/。式1)

・•・拒绝,认为性别与色盲两特性不独立(男女在是否色盲

上有差别)。

二rxc列联表(教材P122)

BiB2…Bc总计

Annnn…nic

%〃22…n2c

•*

*■■■•

••

%2…nrcnr.

n

总计%%…n.c

cr

其中,%•=E〃ij,,=1,…凡j=E%,j=

i=li=l

rcrc

n=£%,=2n.j=ZE%・

i=ij=ii=ij=i

假设检验问题为:

Ho:特性A和特性B理立

(A类中的r种情况在特性B上是同质的),

H.Q特性A和特性B不•独•立•

(A类中的r种情况在特性B上不同质)

若真,特性A和特性B没有十分密切的关系,

居出现的频率应为区;B2出现的频率应为乜;

n

……;Bc出现的频率应为外;

n

这样,在/真时,理论上4吗出现的个数应为

n..

Eij=ni.—,=l,2,・・・,r,j=l,2,…,c.

n

可以证明,?真时,在大样本情况下,

2

rc(np\近似

〜/((r-l).(c-l))

1=1j=iBq〃充分大

检验思想:若名真,理论值吗与实际值他应当很接近,

/的取值应比较小,所以,/取值太大时拒绝

检验的拒绝域的形式:%2>k.

给定显著水平a,查表9(P259)得

P{/>/((D(D)}=a

检验的拒绝域为:N>7:("-1)・(。-1))。

例2,为研究某地区男、女受教育是否平等,从30〜35岁

人中随机抽取200名男性和100名女性进行调查,得如下

结果:

中学大学研究生总计

"13=14

男nn=137%=49n19=200

女%=70%=26/3=4%•=100

总计%]=207凡2=75几3=18n=300

问该地区男、女受教育程度是否有显著差异(a=0.05)?

解:Ho:受教育程度和性别是独立的

(在受教育程度上男、女是同质的)

Hx:受教育程度和性别不是独立的

(在受教育程度上男'女不是同质的)。

若真,则男女无差别,各种受教育程度的人所占比例

为:

中学大学研究F-

=207n92=75n91=18

丁一丽丁―丽丁一丽

理论上,男、女各种受教育程度的人数为:

男中学:耳]=200x迎=138,

11300

男大学:£=200x——=50,

12300

1Q

男研究生:E[3=200X—J=12,

3300

女中学:£=ioox迎=69,

21300

7s

女大学:F22=100x^=25,

~2300

IQ

女研究生:E=100X-^-=6O即

23300

________中学大学研究生

男nn=137耳产138n12=49Ei2=50=14£13=12

女n21=70E2i=69n22=26^22=25n23=4£23=6

(137-138)2(49—50)2(i"12)2

138+50+12+

(70-69)2(26-25产(4-6产

=1.0817

69256

/=2,c=3,后("1)・(c-1))=就05(2)=5.991

/〈匕((r-lA(c-D),所以,不能拒绝8。,即认为该

地区男、女受教育程度无显著差异。

第四章内容:

假设检验的基本思想基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论