非参数假设检验(1)_第1页
非参数假设检验(1)_第2页
非参数假设检验(1)_第3页
非参数假设检验(1)_第4页
非参数假设检验(1)_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、二、似然比检验二、似然比检验 1 0110r0 100 ( ; ), ( ,),: :=,=, ,. k r r f x H 假设总体的密度函数或概率分布为其中 是k维参数检验其中的r个参数 其中为给定常数 0 sup ( ) ( ) sup ( ) ( ) :(1)0(r) If xdx 定理3.2.1当似然函数L( )为三阶可导函数 且 连续可导 则 的极限分布为 拒绝域为 样本容量样本容量n的确定的确定 原假设和备择假设都是简单假设原假设和备择假设都是简单假设(即参数只取参即参数只取参 数空间的一个点数空间的一个点)时时,寻找最小的样本容量寻找最小的样本容量,使得两类使得两类 错误的概率

2、控制在预制范围内错误的概率控制在预制范围内. 1.总体方差已知时总体方差已知时,正态总体均值的右边检验正态总体均值的右边检验 22 00110 ( ,), :,:. X N HH 设 已知 检验假设为 0 011 101 1 10 1 1 2 2 2 10 | / | / / n=() () X PHHPuH n X PuH nn uu n uu uu 接受为真 为真 为真 因此 又 有 2.总体方差未知时总体方差未知时,正态总体均值的右边检验正态总体均值的右边检验 22 00110 N( ,), :,:. X HH 设未知 检验假设 0 011 101 1 10 1 2 2 2 10 10

3、|(1) | / | / (1)(1)(1) / n=(1)(1) () (1)(1) / X PHHPtnH Sn X PtH SnSn tntntn Sn S tntn tntn Sn 接受为真 为真 为真 因此 有没有? n满足 3.总体期望未知时总体期望未知时,正态总体方差的右边检验正态总体方差的右边检验 2 22222 00110 2 2 011 2 0 22 2 1 1 22 10 22 2 0 1 22 11 2 22 0 1 2 1 N( ,), :,:. (1) |(1)| (1) (1)| (1) (1)| (1)(1) X HH ns PHHPnH ns PnH ns P

4、nH nn 设未知 检验假设 接受为真 为真 为真 为真 因此 设总体 X 服从参数为 p 的(01)分布, 即 1, 0,)1 ( 1 xppxXP xx 设 n XXX, 21 为 X 的样本, 检验假设 0100 :,:ppHppH 1 1(0(01)1)分布参数的假设检验分布参数的假设检验 由于 n i i pXE n XE 1 )( 1 )( n i i pp n XD n XD 1 2 )1 ( 1 )( 1 )( 因此由中心极限定理可知, 当 0 H成立且样本容量 n充分大时,统计量 npp pX U / )1 ( 00 0 服从标准正态分布N(0,1). =该假设检验问题的拒绝

5、域为 2/ 00 0 / )1 ( u npp px u 近似地 例例1 1 某种产品在通常情况下次品率为5%. 现在从 生产出的一批产品中随机地抽取50件进行检验, 发 现有4件次品. 问能否认为这批产品的次品率为5%? (=0.05) 解解 设这批产品的次品率为 p. 在这批产品中任 任意取一件产品,定义随机变量 X 如下 .0 , 1 该产品为合格品, 该产品为次品 X ), 1 (pbX 检验假设 ,05. 0: 0 pH05. 0: 1 pH 该假设检验问题的拒绝域为 2/ / )05. 01 (05. 0 05. 0 u n x u 现在 ,50n,08. 0 50 4 x 96.

6、 1 025. 02/ uu 统计量U的值为 0.080.05 0.973 0.05 1 0.05 /50 u 96. 10306. 0| u =接受假设 0 H =可以认为这批产品的次品率为5% 2.2.总体均值的假设检验总体均值的假设检验 假设总体X 的均值为, 方差为 2 n XXX, 21 为 X 的样本,检验假设 0100 :,:HH 由中心极限定理知,当样本容量n充分大时, n X U / 0 近似地服从标准正态分布N(0,1) 由于样本方差 n i i XX n S 1 2 2 1 1 为 2 的无偏估计量, =可以用 2 S近似代替 2 ,并且当 0 H为真 且样本容量n充分大

7、时,统计量 nS X U / 0 仍近似地服从标准正态分布N(0,1) =该假设检验问题的拒绝域为 2/ 0 / u ns x u 例例2 2 某电器元件的平均电阻一直保持在2.64. 改 变加工工艺后, 测得100个元件的电阻, 计算得平 均电阻为 2.58 , 样本标准差为0.04 . 在显著性 水平 =0.05下, 判断新工艺对此元件的平均电阻 有无显著影响. 解解 设该电器元件的电阻为X, 其均值为 检验假设 ,64. 2: 0 H64. 2: 1 H 拒绝域为 2/ / 64. 2 u ns x u 现在 ,100n,58. 2x,04. 0s05. 0 ,96. 1 025. 02

8、/ uu统计量U的值为 15 100/04. 0 64. 258. 2 u 96. 115| u =拒绝假设 ,64. 2: 0 H 接受假设 64. 2: 1 H =新工艺对电子元件的平均电阻有显著影响. 3.3.两个总体均值的假设检验两个总体均值的假设检验 设总体 X和 Y相互独立, 的样本, 1 , 21n XXX 是 X 2 , 21n YYY 是 Y 的样本. 记 , 1 1 1 1 n i i X n X 1 1 2 1 2 1 )( 1 1 n i i XX n S , 1 2 1 2 n i i Y n Y 2 1 2 2 2 2 )( 1 1 n i i YY n S 设总体

9、 X的均值为 1 ,方差为 2 1 总体 Y的均值为 2 ,方差为 2 2 ,: 210 H 211 :H 的拒绝域. 由中心极限定理知,当样本容量 1 n和 2 n 都充分大时, 2 2 21 2 1 21 nn YX U 近似地服从标准正态分布 由于样本方差 2 1 S 和 2 2 S分别为 2 1 和 2 2 的无偏估计量,因此 可以 分别用 2 1 S 和 2 2 S近似代替 2 1 和 2 2 ,并且当 求假设检验问题 1 n 和 2 n 2 2 21 2 1 21 nn YX U 近似地服从标准正态分布 ,从而当原假设 0 H 成立时, 统计量 2 2 21 2 1 nSnS YX

10、 U 仍近似地服从标准正态分布. 都充分大时, =当 0 H成立且 21,n n 都充分大时, 统计量U的值应该在零附近摆动, 当 u过大时就认为 0 H不成立. =该假设检验问题的拒绝域为 2/ 2 2 21 2 1 u nsns yx u 例例3 两台机床加工同一中轴承,现在从他们加工 的轴承中分别随机地抽取200根和100根,测量其椭 圆度(单位:mm),经计算得 ,062. 0,081. 0yx062. 0,025. 0 21 ss 能否认为这两台机床加工的轴承的平均椭圆度是相 同的(=0.05) 解解设这两台机床加工的轴承的椭圆度分别为X,Y 且 , 1 XE YE 2 检验假设 ,

11、: 210 H 211 :H 由于题目给出的两个样本都是大样本,因此该假设 检验问题的拒绝域为 现在 ,100,200 21 nn 96. 1 025. 02/ uu 2/ 2 2 21 2 1 u nsns yx u 2 2 21 2 1 nsns yx u =拒绝原假设 , 0 H即认为这两台机床加工的 轴承的平均椭圆度是不相同的. 96. 15849. 3 设总体X的实际分布函数为F(x),它是未知的. n XXX, 21 为来自总体 X的样本. 根据这个样本来检验总体X的分布函数F(x) 是否等于某个给定的分布函数 F0(x),即检验假设 ),()(: 00 xFxFH)()(: 01

12、 xFxFH : 注意注意: : 若总体 X 为离散型的, 则 0 H相当于 总体 X 的分布律为 , 2 , 1,ipxXP ii 若总体 X 为连续型的, 则 0 H相当于总体 X 的 概率密度为 f (x) . 0 H中 X 的分布函数 )(xF 不含未知参数. 记 为 X的所有可能取值的全体, 将 分为k个 两两互不相交的子集 k AAA, 21 以 ), 2 , 1(kif i 表示样本观察值 n xxx, 21 中落入 i A的个数, = 在n次试验中,事件 Ai发生的频率为 fi /n 另一方面,当H0 0为真时, 可以根据H0所假设的 X 的分 布函数来计算 ).( ii AP

13、p 选取统计量 k i i i i p n f h 1 2 来度量样本与H0中所假设的分布的吻合程度,hi是 给定的常数。 k i i i k i i ii n np f np npf 1 2 1 2 2 )( 一般选取 ,/ ii pnh 则上述统计量变成 定理定理1 1 (皮尔逊)(皮尔逊)当H0为真且n充分大时, 统计量 k i i i k i i ii n np f np npf 1 2 1 2 2 )( 近似服从 ) 1( 2 k分布. 由定理1, 若给定显著性水平,则前述假设检验问 题的拒绝域为 ) 1( 22 k (2)若H0中X 的的分布函数含有未知参数. 此时, 首先在假设下

14、利用样本求出未知参数的最大 似然估计, 以估计值作为参数值, 然后再根据 H0中 所假设的 X 的分布函数 F(x)求出 pi的估计值 )( ii APp k i i i k i i ii n np f np npf 1 2 1 2 2 )( 并在 中以 i p 代替 i p , 得到统计量 n pn f pn pnf k i k i i i i ii 11 22 2 )( 0 H为真且 n充分大时, 统计量定理定理2 2 (皮尔逊)(皮尔逊)当 n pn f pn pnf k i k i i i i ii 11 22 2 )( 近似服从 ) 1( 2 rk分布, 其中r是 X的分布函数 F(

15、x)包含的未知参数的个数. 若给定显著性水平,则前述假设检验问题的拒绝域为 ) 1( 22 rk 注意:注意:运用 2 检验法检验总体分布, 把样本数据进 (1)大样本, 通常取50n (2)要求各组的理论频数 5 i np或 5 i pn (3)一般数据分成7到14组. 有时为了保证各组 行分类时, 5 i np 组数可以少于7组 例例1 1 孟德尔在著名的豌豆杂交实验中, 用结黄色 圆形种子与结绿色皱形种子的纯种豌豆作为亲本进 行杂交, 将子一代进行自交得到子二代共556株豌 豆, 发现其中有四种类型植株 (黄圆)(黄皱) (绿圆)(绿皱) RYrrY yyRyyrr 总计 315株 10

16、1株 108株 32株 556株 试问这些植株是否符合孟德尔所提出的 1:3:3:9 的理论比例 )05. 0( 解解 检验假设 : 0 H 这些植株符合 1:3:3:9 的理论比例. : 1 H 这些植株不符合 1:3:3:9 的理论比例. 由 1:3:3:9 的理论比例可知 16 1 , 16 3 , 16 3 , 16 9 4321 pppp 由n=556,得 25.104,75.312 21 npnp 75.34,25.104 43 npnp 而 ,32,108,101,315 4321 ffff, 4k 计算得 .47. 0 )( 1 2 2 k i i ii np npf 由 =0

17、.05 ,自由度, 3141k查 2 分布表得 815. 7)3( 2 05. 0 )3( 2 05. 0 2 =在=0.05下接受 0 H =这些植株是符合孟德尔所提出的 1:3:3:9 的理论比例 例例2 2 某农科站为了考察某种大麦穗长的分布情况, 在一块实验地里随机抽取了100个麦穗测量其长度, 得到数据如下(单位: cm) 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3

18、5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3 试检验大麦穗长是否服从正态分布?(=0.05) 解解 检验假设

19、: 0 HX的概率密度为 2 2 2 )( 2 1 )( x exf 2 ,是未知的, 所以应首先估计 2 , 2 , 的最大似然估计为 ,921. 5 x 222 6034. 0 1 s n n 把X可能取值的全体 55. 7,95. 3 划分为 k =12个互不重叠的小区间: ,25. 4,95. 3 1 A,55. 4,25. 4( 2 A 55. 7,25. 7( 12 A =大麦穗长的频数、频率分布表 3.954.25 4.254.55 4.554.85 4.855.15 5.155.45 5.455.75 5.756.05 6.056.35 6.356.65 6.656.95 6.

20、957.25 7.257.55 合计合计 i A i f 频率 频数 nf i / 累计频率 5 2 1 1 05.0 02.0 01.0 01.0 0.09 11 15 28 13 11 0.11 0.15 0.28 0.13 0.11 0.20 0.35 0.63 0.76 0.87 1 2 10 01. 0 02. 0 10. 0 1.00 1001.00 ,921. 5 x 222 6034. 0 1 s n n 由 )6034. 0,921. 5( 2 NX 由此可计算 ),( ii APp ,( 1iii ttA 若则 1ii i tt p 6034. 0 921. 5 6034.

21、 0 921. 5 1ii tt 2 , i p的值见下表 的计算表 2 组号组号分组分组 频数频数 13.955.1590.099769.9760.09549 25.155.45110.117411.740.04664 35.455.75150.17217.20.2814 45.756.05280.193519.353.8668 56.056.35130.177917.791.28972 66.356.65110.125812.580.19844 76.657.55130.1096310.9630.37849 合计合计1001000.9959999.5996.15698 i f i p i p n iii pnpnf/)( 2 由 k=7,r=2,得自由度 k-r-1=4,查表得 488. 9)4( 2 05. 0 而 488. 915698. 6 2 =接受原假设, 即在检验水平=0.05下,下可认为大 麦的穗长服从正态分布 )6034. 0,921.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论