




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1http:/ 假设检验假设检验 关键词:关键词:假设检验假设检验 正态总体参数的假设检验正态总体参数的假设检验 分布拟合检验分布拟合检验 秩和检验秩和检验http:/ 一个正态总体两个正态总体待估参数 假设枢轴量 检验统计量 分 布置信区间拒绝域正态总体均值、方差的置信区间与假设检验1置信度2(已知)2(未知)0010:hh0010:hhxn0xn0xsnxsn2xzn02xzn2(1)xtns n02( 1 )xtns n(0,1)n(1)t n2(未知)22002210:hh22(1)ns220(1)ns2122222(1)(1)(1)nnsn2212202222(1)(1)(1)(1)
2、nsnnsn或21(n)1222212()012112:hh121211() ()wnnx ys 1211wnnx ys12(2)t n n 12121112() ()(2)wnnx yst nn121112(2)wnnx yst nn21222201222112:hh22112222ss2122ss12(1 ,1 )fnn121222112222212(1,1)(1,1)fnnssfnn211212222121222(1,1)(1,1)sfnnssfnns或http:/ 实际中可能遇到这样的情形,总体服从何种实际中可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提理论
3、分布并不知道,要求我们直接对总体分布提出一个假设出一个假设 。 例如,从例如,从1500到到1931年的年的432年间,每年爆发年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了年间共爆发了299次战争,具体数据如下次战争,具体数据如下:战争次数x 0 1 2 3 4发生 x次战争的年数 223 142 48 15 4 可以假设每年爆发战争次数分布x近似泊松分布。那么上面的数据能否证实x 具有泊松分布假设?http:/ 问该厂生产的钟的误差是否服从正态分布?问该厂生产的钟的误差是否服从正态分布?再如,某工厂制造一批骰子,声称它是
4、均匀再如,某工厂制造一批骰子,声称它是均匀的。即在投掷中,出现的。即在投掷中,出现1 1点,点,2 2点,点,6 6点的点的概率都应是概率都应是1/61/6。为检验骰子是否均匀,要把。为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率骰子实地投掷若干次,统计各点出现的频率与与1/61/6的差距。那么得到的数据能否说明的差距。那么得到的数据能否说明“骰骰子均匀子均匀”的假设是可信的?的假设是可信的?http:/ 在总体在总体x 的分布未知时,根据来自总体的样本,的分布未知时,根据来自总体的样本, 检验关于总体分布的假设的一种检验方法。检验关于总体分布的假设的一种检验方法。2拟合检验法
5、最初是用于分类数据的有关检验问题的http:/ (理论理论频数频数)应相差不大。应相差不大。 总体总体x可以分为可以分为k,记作,记作a1, a2, , ak ,如,如今要检验的是:今要检验的是:如对总体做作了如对总体做作了n次观察,各类出现的频数次观察,各类出现的频数为为fi (实测频数)(实测频数),所有频数之和,所有频数之和f1+ f2+ + fk等于样本容量等于样本容量n, fi /n称为频率。称为频率。 具体思想如下:0:(),1,2, ,iihp ap ik10,1.iiiipppk其中各 已知,且http:/ iinpf 标志着经验分布与理论分布之间的差异的大小标志着经验分布与理
6、论分布之间的差异的大小.皮尔逊引进如下统计量表示经验分布皮尔逊引进如下统计量表示经验分布与理论分布之间的差异与理论分布之间的差异:统计量统计量 的分布是什么的分布是什么?2 在理论分布在理论分布已知的条件下已知的条件下,npi是常量是常量实测频数实测频数理论频数理论频数http:/ 若原假设成立,那么当若原假设成立,那么当 时,统计时,统计量量n渐近服从自由度为(渐近服从自由度为(k-1)的)的 分布分布.2 2(1).ck2检验的拒绝域形为: w=当显著性水平 给定时,可得 c=http:/ 如果根据所给的样本值如果根据所给的样本值 x1,x2, ,xn算得算得统计量统计量 的实测值落入拒绝
7、域,则拒绝原假的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设设,否则就认为差异不显著而接受原假设.2 http:/ 皮尔逊定理是在皮尔逊定理是在n无限增大时推导出来无限增大时推导出来的,因而在使用时要注意的,因而在使用时要注意n要足够大要足够大,以及,以及npi 不太小不太小这两个条件这两个条件. 根据计算实践,要求根据计算实践,要求n不小于不小于50,以及,以及npi 都不小于都不小于 5. 否则应适当合并类,使否则应适当合并类,使npi满足这个要求满足这个要求 .http:/ 奥地利生物学家孟德尔进行了长奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试验达八年之久的豌
8、豆杂交试验, 并根据并根据试验结果试验结果,运用他的数理知识运用他的数理知识, 发现了发现了遗传的基本规律遗传的基本规律. 在此,我们以遗传学上的一项伟大发现为在此,我们以遗传学上的一项伟大发现为例,说明统计方法在研究自然界和人类社会的例,说明统计方法在研究自然界和人类社会的规律性时,是起着积极的、主动的作用规律性时,是起着积极的、主动的作用.孟德尔孟德尔http:/ 根据他的理论,子二代中根据他的理论,子二代中, 黄、绿之比黄、绿之比 近似为近似为3:1, 例例1 奥地利生物学家孟德尔进行了长达八奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试验年之久的豌豆杂交试验, 并根据试验结果并根据
9、试验结果,运运用他的数理知识用他的数理知识, 发现了遗传的基本规律。发现了遗传的基本规律。http:/ k=2,检验孟德尔的检验孟德尔的3:1理论理论:提出假设h0: p1=3/4, p2=1/4理论频数为: np1=72.75, np2=24.25实测频数为70,27.2122)(iiiinpnpf 统计量) 1 (2 近似服从近似服从自由度为k-1=120.050.05(1)3.8413.8412按,查表得,拒绝域为 w=2 由于统计量的实测值2 =0.41583.841,故认为试验结果符合故认为试验结果符合孟德尔的孟德尔的3:1理论理论.http:/ 这些试验及其它一些试验,都显这些试验
10、及其它一些试验,都显 示孟德尔的示孟德尔的3: 1理论与实际是符合的理论与实际是符合的. 这本身就是这本身就是统计方法在科学中的一项统计方法在科学中的一项 重要应用重要应用.用于客观地评价理论上的某个结论是用于客观地评价理论上的某个结论是否与观察结果相符,以作为该理论是否与观察结果相符,以作为该理论是否站得住脚的印证否站得住脚的印证.http:/ 将这种方法推广至对一般总体的分将这种方法推广至对一般总体的分布的假设检验上。布的假设检验上。 01先提出假设:h :总体x的分布函数为f(x),h :总体x的分布函数不是f(x)。,1,2,.( )iixhhxp xtp ixhhxf x0 00 0
11、0 00 0注注1 1:若若总总体体 为为离离散散型型,则则相相当当于于: :总总体体 的的分分布布律律为为。若若总总体体 为为连连续续型型,则则相相当当于于: :总总体体 的的概概率率密密度度为为。( )hxf x0 0注注2 2:当当中中的的总总体体 的的分分布布函函数数含含有有未未知知参参数数时时,极极大大似似然然估估计计需需要要先先用用样样本本求求出出参参数数的的,以以估估计计值值为为参参数数值值。http:/ 若原假设中的理论分布若原假设中的理论分布f(x)已经完全给已经完全给定,那么当定,那么当 时,统计量时,统计量n渐近服从渐近服从(k-1)个自由度的个自由度的 分布分布.2 2
12、21()kiiiifnpnp如果理论分布如果理论分布f(x)中有中有r个未知参数,需个未知参数,需用相应的估计量来代替,那么取统计量用相应的估计量来代替,那么取统计量为为 渐近服从渐近服从(k-r-1)个自由度的个自由度的 分布分布.2 http:/ 在在f(x)尚未完全给定的情况下,每个未知尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个参数用相应的估计量代替,就相当于增加一个制约条件,制约条件,因此,自由度也随之减少一个因此,自由度也随之减少一个. . 若有若有r个未知参数需用相应的估计量来代个未知参数需用相应的估计量来代替,替,自由度就减少自由度就减少r个个. .此
13、时统计量此时统计量 渐近渐近(k-r-1)个自由度的个自由度的 分布分布.2 2 http:/ x服从参数为服从参数为 的泊松分布的泊松分布 按参数按参数为为0.69的泊松分布,计算事件的泊松分布,计算事件x=i 的的概率概率pi ,将有关计算结果列表如下:pi的估计是,i=0,1,2,3!69. 069. 0iepii根据观察结果,得参数 的极大似然估计为 , 故 的极大似然估计值为。 = x 0.69 例例2 从从1500到到1931年的年的432年间,每年爆发战争的次年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这数可以看作一个随机变量,椐统计,这432年间共爆发了年间共爆发了2
14、99次战争,具体数据如下次战争,具体数据如下:战争次数战争次数x 0 1 2 3 4 0 1 2 3 4发生发生 x次战争的年数次战争的年数 223 142 48 15 4 223 142 48 15 40.694440.69!iipp xeihttp:/ 因因h0所假设的理论分布中有一个未知所假设的理论分布中有一个未知参数,故自由度为参数,故自由度为4-1-1=2.x 0 1 2 3 4fi 223 142 48 15 4 0.58 0.31 0.18 0.01 0.02n 216.7 149.5 51.6 12.0 2.16 2()iiifnpnp0.1830.376 0.251 1.62
15、3战争次数实测频数ip ip 14.162.43将将n 5的组予以合并,即将发生的组予以合并,即将发生3次及次及4次次战争的组归并为一组战争的组归并为一组.ip 14.16http:/ 故认为每年发生战争的次数故认为每年发生战争的次数x服从服从参数为参数为0.69的泊松分布的泊松分布.按 =0.05,自由度为4-1-1=2查 分布表得2 =5.991)2(205. 0 2 =2.435.991,由于统计量2 的实测值未落入拒绝域.25.991w故拒绝域为http:/ 下面列出了下面列出了84个伊特拉斯坎个伊特拉斯坎(etruscan)人男子人男子的头颅的最大宽度的头颅的最大宽度(mm),试检验
16、这些数据是否来,试检验这些数据是否来自正态总体(取自正态总体(取=0.1=0.1)141 148132138154142150146155158150140147 148144150149145149158143141144144126 140144142141140145135147146141136140 146142137148154137139143140131143141 149148135148152143144141143147146150 132142142143153149146149138142149142 137134144146147140142140137152145
17、http:/ 为粗略了解数据的分布情况,先画出直方图。为粗略了解数据的分布情况,先画出直方图。步骤如下:步骤如下:1.找出数据的最小值、最大值为找出数据的最小值、最大值为126、158,取区,取区间间124.5, 159.5,它能覆盖它能覆盖126, 158;2.将区间将区间124.5, 159.5等分为等分为7个小区间个小区间,小区间的小区间的长度长度=(159.5-124.5)/7=5, =(159.5-124.5)/7=5, 称为组距,小区称为组距,小区间的端点称为组限,建立下表:间的端点称为组限,建立下表:组组 限限频数频数 fi频频率 fi /n累计频计频率124.5-129.512
18、9.5-134.5134.5-139.5139.5-144.5144.5-149.5149.5-154.5154.5-159.514103324930.01190.04760.11910.39290.28570.10710.03570.01190.05950.17860.57150.85720.95241http:/ /(n)为高的小矩为高的小矩形形 如下图,即为直方图。如下图,即为直方图。注:注:直方图的小区间可以不等长,但小区间的长直方图的小区间可以不等长,但小区间的长度不能太大,否则平均化作用突出,淹没了密度度不能太大,否则平均化作用突出,淹没了密度的细节部分;也不能太小,否则受随机化影
19、响太的细节部分;也不能太小,否则受随机化影响太大,产生极不规则的形状。大,产生极不规则的形状。http:/ - )-201:( ),-2xhxf xex 的概率密度为22022( -143.8)-2 6143.8,6.0 ,1( ),-26xhxf xex 2中, 未知,先求出其极大似然估计分别为此时 的概率密度的估计为http:/ x129.5129.5x134.5134.5x139.5139.5x144.5144.5x149.5149.5x154.5154.500870.05190.17520.31200.28110.13360.03750.734.3614.72
20、26.2123.6941.5524.4010.02=87.67iaifipinp2iifnp2a3a4a5a6a7a1a14.3714.375 5. .0 09 94.91287.67-843.67220.10.1( - -1)(2)4.6053.67k r故在水平0.1下接受h0,认为数据来自正态总体。http:/ 如果根据所给的样本值如果根据所给的样本值 x1,x2, ,xn算得算得统计量统计量 的实测值落入拒绝域,则拒绝原假的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设设,否则就认为差异不显著而接受原假设.2 据pearson定理,分布拟合检
21、验的拒绝域为:) 1(22k ) 1(22rk (不需估计参数)(估计r 个参数) 注意:注意: 皮尔逊定理是在皮尔逊定理是在n无限增大时推导无限增大时推导出来的,因而在使用时要注意出来的,因而在使用时要注意n要足够大要足够大,以及以及npi ( )不太小不太小这两个条件这两个条件.inphttp:/ 2()()()()xexe xxe xed xd x定义:随机变量 的偏度:,4422()()()()exe xxe xed xd x峰度:,212( ,),0,3.xn 当时http:/ 的样本,()是样本 阶中心矩34123 22221212.,bbggbbg g 定义:样本偏度:,样本峰度
22、:则分别是的矩估计。2122( ,)6(2)0,(1)(3)624 (2)(3)3,.1 (1) (3)(5)xnnngnnnn nngnnnnn 若总体,则可证当 充分大时,近似有http:/ ,(1)(3)624 (2)(3)30,1 .1(1) (3)(5)nxxxhnnugnnnn nnugnnnnn设是总体 的样本,当为真时,对于充分大的 ,近似有1122ukuk检验的拒绝域为:或。1424uzuz于是对给定显著性水平 ,检验的拒绝域为:或。000001424142422hhhp hhpuzuzpuzpuz此时,为真拒绝http:/ 试用偏度、峰度检验法检验例3中的数据是否来自正态总
23、体(取=0.1)0:h解:检验假设数据来自正态总体.12226(2)0.1,84,0.2579,(1)(3)624 (2)(3)32.9294,0.4892.1(1) (3)(5)nnnnn nnnnnn这里2341235.2246,28.5,3840.0.1363,3.0948.bbbgg 样本偏度、样本峰度的观察值为:40.02511122221.96,1.96,1.96.zzugug查表得因此检验拒绝域为:或1200.52851.96,0.3381 1.96.,uuh计算得故接受认为数据来自正态总体。http:/ 秩和检验检验随机化模型随机化模型 设某问题涉及两种不同的处理方法设某问题涉
24、及两种不同的处理方法 (如两种治疗某疾病的方法,两种炼钢方法,两种加如两种治疗某疾病的方法,两种炼钢方法,两种加工某产品的方法,等等),工某产品的方法,等等), 为比较这两种方法的优劣,设有为比较这两种方法的优劣,设有n=n1+n2个可供试个可供试验的个体,验的个体, 其中随机取其中随机取n1个接受一种处理方法,其余个接受一种处理方法,其余n2个接受个接受另一种方法的试验。另一种方法的试验。 两种处理方法比较的随机化两种处理方法比较的随机化模型。模型。http:/ 通常设一种方法为“新方法”,另一方法为“对照方法”,在很多情况下,对照方法即原标准方法,新方法是原方法的改进,我们在实验前已认为新
25、方法不会比对照方法差。于是,需要检验假设01:hh两种方法处理效果无显著差异,新方法优于对照方法。12211221( )( ),( )( - ),-f xfxfxf x aa设两连续总体的概率密度分别为,两总体的均值存在,分别记为 ,。 012112012112:,:,:.hhhh则检验问题相当于;或012112:,:.hhhttp:/ )( )( ).1,2,., .niixxxxixin,称的足标 为的,秩秩秩 将一总体的容量为n的样本观测值按自小到大的次序编号排列成12121212,.,.,nnx yn nx xxy yy设两总体的容量分别为的样本为,12(1)(2)().nnzzz将它
26、们合起来并从小到大排序为,1212121212,1()(1)2xr yrrrrrnnnn其中 的样本值秩和记为的样本值秩和记为,则 ,为离散型变量,。11111211(1)(21)22n nn nnrhttp:/ 01122ulhrcrc在给定 下,的拒绝域为,或 0122201222uaulalcprccprc其中是满足的最大整数,是满足的最小整数。 0112201012222,aulaualprcor rcprcprc则犯第i类错误概率。 1222,ulccn n,的值在取210之间时由附表8给出。http:/ 22例如,。12123434时时值值的的确确定定uln = ,n =cc秩秩
27、r1秩秩 r1秩秩 r1秩秩 r1秩秩 r1123 6124 7125 8126 9127 10134 8135 9136 10137 11145 10146 11147 12156 12157 13167 14234 9235 10236 11237 12245 11246 12247 13256 13257 14267 15345 12346 13347 14356 14357 15367 16456 15457 16467 17567 18r1 6 7 8 9 10 11 12 13 14 15 16 17 1835pk 1 1 2 3 4 4 5 4 4 3 2 1 1 0.170.1
28、17;0.1580.116.,ululcccc http:/ 设第1,2总体分别为新旧方法的排名(秩)012112:,:hh则检验问题相当于;1215,0.05,0.053636.lnncr查附表 ,即拒绝域为 13579 103436r 题目中的第一张表,新方法的秩和即不能认为新方法显著提高了教学效果;14679 1036r 题目中的第二张表,新方法的秩和可以认为新方法显著提高了教学效果。http:/ nnd rn n nn 0可以证明,当h 为真时,111121211,10(,),rrrrn nrnrz0当,h 为真时,近似地有此时将作为检验统计量,就有0121122012112012112:,:.:,:.:,:.hhzzhhzzhhzz 近似拒绝域为近似拒绝域为近似拒绝域为http:/ 某商店为了确定向公司某商店为了确定向公司a或公司或公司b购买某种商品,将购买某种商品,将a,b公司以往各次进货的次品率进行比较,数据如下,设两样本公司以往各次进货的次品率进行比较,数据如下,设两样本独立。问两公司的商品的质量有无显著差异。设两公司的商独立。问两公司的商品的质量有无显著差异。设两公司的商品的次品率的密度至多只差一个平移。(取品的次品率的密度至多只差一个平移。(取=0.05=0.05)a 7.0 3.5 9.6 8.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 道路测量外包合同范本
- 民间私人抵押合同范本
- 装修材料回收协议合同
- 过桥公司股东合同范本
- 道路施工甲供合同范本
- 配送承包协议合同范本
- 车辆外借协议签订合同
- 物品闲置托管合同范本
- 租车信息服务合同范本
- 甲方版权授权合同范本
- 《测绘基础》课件(共八个任务)
- 物业轮岗活动方案
- 医院医疗服务培训
- 中国大麻酚油(CBD油)行业发展监测及投资战略研究报告
- 《工业机器人技术与应用》高职人工智能技术应用专业全套教学课件
- 中医院依法执业管理制度
- 广西b证继续教育考试试题及答案
- JG/T 463-2014建筑装饰用人造石英石板
- DB32/T 3946-2020平原水网地区闸控航道通航标准
- 2025年初级银行从业资格之初级个人理财考试题库
- 2025-2030年中国核子及核辐射测量仪器行业竞争格局及发展趋势分析报告
评论
0/150
提交评论