拟合优度检验_第1页
拟合优度检验_第2页
拟合优度检验_第3页
拟合优度检验_第4页
拟合优度检验_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、欧阳顺湘 2005.6.25北京师范大学珠海分校 检验 Chi-Squared TestGoodness-of-fit Test 拟合优度检验拟合优度检验&Test of Row and Column Independenc 独立性检验独立性检验2 欧阳顺湘 2005.6.25北京师范大学珠海分校2分布 (图示) 欧阳顺湘 2005.6.25北京师范大学珠海分校样本方差的分布) 1() 1(222nsn22) 1(sn 欧阳顺湘 2005.6.25北京师范大学珠海分校由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875

2、年和1900年推导出来设 ,则令 ,则 Y 服从自由度为1的2分布,即 当总体 ,从中抽取容量为n的样本,则2分布 (2 distribution),(2NX) 1 , 0( NXz2zY ) 1 (2Y),(2NX) 1()(2212nxxnii欧阳顺湘 2005.6.25北京师范大学珠海分校分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自由度) 可加性:若U和V为两个独立的2分布随机变量,U2(n1), V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布 2分布

3、 (性质和特点)欧阳顺湘 2005.6.25北京师范大学珠海分校2分布 (图示) 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2 = (n-1)s2/2计算出所有的计算出所有的 2值值总体总体欧阳顺湘 2005.6.25北京师范大学珠海分校 前面讨论了当总体分布为正态时,关前面讨论了当总体分布为正态时,关于其中未知参数的假设检验问题于其中未知参数的假设检验问题 . 然而可能遇到这样的情形,然而可能遇到这样的情形,总体服从何总体服从何种理论分布并不知道种理论分布并不知道,要求我们直接对总体要求我们直接对总体分布提出一个假设分布提出一个假设

4、 .举例:用 Excel 演示投掷硬币的检验欧阳顺湘 2005.6.25北京师范大学珠海分校 例如,从例如,从1500到到1931年的年的432年间,每年年间,每年爆发战争的次数可以看作一个随机变量,椐统爆发战争的次数可以看作一个随机变量,椐统计,这计,这432年间共爆发了年间共爆发了299次战争,具体数据次战争,具体数据如下如下:战争次数战争次数X01234 22314248154 发生发生 X次战争的年数次战争的年数欧阳顺湘 2005.6.25北京师范大学珠海分校 在概率论中,大家对泊松分布产生的一在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战般条件已有所了解,容

5、易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似争的次数,可以用一个泊松随机变量来近似描述描述 . 也就是说,我们可以假设每年爆发战也就是说,我们可以假设每年爆发战争次数分布争次数分布X近似泊松分布近似泊松分布.上面的数据能否证实上面的数据能否证实X 具有具有泊松分布的假设是正确的?泊松分布的假设是正确的?现在的问题是:现在的问题是:欧阳顺湘 2005.6.25北京师范大学珠海分校又如,某钟表厂对生产的钟进行精确性检又如,某钟表厂对生产的钟进行精确性检查,抽取查,抽取100个钟作试验,拨准后隔个钟作试验,拨准后隔24小时小时以后进行检查,将每个钟的误差(快或慢)以后进行检查,将每个钟的

6、误差(快或慢)按秒记录下来按秒记录下来.问该厂生产的钟的误差是否服从正态问该厂生产的钟的误差是否服从正态分布?分布?欧阳顺湘 2005.6.25北京师范大学珠海分校再如,某工厂制造一批骰子,再如,某工厂制造一批骰子,声称它是均匀的声称它是均匀的.为检验骰子是否均匀,要把骰子实地投掷为检验骰子是否均匀,要把骰子实地投掷若干次,统计各点出现的频率与若干次,统计各点出现的频率与1/6的差距的差距.也就是说,在投掷中,出也就是说,在投掷中,出现现1点,点,2点,点,6点的概点的概率都应是率都应是1/6.得到的数据能否说明得到的数据能否说明“骰子均匀骰子均匀”的假设是可信的?的假设是可信的?问题是:问题

7、是:欧阳顺湘 2005.6.25北京师范大学珠海分校K.皮尔逊皮尔逊这是一项很重要的工作,不少人这是一项很重要的工作,不少人把它视为近代统计学的开端把它视为近代统计学的开端. 解决这类问题的工具是英国统计学家解决这类问题的工具是英国统计学家K.皮尔逊在皮尔逊在1900年发表的一篇文章中引进年发表的一篇文章中引进的所谓的所谓 检验法检验法.2 欧阳顺湘 2005.6.25北京师范大学珠海分校 检验法检验法是在总体是在总体X 的分布未知时,的分布未知时,根据来自总体的样本,检验关于总体分根据来自总体的样本,检验关于总体分布的假设的一种检验方法布的假设的一种检验方法. 2欧阳顺湘 2005.6.25

8、北京师范大学珠海分校 H0:总体:总体X的分布函数为的分布函数为F0(x) 然后根据样本的经验分布和所假设的理论分然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设布之间的吻合程度来决定是否接受原假设. 使用使用 对总体分布进行检验时,对总体分布进行检验时,我们先提出原假设我们先提出原假设:2检验法检验法这种检验通常称作这种检验通常称作拟合优度检验拟合优度检验,它是一,它是一种非参数检验种非参数检验.欧阳顺湘 2005.6.25北京师范大学珠海分校 在用在用 检验假设检验假设H0时,若在时,若在H0下下分布类型已知,但其参数未知,这时需要先分布类型已知,但其参数未知,这

9、时需要先估计参数,然后作检验估计参数,然后作检验. 2检验法检验法分布拟合的分布拟合的 的基本原理和步的基本原理和步骤如下骤如下:2检验法检验法欧阳顺湘 2005.6.25北京师范大学珠海分校3.根据所假设的理论分布根据所假设的理论分布,可以算出总体可以算出总体X的的值落入每个值落入每个Ak的概率的概率pk,于是于是npk就是落入就是落入Ak的样本值的的样本值的理论频数理论频数.1. 将总体将总体X的取值范围分成的取值范围分成 r 个互不重迭的个互不重迭的小区间小区间ai-1,ai, i=1,r, 记作记作A1, A2, , Ar .2.把落入第把落入第k个小区间个小区间Ak的样本值的个数记的

10、样本值的个数记作作 nk , 称为称为实际频数实际频数. 1001()()()()kkkkkkpPAP aaF aF a欧阳顺湘 2005.6.25北京师范大学珠海分校221()rkkkknnpnpkknnp标志着经验分布与理论分布之间的差异的大小标志着经验分布与理论分布之间的差异的大小.皮尔逊引进如下统计量表示经验分布皮尔逊引进如下统计量表示经验分布与理论分布之间的差异与理论分布之间的差异:统计量统计量 的分布是什么的分布是什么?2 在理论分布在理论分布已知的条件下已知的条件下,npk是常量是常量实际频数实际频数理论频数理论频数欧阳顺湘 2005.6.25北京师范大学珠海分校皮尔逊证明了如下

11、皮尔逊证明了如下定理定理:221()rkkkknnpnp 若原假设中的理论分布若原假设中的理论分布F0(x)已经完全给已经完全给定,那么当定,那么当 时,统计量时,统计量n的分布渐近的分布渐近(r-1)个自由度的个自由度的 分布分布.2 2 n2 如果理论分布如果理论分布F0(x)中有中有m个未知参数需个未知参数需用相应的估计量来代替,那么当用相应的估计量来代替,那么当 时,时,统计量统计量 的分布渐近的分布渐近 (r-m-1) 个自由度个自由度 的的 分布分布.欧阳顺湘 2005.6.25北京师范大学珠海分校 如果根据所给的样本值如果根据所给的样本值 X1,X2, ,Xn算得算得统计量统计量

12、 的实测值落入拒绝域,则拒绝原假的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设设,否则就认为差异不显著而接受原假设.2 得拒绝域得拒绝域:22(1)r22(1)rm(不需估计参数不需估计参数)(估计估计 r 个参数个参数) )(22P查查 分布表可得临界值分布表可得临界值2 2 ,使得,使得 根据这个定理,对给定的显著性水平根据这个定理,对给定的显著性水平 , 欧阳顺湘 2005.6.25北京师范大学珠海分校 皮尔逊定理是在皮尔逊定理是在n无限增大时推导出来无限增大时推导出来的,因而在使用时要注意的,因而在使用时要注意n要足够大要足够大,以及,以及npi 不太小不太小这两个

13、条件这两个条件. 根据计算实践,要求根据计算实践,要求n不小于不小于50,以及,以及npi 都不小于都不小于 5. 否则应适当合并区间,使否则应适当合并区间,使npi满足这个要求满足这个要求 .欧阳顺湘 2005.6.25北京师范大学珠海分校 让我们回到开始的一个例子,检验每让我们回到开始的一个例子,检验每年爆发战争次数分布是否服从泊松分布年爆发战争次数分布是否服从泊松分布.提出假设提出假设H0: X服从参数为服从参数为 的泊松分布的泊松分布 按参数按参数为为0.69的泊松分布,计算事件的泊松分布,计算事件X=i 的的概率概率pi ,=0.69X 将有关计算结果列表如下将有关计算结果列表如下:

14、pi的估计是的估计是,i=0,1,2,3,4!69. 069. 0iepii根据观察结果,得参数根据观察结果,得参数 的极大似然估计为的极大似然估计为 欧阳顺湘 2005.6.25北京师范大学珠海分校 因因H0所假设的理论分布中有一个未知所假设的理论分布中有一个未知参数,故自由度为参数,故自由度为4-1-1=2.x 0 1 2 3 4fi 223 142 48 15 4 0.58 0.31 0.18 0.01 0.02n 216.7 149.5 51.6 12.0 2.16 iiinpnpf2)(0.1830.376 0.251 1.623战争次数战争次数实测频数实测频数ip ip 14.16

15、2.43将将n 5的组予以合并,即将发生的组予以合并,即将发生3次及次及4次次战争的组归并为一组战争的组归并为一组.ip 欧阳顺湘 2005.6.25北京师范大学珠海分校 故认为每年发生战争的次数故认为每年发生战争的次数X服从服从参数为参数为0.69的泊松分布的泊松分布.按按 =0.05,自由度为,自由度为4-1-1=2查查 分布表得分布表得2 =5.991)2(205. 0 2 =2.435.991,由于统计量由于统计量2 的实测值的实测值未落入否定域未落入否定域.欧阳顺湘 2005.6.25北京师范大学珠海分校 奥地利生物学家孟德尔进行了长奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试

16、验达八年之久的豌豆杂交试验, 并根据并根据试验结果试验结果,运用他的数理知识运用他的数理知识, 发现了发现了遗传的基本规律遗传的基本规律. 在此,我们以遗传学上的一项伟大发现为在此,我们以遗传学上的一项伟大发现为例,说明统计方法在研究自然界和人类社会的例,说明统计方法在研究自然界和人类社会的规律性时,是起着积极的、主动的作用规律性时,是起着积极的、主动的作用.孟德尔孟德尔欧阳顺湘 2005.6.25北京师范大学珠海分校子二代子二代子一代子一代黄色纯系黄色纯系绿色纯系绿色纯系他的一组观察结果为:他的一组观察结果为:黄黄70,绿,绿27近似为近似为2.59:1,与理论值相近,与理论值相近. 根据他

17、的理论,子二代中根据他的理论,子二代中, 黄、绿之比黄、绿之比 近似为近似为3:1,欧阳顺湘 2005.6.25北京师范大学珠海分校 由于随机性,观察结果与由于随机性,观察结果与3:1总有些差总有些差距,因此有必要去考察某一大小的差异是否距,因此有必要去考察某一大小的差异是否已构成否定已构成否定3:1理论的充分根据,这就是如理论的充分根据,这就是如下的检验问题下的检验问题.这里,这里,n=70+27=97, k=2,检验孟德尔的检验孟德尔的3:1理论理论:提出假设提出假设H0: p1=3/4, p2=1/4理论频数为:理论频数为: np1=72.75, np2=24.25实测频数为实测频数为7

18、0,27.欧阳顺湘 2005.6.25北京师范大学珠海分校2 由于统计量由于统计量的实测值的实测值2122)(iiiinpnpf 统计量统计量) 1 (2 自由度为自由度为k-1=12 =0.41583.841,按按 =0.05,自由度为,自由度为1,查,查 分布表得分布表得2 =3.841) 1 (205. 0 未落入否定域未落入否定域.故认为试验结果符合故认为试验结果符合孟德尔的孟德尔的3:1理论理论.欧阳顺湘 2005.6.25北京师范大学珠海分校 这些试验及其它一些试验,都显这些试验及其它一些试验,都显 示孟德尔的示孟德尔的3: 1理论与实际是符合的理论与实际是符合的. 这本身就是这本身就是统计方法在科学中的一项统计方法在科学中的一项 重要应用重要应用.用于客观地评价理论上的某个结论是用于客观地评价理论上的某个结论是否与观察结果相符,以作为该理论是否与观察结果相符,以作为该理论是否站得住脚的印证否站得住脚的印证.欧阳顺湘 2005.6.25北京师范大学珠海分校 某地英语高考测验题共105道, 要求这些题目的难度分布为: 要求 实际值 00.3之间 0.15 9 0.30.7之间 0.70 81 0.7 1之间 0.15 15 问实测结果与难度的理想分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论