第21讲《概率论与数理统计》_第1页
第21讲《概率论与数理统计》_第2页
第21讲《概率论与数理统计》_第3页
第21讲《概率论与数理统计》_第4页
第21讲《概率论与数理统计》_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 概率论与数理统计概率论与数理统计第二十一讲第二十一讲主讲教师:李俊海主讲教师:李俊海河南工业大学理学院河南工业大学理学院 利用样本方差利用样本方差 S S 2 2是是 2的一个无偏估计,的一个无偏估计,且且 (n- -1)S2/ 2 2n- -1 的结论。的结论。8.3.1 单个正态总体方差的单个正态总体方差的 2 检验检验 设设 X1, X2, , Xn 为来自总体为来自总体 N( , 2) 的样的样本,本, 和和 2 2未知,求下列假设的显著性水平为未知,求下列假设的显著性水平为 的检验。的检验。思路分析思路分析: 1. H0: 2 = 02;H1: 2 02 8.3 正态总体方差的检验

2、正态总体方差的检验 当原假设当原假设 H0: 2 = 02成立时,成立时,S2 2和和 0 02 2应应该比较接近,即比值该比较接近,即比值 S S 2 2/ / 0 02 2应接近于应接近于1 1。所以。所以, ,这个比值过大或过小这个比值过大或过小 时,应拒绝原假设。时,应拒绝原假设。 合理的做法是合理的做法是: 找两个合适的界限找两个合适的界限 c1 和和 c2 , 当当 c1(n- -1)S2/ 02 02 同理,当同理,当 H0: 2 = 02成立时,有,成立时,有, . )1( 212020nSnH 的的拒拒绝绝域域为为所所以以,. )() 1(21202nSnP此检验法也称此检验

3、法也称 2 2 检验法检验法。3*. H0: 2 02;H1: 2 02 (同同2.)例例1:某公司生产的发动机部件的直径某公司生产的发动机部件的直径 (单位单位: cm) 服从正态分布,并称其标准差服从正态分布,并称其标准差 0=0.048 。现随机抽取现随机抽取5个部件,测得它们的直径为个部件,测得它们的直径为 1.32, 1.55, 1.36, 1.40, 1.44.取取 =0.05,问,问:(1). 能否认为该公司生产的发动机部件的直径能否认为该公司生产的发动机部件的直径 的标准差确实为的标准差确实为 = 0?(2). 能否认为能否认为 0?解解: (1). 的问题就是检验的问题就是检

4、验 H0: 2 = 02; H1: 2 02.其中,其中,n=5, =0.05, 0=0.048.故,故,拒绝原假设拒绝原假设 H0 ,即认为部件直径标准即认为部件直径标准差不是差不是 0.048 cm。 经计算,得经计算,得 S2=0.00778,. 0.484)0.975()2/1 ( 11.143)0.025()2/( 242124212nn,分分布布表表,得得查查. 11.14351.13048. 000778. 0) 1(51)( 2202Sn算算得得故,故,拒绝原假设拒绝原假设 H0,即认为部件的直径标准即认为部件的直径标准差超过了差超过了 0.048 cm。 (2). 的问题是检

5、验的问题是检验 H0: 2 02 ; H1: 2 02.,分分布布表表,得得查查 488. 9)0.05()( 24212n. 9.48851.131)( 202Sn而而 该检验主要用于上节中实施两该检验主要用于上节中实施两样本样本 t 检检验之前,讨论验之前,讨论 1 12 2 = = 2 22 2 的的假设是否合理。假设是否合理。8.3.2 两正态总体方差比的两正态总体方差比的 F 检验检验1. H0: 12 = 22;H1: 12 22. 设设X1, X2, , Xm和和Y1, Y2, , Yn 分别为抽自分别为抽自正态总体正态总体 N( 1, 12)和和 N( 2, 22)的样本的样本

6、, 欲检验欲检验 当当 H0: 12= 22 成立时成立时, 12/ 22=1, 作为其作为其估计,估计,S12/S22也应与也应与 1 相差不大。相差不大。当当该值过分该值过分地大或过分地小时,都应拒绝原假设成立。地大或过分地小时,都应拒绝原假设成立。 合理的思路是:找两个界限合理的思路是:找两个界限c1和和c2, 当当 c1 S12/S22 22 同理,当同理,当 H0: 12 = 22成立时,有成立时,有 S12/S22 Fm- -1, n- -1, . )(1 1,2221nmFSSP . 1, 122210nmFSSH 的拒绝域为的拒绝域为所以,所以,例例2:甲乙两厂生产同一种电阻,

7、现从甲乙两甲乙两厂生产同一种电阻,现从甲乙两厂的产品中分别随机地抽取厂的产品中分别随机地抽取1212个和个和1010个样品个样品, ,测得它们的电阻值后,测得它们的电阻值后,计算出样本方差分别计算出样本方差分别为为S12=1.40,S22=4.38。3. H0: 12 22;H1: 12 22结论同结论同 2 2。 以上检验都用到了以上检验都用到了F分布,因此称上述检分布,因此称上述检验为验为 F 检验检验。 假设两厂生产的电阻假设两厂生产的电阻的电阻的阻值分别服从正态分布的电阻的阻值分别服从正态分布 N( 1, 12)和和 N( 2, 22)。在显著性水平在显著性水平 = 0.10下下, ,

8、 是否可接受:是否可接受: (l).(l). 1 12 2 = = 2 22 2;(2).(2). 1 12 2 2 22 2. . 解:解:(1). 的问题是检验的问题是检验 H0: 12 = 22;H1: 12 22.其中,其中,m=12, n=10, =0.10, S12=1.40, S22=4.38, S12/S22 =0.32。利用第六章学过的利用第六章学过的 )2/(1)2/1 (1 1,1 1,mnnmFF及及P237的附表的附表5,有,有 Fm- -1, n- -1(1- - /2) = F11, 9(0.95) = 1/F9, 11(0.05) = 1/(2.90) = 0.

9、34.因因 S12/S22 = 0.32 0.34,所以,所以,无须再考虑无须再考虑Fm- -1, n- -1( /2)的值,就可得到拒绝的值,就可得到拒绝 12 = 22的的结论。结论。 查查P237 附表附表5,因,因查不到查不到 F11, 9(0.10),改,改用用F10, 9(0.10)和和F12, 9(0.10)的平均值近似之,得的平均值近似之,得 F11, 9(0.10)=F10, 9(0.10)+F12, 9(0.10)/2 2.42+2.38/2 = 2.40.因因 S12/S22 = 0.32 22. . 110 1122221,检检验验的的拒拒绝绝域域为为FSS 在前面的讨

10、论中,我们总假定总体的分在前面的讨论中,我们总假定总体的分布形式是已知的。例如,假设总体分布为正布形式是已知的。例如,假设总体分布为正态分布态分布 N( , 2), 总体分布为区间总体分布为区间 (a, b) 上的上的均匀分布,等等。均匀分布,等等。 然而,在实际问题中,然而,在实际问题中,我们所遇到的总我们所遇到的总体服从何种分布往往并不知道体服从何种分布往往并不知道。需要我们先。需要我们先对总体的分布形式提出假设,如:总体分布对总体的分布形式提出假设,如:总体分布是正态分布是正态分布N( , 2),总体分布是区间总体分布是区间(a, b)上均匀分布等,然后利用数据上均匀分布等,然后利用数据

11、 (样本样本) 对这一对这一假设进行检验,看能否获得通过。假设进行检验,看能否获得通过。8.4 拟合优度检拟合优度检验验 这是一项非常重要的工作这是一项非常重要的工作,许多学者视它为近代统计学的许多学者视它为近代统计学的开端。开端。 解决这类问题的方法最早由英国统计学解决这类问题的方法最早由英国统计学家家 K. Pearson (皮尔逊皮尔逊) 于于1900年在他发表的年在他发表的一篇文章中给出一篇文章中给出, 该方法后被称为该方法后被称为 Pearson 2检验法,简称检验法,简称 2检验检验。 设设F(x)为一已知的分布函数,现有样本为一已知的分布函数,现有样本X1, X2, , Xn,但

12、我们并不知道样本的总体但我们并不知道样本的总体 分分布是什么。现在试图检验布是什么。现在试图检验 H0:总体总体 X 的分布函数为的分布函数为F(x) ; (1) 对立假设为对立假设为 H1:总体:总体 X 的分布函数非的分布函数非F(x)。如果如果 F(x) 形式已知,但含有未知参数形式已知,但含有未知参数 或参或参数向量数向量 =(1, 2, r ) ,则记其为,则记其为F(x, )。这种检验通常称为这种检验通常称为拟合优度检验拟合优度检验。 不妨设总体不妨设总体 X 是连续型分布。检验思想是连续型分布。检验思想与步骤如下与步骤如下:(1). 将总体将总体 X 的取值范围分成的取值范围分成

13、 k 个互不重叠的个互不重叠的 小区间小区间 I1, I2, , Ik,. ( ( (12101212101kkkkkaaaaaaaIaaIaaI,(2). 计算各子区间计算各子区间 Ii 上的理论频数。上的理论频数。如果总体的分布函数为如果总体的分布函数为F(x, ),那么每个,那么每个点落在区间点落在区间 Ii 上的概率均为上的概率均为,k.,iaFaFpiii21 ),(),()(1)(inpn 个点中,个点中,理论上理论上有有n pi ( )个点落在个点落在 Ii 上上, (称为理论频数称为理论频数)。当分布函数中含有未知。当分布函数中含有未知参数参数 时,理论频数也未知,要用时,理论

14、频数也未知,要用来估计来估计 n pi ( ),其中,其中 为为 的极大似然估。的极大似然估。(3). 计算各子区间计算各子区间 Ii 上的实际频数上的实际频数 fi 。 fi = X1, X2, , Xn Ii , i=1, 2, , k . 计数符号,取集计数符号,取集合中元素的个数合中元素的个数)2( )()(122,kiiiinpnpf(4). 计算理论频数与实际频数的偏差平方和。计算理论频数与实际频数的偏差平方和。可以证明:在可以证明:在 H0 成立,且成立,且 n时时, 和和式式中中的的影影响响力力。频频数数比比较较大大的的那那些些项项在在理理论论去去除除的的其其目目的的是是:缩缩

15、小小每每一一项项用用 )( inp)3( 212,k-r- 1 22是是参参数数个个数数。是是子子区区间间数数,分分布布,的的由由度度为为统统计计量量的的分分布布收收敛敛到到自自即即rkrk(5). H0 的显著性水平为的显著性水平为 的检验的拒绝域为的检验的拒绝域为)4( )( 212,k-r- 注意注意:该检验方法是在:该检验方法是在 n 充分大时使用充分大时使用的,因而,使用时要注意的,因而,使用时要注意 n 必须足够地大必须足够地大, 以及以及 npi 不能太小不能太小这两个条件。这两个条件。 在实用上,在实用上,一般要求一般要求 n 50,以及所有以及所有npi 5。如果初始子区间划

16、分不满足后一个如果初始子区间划分不满足后一个条件条件, 则适当地将某些子区间合并,可使则适当地将某些子区间合并,可使 npi 满足上述要求。满足上述要求。例例1:为检验棉纱的拉力强度为检验棉纱的拉力强度 X (单位单位: 千克千克) 服服从正态分布,从一批棉纱中随机抽取从正态分布,从一批棉纱中随机抽取300条进条进行拉力试验,结果列在表行拉力试验,结果列在表8.2中。给定中。给定 = 0.01,检验假设检验假设 H0:拉力强度:拉力强度 X N(, 2) .解:解:本例中,并未给出各观测值本例中,并未给出各观测值 Xi 的具体值的具体值,只给出了各观测值的取值范围,这样的数据只给出了各观测值的

17、取值范围,这样的数据称为区间数据。称为区间数据。样本均值样本均值与与样本方差样本方差可通过可通过下列式计算:下列式计算:. 211 21 1221211kiiiikiiiiXnaannSaannX,.26. 01 41. 1 ),( 22222SnnXN,为为极极大大似似然然估估计计的的和和,对对正正态态总总体体 (1). 先将数据先将数据 Xi 分成分成13组,每组落入一个区组,每组落入一个区 间,区间的端点为:间,区间的端点为: . 18. 2 78. 0 64. 0 1312210aaaaa,(2). 计算数据落入各子区间的理论频数。计算数据落入各子区间的理论频数。因分布中含有两个未知参

18、数,所以,理论因分布中含有两个未知参数,所以,理论频数只能近似地估计。落入第频数只能近似地估计。落入第 i 个子区间个子区间Ii 的理论频数的估计为的理论频数的估计为 , 其中其中 .13 2 1 26. 041. 126. 041. 1) ( 12 ,iaappiiiiipn,因因0.46 1.85 1.85 0.46 131221pnpnpnpn。见见表表最最后后两两组组合合并并成成一一组组我我们们将将前前两两组组和和所所以以,均均大大于于,而而8.3)( 5 113pnpn(3). 计算数据落入各子区间上的实际频数计算数据落入各子区间上的实际频数 fi 。 fi = X1, X2, ,

19、Xn Ii , i=1, 2, , 10 . .15.22 122kiiiipnpnf(4). 计算检验统计量的值计算检验统计量的值因为因为 k =10,r =2,所以上述,所以上述 2分布的自分布的自由度为由度为 k- -r- -1=7。由由.48.18)(15.22212rk(5). H0 的显著性水平为的显著性水平为 的检验的检验 于是,拒绝原假设,即认为棉纱拉力强于是,拒绝原假设,即认为棉纱拉力强度不服从正态分布。度不服从正态分布。 孟德尔在关于遗传问题的研孟德尔在关于遗传问题的研究中,用豌豆做实验。豌豆有黄究中,用豌豆做实验。豌豆有黄和绿两种颜色,在对它们进行两和绿两种颜色,在对它们

20、进行两代杂交之后,发现一部分杂交豌代杂交之后,发现一部分杂交豌豆呈黄色,另一部分呈绿色。其豆呈黄色,另一部分呈绿色。其数目的比例大致是数目的比例大致是 3:1。 2检验的一个著名应用例子是孟德尔豌豆检验的一个著名应用例子是孟德尔豌豆实验。奥地利生物学家孟德尔在实验。奥地利生物学家孟德尔在1865年发表的年发表的论文,事实上提出了基因学说,奠定了现代遗论文,事实上提出了基因学说,奠定了现代遗传学的基础。他的这项伟大发现的过程有力地传学的基础。他的这项伟大发现的过程有力地证明了统计方法在科学研究中的作用。因此,证明了统计方法在科学研究中的作用。因此,我们有必要在这里将这一情况介绍给大家。我们有必要

21、在这里将这一情况介绍给大家。 这只是一个表面上的统计规律。但它启这只是一个表面上的统计规律。但它启发孟德尔去发展一种理论,以解释这种现象。发孟德尔去发展一种理论,以解释这种现象。他大胆地假定存在一种实体,即现在我们称他大胆地假定存在一种实体,即现在我们称为为“基因基因”的东西,决定了豌豆的颜色。这的东西,决定了豌豆的颜色。这基因有黄绿两个状态,一共有四种组合:基因有黄绿两个状态,一共有四种组合: 孟德尔把他的实验重复了多次,每次都孟德尔把他的实验重复了多次,每次都得到类似结果。得到类似结果。(黄黄, 黄黄),(黄黄, 绿绿),(绿绿, 黄黄),(绿绿, 绿绿). (黄黄, 黄黄),(黄黄, 绿

22、绿),(绿绿, 黄黄),(绿绿, 绿绿). 孟德尔认为孟德尔认为, 前三种配合使豆子呈黄色前三种配合使豆子呈黄色,而第四种配合使豆子呈绿色。从古典概率的而第四种配合使豆子呈绿色。从古典概率的观点看,黄色豆子出现的概率为观点看,黄色豆子出现的概率为3/4,绿色豆,绿色豆子出现的概率为子出现的概率为1/4。这就解释了黄绿颜色豆。这就解释了黄绿颜色豆子之比为什么总是接近子之比为什么总是接近 3:1 这个观察结果。这个观察结果。 孟德尔这个发现的深远意义是他开辟了孟德尔这个发现的深远意义是他开辟了遗传学研究的新纪元。下面的例子就是用遗传学研究的新纪元。下面的例子就是用 2检验来检验孟德尔提出黄绿颜色豌

23、豆数目之检验来检验孟德尔提出黄绿颜色豌豆数目之比为比为 3:1的论断。的论断。例例2:孟德尔豌豆试验中,发现黄色豌豆为孟德尔豌豆试验中,发现黄色豌豆为25粒粒, 绿色豌豆绿色豌豆11粒,试在粒,试在 =0.05下下, 检验豌豆检验豌豆黄绿之比为黄绿之比为3:1。解:解:定义随机变量定义随机变量 X. , 0, 1豌豌豆豆为为绿绿色色豌豌豆豆为为黄黄色色,X我们要检验我们要检验,记记 . 01 21XPpXPp . 4/14/3 210ppH,:(1). 将将 (- -, ) 分成两个区间分成两个区间 . 0.5 ( ) 0.5(21,II(2). 计算每个区间上的理论频数,这里计算每个区间上的

24、理论频数,这里 n = 25+11=36, 不存在要估计的未知参数不存在要估计的未知参数, 故故 . 94)/1 (36 274)/3(3621npnp,(3). 实际频数为,实际频数为,f1=25, f2=11 .(4). 计算统计量的值计算统计量的值.592. 0 9)911(27)2725( 222122iiiinpnpf.841. 3)05. 0()( 0.592 0.05 2 21212k-k,因因为为(5). H0 的显著性水平为的显著性水平为 的检验的检验 所以,接受原假设,即认为豌豆的黄绿所以,接受原假设,即认为豌豆的黄绿之比为之比为 3:1 。例例3:某医院一年中出生的婴儿共计某医院一年中出生的婴儿共计1521人人,其中男婴其中男婴802人,女婴人,女婴719人。给定人。给定 =0.05,试问:能否认为男婴、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论