第五章 统计推断_第1页
第五章 统计推断_第2页
第五章 统计推断_第3页
第五章 统计推断_第4页
第五章 统计推断_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 统计推断 统计推断是根据总体理论分布,从样本的统计量对总体参数的推断。主要包括假设检验 ( test of hypothesis) 和参数估计(parametric estimation)二个内容。 统计推断的目的是分析误差产生的原因,确定误差的性质,排除误差的干扰,从而对总体的特征做出正确的判断。5.1 假设检验的原理和方法一、假设检验的概念: (见P30)。假 设 检 验 又叫 显著性 检验 (test of significance)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程.逻辑上运用反证法,统计上依据小概率原理.有参数检验和非参数检验.

2、生物统计学中,一般认为等于或小于0.05或0.01的概率为小概率。分别表示为差异显著或极显著。 二、假设检验的步骤 (一)、提出假设 1、原假设(null hypothesis) 无效假设(ineffective hypothesis) 研究者想收集证据予以反对的假设,又称“0假设”。原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等。试验结果的差异由误差所致。 表示为 H0H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm 研究者想收集证据予以支持的假设 也称“研究假设” 总是有符号 , 或 表示为 H1H1 : 某一数值,或 某一数值例如, H1 : 临界值

3、,拒绝H0左侧检验:统计量 临界值,拒绝H0(P值)若p值, 拒绝 H0 显著性水平和拒绝域(双侧检验 ) 显著性水平和拒绝域(单侧检验 )有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据一些证据”不利于原假设;5%代表有“适度证据适度证据”不利于原假设;1%代表有

4、“很强证据很强证据”不利于原假设三、双尾检验与单尾检验(假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0 0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : : 0 0H1 : : 0 0四、假设检验中的两类错误两类错误的控制 一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率 (1) 在样本容量n固定的条件下,提高显著水平(取较小的值),如从5%变为1%则将增大第二类错误的概率值。 (2) 在

5、n和显著水平相同的条件下,真总体平均数和假设平均数的相差(以标准误为单位)愈大,则犯第二类错误的概率值愈小。 (3) 为了降低犯两类错误的概率,需采用一个较低的显著水平,如=0.05;同时适当增加样本容量,或适当减小总体方差,或两者兼有之。 (4) 如果显著水平已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。因此,不良的试验设计(如观察值太少等)和粗放的试验技术,是使试验不能获得正确结论的极重要原因。因为在这样的情况下,容易接受任一个假设,而不论这假设是正确的或错误的。 错误和 错误的关系(“接受接受”与与“不拒绝不拒绝”)假设检验的目的在于试图找到证据拒绝原假设,而

6、不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受接受原假设原假设”的表述,而采用“不拒绝原假设不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确(“显著显著”与与“不显著不显著”) 【例】比如原假设为H0: =10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原

7、假设,这意味着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0: =10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道5.2样本平均数的假设检验 一、大样本平均数的检验 (一)、一个样本平均数 假定条件 正态总体或非正态总体大样本(n30) 使用z检验统计量 2 已知:2. 2 未知)1 ,0(0Nnxz)1 , 0(0Nnsxz01. 14052558 .2550nxz50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.0

8、61.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.866061. 250365749. 035. 13152. 1z75.33612052005275z (二)、两个样本体均值之差的检验 (独立大样本)1.假定条件 两个样本是独立的随机样本 正态总体或非正态总体大样本(n130和 n230) 检验统计量 12 ,

9、22 已知: 12 , 22 未知:) 1 , 0()()(2221212121Nnnxxz)1 , 0()()(2221212121Nnsnsxxz 两个样本的有关数据两个样本的有关数据 男性职员男性职员女性职员女性职员n1=44n1=32 =75 =70S12=64 S22=42.25002. 33225.4244647075z两个样本体均值之差的检验 (独立大样本) 二、小样本平均数的检验 (一)、一个样本平均数的t检验 1. 假定条件 总体服从正态分布 小样本(n 30) 检验统计量 2 已知:2. 2 未知:) 1 , 0(0Nnxz) 1(0ntnsxt10个零件尺寸的长度个零件尺

10、寸的长度 (cm)12.210.812.011.811.912.411.312.212.012.37035.0104932.01289.11tP57例例4.5(二)、成组数据平均数比较的t检验两个总体均值之差的检验( 12, 22 已知)假定条件 两个独立的小样本 两个总体都是正态分布 12, 22已知检验统计量)1 ,0()()(2221212121Nnnxxz两个总体均值之差的检验 (12,22 未知但12=22)21212111)()(nnsxxtp2) 1() 1(212222112nnsnsnsp221nn2221212121)()(nsnsxxt112222212121222212

11、1nnsnnsnsnsv(三)、成对数据平均数比较的t检验)1(0ntnsddtdddniindd11)(12dniidndds观察序号观察序号样本样本1样本样本2差值差值1x11x21d1 = x11 - x212x12x22d2 = x12 - x22M MM MM MM Mix1ix2idi = x1i - x2iM MM MM MM Mnx1nx2ndn = x1n- x2n(匹配样本检验方法的总结)两个总体均值检验方法总结5.3样本频率的假设检验 许多生物试验的结果是用百分数或成数表示的,如结实率、发芽率、杀虫率、病株率以及杂种后代分离比例均为不同类型的百分率。这些百分数系由计数某一

12、属性的个体数目求得,属间断性的计数资料,它与上述连续性的测量资料不相同。在理论上,这类百分数的假设测验应按二项分布进行,即从二项式的展开式中求出某项属性个体百分数的概率(略)。 如样本容量n 较大,p不过小,而np和nq又均不小于5时,的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作出近似的测验。适于用u测验所需的二项样本容量n见表。 表 适于用正态离差测验的二项样本的np和n值表(样本百分数)(较小组次数)n(样本容量)0.5015300.4020500.3024800.20402000.10606000.05701400 一、单个样本频率(百分数)的假设测验 np或nq5,则由

13、二项式 展开式直接检验。 5 np或nq30时,二项式分布趋近正态,可用z检验(n 30)或t检验(n30),但需进行连续性矫正。 np、nq均大于30时,用z检验,不需进行连续性矫正。nqp)( 样本频率的标准误为: 在不需要进行连续矫正时,z值的计算公式为: 在需要进行连续矫正时, 值的计算公式为:cz例4.10,4.11 二、两个样本频率(百分数)的假设测验 np或nq5,则由二项式 展开式直接检验。 5 np或nq30时,二项式分布趋近正态,可用z检验(n 30)或t检验(n30),但需进行连续性矫正。 np、nq均大于30时,用z检验,不需进行连续性矫正。两个样本频率的标准误为:在

14、的条件下,两个样本频率的标准误为:其中 ,x1、 x2 分别代表两样本中某属性出现的次数,n1 n2 分别为两样本的容量。 在不需要进行连续矫正时,z值的计算公式为:例4.12,4.13在需要进行连续矫正时,zc值的计算公式为:5.4总体方差的检验( 2检验) (一)、一个样本)1()1(22022nsn1225. 848 . 3) 110(222总体方差的检验(检验方法的总结)(二)、两个总体方差比的检验(F 检验)1, 1()1, 1(122122212221nnFssFnnFssF或F 检验(临界值)两个总体方差比的检验(检验方法的总结)5.5 参数估计估估 计计 方方 法法点点 估估

15、计计区间估计区间估计点估计(point estimate)一、区间估计和点估计一、区间估计和点估计区间估计(interval estimate)区间估计的图示评价估计量的标准 无偏性(unbiasedness)二、总体均值的区间估计总体均值的区间估计结果的四舍五入法则)1 ,0( Nnxz)(22未知或nszxnzx(一)、一个(一)、一个 例题分析25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.

16、8101.5 98.4 93.328.109,44.10192.336.105251096.136.1052nzx36.105x36个投保人年龄的数据个投保人年龄的数据 23353927364436424643313342534554472434283936444039493834485034394548453263.41,37.3713.25 .393677.7645.15 .392nszx5 .39x77.7s)1(ntnsxtnstx2P67:例4.15 (二)、两个(二)、两个 (独立大样本)1 , 0()()(2221212121Nnnxxz (大样本)222121221)(nnzx

17、x222121221)(nsnszxxnzdd2两个总体均值之差的区间估计(独立小样本)2)1()1(212222112nnsnsnsp21221211nnsnsnsppp) 2(11)()(21212121nntnnsxxtp21221221112nnsnntxxp (例题分析)两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.55 .321x996.1521s8 .282x358

18、.1922s677.1721212358.19) 112(996.15) 112(2ps56. 37 . 3121121677.170739. 2)8 .285 .32( 两个总体均值之差的估计(小样本: 12 22 )()()(2221212121vtnsnsxxt1222221121212222121nnsnnsnsnsv222121221)(nsnsvtxx (例题分析)两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.25 .321x996.1521s875.272x014.2322s13188.13188014.2311212996.158014.2312996.15222v433. 4625. 48014.2312996.151604. 2)875.275 .32(两个总体均值之差的估计(匹配小样本)nsntdd)1(2 (例题分析) 10名学生两套试卷的得分名学生两套试卷的得分 学生编学生编号号试卷试卷A试卷试卷B差值差值d178717263441937261

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论