版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 假设检验,8.1 基本概念,下面,我们讨论不同于参数估计问题的另一类统计推断问题根据样本提供的信息,检验总体的某个假设是否成立的问题。,这类问题称为假设检验。,假设检验,参数检验,非参数检验,总体分布已知情 形下,检验未知 参数的某个假设,总体分布未知情形 下的假设检验问题,先看一个例子。,例1:某工厂生产 10 欧姆的电阻,根据以往生产的电阻实际情况,可以认为: 电阻值 X服从正态分布 N(, 0.12)。现在随机抽取10个电阻, 测得它们的电阻值为: 9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10.0, 10.5, 10.1, 10.2. 问: 从样本看,能否
2、认为该厂生产的电阻的平均值 = 10 欧姆?, 确定总体:记 X 为该厂生产电阻的测值,则 X N(, 0.12); 明确任务:通过样本推断 “X 的均值 是否 等于10欧姆”; 假设:上面的任务是要通过样本检验“X 的 均值 =10”这一假设是否成立。,I. 如何建立检验模型,原假设的对立面是 “ X 的均值 10”,称为 “对立假设” 或 “备择假设”,记成 “ H1: 10”。把原假设和对立假设合写在一起,就是:,H0: =10; H1:10.,在数理统计中,把 “ X 的均值 =10” 这样一个待检验的假设记为 “原假设” 或 “零假设”,记成 “ H0: =10”。,II. 解决问题
3、的思路,因样本均值是 的一个很好的估计。所以,当 =10,即原假设 H0 成立时, 应比较小;,如果该值过大, 想必 H0 不成立。,于是,我们就用 的大小检验 H0 是否成立。,合理的做法应该是:找出一个界限 c,,这里的问题是:如何确定常数 c 呢?,细致地分析:,根据定理 6.4.1,有,于是,当原假设 H0:=10 成立时,有,为确定常数 c,我们考虑一个很小的正数, 如 = 0.05。当原假设 H0: =10 成立时,有,于是,我们就得到如下检验准则:,为原假设 H0 的拒绝域。,用以上检验准则处理我们的问题,,所以,接受原假设 H0:=10。,因为,当原假设是 H0: =10 成立
4、时,,所以,当 很小时,若 H0 为真(正确), 则检验统计量落入拒绝域是一小概率事件 (概率很小,为 )。前面我们曾提到:“通常认为小概率事件在一次试验中基本上不会发生”。,III. 方法原理,那么,如果小概率事件发生了,即:,发生, 就拒绝接受 H0 成立,即认为 H0不成立。,IV. 两类错误与显著性水平,当我们检验一个假设 H0 时,有可能犯以下两类错误之一:H0 是正确的,但被我们拒绝了,这就犯了“弃真”的错误,即抛弃了正确假设;H0 是不正确的,但被我们接受了,这就犯了“取伪”的错误,即采用了伪假设。,因为检验统计量总是随机的,所以,我们总是以一定的概率犯以上两类错误。,通常用 和
5、 记犯第一、第二类错误的概率,即,在检验问题中,犯“弃真”和“取伪”两类错误都总是不可避免的,并且减少犯第一类错误的概率,就会增大犯第二类错误的概率;反之亦然。,所以,犯两类错误的概率不能同时得到控制。,在统计学中,通常控制犯第一类错误的概概率。一般事先选定一个数 (01),要求犯第一类错误的概率不超过 。称 为假设检验的显著性水平,简称水平。,犯第二类错误的概率的计算超出了课程的学习范围。因此,不作讨论。,例1(续):分析该例的显著性水平。,H0: =10,,现在我们来分析一下:取上述 c 后,如果 H0 是正确的,却被我们拒绝了。这时,犯第一类错误的概率是多少呢?,可见:用该方法进行检验时
6、,犯第一类错误的概率等于 ,即显著性水平等于 。,因为当原假设 H0: =10 成立时,有,分析:,8.2 正态总体均值的假设检验,8.2.1 单正态总体 N(, 2)均值 的检验,1. 双边检验 H0: = 0;H1: 0,假设 2已知,根据上节中的例1,当原假设 H0: = 0 成立时,有,在应用上,2未知的情况是常见的。此时,和前面不同的是:常用样本方差 S2代替未知的2 。,以上检验法称作 U 检验法。,当 2未知时,根据基本定理 6.4.1 ,当原假设 H0: = 0 成立时,有,此检验法称作 t 检验法。,解:n=10, =0.05, 0=10, t10-1( /2)=t9(0.0
7、25)=2.2622,,例1(续例 8.1.1) : 假设2未知,检验,所以,接受原假设 H0: =10.,H0: =10;H1: 10.,上一段中, H0:=0 ; H1: 0 的对立假设为 H1: 0 , 该假设称为双边对立假设。,2. 单边检验 H0: =0; H1: 0,而现在要处理的对立假设为 H1: 0, 称为右边对立假设。,类似地,H0: =0; H1: 0 中的对立假设H1: 0,假设称为左边对立假设。右边对立假设和左边对立假设统称为单边对立假设,其检验为单边检验。,例如:工厂生产的某产品的数量指标服从正态分布,均值为 0 ;采用新技术或新配方后,产品质量指标还服从正态分布,但
8、均值为 。我们想了解 “是否显著地大于0”,即产品的质量指标是否显著地增加了。,如果 =0,即原假设成立,则 就,不应太大;反之,如果 过大,就认为原假设不成立。,在2已知情况下,根据定理6.4.1,知:,当原假设 成立时,,单边检验 H0: =0; H1: 0,在2未知情况下,当原假设 成立时,,例 2:某厂生产一种工业用绳,其质量指标是绳子所承受的最大拉力,假定该指标服从正态分布,且该厂原来生产的绳子指标均值 0 =15公斤,采用一种新原材料后,厂方称这种原材料提高了绳子的质量,也就是说绳子所承受的最大拉力 比15公斤增大了。 为检验该厂的结论是否真实,从其新产品中随机抽取50件,测得它们
9、所承受的最大拉力的平均值为15.8公斤,样本标准差S=0.5公斤。取显著性水平 =0.01。问从这些样本看:能否接受厂方的结论。,解:问题归结为检验如下假设 H0: =15; H1: 15 (2未知),于是,,从而,拒绝原假设,即认为新的原材料确实提高了绳子所能承受的最大拉力。,8.2.2 两个正态总体 N(1, 12) 和 N(2, 22) 均值的比较,在应用上,经常会遇到两个正态总体均值的比较问题。,例如:比较甲、乙两厂生产的某种产品的质量。将两厂生产的产品的质量指标分别看成正态总体 N(1, 12) 和 N(2, 22)。比较它们的产品质量指标的问题,就变为比较这两个正态总体的均值 1和
10、 2的的问题。,又如:考察一项新技术对提高产品质量是否有效。将新技术实施前后生产的产品质量指标分别看成正态总体 N(1, 12)和 N(2, 22)。这时,所考察的问题就归结为检验这两个正态总体的均值 1和 2是否相等的问题。,设X1, X2, , Xm与Y1, Y2, , Yn 分别为抽自正态总体 N(1, 12)和 N(2, 22)的样本,记,考查如下检验假设:,1. H0: 1= 2 ; H1: 12,当 12 和 22 已知时,根据定理7.5.1,有,当 H0: 1 = 2为真时,,故,拒绝域为,在12=22 =2,2未知情况下,根据定理7.5.1,有,当 H0: 1=2 为真时,有,
11、拒绝域为,从而,上面,我们假定 12=22。当然,这是个不得已而强加上去的条件,因为如果不加此条件,就无法使用简单易行的 t 检验。 在实用中,只要我们有理由认为12和22相差不是太大,往往就可使用上述方法。通常是:如果方差比检验未被拒绝(见下节), 就认为12和22相差不是太大。,说明,例3:假设有A和B两种药,欲比较它们在服用2小时后在血液中的含量是否一样。对药品A,随机抽取8个病人服药,服药2小时后,测得8个病人血液中药物浓度(用适当的单位)分别为: 1.23, 1.42, 1.41, 1.62, 1.55, 1.51, 1.60, 1.76. 对药品B,随机抽取6个病人服药,服药2小时
12、后,测得血液中药的浓度分别为: 1.76, 1.41, 1.87, 1.49, 1.67, 1.81. 假定这两组观测值抽自具有共同方差的两个正态总体,在显著性水=0.10下,检验病人血液中这两种药的浓度是否有显著不同?,故,接受原假设。即, 认为病人血液中这两种药浓度无显著差异。,解:问题就是从总体 N(1, 2)和N(2, 2)中分别抽取样本X1, X2, X8 和Y1, Y2, Y6,样本均值和样本方差分别为:,与1.的分析完全类似,可以得到:,2. 单边检验 H0: 12; H1: 12, 12和22已知情况下,H0的拒绝域为, 12与22未知,但二者相等情况下,H0的 拒绝域为,与1
13、.的分析完全类似,可以得到:,3. 单边检验 H0: 12; H1: 12, 12和22已知情况下,H0的拒绝域为, 12与22未知,但二者相等情况下,H0的 拒绝域为,两个正态总体与成对数据的区别 两个正态总体假定来自这两个正态总体 的两组样本,是相互独立的。 成对数据两组样本可以是来自对同一个 总体上的重复测量,它们是成对出现的,可 以是相关的。,8.2.3 成对数据的 t 检验,例如: 为了考察一种降血压药的效果,测试了n 个高血压病人服药前、后的血压分别为X1, X2, Xn 和Y1,Y2,Yn。这里(Xi ,Yi)是第 i个病人服药前和服药后的血压,它们是相关的。,处理成对数据的思路
14、,因(Xi , Yi)是在同一人身上观测到的血压。所以,Xi-Yi 就消除了人的体质等诸方面的条件差异,仅剩下降血压药的效果。 所以,我们可以把 di=Xi-Yi,i=1, 2, n.看成抽自正态总体 N( , 2)的样本。其中 就是降血压药的平均效果。,一般的成对数据同样也是这样转变的。从前面所学内容可以看出:其实就是作 H0: = 0; H1: 0; H0: 0; H1: 0,方差2未知情况下的检验。,上述三种检验的拒绝域分别为:,例4:为了检验A, B两种测定铁矿石含铁量的方法是否有明显差异, 现用这两种方法测定了取自12个不同铁矿的矿石标本的含铁量(%),结果列于表 8.2.1中。取=
15、0.05, 问这两种测定方法是否有显著差异?,解: 将方法A和方法B的测定值分别记为 X1, X2, X12 和 Y1, Y2, Y12 .,因这12个标本来自不同铁矿,所以, X1, X2, X12 不能看成来自同一个总体的样本。同理, Y1, Y2, Y12也不能看成来自同一个总体的样本。故, 用成对 t 检验。记 di=Xi-Yi, i=1, 2, , 12.,所以,接受原假设,即认为两种测定方法无显著性差异。,小结,本讲首先介绍假设检验的基本概念;然后讨论正态总体均值的各种假设检验问题,给出了检验的拒绝域及相关例题。,利用样本方差 S 2是2的一个无偏估计,且 (n-1)S2/ 2 2
16、n-1 的结论。,8.3.1 单个正态总体方差的 2 检验,设 X1, X2, , Xn 为来自总体 N( , 2) 的样本, 和 2未知,求下列假设的显著性水平为 的检验。,思路分析:,1. H0: 2 =02;H1: 2 02,8.3 正态总体方差的检验,当原假设 H0: 2 = 02成立时,S2和02应该比较接近,即比值 S 2/02应接近于1。所以,这个比值过大或过小 时,应拒绝原假设。 合理的做法是: 找两个合适的界限 c1 和 c2 , 当 c1(n-1)S2/02 c2 时,接受H0; 当 (n-1)S2/02c1 或 (n-1)S2/02c2 时, 拒绝 H0 。,由于当原假设
17、 H0: 2 = 02成立时,有,上述检验法称为 2 检验法。,c1与 c2 的确定,2. H0: 2 =02;H1: 2 02,同理,当 H0: 2 = 02成立时,有,,此检验法也称 2 检验法。,3*. H0: 2 02;H1: 2 02 (同2.),例1:某公司生产的发动机部件的直径 (单位: cm) 服从正态分布,并称其标准差 0=0.048 。现随机抽取5个部件,测得它们的直径为 1.32, 1.55, 1.36, 1.40, 1.44. 取=0.05,问: (1). 能否认为该公司生产的发动机部件的直径 的标准差确实为= 0? (2). 能否认为 0?,解: (1). 的问题就是
18、检验 H0: 2 = 02; H1: 2 02. 其中,n=5, =0.05,0=0.048.,故,拒绝原假设 H0 ,即认为部件直径标准差不是 0.048 cm。,经计算,得 S2=0.00778,故,拒绝原假设 H0,即认为部件的直径标准差超过了 0.048 cm。,(2). 的问题是检验 H0: 2 02 ; H1: 2 02.,该检验主要用于上节中实施两样本 t 检验之前,讨论 12 =22 的假设是否合理。,8.3.2 两正态总体方差比的 F 检验,1. H0: 12 = 22;H1: 12 22.,设X1, X2, , Xm和Y1, Y2, , Yn 分别为抽自正态总体 N(1,
19、12)和 N(2, 22)的样本, 欲检验,当 H0: 12=22 成立时, 12/22=1, 作为其估计,S12/S22也应与 1 相差不大。当该值过分地大或过分地小时,都应拒绝原假设成立。 合理的思路是:找两个界限c1和c2, 当 c1 S12/S22 c2 时,接受H0; 当 S12/S22 c1, 或 S12/S22 c2 时, 拒绝H0 。,思路分析:,因两总体 N(1, 12)和 N(2, 22)的样本方差S12和S22分别为12和22的无偏估计。所以,直观上讲,S12/S22 是 12/22 的一个好的估计。,根据定理 6.4.1,有,c1与 c2 的确定,特别地,当 H0: 1
20、2 = 22成立时, S12/S22 Fm-1,n-1.,2. H0: 12 = 22;H1: 12 22,同理,当 H0: 12 =22成立时,有 S12/S22 Fm-1, n-1,,例2:甲乙两厂生产同一种电阻,现从甲乙两厂的产品中分别随机地抽取12个和10个样品,测得它们的电阻值后,计算出样本方差分别为S12=1.40,S22=4.38。,3. H0: 12 22;H1: 12 22,结论同 2。,以上检验都用到了F分布,因此称上述检验为 F 检验。,假设两厂生产的电阻的电阻的阻值分别服从正态分布 N(1, 12)和 N(2, 22)。,在显著性水平 = 0.10下, 是否可接受: (
21、l).12 =22;(2).1222.,解:(1). 的问题是检验 H0: 12 =22;H1: 12 22. 其中,m=12, n=10, =0.10, S12=1.40, S22=4.38, S12/S22 =0.32。,利用第六章学过的,及P237的附表5,有 Fm-1, n-1(1- /2) = F11, 9(0.95) = 1/F9, 11(0.05) = 1/(2.90) = 0.34. 因 S12/S22 = 0.32 0.34,所以,无须再考虑 Fm-1, n-1(/2)的值,就可得到拒绝12 =22的结论。,查P237 附表5,因查不到 F11, 9(0.10),改用F10,
22、 9(0.10)和F12, 9(0.10)的平均值近似之,得 F11, 9(0.10)=F10, 9(0.10)+F12, 9(0.10)/2 2.42+2.38/2 = 2.40. 因 S12/S22 = 0.32 2.40,故接受12 22.,(2). 问题是检验 H0: 12 22;H1: 12 22.,在前面的讨论中,我们总假定总体的分布形式是已知的。例如,假设总体分布为正态分布 N(, 2), 总体分布为区间 (a, b) 上的均匀分布,等等。,然而,在实际问题中,我们所遇到的总体服从何种分布往往并不知道。需要我们先对总体的分布形式提出假设,如:总体分布是正态分布N( , 2),总体
23、分布是区间(a, b)上均匀分布等,然后利用数据 (样本) 对这一假设进行检验,看能否获得通过。,8.4 拟合优度检验,这是一项非常重要的工作,许多学者视它为近代统计学的开端。,解决这类问题的方法最早由英国统计学家 K. Pearson (皮尔逊) 于1900年在他发表的一篇文章中给出, 该方法后被称为 Pearson 2检验法,简称 2检验。,设F(x)为一已知的分布函数,现有样本X1, X2, , Xn,但我们并不知道样本的总体 分布是什么。现在试图检验,H0:总体 X 的分布函数为F(x) ; (1),对立假设为 H1:总体 X 的分布函数非F(x)。如果 F(x) 形式已知,但含有未知
24、参数 或参数向量 =(1, 2, r ) ,则记其为F(x, )。这种检验通常称为拟合优度检验。,不妨设总体 X 是连续型分布。检验思想与步骤如下:,(1). 将总体 X 的取值范围分成 k 个互不重叠的 小区间 I1, I2, , Ik,,(2). 计算各子区间 Ii 上的理论频数。,如果总体的分布函数为F(x, ),那么每个 点落在区间 Ii 上的概率均为,n 个点中,理论上有n pi ( )个点落在 Ii 上, (称为理论频数)。当分布函数中含有未知参数 时,理论频数也未知,要用 来估计 n pi ( ),其中 为 的极大似然估。,(3). 计算各子区间 Ii 上的实际频数 fi 。 f
25、i = X1, X2, , Xn Ii , i=1, 2, , k .,计数符号,取集 合中元素的个数,(4). 计算理论频数与实际频数的偏差平方和。,可以证明:在 H0 成立,且 n时,(5). H0 的显著性水平为 的检验的拒绝域为,注意:该检验方法是在 n 充分大时使用的,因而,使用时要注意 n 必须足够地大, 以及 npi 不能太小这两个条件。,在实用上,一般要求 n 50,以及所有npi 5。如果初始子区间划分不满足后一个条件, 则适当地将某些子区间合并,可使 npi 满足上述要求。,例1:为检验棉纱的拉力强度 X (单位: 千克) 服从正态分布,从一批棉纱中随机抽取300条进行拉力
26、试验,结果列在表8.2中。给定 = 0.01,检验假设,H0:拉力强度 X N(, 2) .,解:本例中,并未给出各观测值 Xi 的具体值,只给出了各观测值的取值范围,这样的数据称为区间数据。样本均值与样本方差可通过下列式计算:,(1). 先将数据 Xi 分成13组,每组落入一个区 间,区间的端点为:,(2). 计算数据落入各子区间的理论频数。,因分布中含有两个未知参数,所以,理论频数只能近似地估计。落入第 i 个子区间Ii 的理论频数的估计为 , 其中,(3). 计算数据落入各子区间上的实际频数 fi 。 fi = X1, X2, , Xn Ii , i=1, 2, , 10 .,(4). 计算检验统计量的值,因为 k =10,r =2,所以上述 2分布的自由度为 k-r-1=7。由,(5). H0 的显著性水平为 的检验,于是,拒绝原假设,即认为棉纱拉力强度不服从正态分布。,孟德尔在关于遗传问题的研究中,用豌豆做实验。豌豆有黄和绿两种颜色,在对它们进行两代杂交之后,发现一部分杂交豌豆呈黄色,另一部分呈绿色。其数目的比例大致是 3:1。, 2检验的一个著名应用例子是孟德尔豌豆实验。奥地利生物学家孟德尔在1865年发表的论文,事实上提出了基因学说,奠定了现代遗传学的基础。他的这项伟大发现的过程有力地证明了统计方法在科学研究中的作用。因此,我们有必要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专辑线下活动策划方案(3篇)
- 厂房倒塌施工方案(3篇)
- 施工方案装订视频(3篇)
- 校园加分活动方案策划(3篇)
- 化石燃料相关结直肠癌的早筛模型验证研究
- 2026年及未来5年中国浸膏行业市场调查研究及投资策略研究报告
- 2026及未来5年中国洗脸仪行业市场全景调研及前景战略研判报告
- 广西浦北县振兴皮革有限公司地块土壤污染状况调查报告
- 妊娠合并布鲁氏菌病的护理
- 创新医疗支付与患者就医行为变化
- 2025年打磨工培训试题及答案
- GB/T 33594-2025电动汽车充电用电缆
- 2026年湖南电气职业技术学院单招职业技能测试必刷测试卷附答案
- 2025年智能网卡行业分析报告及未来发展趋势预测
- 体育场座位施工方案
- 领导干部个人有关事项报告表【模板】
- 节后复工化验室安全培训课件
- 年产12万吨生物基乙二醇项目可行性研究报告
- 储能电池安全管理与防火方案
- 产业园区物业运营管理方案
- 《构成设计基础》全套教学课件
评论
0/150
提交评论