第五章 统计估计和假设检验.doc_第1页
第五章 统计估计和假设检验.doc_第2页
第五章 统计估计和假设检验.doc_第3页
第五章 统计估计和假设检验.doc_第4页
第五章 统计估计和假设检验.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章统计估计和假设检验 统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。 统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。 假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。第一节点估计一、点估计的极大似然法 点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。 例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢? 记 A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有 X=0 与 X=1 两种情形,于是,可得事件 A发生的概率为: P(A)= 其中:是这批产品的次品率。 若次品率=0.1,则P(A)=0.1=0.0229 若次品率=0.4,则P(A)=0.4=0.0003。 现在事件A 既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。 由于0.02290.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。 把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。设是取自密度函数为f(x, )的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A =“一次观察中,所得一组样本的样本值为( )”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于 相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件: 同时发生的概率,也就是P(A)=,记为L()=L(), 于是有: L()= L()称为的似然函数。求极大似然值的问题就是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。因为ln L()与L()取得极大值的点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。在我们上述例子中,f(1, )=,f(0,)=1-,于是得到似然函数:L()=令=0,舍去=1,得的最大似然估计值=0.067。实际上,正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。 例5-2。从一个正态总体中抽取容量为n的样本,求总体参数的极大似然估计。 解:构造似然函数 为了求和,使ln的极大,令 解上述方程得到: 所以得到和的极大似然估计量为: 二、估计量好坏的评选标准前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。 例5-3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原因,每次抽取样本的测量结果是不同的。如果样本容量为3,抽取4组样本,测得结果如表5-1所示。表5-1 一组抽样样本的观察值样本值 样本顺序均值19009991011970299510501105106531010941890947495091011401000 为了说明的方便起见,我们假定,实际上=1000公斤,当然这在事先是不知道的。我们要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?评价点估计的结果通常有无偏性、有效性和一致性等标准。 1. 无偏性 无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一般地,无偏性的定义为:设为被估计参数,若有估计量( ),对一切n,有=,则称为的无偏估计量。 若-b,则称b为估计量的偏差。若b0,则称为的有偏估计量。如果,则称为的渐近无偏估计量。 不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值和总体比例的无偏估计,即,但样本方差并不是总体方差的无偏估计量。这是因为如果我们把定义为 =,则: 产生偏差的原因是总体方差的无偏估计应该是,但抽样时由于是未知的,因而用估计量来代替。根据最小平方原理,变量X距样本均值的离差平方和为最小,因此就小于,从而用代替计算的方差就低估了,为了得到的无偏估计,令 这时,由于,就是的无偏估计了。 样本方差与之差称为偏差。但当n很大时,所以它是渐近无偏差估计。当样本容量很大时,也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比较大了。 图5-1 估计的无偏性和有效性 2. 有效性 即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,如图5-1所示。 但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(),V()分别表示各自的方差,若V()/V()100。这表示备择假设是总体的均值大于100。或者是:100。反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设,则称作左侧检验。此时,原假设实际上变为:100,备择假设为:100。由此可见,原假设和备择假设总是排他性的。(二)检验的显著性水平 假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水平。所谓检验的显著性水平就表示,在假设正确的条件下落在某个界限以外的样本均值所占的百分比。具体地说,“在5%的显著性水平下检验假设”就是说,假定对总体参数所作的假设正确,那么样本均值同假设的总体均值差异过大的,在每100个样本中不应超过5个。如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体,所以拒绝零假设。我们可以用图5-4来直观地解释假设检验的原理。假如设检验的显著性水平=5%,我们已知在概率密度曲线下包括在假设的均值两侧直线间的面积是95%,两边每一个尾端的面积各为2.5%。于是若样本的均值落在95%的区域内,我们就认为样本统计量与假设的总体参数的差异是不显著的。结果就接受原假设。若样本统计量落在左右尾端的各为2.5%的区域内,则差异就是显著的。我们就拒绝原假设。接受备择假设。 图5-4 假设检验的接受区域和拒绝区域不过应该强调指出,在假设检验中“接受原假设”的意思仅仅是意味着没有充分的统计证据拒绝原假设。在假设检验中“接受原假设”的特定含义就是不拒绝原假设。但实际上,即使样本统计量落在95%的面积内,也并不能证明原假设就是正确的。因为只有在知道了总体参数的真实值与假设值完全相同才能证明假设正确。但我们无法知道总体参数的真实值。在给定了检验的显著性水平后,我们可以根据假设来确定接受还是拒绝原假设的区域或范围。如果样本均值落在某一区域内我们就接受原假设,则就称这一区域为接受区域。如果样本均值落在某一区域内就拒绝原假设,我们就称这一区域为拒绝区域。 对于显著性水平的选择没有一个唯一的或通用的标准。实际上在任何显著性水平下检验某个假设都是可能的,但是必须注意不管选择什么样的显著性水平,都存在假设为真而被拒绝的可能性。另一方面,在检验同一个假设时,使用的显著性水平愈高,原假设为真时而被拒绝的概率也就愈高。这就需要研究假设检验中的错误,我们在以后将对此进行讨论。二、假设检验的步骤 1. 提出原假设和备择假设。原假设和备择假设必须由题意来决定。在一般情况下总是把检验的目的作为备择假设,这样可以有充分的把握拒绝原假设。 2. 选择检验的显著性水平,从而确定检验的拒绝区域或临界点。表示在假设检验时当原假设为真而我们却拒绝了原假设,接受备择假设的错误概率。假设检验中还可能犯另一种错误,这将在下面讨论。3. 确定样本的统计量和分布。样本统计量又称检验统计量。不同的统计量具有不同的分布,用于检验不同的假设,要根据所检验的假设来正确地选择检验统计量。4. 计算检验统计量并由此作出决策。根据样本数据计算出检验统计量的值,如果统计量的值落在拒绝区(包括临界点)内就说明原假设与样本所反映的情形有显著的差异,应该拒绝原假设。如果统计量的值落在接受区域内,就说明原假设与样本所反映的情形的差异并不显著,应该接受原假设。三、几种常用的假设检验(一) 平均数的假设检验1. 双侧检验让我们研究下面的例子。 例5-4。某食品厂规定某种罐头每罐的标准重量是500克。多年的经验表明这个厂每罐重量的标准差是15克。今随机抽取了49个罐头,发现这些罐头的平均重量是506克。问在=0.05的显著性水平下能否认为这批罐头的重量符合标准的要求? 要检验这批罐头的重量是否符合标准的要求就是要检验这批样本的平均重量与标准重量之间是否具有明显的差别。因此可以列出要检验的假设为: :=500 :500。这是一个双侧检验问题。根据区间估计的结论可知原假设的接受区域为由于置信度水平=0.05,=1.96。由此得到接受区域为495.8,504.2。但现在样本的实际均值为506,落在拒绝区域内,因此拒绝原假设接受备择假设。我们无法认为这批罐头的重量符合标准的要求,即这批罐头的重量不符合标准的要求。当总体方差未知,样本数量又小于等于30时,检验统计量样本均值服从t分布。这就要用t分布确定原假设的接受区域和拒绝区域了。在得到接受区域后也就可以利用上面同样的方法,根据样本均值所处的位置作出判断。2. 单侧检验 再看下面的例子。例5-5。某饮料厂规定某种纸罐包装饮料的容量不得少于500ml。今随机抽取了25个纸罐,发现这些罐头的平均重量是498 ml,标准差S=10。问在=0.05的显著性水平下能否认为这批纸罐的容重符合标准的要求?根据问题的要求可以列出要检验的假设为::500:496.6。可见样本均值落在原假设的接受区域内。我们接受原假设,即认为这批纸罐的容重符合标准的要求。例5-6。某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤。今随机抽取了16块这种规格新型墙体材料,测得其平均重量为505公斤,标准差S=10。问在=0.05的显著性水平下能否认为这批新型墙体材料的重量符合标准的要求?这次要检验的假设为::500:500这次也需要利用t分布来进行检验。这是一个右侧检验问题。原假设的接受区域为 根据置信度水平=0.05,查表得到。由此可以得到原假设的接受区域临界点是504.4。现样本均值=505504.4。可见样本均值落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合标准的要求。(二)比例的假设检验例5-7。某酒厂规定某种酒中含有的糖度应为12%,产品才能算合格。今随机抽取了100瓶这种酒,发现平均的糖度为11.3%。问在显著性水平=0.10的条件下,这批酒与合格产品对糖度的要求有无明显的差别?问题要检验的假设为::=0.12:0.12这是比例的双侧检验问题。根据区间估计的结果,原假设的接受区域是由于=0.10,则=1.64。计算得到原假设的接受区域是0.114,0.126。由于样本比例0.1131300的情况下,有( )成立。(单选题) A. 若=0.05,则接受 B. 若=0.05,则接受 C. 若=0.10,则接受 D. 若=0.10,则拒绝 5-10下面关于假设检验的陈述正确的是( )。(多选题)A. 假设检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论