假设检验与统计推断.ppt_第1页
假设检验与统计推断.ppt_第2页
假设检验与统计推断.ppt_第3页
假设检验与统计推断.ppt_第4页
假设检验与统计推断.ppt_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验与重要概率分布,计量经济学第一次小组展示,一、假设检验,1、定义:根据样本信息判断总体分布是否具有指定特征,这个过程就叫做假设检验。 2、方法:运用“反证法”的思想,即先假定假设成立,然后根据某种判别准则看能得出什么样的结果。如果得出合理结果,则自然认为假设成立;如果得出不合理结果,则认为假设不成立。,在假设检验中,我们首先对总体参数做一个尝试性的假设。该尝试性的假设被称为原假设,记作H0。然后,定义另一个与原假设内容完全相反的假设,记作H,称之为备择假设。假设检验的过程就是根据样本数据对这两个对立的假设H0和H进行检验。,一般来说,假设检验是拒绝H0,从而证明H 正确,1.等号只能位于原假设H0中; 2.单侧检验方向的设定,决定了拒绝规则的选择; 3.一般先设定备择假设H ; 4. H0与H 应保证相互独立且完备。,注意事项:,假设检验的两类错误,表格中的第一行说明,当做出接受H0结论时所可能发生的情况。这时,如果H0是真的,则该结论正确;如果H是真的,那么我们发生了第二类错误,即当H0为假时我们却接受了H0. 表格中的第二行说明,当做出拒绝H0结论时所可能发生的情况。这是,如果H0是真的,那么我们发生了第一类错误,即当H0是真的时候我们却拒绝了H0 ,如果H是真的,则拒绝H0是正确的。,当原假设以等式的形式为真时,犯第一类错误的概率被称为检验的显著性水平。 用希腊字母表示显著性水平,一般取为0.05或0.01。通过选择,控制了犯第一类错误的概率。一般的,我们将控制第一类错误的假设检验叫做显著性检验。,3、原假设和备择假设的建立三种形式:,计量经济学中的假设检验主要是双侧假设检验,双侧检验,左侧检验,右侧检验,设 是来自正态总体X的一个简单随机样 本,样本均值为 ,根据单个总体的抽样分布结 论,选用统计量,选用统计量:,4、检验统计量,5、P-值法,P-值是一个概率值,衡量样本对原假设的支持程度。P-越小说明对原假设的支持程度越低。小的P-值表明在假设H0为真时,统计量的值时异常的。 (以下侧检验为例)方法:首先根据题目中所给条件计算检验统计量,然后通过查标准正态分布表得出Z下侧的面积(即P-值),接着找到给定的显著性水平,最后如果P-值,则拒绝H0。,5、临界值法,临界值导致拒绝原假设的检验统计量的最大值,一般的,临界值是在标准正态分布的下侧面积对应于=0.01的检验统计量的值。 (以下侧检验为例)方法:首先根据题目中所给条件计算检验统计量,然后计算标准正态分布的下侧面积对应于 的Z值(即临界值)最后如果所求Z值-Z ,则拒绝H0,假设检验的步骤: 1、提出原假设和备择假设 2、指定检验中的显著性水平 3、搜集样本数据并计算检验统计量的值 P-值法 4、利用检验统计量计算出P-值 5、如果P-值 ,则拒绝H0 临界值法 4、显著性水平确定临界值以及拒绝规则 5、利用检验统计量的值及拒绝规则确定是否拒绝H0,对于上侧检验,和双侧检验的P-值法和临界值法运用的原理是相同的,这里不一一列举。,总体均值的检验,例:某电子元器件生产厂对一批产品进行检测,使用寿命不低于2000小时为合格品。该电子元器件的使用寿命服从正态分别,标准差为100小时。从该批产品中随机抽取了120个产品进行检测,测得样本均值为1960小时,在 的显著性水平下检验该批电子元器件的质量是否符合要求。,解:由题意总体服从正态分布,,样本均值 ,样本容量,4.382,拒绝域,= -2.33,所以拒绝原假设,即电子元件的质量不符合标准。,(1),(2),(3),(4),二、重要的概率分布复习,(一)正态分布 (二) t分布 (三) x分布 (四) F分布,(一)正态分布,1、简介:对于连续型随机变量而言,正态分布是最重要的一种概率分布,其形状似“钟型”。经验表明:对于其值依赖于众多微小因素且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。如身高、体重、考试成绩等。,表示随机变量X服从正态分布。 符号表示随机变量服从什么样的分布;N表示正态分布;,为正态分布的(总体)均值(或期望)和方差。X是一个连续型随机变量,可在区间(,+)内任意取值。,-,-2,2,68%近似,3,-3,95%近似,99.7%近似,2、正态曲线下的区域示意图,正态分布曲线以均值为中心,对称分布。 正态分布的概率密度函数呈中间高、两边低,在均值处达到最高,向两边逐渐降低,即随机变量在远离均值处取值的概率逐渐变小。 正态曲线下的面积约有68%位于 两值之间;约有95%面积位于2之间;约有99.7%的面积位于 3之间。这些区域可用作概率的度量。(即经验法则),3、性质,正态分布可由两个参数,来描述,即一旦知道,的值,就可以根据附录表查到随机变量X落于某一区间的概率值。 两个(或多个)正态分布随机变量的线性组合仍服从正态分布。该性质很重要,解释如下: 正态分布的偏度为0,峰度为3。,如果变量X的均值为,方差为,定义一个新的变量Z, 则根据性质5,变量Z的均值为0,方差为1。在统计学中,我们称之为单位或标准正态变量,用符号表示为:XN(0,1)任一给定均值和方差的正态变量都可转化为标准正态变量,将其标准化可以大大简化计算。,4、标准正态分布,(二)t分布,1、样本均值的抽样分布或概率分布 样本均值是总体均值的估计量,但是由于样本均值是依靠某一给定样本而定,因此它的值会因随机样本的不同而变化。由此,我们将样本均值看作随机变量,在样本是随机抽取得到的条件下,求样本均值的概率密度函数。,2、理论依据: 若X1,X2,X3,Xn是来自于均值为,方差为的正态总体的一随机样本。则样本均值 也服从正态分布,其均值为,方差为/n,即:,也就是说,样本均值 的抽样(或概率)分布,同样服从正态分布。,样本均值概率分布的标准正态变量:,将样本均值的概率密度转化为标准正态分布后,可以从标准正态分布表中计算某一给定样本均值大于或小于给定的总体均值的概率。,3、中心极限定理:如果X1,X2,Xn是来自(均值为,方差为)任一总体的随机样本,随着样本容量的无限增大,其样本均值趋于正态分布,其均值为,方差为/n。,4、假定已知和的估计量S,则可以用样本标准差(S)代替总体标准差(),得到一个新的变量t。,根据统计理论得知:变量t服从自由度为(n-1)的t分布。 注意:在这里,自由度为(n-1),而不是n。 结论:从正态总体中抽取随机样本,若该正态总体的均值为,但方差用其估计量S来代替,则其样本均值服从t分布。通常用符号tk表示,其中k表示自由度。,k=120(正态),K=20,K=5,0,不同自由度下的 t分布,5、性质, t分布与正态分布相类似,具有对称性。 t分布的均值与标准正态分布均值相同,为0,但方差为k/(n-2)。由此,在求t分布的方差时定义自由度必须大于2。标准正态分布的方差等于1,因此,t分布方差总大于标准分布的方差,也就是说,t分布比正态分布略“胖”些。,t分布与正态分布 当k增大时,t分布的方差接近于标准正态分布方差值1。 当k=10时,t分布的方差为10/8=1.25; 当k=30时,t分布的方差为30/28=1.07; 当k=100时,t分布的方差为100/98=1.02; 结论:随着自由度的逐渐增大t分布近似于正态分布。 注意:对于t分布,不要求其样本容量很大k=30时,t分布与正态分布已很近似。,t分布表的使用:,0,-1.812,1.812,例:自由度为10,P (t1.812)=P (t1.812)=P (t1.812)+P(t-1.812)=0.1,0.05,0.05,例:已知20名10岁男孩的跳远成绩的平均数为1.65m,标准差为0.2m,求出其总体平均数的95%的置信区间。,(三) 分布,1、分布是统计学中常用的一种概率分布,它与正态分布有紧密的关系。 统计理论证明:标准正态变量的平方服从自由度为1的分布,用符号表示为,,其中,Z是标准正态变量,即ZN(0,1); x的下标(1)表示自由度。自由度是指平方和中独立观察值的个数。因为我们考虑的是一个标准正态变量的平方,故自由度为1。,现在令Z1,Z2,,Zk为k个独立的标准正态变量(即每一个变量都是均值为0,方差为1的正态变量),现在对所有的变量Zs平方,则它们的平方和服从自由度为k的X分布,即,公式里的自由度为k,因为在所有变量的平方和中 有k个独立的观察值。,分布的几何图形:,f(),概率密度,K=2,K=5,K=10,变量的密度函数,0,性质,与正态分布不同, 分布只取正值(它是平方和的分布),并且取值范围从0到无限大。 与正态分布不同, 分布是斜分布,其偏度取决于自由度的大小,自由度越小,越向右偏,但是随着自由度的增大,逐渐呈对称,接近于正态分布。 分布的期望值为k,方差为2k。k为分布的自由度。即分布的方差是其均值的2倍。 若E1、E2分别为自由度为k1,k2的两个相互独立的 变量,则其和(Z1+Z2)也是一个变量,其自由度为(k1+k2)。,可以证明: 样本方差与总体方差的比值与自由度 (n-1)的积服从自由度为(n-1)的分布。公式表示为:,其中,为总体方差,S为样本方差,样本容量为n。,(四) F分布,令随机样本X1,X2,X3,Xm来自均值为x和方差为x的正态总体,其样本容量为m;随机样本Y1,Y2,Y3,Yn来自均值为y和方差为y的正态总体,其样本容量为n;且这两个样本相互独立。假设知道这两个随机样本的样本方差Sx和Sy(两个总体方差的估计量)。,定义一个新的变量F,分析F值:如果这两个总体方差真实相等,则计算出的F值接近于1,如果两个总体方差真实值不相等,则F值不等于1;两总体方差相差越大,则F值越大。 统计理论表明:如果x =y(即两总体方差相等),则F服从分子自由度为k1=(m-1),分母自由度为k2=(n-1)的F分布。,需要说明一点: 在概率论与数理统计中,更准确的说法是:( Sx/ x)/(Sy/ y)服从F分布,但我们上式给出, x =y,故样本方差之比服从F分布。 F分布又称为方差比分布,通常用符号表示为: 其中的双下标表明了分子与分母的自由度。 在计算F值时,将方差大的值放在上面,故F值总是大于或等于1。,性质, 与分布类似,F分布也是斜分布,向右偏,其取值范围也为0到无限大(见下图) 。,0,F,F (F),概率密度,F2,2,F50,50,F10,2, 与分布类似,当自由度k1,k2逐渐增大时,F分布近似于正态分布。 t分布变量的平方服从分子自由度为1,分母自由度为k的F分布,即 变量与其自由度之比近似为分母自由度为m,分子自由度很大(无限大)的F变量,即,当n ,对于大容量的样本,我们可以用分布来代替F分布;同样,也可用F分布代替分布。 性质3也可以改写为:,即若分子自由度充分大,则Fm,n值的m倍,等于自由度为m的分布。,例:两个班做同样的计量经济学测试。其中,一班级共有学生100名,二班级共有学生150名。老师从一班级随机抽取25个学生,从二班级随机抽取31个学生,观察得到两个班级学生考试平均分数的样本方差分别为100和132。假设学生考试平均分数这一随机变量服从正态分布,能否认为这两个班级的分数平均值同方差。 分析:这两个随机样本来自两个正态总体,并且相互独立,则首先利用公式计算F值。 F=132/100=1.32 它服从自由度为30、24的F分布。,查F分布表得当分子自由度为30、分母自由度为24时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论