版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021-10-101第一节第一节 参数的估计参数的估计第二节第二节 估计量的好坏标准估计量的好坏标准 第三节第三节 似然函数的渐近性质似然函数的渐近性质第四节第四节 区间估计区间估计第五节第五节 参数估计的贝叶斯方法参数估计的贝叶斯方法第六节第六节 假设检验概述假设检验概述第七节第七节 正态分布的参数检正态分布的参数检验验第八节第八节 分布型式的检验分布型式的检验第九节第九节 似然比检验似然比检验第十节第十节 方差分析方差分析2021-10-102实实验验测测量量随机随机变量变量的的n n个容个容量的量的样本样本随随机机变变量量的的信信息息获取获取?得到得到2021-10-103第一节第一节
2、 参数的估计参数的估计 一、参数估计的两类作法一、参数估计的两类作法 二、点估计的作法二、点估计的作法 三、点估计的两类常见作法:矩法、最大似然法三、点估计的两类常见作法:矩法、最大似然法 四、总结四、总结2021-10-104一、参数估计的两种作法一、参数估计的两种作法参数参数估计估计对参数本身数值作意估计对参数本身数值作意估计(点估计)(点估计)找出一个区间来并确定参数落在此区间的概率找出一个区间来并确定参数落在此区间的概率(区间估计)(区间估计)随机变量随机变量x x参数参数c c的值的值服从概率分布形式服从概率分布形式f f(x x,c c), ,n n次观测量次观测量),.,(21n
3、xxxx =?2021-10-105二、点估计的作法二、点估计的作法( )(2.1.1)cT x=获得点估计的方法有获得点估计的方法有矩法矩法、最大似然法最大似然法、最小二乘法最小二乘法等。本章主等。本章主要介绍矩法和最大似然法,最小二乘法将在第五章详细讨论。要介绍矩法和最大似然法,最小二乘法将在第五章详细讨论。找出一个统计量找出一个统计量T(xT(x),其为样本,其为样本x x的函数,的函数,将样本值代入,得到参将样本值代入,得到参数的估计值数的估计值,以,以表示,即表示,即c 2021-10-106三、点估计的两类常见作法:矩法、最大似然法三、点估计的两类常见作法:矩法、最大似然法1 1、
4、矩法、矩法样本矩样本矩总体总体矩矩矩:描述随机变量的重要数字矩:描述随机变量的重要数字特征(反映分布对称性质)特征(反映分布对称性质)设样本按设样本按大小大小顺序排好,样本分布函数顺序排好,样本分布函数F Fn n(x x)可定义为)可定义为10( )(2.1.2)1iniinxxiFxxxxnxx=2021-10-1071( )2.1.4KKKniix dF xxn=()1( )(2.1.3)niixxdF xxn=样本平均值为样本平均值为样本的样本的K K阶原点矩为阶原点矩为样本的样本的K K阶中心矩为阶中心矩为1()( )()2.1.5KKKnix x dF xx xn=()由参数和各阶
5、矩的关系,解方程可得到参数的估计值,此方法称由参数和各阶矩的关系,解方程可得到参数的估计值,此方法称为为矩法矩法。)(xdFn在各点在各点处,处, 样本分布函数增量样本分布函数增量为为1/n1/n。ix2021-10-108例:用矩法估计方差例:用矩法估计方差2解:由解:由K K阶原点矩的定义有阶原点矩的定义有11( )(1)niixxdF xxn= =222221( )(2)niix dF xxxn=由方程(由方程(1 1)、()、(2 2)得)得221()iixxn=2021-10-109);(cxL121( ; )( ; )( ; ) (; ). (; )(2.1.10)niniL x
6、cf x cf x c f x cf x c=2 2、最大似然法、最大似然法似然函数似然函数:设测量总体的概率密度函数为:设测量总体的概率密度函数为,样本是,样本是);(cxfnxxxx., 2, 1=我们称样本的联合概率密度函数为似然函数,记作:我们称样本的联合概率密度函数为似然函数,记作:);(cxL由于各次观测由于各次观测相互独立相互独立,因而似然函数为各观测值的概率密度之积。,因而似然函数为各观测值的概率密度之积。未知参数未知参数c c参数参数c c应该是使得观测值具有应该是使得观测值具有最大概率最大概率,即似然函数为,即似然函数为最大!最大!即即为数学的为数学的极值问题极值问题。20
7、21-10-10 1011ln ( ; )ln( ; )ln( ; )(2.1.11)nniiiilL x cf x cf x c=便于计算,引入便于计算,引入对数似然函数对数似然函数l l由数学中的求解由数学中的求解极值问题极值问题有:有:1ln( ; )ln ( ; )0(2.1.12)niif x cL x ccc=或将测量样本代入(将测量样本代入(2.1.122.1.12)即可求得参数)即可求得参数c c的值(的值(c c可以是可以是多个多个参参数)数)2021-10-10 11( ,)N 2211( )exp()(1)22f xx=22122211( ; ,)exp() 221lnl
8、n(2 )ln()()(2)222niiiiiL xxnnlLx = 或例:求正态总体例:求正态总体参数的最大似然估计参数的最大似然估计解:由于是解:由于是正态正态分布,因而分布,因而概率密度函数概率密度函数为为则则似然函数似然函数为为由由数学极值问题数学极值问题有:有:22224ln1()0(3)ln1()022iiiiLxLnx= =解之得解之得221(4)1()iiiixnxxn=2021-10-10 12四、总结四、总结最大似然法最大似然法:统计性好统计性好、具有、具有渐近行为渐近行为(即分(即分布最终趋于一布最终趋于一正态正态分布,但需知道分布,但需知道总体概率总体概率分布分布矩法和
9、最大似然法的比较:矩法和最大似然法的比较:矩法矩法:简单、直观简单、直观,不不需知道总体需知道总体概率概率分布分布的形式,但统计性没最大似然法好的形式,但统计性没最大似然法好方法比较方法比较2021-10-10 13第二节第二节 估计量的好坏标准估计量的好坏标准一、引言一、引言二、判断估计量好坏的三个主要标准二、判断估计量好坏的三个主要标准三、总结三、总结2021-10-10 14一、引言一、引言不不同的方同的方法法不不同的结同的结果果同一参数同一参数好坏怎么判断好坏怎么判断判断判断标准标准无偏性无偏性有效性有效性一致性一致性2021-10-10 15( ),()02.2.1E ccE cc=
10、或()二、判断估计量好坏的三个主要标准二、判断估计量好坏的三个主要标准1 1、无偏性、无偏性估计量是估计量是样本样本的的函数函数,也可以看作一,也可以看作一随机变量随机变量,不同样本不同样本得到得到不同不同的数值的数值。估计值应该围绕着。估计值应该围绕着待估计参数待估计参数的的真值上下摆动真值上下摆动。即要求参。即要求参数值的数值的期望值等于期望值等于参数的参数的真值真值。即:。即:若满足(若满足(2.2.12.2.1)式要求的估计量称为)式要求的估计量称为无偏估计量无偏估计量。若若则此估计量为则此估计量为有偏有偏,偏离量偏离量为为b b。 ()0E ccb=2021-10-10 16证明:证
11、明: 是无偏估计量,是无偏估计量, 是有偏估计量。是有偏估计量。iixx n=22()iixxn=11( )()( )iiiiEExnE xnnn=证:证:2222222211()() )() () 1()() 111iiiiiiiiEExxExxnnE xE xnnnnn= 由于由于2221()11iinSxxnn=因而因而 是是 的的无偏无偏估计量估计量2S22021-10-10 17同一同一样本容量,围绕期样本容量,围绕期望值望值摆动摆动最小最小的,即是有的,即是有较小方差较小方差的那个的那个无偏估计量更好一些。无偏估计量更好一些。( )( )/( )1(2.2.4)e cD cD c2
12、 2、有效性、有效性同一同一个参数可能找到个参数可能找到多个多个无偏估计量,怎么来无偏估计量,怎么来比较比较它们的它们的好坏好坏呢?呢?有效性概念有效性概念设参数设参数c c的两个无偏估计量的两个无偏估计量,容量为,容量为n n,若它们的方差满足,若它们的方差满足 cc、比比 更更有效有效,并称,并称的的效率。效率。相对于相对于为为称称 c) (cec cc 2021-10-10 182121ln ( ; )1( )()( ; )(2.2.5)ln ( ; )() L x cV cf x c dxL x cncEc=所有无偏估计的方差所有无偏估计的方差下限下限( (罗罗- -克拉美不等式克拉美
13、不等式)2122211( )(ln( ; ) ( ; )(2.2.6)ln ( ; )V cf x cf x c dxL x cncEc=或等价于或等价于此下限称为无偏估计的此下限称为无偏估计的最小方差限最小方差限,若方差达到这个下限的无偏,若方差达到这个下限的无偏估计称为估计称为佳效估计佳效估计(或(或有效估计有效估计)2021-10-10 19例:对正态分布例:对正态分布 ,检验,检验 的无偏估计的无偏估计 是否为佳是否为佳效估计。效估计。( , )N ()iixx n=由于是正态分布,则分布函数为由于是正态分布,则分布函数为2211( ; )exp()(1)22f xx=则则21ln()
14、(2)fx=代入(代入(2.2.52.2.5)212212221ln( )()1 111()exp() (3)22fV xfdxnxxnn=解:解:2021-10-10 20()(;)ccx Lx c d x=11111(; )1( )( ; )ln (; )( )( ; )(2.2.7)ln ( ; ) ( ( ) )nnKiKinnKiKiniif xcc xf x cdxcf xcc xf x cdxcf x cE c x ZZc= 其中是无偏估计,且方差为是无偏估计,且方差为 ,因而是佳效估计。,因而是佳效估计。又又2nx罗罗- -克拉美不等式克拉美不等式的的证明证明证:证:两边对两边
15、对c c求导,有求导,有由于由于为为c c的无偏估计量,因而有的无偏估计量,因而有( )c x2021-10-10 211ln ( ; )ln ( ; )ln ( ; )( )()() ( ; )( ; )(1)0niiiiiiiiiiiif x cf x cf x cE ZEEf x c dxcccf x c dxcc=( , )()( ) ( )Cov x yE xyE x E y=1( ( )( )( ( ) )0( )( )(2.2.9)E c xE ZCov c x ZD cD Z=2222121ln ( ; )( )()( )()() ln ( ; )ln ( ; )ln ( ;
16、)() niinjiiii jf x cD ZE ZE ZE ZEcf x cf x cf x cEEccc=由由有有又又2021-10-10 22221ln( ; )ln( ; )( )() () niiif x cf x cD ZEnEcc=ln(; )ln(; )ln( ; )ln( ; ) ln(; )ln( ; ) () ()0jjiiijijjiijf x cf x cf x cf x cEEccccf x cf x cEEcc=其中其中因而因而因而因而22111 ( )ln ( ; )( )( )() iD cf x cD ZD ZnEc=1ln( ; ) ( )(2.2.10)
17、niif x cK c xcc=只有当只有当时,上式子取等号,即要求时,上式子取等号,即要求1=由于由于212021-10-10 23222ln( ; )ln( ; )() ()f x cf x cEEcc= 22222ln( ; )1ln1f x cfffcc fccfc= 2222221( ; )1( ; ) ( ; )( ; )( ; )( ; )0f x cf x cEf x c dxf x ccf x ccf x c dxc=下面要下面要证明证明22222ln( ; )ln( ; )1( ; )()() ( ; )f x cf x cf x cEEEccf x cc= 因因两边取期望
18、值有两边取期望值有其中其中因而命题得证因而命题得证2021-10-10 242 ()0nnE cc 3 3、一致性、一致性由于参数估计值是样本的函数,不同的样本有不同的值,总希望观由于参数估计值是样本的函数,不同的样本有不同的值,总希望观测次数测次数增加增加(样本容量(样本容量增大增大),估计值要越来越靠近真值。满足此),估计值要越来越靠近真值。满足此要求叫要求叫一致性一致性。为为一致估计量一致估计量。则称则称nc满足满足若若nc三、总结三、总结无偏性、有效性无偏性、有效性是对是对每一每一n n提出的要求,即参数估计值在每一提出的要求,即参数估计值在每一n n下下都要无偏和有效;都要无偏和有效
19、;一致性一致性是对是对n n增加增加提出的要求,即为对估计量的提出的要求,即为对估计量的渐近性渐近性要求。要求。2021-10-10 25第三节第三节 似然函数的渐近性质似然函数的渐近性质一、单参数情况一、单参数情况二、多参数情况二、多参数情况2021-10-10 26 一、单参数情况一、单参数情况( )ln( ; )0iil cf x cc=是通过最大似然法估计出来的,因而有是通过最大似然法估计出来的,因而有( )c x设设能进一步对能进一步对c c求导,将求导,将在在处展开有处展开有( )l c( )l ccc=2 ( )( )() ( )()( ).l cl ccc l ccc l c=
20、略去高于二阶项略去高于二阶项有有 ()cc( )( )() ( )(2.3.1)l cl ccc l c=其中其中( )0c0lcl=(因为 的得到就是使)2021-10-10 2722 ( )( )ln( ; )ln( ; )c cc cc ciiiil cl cf x cccf x cc=对于对于n n比较大比较大的情况,上式可用的情况,上式可用数学期望数学期望替代,因而有替代,因而有22( )ln( ; )1( )2.3.2l cnEf x cV cc= ()其中其中为无偏估计的为无偏估计的最小方差最小方差,为,为常数。常数。 ( )V c由(由(2.3.12.3.1)和()和(2.3.
21、22.3.2)式有)式有: :1( )()2.3.3 ( )l cccV c= ()2021-10-10 28因而,在因而,在大样本大样本(n n较大较大)情况下,似然函数具有平均值为)情况下,似然函数具有平均值为 、方、方差为差为 的的正态正态分布形式。最大似然估计的这种性质(分布形式。最大似然估计的这种性质(无偏、有最无偏、有最小方差、服从正态分布小方差、服从正态分布)是在)是在大样本大样本下下 才具有的。因而为才具有的。因而为渐渐近无偏近无偏。因而似然函数也被称为。因而似然函数也被称为渐近正态渐近正态。 c ( )V c()n221( )()2 ( )1( )exp() /( ),2.3
22、.42l cccV cL ckccV ck= =常数或为常数()上式上式积分积分得:得:二、多参数情况二、多参数情况设似然函数中有设似然函数中有m m个参数,用个参数,用c c来表示。将对数似然函数在来表示。将对数似然函数在c c的最大的最大似然估计似然估计 处展开,有处展开,有 c2021-10-10 2912( )ln( )( )()()1()()().(2.3.5)2mc ciiiic ciijjijijll cL cl cccclccccc c= 1( )ln( )( )()()(2.3.6)2Tl cL Cl CCCW CC=由于由于 是最大似然估计,因而对数似然函数的一阶导数为是最
23、大似然估计,因而对数似然函数的一阶导数为0 0。 c22()()ijijllnEc cc c 当,时因而(因而(2.3.52.3.5)化为)化为其中其中1122mmccccCCcc=2021-10-10 302222112122222122222212()()()()()()()()()mmmmmlllEEEcc cc clllEEEc ccc cWlllEEEccccc =积分(积分(2.3.62.3.6)得似然函数)得似然函数L L(C C)为)为1( )exp()()(2.3.7)2TL CkCCW CC=这为一这为一m m维维正态分布正态分布,其均值为,其均值为C C,协方差矩阵为,协
24、方差矩阵为1( )V CW=2021-10-10 31例:求正态分布参数的最大似然估计的方差例:求正态分布参数的最大似然估计的方差解:解:222()1( ;)lnC2iixln = 由于是由于是正态正态分布,因而有分布,因而有对数似然函数对数似然函数为为222222222222(),()2()iixlnlnl = = = 权权W W的矩阵元为的矩阵元为其中其中 和和 未知,用最大似然估计值代入有未知,用最大似然估计值代入有222x2021-10-10 32则权矩阵为则权矩阵为24002nWn= 协方差矩阵为协方差矩阵为214020nVWn=由于协方差矩阵由于协方差矩阵非对角非对角元素为元素为0
25、 0,因而,因而 和和 是是不相关不相关。22021-10-10 33第四节第四节 区间估计区间估计一、置信区间的概念一、置信区间的概念二、置信区间的求法二、置信区间的求法2021-10-10 34一、置信区间的概念一、置信区间的概念对于参数对于参数c c,仅求其点估计,还是不够的。它只是得到参数,仅求其点估计,还是不够的。它只是得到参数c c的一的一个近似值。还必须知道它的近似程度,即要求给出包含参数真值的个近似值。还必须知道它的近似程度,即要求给出包含参数真值的一个区间及其相应的概率。这即是区间估计所讨论的问题。一个区间及其相应的概率。这即是区间估计所讨论的问题。12 ( )( )(2.4
26、.1)PP c xcc x=则称区间则称区间 是参数是参数c c的置信概率为的置信概率为 的置信区间。的置信区间。 又称为置信又称为置信水平或置信度,水平或置信度, 称为显著水平或显著度称为显著水平或显著度。), (21ccP1 P=P设对某总体样本分布待求的未知参数为设对某总体样本分布待求的未知参数为c c,由样本,由样本x x找到两个统计找到两个统计量量 ,它们组成的区间,它们组成的区间 内包含参数真值内包含参数真值c c的概率为的概率为 即即P12(,)c c12( )( )c xc x、2021-10-10 35注意!:注意!:参数真值没有随机性参数真值没有随机性,是一个确定值。,是一
27、个确定值。这里的随机性这里的随机性是属于置信区间本身。是属于置信区间本身。二、置信区间的求法二、置信区间的求法(一)利用无参数的分布来求(一)利用无参数的分布来求若能找到一统计量,它为样本和被估参数的函数,分布不依赖于任若能找到一统计量,它为样本和被估参数的函数,分布不依赖于任何参数,则可用此统计量求出一定置信水平下参数的置信区间。何参数,则可用此统计量求出一定置信水平下参数的置信区间。例例1 1:求正态分布期望值的置信区间:求正态分布期望值的置信区间解:解:选统计量选统计量() ()uxn=设设 服从正态分布服从正态分布 ,根据,根据 是否已知,分两种情况讨论是否已知,分两种情况讨论2( ;
28、)N 2x1. 1. 已知已知22021-10-10 3612()(2.4.4)xPuuuPn=对对 取取对称位置对称位置,12uu、即即22()1xPuuuPn= =122uuu=则上式化为:则上式化为:22(0,1)1(2.4.4 )uuNduP= =因而可得因而可得22()P xuxuPnn=2u满足满足其中其中则统计量则统计量 服从标准正态分布,有服从标准正态分布,有u2021-10-10 37相应置信概率为:相应置信概率为:亦可表为:亦可表为:22(,)xuxunn因而因而 的置信区间为的置信区间为P2()xuPn置信概率为2. 2. 未知情况未知情况2选统计量选统计量2()()(1
29、)(2.4.6)iixxtxxxn nS=2021-10-10 38统计量统计量t t服从自由度为服从自由度为n-1n-1的的t t分布,因而有分布,因而有22() 1(2.4.6)xxP tttPS = =由置信概率和自由度,通过查由置信概率和自由度,通过查t t分布表得到。分布表得到。2t分位点分位点由上式有由上式有22()()(2.4.7)xxP x t Sx t SP =相应的置信概率为:相应的置信概率为:也可表为:也可表为:因而因而的置信区间为的置信区间为22(,)xxx t S x t SP2()xx t SP置信概率为2021-10-10 39由似然函数和最大似然估计值,可以对于
30、任意给定置信水平,求出由似然函数和最大似然估计值,可以对于任意给定置信水平,求出参数参数c c的置信区间:的置信区间:12 ,cc cc(二)利用似然函数求置信区间(二)利用似然函数求置信区间步骤:步骤:21221ln ( ; ) ln ( ;)(2.4.8)2ccL x cL x cu=其次其次,找出对数似然函数,找出对数似然函数 ,比其最大值,比其最大值 下降下降 所所相应的参数值,即由方程相应的参数值,即由方程ln ( ; )L x cln ( ; )L x c2212u解出解出 和和 。1 c2 c最后最后,得到参数,得到参数c c在置信概率为在置信概率为 时的置信区间为:时的置信区间
31、为:P12 ,cc cc首先首先,根据选定的置信水平,根据选定的置信水平 ,查出标准正态分布双侧分位数,查出标准正态分布双侧分位数 。P2u证明证明( (略)略)2021-10-10 40VcceVcVcNccP2/)(21221) (;), (=(三)大样本下最大似然估计的置信区间(三)大样本下最大似然估计的置信区间在在大大样本情况下,参数样本情况下,参数c c的最大似然估计量的最大似然估计量c c总趋于一总趋于一正态正态分布分布);(ln/122cxfcEnV=其中方差其中方差V V为无偏估计的最小方差限,由(为无偏估计的最小方差限,由(2.2.62.2.6)式决定,即)式决定,即因而大样
32、本情况下,对任意分布因而大样本情况下,对任意分布f f(x x;c c)的参数)的参数c c进行区间估计进行区间估计时,就可以利用对正态分布期望值进行区间估计的方法进行。时,就可以利用对正态分布期望值进行区间估计的方法进行。做变量做变量代换代换()/uccV=2021-10-10 412()(2.4.12)c uVP置信概率为得得c c的置信区间的置信区间V V可通过下面方法求得可通过下面方法求得2212212121111/ln( ; )ln( ; )ln( ; )(2.4.13)nic cinic ciVEf x cf x cncnncf x cc= 给定置信概率给定置信概率 ,可查出分位数
33、,可查出分位数 2uP2021-10-10 42上式中上式中V V的求法的的求法的两两个近似:个近似:一是一是在在V V的式子中对的式子中对 的期望值的积分计算很难做,用其平的期望值的积分计算很难做,用其平均值代替;均值代替;);(ln22cxfc一是一是概率密度函数概率密度函数 中的参数中的参数c c未知,用估计值代替。未知,用估计值代替。);(cxf(四)似然区间(四)似然区间(自学自学)2021-10-10 43第五节第五节 参数估计的贝叶斯方法参数估计的贝叶斯方法一、参数的验前分布与验后分布一、参数的验前分布与验后分布二、贝叶斯假设二、贝叶斯假设2021-10-10 44一、参数的验前
34、分布与验后分布一、参数的验前分布与验后分布( ; )()(2.5.1)p x cp x c=有些情况下,参数有些情况下,参数c c本身也可以是一个随机变量,它可能服从某种本身也可以是一个随机变量,它可能服从某种分布分布 ,参数,参数c c的这种分布称为的这种分布称为验前分布验前分布。( )p c对概率密度函数对概率密度函数 的理解:在的理解:在参数参数c c取定值取定值的条件下,随机变的条件下,随机变量为量为 的概率密度,的概率密度,x);( cxp在参数本身是随机变量的情况下,推断在出现某样本情况下,参数在参数本身是随机变量的情况下,推断在出现某样本情况下,参数c c取各种可能值的概率密度,
35、即参数取各种可能值的概率密度,即参数c c的条件概率密度的条件概率密度 。这个。这个函数称参数函数称参数c c的的验后分布验后分布。()p c x即:即:验前分布验前分布验后分布验后分布2021-10-10 45由贝叶斯公式有:由贝叶斯公式有:() ( )()(2.5.2)( )p x c p cp c xp x=为似然函数,由下式决定为似然函数,由下式决定()p x c1()()()(2.5.3)niip x cL x cp x c=( )() ( )(2.5.4)p xp x c p c dc=由上面知,要确定验后分布,由上面知,要确定验后分布,关键问题关键问题是要知道参数是要知道参数c
36、c的的验前分布验前分布。为样本的函数,由下式决定为样本的函数,由下式决定( )p x2021-10-10 46解:解:由(由(2.5.22.5.2)式,当)式,当 或或 时时 1 c 2 2.5 c 3.5223.523.512.512.5(1.6)20.5 (1.6; ,1) 0.5 (1.6; ,1)(1.6; ,1)(1.6)0.5(1.6; ,1)0.5(1.6; ,1)(1.6; ,1)(1.6; ,1)(1.6; ,1)1.860.53652cncncncp c xncdcncdcncdcncdcnce=例:如果某量例:如果某量c c的观测值的观测值 服从正态分布,方差为服从正态分
37、布,方差为1 1,即,即 。若若c c也是一个随机变量,由于某些物理条件的限制,它只能取区间也是一个随机变量,由于某些物理条件的限制,它只能取区间1,21,2和和2.5,3.52.5,3.5内的数值,并取各个可能值有相同的概率密度。内的数值,并取各个可能值有相同的概率密度。即参数即参数c c的验前分布为的验前分布为如果一次实验观测值如果一次实验观测值 ,试计算,试计算c c的验后分布。的验后分布。 ( ; ,1)x n x c0.5( )pc =当 1 c 2或 2.5 c 3.50其 它1.6x =x2021-10-10 47显然,当显然,当 时,得到时,得到c c在在 内的概率内的概率远大
38、于远大于c c在在 内的概内的概率。率。1.6x=1,22.5,3.5二、贝叶斯假设二、贝叶斯假设参数的验前分布参数的验前分布参数的验后分参数的验后分布布但验后分布一般不知,怎么办?但验后分布一般不知,怎么办?由(由(2.5.22.5.2)如果对参数的如果对参数的验前分布验前分布没有任何知道和信息,则假定参数对一切可没有任何知道和信息,则假定参数对一切可能取值都是能取值都是等概率等概率的。的。贝叶斯假设:贝叶斯假设:2021-10-10 48基于贝叶斯假设,有参数基于贝叶斯假设,有参数c c的验后分布为:的验后分布为:()( )()( )()()( )()( )()(2.5.5)()p x c
39、 p cp x c p c L x cp c xp xp x c p c dcL x cL x c dc=即验后分布是似然函数即验后分布是似然函数归一化归一化的结果。的结果。2021-10-10 49第六节第六节 假设验证概述假设验证概述一、基本概念一、基本概念二、显著性检验的一般方法二、显著性检验的一般方法三、两类错误三、两类错误2021-10-10 50一、基本概念一、基本概念 对抽样总体的分布形式或其中的参数所作出的某个推测或断对抽样总体的分布形式或其中的参数所作出的某个推测或断言称作一个假设,记为言称作一个假设,记为H H。 根据观测的样本对假设进行检验,称为假设检验。根据观测的样本对
40、假设进行检验,称为假设检验。 接受假设或拒绝假设(舍弃)。接受假设或拒绝假设(舍弃)。 接受假设接受假设并不是证明假设并不是证明假设,只是说明样本和假设之间还,只是说明样本和假设之间还没有没有发现显著的矛盾发现显著的矛盾。注意:注意:如果被检验的假设只涉及到参数值,如果被检验的假设只涉及到参数值,如果要检验分布类型,如果要检验分布类型,假设假设:假设检验假设检验:检验结果检验结果:则为则为参数检验参数检验。则称则称非参数检验非参数检验或或分布类型检验分布类型检验。2021-10-10 51有些问题属于二中选一,这时可作两种假设,有两个假设时,其中有些问题属于二中选一,这时可作两种假设,有两个假
41、设时,其中要进行检验的假设叫要进行检验的假设叫零假设零假设(或叫(或叫原假设原假设)用)用 表示,而另一假设表示,而另一假设叫叫备择假设备择假设,用,用 表示。表示。0H1H不考虑备择假设,只检验样本与零假设有无显著差异,称为不考虑备择假设,只检验样本与零假设有无显著差异,称为显著性显著性检验检验。若只涉及参数,称为。若只涉及参数,称为参数显著性检验参数显著性检验。单假设单假设(假设中概率密度函数参数完全给定)(假设中概率密度函数参数完全给定)复假设复假设(假设中参数给出在一个范围内,参数值没确定)(假设中参数给出在一个范围内,参数值没确定)二、显著性检验的一般方法二、显著性检验的一般方法首先
42、首先根据检验假设的性质选择一个检验统计量根据检验假设的性质选择一个检验统计量T T,它为样本的函数,它为样本的函数( )(2.6.1)TT x=2021-10-10 52)( HTp其次,在假设其次,在假设H H成立的条件下得到该统计量的概率密度函数成立的条件下得到该统计量的概率密度函数 由此确定关于由此确定关于T T值的某个区域值的某个区域R R,在这个区域内,在这个区域内T T值落入的概率为值落入的概率为 其值很少,此区域称为拒绝域,见下图其值很少,此区域称为拒绝域,见下图 称为显著水平,意义为:表示在零假设成立的条件下检验统计量称为显著水平,意义为:表示在零假设成立的条件下检验统计量T
43、T2021-10-10 53归纳归纳步骤步骤:1.1.根据实际问题,根据实际问题,构成构成统计统计假设假设H H;2.2.选用恰当的检验选用恰当的检验统计量统计量T T;3.3.选定显著水平选定显著水平 ,确定,确定拒绝域拒绝域R R;4.4.由样本计算出由样本计算出 ;( )TT x=5.5.如果如果T T落在落在R R内,则称在显著水平内,则称在显著水平 下拒绝假设下拒绝假设H H,否则接受假设。,否则接受假设。落在拒绝域落在拒绝域R R内的内的概率含量概率含量。若通过样本计算出。若通过样本计算出T T落入落入拒绝域拒绝域R R内,内,则观测样本与假设则观测样本与假设显著差异显著差异,从而
44、在显著水平,从而在显著水平 下下拒绝拒绝零假设;零假设;反之,则接受零假设。拒绝域反之,则接受零假设。拒绝域R R因显著水平变化而变化。因显著水平变化而变化。2021-10-10 54三、两类错误三、两类错误一类为一类为“以假当真以假当真”错误,存伪错误、检验污染、第二类错误、错误,存伪错误、检验污染、第二类错误、 错误。错误。一类为一类为“以真乱假以真乱假”错误,拒真错误、检验的损失、第一种错误或错误,拒真错误、检验的损失、第一种错误或错误;错误;犯两类错误的概率与分布函数犯两类错误的概率与分布函数及拒绝域位置有关,见右图及拒绝域位置有关,见右图2021-10-10 55同时考虑到犯两类错误
45、的概率,才有可能选择最佳的检验方案。同时考虑到犯两类错误的概率,才有可能选择最佳的检验方案。 称为称为检验功效检验功效, 称为称为检验污染检验污染,如下图。检验时,当检验损,如下图。检验时,当检验损失一定时,应当选择检验功效较大的检验方案。失一定时,应当选择检验功效较大的检验方案。12021-10-10 56 一般样本容量一般样本容量n n一定时,一定时, 减小,减小, 则增加,如果它们同时减小则增加,如果它们同时减小或一个减小而另一个不变,则必须增大样本容量。或一个减小而另一个不变,则必须增大样本容量。注意注意:2021-10-10 57第七节第七节 正态分布的参数检验正态分布的参数检验一、
46、平均值的检验一、平均值的检验二、两个平均值的比较二、两个平均值的比较三、方差的检验三、方差的检验2021-10-10 58一、平均值的检验一、平均值的检验=a假设假设H H:设正态分布设正态分布 ,样本,样本 ,检验样本所来自的总体的期,检验样本所来自的总体的期望是否与已知的望是否与已知的 相同。相同。),(N),.,(21nxxxx =(一)(一) 已知已知 检验法检验法2u选统计量为选统计量为(2.7.1)xun=服从标准的正态分布。根据显著水平确定拒绝域。有服从标准的正态分布。根据显著水平确定拒绝域。有两两种检验方法:种检验方法:单单边检验(拒绝域在边检验(拒绝域在一端一端););双双边
47、检验(拒绝域在边检验(拒绝域在两端两端),见下图。),见下图。2021-10-10 59最后最后:比较:比较 与与 ,得出结论。,得出结论。u2u 如果如果 比比 太大或太小都要拒绝,采用太大或太小都要拒绝,采用双边双边检验;只考检验;只考虑一种可能,则用虑一种可能,则用单边单边检验。检验。x选取标准:选取标准:我们在此讨论双边检验我们在此讨论双边检验步骤:步骤:首先首先:根据显著水平查正态分布函数值:根据显著水平查正态分布函数值表得到表得到 ;2u其次其次:由样本按(:由样本按(2.7.12.7.1)计算出)计算出 值;值;u这一检验称为这一检验称为 检验法。检验法。u若若 ,则接受假设;反
48、之,则拒绝假设。,则接受假设;反之,则拒绝假设。2uu2021-10-10 60选统计变量选统计变量(2.7.2)/xtSn=服从自由度为服从自由度为n-1n-1的的t t分布,其中分布,其中2 121() 1iiSxxn=由显著水平由显著水平 ,查,查t t分布表得出分位点分布表得出分位点 ,即,即2t2()(2.7.3)P tt=由样本,利用(由样本,利用(2.7.22.7.2)计算统计量)计算统计量t t。若若 ,则,则拒绝拒绝原假设原假设H H,否则,否则接受接受H H。2tt(二)(二) 未知未知 检验法检验法t22021-10-10 61解:解:由题知由题知n=4n=4,方差未知,
49、因而选,方差未知,因而选t t检验法检验法。查自由度查自由度n=3n=3的的t t分布表,得到分位点分布表,得到分位点20.025(3)3.1824tt=选统计量选统计量/xtSn=由样本信息得统计量由样本信息得统计量t t的值为:的值为:8.30 8.320.3333/0.034xtSn=例:测某铜液例:测某铜液4 4次得铜含量均值为次得铜含量均值为 ,样本标准方差,样本标准方差 。若测定值总体服从正态分布。若测定值总体服从正态分布。试在显著水平试在显著水平 下检验假设下检验假设H: H: ?8.32a= =8.30%x =0.03%S =0.05=2021-10-10 6220.0250.
50、3333(3)3.1824ttt=12111222,.(,),.(,)nmx xxNy yyN 来自总体来自总体由于由于因而在显著水平因而在显著水平 下下接受接受假设。假设。0.05=二、两个平均值的比较二、两个平均值的比较两组样本:两组样本:问题问题:检验这两个总体的期望值是否相同。:检验这两个总体的期望值是否相同。问题的实验背景问题的实验背景:两组实验数据是否对:两组实验数据是否对同一物理量的测量同一物理量的测量或在某种或在某种实验条件变化实验条件变化下正态分布的下正态分布的期望值期望值是否有明显的是否有明显的变化变化。2021-10-10 63210:=H零假设零假设备择假设备择假设21
51、1:H根据方差根据方差 是否已知和相等,分三种情况讨论。是否已知和相等,分三种情况讨论。2212、(一)(一) 和和 已知已知212222 ( ,)yNm 221212 (,)x yNnm11( ,)xNn 分布合成定理分布合成定理选统计量选统计量2212(2.7.4)x yunm=因而可以利用前面的因而可以利用前面的u u检验法检验法进行进行检验检验。假设假设2021-10-10 64(二)(二) 和和 未知但相等未知但相等2122(2.7.7 )11xytSnm=12()()(2.7.5)11xytSnm=221 212221 2111(1)(1)21()() (2.7.6)2nmiiii
52、SnSmSnmxxyynm=选择统计变量(选择统计变量(抽样分布定理抽样分布定理)其服从自由度为其服从自由度为n+m-2n+m-2的的t t分布。式中分布。式中S S为为在原假设成立的条件下,统计量变为:在原假设成立的条件下,统计量变为:(2)tt nm2021-10-10 65若若m=nm=n时,则上式化为:时,则上式化为:221 212(2.7.8)1()xytSSn=(22)ttn 以上两种情况都可用以上两种情况都可用t t检验法检验法进行进行检验检验。(三)(三) 和和 未知且不相等未知且不相等212222122.7.8xyuS n S m=()这种情况不能进行严格,只能进行近似处理。
53、这种情况不能进行严格,只能进行近似处理。22221122SS、当当n n足够大足够大 时,时, 。22S(15)n因而因而选统计量选统计量利用利用u u检验法检验法进行进行检验检验。2021-10-10 66例例: :有以下两组数据,各来自正态总体。问可否认为来自同一正态有以下两组数据,各来自正态总体。问可否认为来自同一正态总体?总体?12:1.36 1.43 1.48 1.40 1.36 1.32 1.54 1.45 1.23 1.38:1.42 1.36 1.48 1.26 1.38 1.46 1.57 1.38 1.43 1.39XX解:解: 由题可知由题可知n=10n=10,由数据可计
54、算出,由数据可计算出11111.395niixXn=22111.423niixXn=2222211()0.007111niiSXxn=2211111()0.007671niiSXxn=12221 21 2121.395 1.42311()(0.007670.00711)100.0280.7290.0384xxtSSn= 2021-10-10 67选定选定 ,查,查t t分布表,相应自由度为分布表,相应自由度为(10+10-2)=18,(10+10-2)=18,得得0.05=20.025(18) 2.10tt=20.0250.729 2.10(18)ttt=由于由于因而因而接受接受假设。假设。三
55、、方差的检验三、方差的检验方差反映出变量方差反映出变量离散离散程度。因而检查仪器工作稳定与否或检查两台程度。因而检查仪器工作稳定与否或检查两台仪器的精确度是否相同时,常用到方差的检验。仪器的精确度是否相同时,常用到方差的检验。(一)(一) 检验法检验法2问题是检验总体方差是否与已知方差相同?问题是检验总体方差是否与已知方差相同?2021-10-10 68提出假设提出假设202:=H选择统计量选择统计量20212022) 1()(Snxxnii=其服从自由度为其服从自由度为n-1n-1的的 分布。分布。2因为总体方差比已知方差太大或太小都说明总体方差有所变化,因因为总体方差比已知方差太大或太小都
56、说明总体方差有所变化,因而采用而采用双边双边检验。检验。由显著水平由显著水平 ,查,查 分布表,得上下分位数分布表,得上下分位数 ,它们应满足,它们应满足22212,22222212()2,()2PP=即即222122() 1P= 2021-10-10 69因而得拒绝域为:因而得拒绝域为:2222122(2.7.11)及若单边检验,则拒绝域为:若单边检验,则拒绝域为:22(二)(二)F F检验法(检验法(用来比较两个正态分布的方差是否相同用来比较两个正态分布的方差是否相同)提出假设提出假设222201212:1H =或由于总体方差可用样本方差来近似(样本容量足够大)。由于总体方差可用样本方差来
57、近似(样本容量足够大)。选择统计量选择统计量22112221(1)()(2.7.11)(1)()niimiimxxSFSnyy=其服从自由度为(其服从自由度为(n-1n-1,m-1m-1)的)的F F分布。分布。2021-10-10 70()(2.7.13)P FF=由显著水平由显著水平 ,查,查F F分布表,得拒绝域的下界分布表,得拒绝域的下界 ,其满足,其满足F由样本计算出由样本计算出F F,若,若 ,则,则拒绝拒绝原假设,反之则原假设,反之则接受接受原假设。原假设。FF例:两种仪器对同一零件长度测得数据如下。问它们的精度一致吗?例:两种仪器对同一零件长度测得数据如下。问它们的精度一致吗?
58、第一仪器第一仪器X X:100 101 103 98 97 99 102 101 98 101第二仪器第二仪器Y Y:97 102 103 100 101 100 96解:解: 由题可提出假设由题可提出假设2212:H=选择统计量选择统计量22112221(1)()(1)()niimjjmyySFSnxx=2021-10-10 71由两组数据可得由两组数据可得11100,10mjjxxmm=22112221(1)()6.481.783.78(1)()njjmiimyySFSnxx=11100,7niiyynn=22111()3.78,101mjjSxxmm=22211()6.48,71niiS
59、yynn=选显著水平选显著水平 ,查,查F F分布表,对应自由度为(分布表,对应自由度为(n-1=6n-1=6,m-1=9m-1=9)得)得0.05=0.05(1,1)(6,9)3.37F nmF=由于由于1.713.37FF=故故接受接受假设,即认为他们的精度一致。假设,即认为他们的精度一致。2021-10-10 72第八节第八节 分布型式的检验分布型式的检验二、柯尔莫哥洛夫检验法二、柯尔莫哥洛夫检验法一、皮尔逊一、皮尔逊 检验法检验法22021-10-10 73 由样本由样本 ,检验随机变量的分布检验随机变量的分布 是否为某种给定的分布是否为某种给定的分布 ,即检验假设,即检验假设 ,这类
60、检,这类检验称为分布型式的检验,又叫拟合性检验。验称为分布型式的检验,又叫拟合性检验。12(,.)nxx xx=);(cxp);(cxf);();(:cxfcxpH=分布型式的检验:分布型式的检验:选取统计变量选取统计变量221()(2.8.1)miiiifnpnp=1.1.将样本由小到大按顺序排列并分组。把区间将样本由小到大按顺序排列并分组。把区间 (或有限区(或有限区间)分为间)分为m m个区间,分点分别为个区间,分点分别为 ,相应区间为,相应区间为 ),()()2() 1 (,.,mxxx),(),.,),.(,(),()1()()1()2()1()1(miixxxxxx检验检验步骤步骤
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省水安建设公司招聘笔试真题及答案
- 儿科体外膜氧合院际转运专家共识重点总结2026
- 侵袭性肺真菌病诊断与治疗指南总结2026
- 2026中级安全工程师《其他安全》课程精讲(第2-1章)
- 2026年事业单位编制考试公共基础知识全真模拟试卷及答案(共十六套)
- 简化型劳动合同协议范本
- 2023年打捆机和玉米割台企业组织架构及部门职责
- 脉冲场消融共识房颤治疗首选
- (新)《平凡的世界》试题及答案2篇
- (2026)注册安全工程师考试建筑施工(中级)安全生产专业实务试卷及解答参考
- 2025年甘肃庆阳市地理生物会考真题试卷(+答案)
- 北京市西城区2026年中考二模英语试题(含答案)
- (三模)济南市2026届高三5月针对性训练生物试卷(含答案)
- 2026宁夏电投永利能源有限公司招聘21人考试备考题库及答案解析
- 金牛区驷马桥等街道2026年公开招聘社区专职工作人员(26人)笔试备考试题及答案详解
- 2026中国报废汽车拆解行业盈利动态与需求趋势预测报告
- 2026年无损检涡流检二级考核模拟题库附参考答案详解【考试直接用】
- 风险预警及处置工作制度
- 2026年春教科版(新教材)小学科学三年级下册第三单元《只有一个地球》知识点清单
- 西安交通大学同等学力人员申请硕士学位资格审查表
- 2026新疆事业单位招聘(公基)笔试题及答案
评论
0/150
提交评论