已阅读5页,还剩161页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,数理统计基础知识,.,例:试验E电话台单位时间内收到的用户呼唤次数。记呼唤次数为X,则X是一个变量,取值为0,1,2,,(X=i)代表相应的基本事件(样本点)。,变量X的取值是变化的取决于试验的基本结果(样本点)事先不能确定,有随机性;但取任一值都有确定的概率。我们把具有上述性质的X称为随机变量。,随机变量的引入,使随机事件的表达在形式上非常简洁,随机变量,.,随机变量的定义,定义2.1设试验E的样本空间为,对于的任一样本点按照某种对应法则,都有唯一确定的实数X()与之对应,即X=X()是定义在上的一个实值函数,且对于任意实数x,x|X()x是一随机事件,有确定的概率,则称X=X()为随机变量。,注:(1)随机变量是试验结果(即样本点)和实数之间的一个对应关系,与高等数学中的函数概念本质上是一回事。,随机变量X=X()是函数,其自变量是样本点,定义域是样本空间,值域是实数集或其子集。,.,(4)引入随机变量后,随机试验中的各种事件,就可以通过随机变量表达出来。,(3)随机变量的取值有一定的概率。(随机变量与普通函数的本质差异)由此可知:对随机变量的研究,不仅要搞清楚随机变量取值的范围,还要搞清楚取相应值的概率。,例如:单位时间内某传呼台收到的呼叫次数用X表示,则“收到不少于一次呼叫”“X1”,“没收到呼叫”“X=0”。,(2)随机变量通常用大写字母,或希腊字母,等表示而表示随机变量所取的值时,一般采用小写字母x,y,z等。,.,随机变量的分类,按照随机变量的取值情况可把其分为两类:离散型随机变量:随机变量的全部取值只有有限个或可列个。非离散型随机变量:其中最重要的是连续型随机变量,随机变量的取值连续地充满某个(或几个)区间或整个数轴。,离散型,连续型,.,为了描述随机变量,只知道它可能取的值是不够的,更重要的是要知道它取各个值的概率(即概率分布情况)。,定义:若随机变量只能取有限个数值x1,x2,xn,或可列无穷多个数值x1,x2,xn,,则称为离散型随机变量。,离散型随机变量,.,若所有可能的取值为x1,x2,对应的概率为p1,p2,。即:P(X=xi)=pi,i=1,2,(1)则称式(1)为随机变量的概率函数或概率分布或分布律或分布列(简称为分布)。,定义:,分布列常以下列表格(概率分布表)的形式表示:,.,离散型随机变量的分布列的性质,性质:由概率的性质可知,任一离散型随机变量的分布列pi都具有下述两个性质:(1)、pi0,i=1,2,;(2)、,反过来,任一具有上述两个性质的数列pi,都有资格作为某一个随机变量的分布列。,分布列不仅明确地给出了(=xi)的概率,而且对于任意的实数a1)=?P(0X3)=?P(-1X2)=?,.,定义2.若随机变量X所有可能取值是某一区间上的所有实数,且存在非负可积的函数f(x),使得对任意实数,有:,则称X为连续型随机变量,称f(x)为X的概率分布密度函数,简称为概率密度或密度函数或密度。记作Xf(x)。,.,由定义知道,概率密度f(x)具有以下性质:,介于曲线y=f(x)与x轴之间的面积等于。,具有上述两条性质的函数必定是某个连续型随机变量的密度函数。,.,注意,连续型随机变量密度函数的性质与离散型随机变量分布律的性质非常相似,但是,密度函数不是概率!,连续型随机变量的一个重要特点:取个别值的概率为零,证明:,所以有,.,连续型随机变量取值于某一区间的概率时,区间是否包含端点,是不必考虑的.,这是连续型随机变量与离散型随机变量截然不同的一个重要特点。它说明,用概率分布描述连续型随机变量毫无意义。,.,说明,由上述性质可知,对于连续型随机变量,我们关心它在某一点取值的问题没有太大的意义;我们所关心的是它在某一区间上取值的问题,.,定义2.2设X是一个随机变量,x是任意实数,函数,称为X的分布函数,对于任意的实数x1,x2(x10,(1)P(AB)的直观含义,P(|B)=1,若Ak(k=1,2,)两两互不相容,则(Ai|B)=(Ai|B)i=1i=1,对于任一事件A,都有0P(A|B)1,.,样本空间,A,B,B新样本空间,条件概率的实质,条件概率P(A|B)的实质是样本空间起了变化。,缩小为只取所包含的样本点。有利事件为AB。,AB,相关性质:对于固定的事件B,设P(B)0,A为任意事件,则:P(A|B)+P(|B)=1另外,对概率的各性质,变为条件概率(|B)后依然成立,.,3、条件概率的求法,注意:应用此公式时P(B)P(AB)都是在原来的样本空间中考虑,.,用P(AB)=P(A)P(B)来刻划独立性,比用P(A|B)=P(A)更方便,因它不受P(B)是否为0的制约,而且,式中事件A与B的地位对称,反映了独立的相互性。,事件的独立性,事件A对于事件B的条件概率P(A|B)和事件A的无条件概率P(A)可能相等或不相等。,若P(A|B)=P(A)(P(B)0),定义1.4,此时由乘法公式知:P(A)=P(A|B)等价于P(AB)=P(A)P(B),称对于独立,P(AB)=P(A)P(B),定义1.5:(事件的独立性),则称事件与相互独立。,如果事件A,B,满足:,.,随机变量的数字特征,.,某班共有学生10人,期中测验成绩情况如下,引例:,随机变量的数学期望,则该班的平均成绩为,若令fi表示频率,则上式可表示为,由概率的统计定义知道,在大量试验下,频率fi概率pi.,加权平均值,.,一、离散型随机变量的数学期望,1、定义:设离散型随机变量的概率函数为P(=xi)=pii=1,2,若级数绝对收敛,则称此级数的和为随机变量的数学期望。简称期望或均值。记作E,即如果级数不绝对收敛,则称随机变量的数学期望不存在。,.,假设一个班共20人,其中18岁的有6人,19岁的有10人,20岁的有4人,现任取一人观察其岁数,则观察到的岁数x为一随机变量,不难求出x的分布率如表2所示。,例:,求:这个班的学生的平均年龄。,解:,.,二、连续型随机变量的数学期望,例1:计算在区间a,b上服从均匀分布的随机变量x的数学期望。,解:依题意,故,2、举例:,.,三、随机变量函数的数学期望,定理1:,设=g(),g(x)是连续函数,那么,(2)若为连续型随机变量,其密度函数为f(x),,(1)若为离散型随机变量,其概率函数为,1、一维随机变量函数的数学期望,.,例1:设随机变量的分布列为,求:E2,E(2-1)。,解:,例2:,求:E,解:,.,定理2:,若(,)是二维随机变量,g(x,y)是二元连续函数,(1)若(,)为二维离散型随机变量,其联合分布为,(2)若(,)为二维连续型随机变量,其联合密度函数为f(x,y),且,2、二维随机变量函数的数学期望,.,解:,例1:设(,)的联合分布为,求:E(-),E。,E(-)=,(0-1)(0-2)(0-3)(1-1)(1-2)(1-3),0.1+0.2+0.3+0.2+0.1+0.1,=-2.1,E()=,(01)(02)(03)(11)(12)(13),0.1+0.2+0.3+0.2+0.1+0.1,=0.7,.,解:,例2:,求:E(-3+2),E。,.,性质1:常量的期望就是这个常量本身,即E(c)=c.,四、数学期望的性质,证:常量c可看作仅取一个值c的随机变量,且取值c的概率为1,即的分布为P(=c)=1,这种分布称为退化分布,其数学期望为E(c)=c1=c,推论:E(E)=E,性质2:随机变量与常量c之和的数学期望等于的期望与这个常量c的和E(+c)=E+c,证:设的分布为pk(离散型);密度函数为f(x)(连续型),则,为离散型时,为连续型时,.,性质3:E(c)=cE常量c与随机变量的乘积的期望等于c与的期望的乘积,证:设的分布为pk(离散型);密度函数为f(x)(连续型),则,性质4:随机变量的线性函数的数学期望等于这个随机变量期望的同一线性函数E(k+c)=kE+c,证:E(k+c)=E(k)+c=kE+c,.,性质5:两个随机变量之和(差)的数学期望等于这两个随机变量数学期望之和(差)E()=EE,推论:对任意常数ci(i=1,2,n)、常数b及随机变量i(i=1,2,n),有,特别地,n个随机变量的算术平均数仍是一个随机变量,其期望值等于这n个随机变量期望的算术平均数。,性质6:两个相互独立随机变量乘积的数学期望等于它们数学期望的乘积,即E()=EE,.,解:Ex=90.3+100.5+110.2=9.9,例1:两相互独立的随机变量x,h的分布如下面两表所示。,Eh2=620.4+720.6=43.8,求:E(x+h)、E(xh)和Eh2,且因x与h相互独立,所以E(xh)=9.96.6=65.34,则E(x+h)=Ex+Eh=9.9+6.6=16.5,Eh=60.4+70.6=6.6,.,定义:设二维随机变量(,)的联合分布为P(=xi,=yj)=pij(i,j=1,2,)在=yj条件下随机变量的条件分布为,1、离散型,为在=yj条件下的条件数学期望,记作,五、条件数学期望,即有,.,即,同样可以定义,所以,例:设(,)在=1条件下的条件分布为,10.5+20.25+30.25=1.75,.,2、连续型,即,同样可以定义,定义:设二维随机变量(,)的条件密度为f(x|y)及f(y|x)。若绝对收敛,则称为在=y条件下的条件数学期望,记作,.,方差,解:,从平均值意义上看,两块手表质量相同。,从离散程度意义上看,甲表质量优于乙表。,方差,.,一、方差的定义,如果随机变量x的数学期望Ex存在,称x-Ex为随机变量的离差。,1.离差的定义:,随机变量x离差平方的数学期望称为随机变量x的方差。记作Dx或Varx,即,2.方差的定义:,特别标准差的定义:,称为x的标准差。,1o如果x是离散型随机变量,并且Px=xk=pk(k=1,2,),则,2o如果x是连续型随机变量,并且有密度函数f(x),则,Dx=Varx=E(x-Ex)2,.,3o方差的计算公式:,证:Dx=E(x-Ex)2,=Ex2-2xEx+(Ex)2,=Ex2-E(2xEx)+E(Ex)2,=Ex2-2Ex(Ex)+(Ex)2,=Ex2-(Ex)2,.,解:,EX2=(-10)20.2+(-5)20.2+120.2+520.2+1020.2=50.2,DX=EX2-(EX)2=50.2-0.22=50.16,解:,EX=(-10)0.2+(-5)0.2+10.2+50.2+100.2=0.2,.,解:,.,三方差的性质,性质1:常量的方差等于零。即:设c为常数,则Dc=0,证:D(c)=E(c-Ec)2=E(c-c)2=0,性质2:随机变量与常量之和的方差就等于随机变量的方差本身即:D(X+c)=DX,证:D(X+c)=EX+c-E(X+c)2=EX+c-EX-c)2=E(X-EX)2=DX,性质3:常量与随机变量乘积的方差,等于常量的平方与随机变量方差的乘积。即:D(cX)=c2DX,证:D(cX)=EcX-E(cX)2=EcX-cEX2=Ec(X-EX)2=Ec2(X-EX)2=c2DX,性质4:设k,b为常数,则:D(kX+b)=k2DX,.,性质5:两个独立随机变量和(差)的方差,等于这两个随机变量方差的和。即:D(XY)=DX+DY,证:D(XY),=E(XY)-E(XY)2,=E(X-EX)(Y-EY)2,=E(X-EX)2+(Y-EY)22(X-EX)(Y-EY),=DX+DY2E(XY-XEY-YEX+EXEY),=E(X-EX)2+E(Y-EY)22E(X-EX)(Y-EY),=DX+DY2(EXY-EXEY-EYEX+EXEY),=DX+DY2(EXY-EXEY),=DX+DY,性质5可以推广到任意有限个随机变量的情况,即,若X1,X2,Xn相互独立,则有D(X1+X2+Xn)=DX1+DX2+.+DXn,D(a1X1+a2X2+anXn+b)=a12DX1+a22DX2+.+an2DXn,=DX+DY2(EXEY-EXEY),.,定义:随机变量X的标准化随机变量,.,协方差与相关系数、矩,.,一协方差,1协方差的定义,定义:对于二维随机变量(X,Y),称E(X-EX)(Y-EY)为X与Y的协方差记做Cov(X,Y),即Cov(X,Y)=E(X-EX)(Y-EY),注:X与Y的协方差是反映X与Y之间相关关系的一个特征数,2协方差的计算,协方差的计算公式,证:Cov(X,Y)=E(X-EX)(Y-EY),Cov(X,Y)=E(XY)-EXEY,=E(XY-YEX-XEY+EXEY),=E(XY)-E(YEX)-E(XEY)+E(EXEY),=E(XY)-EXEY,由协方差的计算公式知,(1)若X与Y独立,则,Cov(X,Y)=0,(2)对X与Y有D(XY)=DX+DY2Cov(X,Y),.,性质5:两个独立随机变量和(差)的方差,等于这两个随机变量方差的和。即:D(XY)=DX+DY,证:D(XY),=E(XY)-E(XY)2,=E(X-EX)(Y-EY)2,=E(X-EX)2+(Y-EY)22(X-EX)(Y-EY),=DX+DY2E(XY-XEY-YEX+EXEY),=E(X-EX)2+E(Y-EY)22E(X-EX)(Y-EY),=DX+DY2(EXY-EXEY-EYEX+EXEY),=DX+DY2(EXY-EXEY),=DX+DY,=DX+DY2(EXEY-EXEY),(2)对X与Y有D(XY)=DX+DY2Cov(X,Y),.,例:设二维随机变量(X,Y)的联合分布如下表所示,求Cov(X,Y)。,解:可求出(X,Y)关于X,Y的边缘分布:,EX=(-1)3/8+02/8+13/8=0EY=0,Cov(X,Y)=E(XY)-EXEY=0,虽然Cov(X,Y)=0,但P(X=0,Y=0)P(X=0)P(Y=0)X,Y不独立,X与Y独立,Cov(X,Y)=0,.,性质4:Cov(1+2,)=Cov(1,)+Cov(2,),性质1:Cov(,)=Cov(,),性质2:Cov(,c)=0,性质3:Cov(a,b)=abCov(,),推论:,Cov(,)=E(E)(-E),3协方差的性质,Cov(a,a)=a2Cov(,),Cov(,)=E(E)(E)=D,.,定义:对于二维随机向量(,),如果D0,D0,则称为,的线性相关系数,简称相关系数,记作,或或。即:,相关系数,例:已知D=4,D=9,=0.5,求D(-),=4+9-20.523=7,.,练习已知(,)的联合分布,求,。,解:,E=2.5E=1.75,Cov(,)=E()-EE=5/8,E2=15/2,D=5/4,E2=47/12,D=41/48,关于,的边缘分布:,.,2相关系数的性质,性质1:,=,性质2:|1,性质3:与不相关=0零相关,.,注1:与独立,则与不相关(=0)。但反之一般不一定成立,注2:=0仅表明与无线性关系,而不是无任何关系(独立),分析:,独立,无任何关系,无线性关系,无非线性关系,=0,.,矩,1原点矩,定义:随机变量X的k次幂的数学期望叫做随机变量X的k阶原点矩记做k,即,对离散型随机变量X,设概率函数为P(X=xi)=pi,(i=1,2,)则,对连续型随机变量X,密度函数为f(x),则,.,定义:X-EX的k次幂的数学期望叫随机变量X的k阶中心矩。记做k,即,对离散型随机变量X,设概率函数为P(X=xi)=pi,(i=1,2,)则,对连续型随机变量X,设密度函数为f(x),则,2中心矩,.,统计量及其分布,.,数理统计学:研究大量随机现象的统计规律性的一门学科,概率论是数理统计的基础,数理统计是概率论的应用,统计量及分布,数理统计的基本概念,一总体和个体,总体:所研究对象的全体构成的集合。,个体:总体中的每一个元素。,例:考察某灯泡厂生产的灯泡。总体:全部灯泡。个体:每一个灯泡,例:考察某大学学生的身体状况.总体:全体学生.个体:每一个学生,总体和个体具有两重性:一方面指所研究的实体,另一方面又指实体的数量指标。,.,总体的分类:(1)有限总体:总体中的元素的个数有限(2)无限总体:总体中的元素的个数无限注意:有限总体的个数很多时,可近似为无限总体如:一个国家的人口,一袋小麦的粒数等,.,二、总体的分布,总体既是集合,又是随机变量。常用X,Y,Z表示,例:考察某灯泡厂生产的灯泡。总体X:灯泡的寿命。,例:考察某大学学生的身体状况.总体X:学生的体温.,总体也可以是二维随机变量,记为(X,Y)等,例:考察某大学学生的身体状况.总体(X,Y):学生的身高、体重.,总体的分布要借助于随机抽样来研究。,以后所研究的总体多是正态总体。,总体X的分布:即随机变量的分布由于总体X以不同的概率或不同的密度取值,X是一个随机变量.设随机变量X的分布函数为F(x),则称F(x)为总体X的分布,.,样本的二重性:容量为n的样本(X1,X2,Xn)是n次试验的结果,因试验是随机的,可把其看成是n个随机变量。但作了试验后,记录下来的是它们在试验中所取的数据(x1,x2,xn),称为样本的观察值。因此,样本在做具体试验前可理解为一个随机向量,在具体试验后可理解为一组观测值,因此,样本一词具有二重性。,随机抽样:从总体X中抽取部分个体。简称抽样,样本:抽取的部分个体(抽样的结果).记为(X1,X2,Xn),样本容量:样本所含个体的个数。,三、样本,.,简单随机样本:设总体为X,如果样本(X1,X2,Xn)满足:(1)代表性:每个Xi与总体X有相同的分布;(2)独立性:X1,X2,Xn相互独立;则称样本(X1,X2,Xn)为简单随机样本,简称为简单样本。,注,在有限总体中要得到简单样本,必须进行重复抽样。但当总体中个体数相对于样本容量充分大时,不重复抽样得到的样本也可近似看作简单样本.,小样本和大样本:当容量n时,研究的是大样本问题。其分布是极限分布。当容量n有限时,样本是小样本。其分布是随机向量的精确分布。在理论研究中小样本意味着固定样本容量,不能让它趋于无穷。,.,统计推断:分析样本数据对总体的分布作出结论,样本从总体带出的信息是分散的、零乱的,统计量,设总体X的分布函数为F(x),(X1,X2,Xn)是来自总体的样本,Xi的分布函数为F(xi),则(X1,X2,Xn)的分布函数为F(x1,x2,xn)=F(x1)F(x2)F(xn),若总体X的密度函数为f(x),(X1,X2,Xn)是来自总体的样本,Xi的密度函数为f(xi),则(X1,X2,Xn)的密度函数为f(x1,x2,xn)=f(x1)f(x2)f(xn),四、样本的分布,.,一、统计量:设(X1,X2,Xn)为来自总体X的样本,容量为n,设h(x1,x2,xn)为一不含未知参数的n元连续函数,则T=h(X1,X2,Xn)是一个随机变量,称为统计量。,5.2统计量,注:(1)统计量完全由样本决定,不依赖于任何其它未知的量。(2)统计量用于估计时称为估计量,用于检验时称为检验统计量(3)把样本观测值代入统计量,得到统计量的观测值。,.,例:当总体XN(,2),其中参数,2未知时,不是统计量,因它们都包含了未知参数。,例:统计量,当参数已知,2未知时,结论如何?,练习:178页第1题,.,二、常用统计量,定义5.2设样本(X1,X2,Xn)来自总体X,常用统计量:,样本均值:,样本方差:,样本k阶原点矩:,样本k阶中心矩:,样本标准差:,.,样本均值和样本方差的性质,定理5.1:设总体X的均值为EX=,方差为DX=2,样本(X1,X2,Xn)来自总体X,则,证:由于(X1,X2,Xn)是简单样本,所以EXi=EX=,DXi=DX=2(i=1,2,n),而且有,.,注意到:,.,有:,.,定义:若连续随机变量X的概率密度为,其中为常数,0为常数,则称X服从参数为,2的正态分布,记为XN(,2)。,正态分布满足密度函数的两个性质:,其分布函数为,正态分布,例如XN(1,4)则=1,=2,.,正态分布N(,2)的密度函数图形如右图所示,正态密度曲线呈古钟形曲线。,(1)(x)图形关于直线x=对称。,(4)参数决定曲线(x)的位置,参数决定曲线(x)的形状。固定而改变值,则曲线左右位置不同但形状不变,即此时(x)图形沿着x轴平行移动;固定而改变值,则曲线形状改变而位置不变。值越大时曲线越平缓,值越小,曲线越陡峭。,(3)在x=处,(x)取得最大值:,其特点如下:,(2)(x)在x轴上方,且以x轴为渐近线。,.,正态分布的重要性,正态分布是概率论中最重要的分布,这可以由以下情形加以说明:,正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布,正态分布有许多良好的性质,这些性质是其它许多分布所不具备的,正态分布可以作为许多分布的近似分布,一方面,有些分布(如二项分布、泊松分布)的极限分布是正态分布;另一方面,有些分布(如2分布、t分布)又可通过正态分布导出。,.,参数=0,=1的正态分布称为标准正态分布其密度函数为:,标准正态分布,记为XN(0,1)。,0(x)的性质,(1)0(x)是偶函数,即有0(-x)=0(x)。曲线0(x)是关于纵轴对称的古钟型曲线;,(2)在x=0处0(x)取得最大值,(3)0(x)在(-,0)内单增,在(0,+)内递减。,(4)0(x)在x=1,-1点取得拐点,且以x轴为渐近线。,.,有关0(x)的结论:,(3)P(|X|x)=0(x)-0(-x)=20(x)-1;,(4)P(|X|x)=P(Xx)+P(X-x)=21-0(x),(1)对于0(x),有0(-x)=1-0(x)0(0)=0.5,其分布函数为:,0(x)的几何意义:曲线0(x)与x轴之间在直线t=x左边图形的面积,若XN(0,1),密度函数为,(2)P(aXb)=0(b)-0(a),.,标准正态分布的密度函数0(x)和分布函数0(x)值有表查,例:已知XN(0,1),求:(1)P(X0.68);(2)P(X1.74);(3)P(|X|1.96);(4)P(|X|1.84)(5)P(X5.18);(6)P(X-8.7);,有关标准正态分布的概率计算,解:,(1)P(X0.68)=P(X0.68)=0(0.68)=0.7517,(2)P(X1.74)=1-P(X1.74)=1-0(1.74)=1-0.9591=0.0409,(3)P(|X|1.96)=P(-1.96X1.96)=0(1.96)-0(-1.96)=20(1.96)-1=20.975-1=0.95,(4)P(|X|1.84)=21-0(1.84)=0.0658,(5)P(X5.18)=0(5.18)1,(6)P(X-8.7)=0(-8.7)=1-0(8.7)0,注:当x5时0(x)1,当x-5时0(x)0,当0x5时查表当-5x0有:,(1)P(|X|x)=2。(x)-1;,(2)P(|X|x)=21-。(x)。,.,若随机变量XN(,2),则随机变量X落在区间(a,b内的概率可以转化成标准正态分布来计算,即P(aXb)=(b)-(a)=,例:设XN(1,4),求:P(01500,考虑:为判别新产品的寿命是否提高,提出以下两个假设(hypothesis)H0:新产品的寿命=1500,备择假设(H1)(alternativehypothesis),原假设(或零假设H0)(nullhypothesis),.,例2某产品的出厂检验规定:次品率p不超过3%才能出厂.现从一万件产品中任意抽查100件发现5件次品,问该批产品能否出厂?若抽查结果发现1件次品,问能否出厂?,该例中问题的解决转化为由抽样结果来判断假设是否成立的问题.,.,【例3】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。因此检验生产过程是否正常就转化为检验是否成立.,.,假设检验问题的处理方法1、对总体分布中的某些参数或对总体分布的类型做某种假设2、根据样本值做出接受还是拒绝所做假设的结论,例4.抛掷一颗骰子100次,1点,2点,6点出现次数依次为16,19,18,17,16,14.问这颗骰子是否均匀?,问题转化为由样本值判断假设:,是否成立的问题.,.,参数假设检验,非参数假设检验,假设检验,1、假设(hypothesis):在数理统计中,把对总体分布的各种论断称为统计假设,简称为假设,(1)、参数假设:关于总体分布中的参数的假设。,(2)、非参数假设:不是关于总体分布中的参数的假设,如:H0:F(x)对数正态分布族H1:F(x)正态分布族,二、假设检验的基本概念,2、假设检验(hypothesistest):在数理统计中,称判断假设是否成立的方法称为假设检验.,依据假设的类型假设检验可分为:,以下我们主要研究参数假设检验问题,.,3、假设检验问题a、对总体分布中的某些参数或对总体分布的类型做某种假设b、根据样本值做出接受还是拒绝所做假设的结论,具体地说:(1)如果一个检验问题只提出一个假设,而我们的目的也是为了判断这一假设是否成立,并不同时研究其他假设问题,这类假设检验问题成为显著性检验问题(2)一个检验问题可能提出两个甚至更多个假设。如果一个检验问题提出两个假设(设为H0-H1),且二者必居其一,则称其中一个为基本假设(零假设或原假设),另一个为它的对立假设(备择假设),本章所讨论的假设检验问题就是利用样本的信息在原假设H0与备择假设H1之间做出拒绝哪一个接受哪一个的判断,这类假设检验问题成为H0对H1的检验问题,.,7.1.2假设检验的基本思想,一、检验法1、从样本(X1,X2,Xn)出发,构造出一个是用于检验H0的统计量,并且,当H0成立时,统计量T的分布或渐近分布是已知的,2、制定一个对每一样本观测值都可明确的决定拒绝还是接受H0的法则,在样本值(x1,x2,xn)确定之后,按照这个法则做出判断拒绝H0,还是拒绝H1,这个法则称为H0对H1的检验法则,二、检验法则-在样本值(x1,x2,xn)确定之后,统计量的值T也确定了,把统计量的所有可能的取值分为两个集合E与,其中P(TE)=(很小),根据小概率事件原理:如果TE,则拒绝原假设H0(即接受备择假设H1)如果T,则接受原假设H0(即拒绝备择假设H1),若样本值(x1,x2,xn)W,若样本值(x1,x2,xn),称为显著性水平(Levelofsignificance)(或检验水平),W称为拒绝域,称为接受域,P(X1,X2,Xn)W)=(很小),样本值(x1,x2,xn)分为两个集合W与,.,注意:1、检验法则逻辑上运用反证法,统计上依据小概率原理2、如果是要检验参数,统计量T常选为要检验的参数的点估计,.,假设检验的基本思想,.因此我们拒绝假设=50,样本均值,m,=50,抽样分布,H0,.,三、假设检验问题的一般步骤1、根据问题的要求提出原假设H0和备择假设H12、选取检验统计量T(X1,X2,Xn),在H0成立的情形下,确定其分布。对于给定的显著性水平a,找到H0的拒绝域W和接受域3、如果根据样本值(x1,x2,xn)求出的检验统计值T,出现了(x1,x2,xn)W(小概率事件发生了),则拒绝H0,否则接受H0,显著性水平a和拒绝域(右侧检验),.,显著性水平a和拒绝域(左侧检验),.,显著性水平和拒绝域(双侧检验),.,7.1.3假设检验中的两类错误,一、第一类错误:拒真P(拒绝H0|H0为真)=-犯第一类错误的概率即P(x1,x2,xn)W|H0为真)=,假如我们给出了H0对H1的某个检验法则,也有了样本(x1,x2,xn)的拒绝域W,和接受域,但由于样本的随机性,在进行判断时,还是有可能犯两类错误:,二、第二类错误:受伪P(接受H0|H0为假)=-犯第二类错误的概率即P(x1,x2,xn)|H0为假)=,.,我们希望进行假设检验时,所找到的W能使犯第两类错误的概率都很小,但在样本容量给定后,要使a、b都很小是不可能的,否则将会导致样本容量无限增大,这又是不切实际的。基于这种考虑,奈曼与皮尔逊(Neyman-Pearson)提出一个原则即在控制犯第一类错误a的条件下,尽量使犯第二类错误b小(人们常常把拒真比受伪看的更重些),.,关于零假设与备择假设的选取,H0与H1地位应平等,但在控制犯第一类错误的概率的原则下,使得采取拒绝H0的决策变得较慎重,即H0得到特别的保护.,因而,通常把有把握的、有经验的结论作为原假设,或者尽可能使后果严重的错误成为第一类错误.,注,.,假设检验的步骤,其中,1、根据实际问题所关心的内容,建立H0与H1,2、在H0为真时,选择合适的统计量V,由H1确,给定显著性水平,其对应的拒绝域,双侧检验,左侧检验,定拒绝域形式,3、根据样本值计算,并作出相应的判断.,右侧检验,三部曲,.,7.2一个正态总体的参数假设检验,.,7.2一个正态总体的参数假设检验,7.2.1均值的假设检验,设总体XN(,2),考虑参数,2的假设检验,检验水平为样本(X1,X2,Xn)来自总体X。,考虑均值的三种形式的假设(1)H0:=0H1:0(2)H0:=0H1:0(3)H0:=0H1:0其中0是某个给定的数,单边检验,双边假设,单边假设,双边检验,.,一、2已知(U检验法),设总体XN(,2),2=02已知,是待检参数,检验水平为样本(X1,X2,Xn)来自总体X。,即当H0为真时,U的取值应在0的附近,这时,若一次抽样所得样本值使得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车销售合同及违约责任
- 房地产营销团队绩效考评制度
- 休闲食品电商运营商业计划书
- 英语定语从句关系代词使用规则
- 学生节假日安全教育活动设计
- 基于大数据的养老服务监控体系
- 2025年煤矿井下安全防护用品管理员年度再培训试卷及答案:用品管理
- 小学英语听说教学辅助材料开发
- 高中英语必修课《体育与健康》教案
- 2025年煤矿应急演练评估培训试卷及答案:应急演练中的演练总结
- 衡重式挡墙设计与施工技术要点
- DB22∕T 389.1-2025 用水定额 第1部分:农业
- 2026届广东肇庆市高三一模英语试题答案讲解课件
- 2025年广东普法考试试题及答案
- 2024年云南云天化股份有限公司招聘考试真题
- 2025年山东省公务员考试申论综合分析专项训练试卷(含答案)
- 2025版房屋租赁合同模板
- 2025-2030零工经济发展现状及平台商业模式优化策略研究报告
- 湖南省凤凰县2026届九年级物理第一学期期中学业水平测试模拟试题含解析
- 2025年民航招聘英语题库及答案
- 2026步步高高中化学必修第一册-学习笔记答案精析
评论
0/150
提交评论