概率论与数理统计期末考试复习资料剖析_第1页
概率论与数理统计期末考试复习资料剖析_第2页
免费预览已结束,剩余23页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章随机事件及其概率(1)排列组合公式Pn-m!从m个人中挑出n个人进行排列的可能数。m(m-n)!Cn-m!从m个人中挑出n个人进行组合的可能数。mn!(m-n)!加法和乘法原理加法原理(两种方法均能完成此事m+n某件事由两种方法来完成,第一种方法可1种方法完成,第二种方法可由n种方法来完成,则这件事可d+n种方法来完成。乘法原理(两个步骤分别不能完成这件事)Xn某件事由两个步骤来完成,第一个步骤可1种方法完成,第二个步骤可由n种方法来完成,则这件事可由Xn种方法来完成。一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题随机试验和随机事件如果一个试验在相同条件下可以重复

2、进行,而每次试验的可能结止一个,但在进行一次试验之前却不能断言它出现哪个结果,则种试验为随机试验。试验的可能结果称为随机事件。基本事件、样本空间和事件在一个试验下,不管事件有多少个,可以从其中找出这样一组事件它具有如下性质: 每进行一次试验,必须发生且只能发生这一组中的一个事件; 任何事件,都是由这一组中的部分事件组成的。这样一组事件中的每一个事件称为基本事件®来表示。基本事件的全体,称为试验的样本空间,表示。一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,表示事件,它们是的子集。Q为必然事件,0为不可能事件。不可能事件(0)的概率为零,而概率为零的事件不一

3、定是不可能事彳同理,必然事件(Q)的概率为1,而概率为1的事件也不一定是必然事件。(6)事件的关系与运算 关系:如果事件A的组成部分也是事件的组成部分,(A发生必有事件B发生):AuB如果同时有AuB,B二A,则称事件A与事件B等价,或称A等于B:A=BbA、B中至少有一个发生的事件AuB,或者A+B。属于A而不属于B的部分所构成的事件,称为与B的差,记为A-B,也可表示为A-AB或者AB,它表示A发生而B不发生的事件。A、B同时发生:AnB,或者AB。A"B=3,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的°-A称为事件A的逆事件,或

4、称(的对立事件,记为。它表示A不发生的事件。互斥未必对立。 运算:结合率:A(BC)=(AB)C0(BUC)=(AUB)UC分配率:(AB)UC=(AUC)n(BUC)(AJB)DC=(AC)U(BC)德摩根率:厲Ai=JAia|jB二AAB,AAB二AUB概率的公理化定义设。为样本空间,为事件,对每一个事伤都有一个实数P(A),若满足下列三个条件:1°OWP(A)W,2°pg=13°对于两两互不相容的事件,A,有pUAi=艺P(Ai)T常=称为可列(完全)可加性。则称P(A)为事件A的概率。yAl古典概型1°Q=to,j,12n12°P(o)

5、=P(o)=P(o)=一o12nn设任一事件A,它是由o,o组成的,则有cA1*mp(a)=X®)U(o)UU(o)J=P(o)+P(o)+P(o)12m12mmA所包含的基本事件数=n基本事件总数(9)几何概型若随机试验的结果为无限不可数并且每个结果出现的可能性均匀时样本空间中的每一个基本事件可以使用一个有界区域来描述,此随机试验为几何概型。对任一事件P(A)=L(Q)。其中L为几何度量(长度、面积、体积)(10)加法公式P(A+B)=P(A)+P(B)-P(AB)当P(AB)=0时,P(A+B)=P(A)+P(B)(11)减法公式P(A-B)=P(A)-P(AB)当BuA时,P(

6、A-B)=P(A)-P(B)当A二Q时,P(B)=1-P(B)(12)条件概率定义设A、B是两个事件,JP(A)>Q则称彳凹为事件A发生条件P(A)下,事件B发生的条件概率,记为(B/A)=P(AB)oP(A)条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(Q/B)=1nP(B/A)=1-P(B/A)(13)乘法公式乘法公式:P(AB)=P(A)P(B/A)更一般地,对事件,A,A,若P(AAA)>0,则有12n12n-1P(A,A2An)=P(A)P(A2IAJP(A3IA/JP(An1A/2AnJo(14)独立性两个事件的独立性设事件A、b满足P(AB)=P(A)

7、P(B),则称事件A、b是相互独立的。若事件A、B相互独立,且P(A)>0,则有P(B1A)=P(AB)=P(A)P(B)=P(B)P(A)P(A)若事件A、B相互独立,则可得到与b、a与B、A与B也都相互独立。必然事馄和不可能事件0与任何事件都相互独立。0与任何事件都互斥。多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,P(AB)二P(A)P(B)P(BC)二P(B)P(C)P(CA)二P(C)P(A)并且同时满足P(ABC)=P(A)P(B)P(C)那么A、B、C相互独立。对于n个事件类似。(15)全概公式设事件Bb.b满足1°B,B2,B”两两互不相容,P(B

8、i)>0(/=1,2,n),2°AuJB,i则有17P(A)二P(B1)P(A1B1)+P(B2)P(A1B2)+P(Bn)P(A1Bn)。(16)贝叶斯公式设事件B,B,,B及A满足1°b,B,B两两互不相容,P(Bi)>0,i=1,2,n,12n2°AuJBi,P(A)>0,则i=1P(R/AP(B)P(A/B)P(Bi'A)-f,i=1,2,n。YP(B)P(A/B)此公式即为贝叶斯公式。P(B),(i=1,2,n),通常叫先验概率。(B/A),(i=1,2,n)通常称为后验概率。贝叶斯公式反映了“因果”的概率规律作出了“由果朔因”

9、的推断。(17.伯努利概型我们作了n次试验,且满足每次试验只有两种可能结果,发生或A不发生;n次试验是重复进行的,即发生的概率每次均一样;每次试验是独立的,即每次试A佥发生与否与其他次试验发生与否是互不影响的。这种试验称为伯努利概型,或称n重伯努利试验。用p表示每次试验A发生的概率,则A发生的概率为p=q,用p表示n重伯努利试验中A出现k(0<k<n)次的概率,"P”(k)=Ckpkqn-k,k=0,1,2,n。第二章随机变量及其分布离散型随机变量的分布律设离散型随机变量的可能取值为(k=1,2,)且取各个值Pk的概率,即事件X=X)的概率为kP(X=x)=p,k=1,2

10、,,则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:X|X1,x2,,xk,。显然分布律应满足下下列条件:pk>0,k=1,2,,£pk=1。连续型随机变量的分布密度设F(x)是随机变量X的分布函数,若存在非负函数(x),对任意实数x,有F(x)二Jxf(x)dx,则称X为连续型随机变量。(x)称为X的概率密度函数或密度函数,简称概率密度。密度函数具有下面个性质:1°f(x)>0。2°卜f(x)dx二1。离散与连续型随机变量的关系P(X=x)uP(x<X<x+dx)qf(x)dx积分元f(x)dx在连续型随机变量理论中

11、所起的作用与P(X=x)=Pk在离散型随机变量理论中所起的作用相类似。分布函数设X为随机变量,x是任意实数,则函数F(x)=P(X<x)称为随机变量(的分布函数,本质上是一个累积函数。P(a<X<b)二F(b)-F(a)可以得到X落入区间a,b的概率。分布函魏(x)表示随机变量落入区间(a,X内的概率。分布函数具有如下性质:1°0<F(x)<1,g<x<+a;2°F(x)是单调不减的函数即x】<x2时,有F(x1)<F(x2);3°F(a)=limF(x)=0,F(+a)=limF(x)=1;x»gx

12、»+a4°F(x+0)二F(x),即F(x)是右连续的;5°P(X二x)二F(x)F(x0)。对于离散型随机变量,(x)pk;xQx对于连续型随机变量,(x)=Jf(x)dx。八大分布0-1分布P(X=1)=p,P(X=0)=q二项分布在n重贝努里试验中,设事件发生的概率划。事件A发生的次数是随机变量,设为,则X可能取值为0,1,2,n。P(X二k)二P(k)二Ckpkqn-k,其中nnq=1-p,0<p<1,k=0,1,2,n,则称随机变量c服从参数为,P的二项分布。记为XB(n,p)。当n=1时,P(X二k)二pkq1-k,k=0.1,这就是(0-

13、1)分布,所以0-1)分布是二项分布的特例。泊松分布设随机变歎的分布律为九kP(X=k)e-九,九0,k二0,1,2,k!则称随机变歌服从参数为i的泊松分布,记为X兀(九)或者P(九)。泊松分布为二项分布的极限分布(=入,nTs)。超几何分布CkCn-kk=0,1,2,/P(X=k)=MNM,Cn/=min(M,n)随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。几何分布P(X=k)=qk-1p,k=1,2,3,,其中P$0,q=1-p随机变量X服从参数为p的几何分布,记为(p)。均匀分布设随机变量X的值只落在a,b内,其密度函数f(x)在a,b上为常数1,即b一afiaWx

14、Wbf(x)=|b-/其他,则称随机变驾在a,b上服从均匀分布,记为xu(ab)。分布函数为0,xva,x-ab一aaWxWb<F(x)=jxf(x)dx=-81,x>b。当aWx<xWb时,X落在区间©,x)内的概率为121'2/、x-xP(x<X<x)=卜。12ba25指数分布九e人,rx>0f(x)40,x<0其中九0,则称随机变量(服从参数恕的指数分布。X的分布函数为1e-人,x>0F(x)二0,xv0。记住积分公式:+8Jxnexdx=n!0正态分布设随机变量X的密度函数为、1f(x)二e2b2,g<x<+

15、8,V2kq其中卩、b>0为常数,则称随机变戟服从参数为卩、b的正态分布或高斯Gauss)分布,记为XN(PQ2)。f(x)具有如下性质:1°f(x)的图形是关于=卩对称的;2°当x*时,f(卩)为最大值;若XN(RQ2),则X的分布函数为1.(tF(x).Jxe_2b2dt°°Q2兀bg参数卩二0、b=1时的正态分布称为标准正态分布1己为XN(0,1),其密度函数记为1x2P(x)=2=e2,分布函数2为g<x<+8,1xt20(x)二Je2dtoJ2兀(x)是不可求积函数,其函数值,已编制成表可查用。(-x)=1-(x)且0(0)=

16、1o如果XN(y,b2)则XN(0,1)o(x-谓(x-卩)P(x<X<x)二-4o12bb(6)分位数下分位表:P(X卩)=a;a上分位表:P(X卩)=a。a函数分布离散型已知X的分布列为XX1,x2,xn'P(X=X,)p1,P2,Pn、Y=g(X)的分布列(y二g(x)互不相等)如下:Yg(x1),g(x2),i,g(x“),P(Y=y.)pp.p'若有某些g(x.)相等,则应将对应的相加作为g(x.)i的概率。连续型先利用X的概率密度f(x)写出Y的分布函数F(y)XY=P(g(X)Wy),再利用变上下限积分的求导公式求f(y)。Y第三章二维随机变量及其分布

17、(1)联合离散型分布如果二维随机向量(X,Y)的所有可能取值卩至多可列个有序对(y),则椒为离散型随机量设g=(X,Y)的所有可能取值为(x,y)(i,j二1,2,),且事件g=(x,y)的概率为P称1"lj,P(X,Y)二(x,y)二p(i,j二1,2,)ijij为g=(X,Y)的分布律或称为(和Y的联合分布律c联合分布有时也用下面的概率分布表来表示:y1y2yjx1p11P12P1jx2p21P22P2j:xiPi1pj:这里p具有下面两个性质:ij(1)P$0(i,j=1,2,);lj连续型1)对于二维随机向量二(X,Y),如果存在非负函数f(x,y)(-8<x<+

18、8,-8<y<+s),使对任意一个其邻边分别平行于坐标轴的矩形区域即D二(X,Y)|a<x<b,c<y有P(X,Y)eD=Hf(x,y)dxdy,则称g为连续型"随机向量并称f(x,y)为g=(X,Y)的分布密度或称为和Y的联合分布密度。分布密度f(x,y)具有下面两个性质:f(x,y)$0;(2)卜卜f(x,y)dxdy二1.(2)二维随机变量的本质g(X=x,Y=y)=g(X=xAY=y)(3)联合分布函数设(X,Y)为二维随机变量,对于任意实数y,二元函数F(x,y)二PX<x,Y<y称为二维随机向範X,Y)的分布函数,或称为随机变量(

19、和Y的联合分布函数。分布函数是一个以全平面为其定义域,以事件(,)l-x<X()<x,-g<Y()<y的概率为函数值的一个实值函数。分布函数(x,y)具有以下的基本性质:(1) 0<F(x,y)<1;(2) F(x,y)分别对x和y是非减的,即当x>x时,有F(x,y)2F(x,y);当y>y时,有F(x,y)鼻2121212F(x,y);1,(3) F(x,y)分别对x和y是右连续的,即F(x,y)=F(x+0,y),F(x,y)=F(x,y+0);(4) F(一叫一g)=F(一®y)=F(x,s)=0,F(+s,+s)=1.对于x&

20、lt;x,y<y,1212F(x,y)-F(x,y)-F(x,y)+F(x,y)>0.22211211离散型与连续型的关系P(X=x,Y=y)沁P(x<X<x+dx,y<Y<y+dy)沁f(x,y)dxdy(5)边缘分布离散型X的边缘分布为P=P(X=x)*p(i,j=1,2,);iijY的边缘分布为'P=P(Y=y)=工p(i,j=1,2,)ojj(/连续型X的边缘分布密度为f(x)=卜f(x,y)dy;XY的边缘分布密度为f(y)=卜f(x,y)dx.Y“(6)条件分布离散型在已知X二x的条件下,Y取值的条件分布为iP(Y=y1X二x)二j;ji

21、p在已知丫二y的条件下,X取值的条件分布为jP(X二x1Y二y)二仝,1jpj连续型在已知丫二y的条件下,X的条件分布密度为f(x1y)=f(”;f(y)Y在已知X二X的条件下,丫的条件分布密度为f(yix)=ffx(x)(刀独立性一般型F(X,Y)二F(x)F(y)XY离散型P=ppij/有零不独立连续型f(x,y)=f(x)f(y)XY直接判断,充要条件: 可分离变量 正概率密度区间为矩形二维正态分布1ff丫-2p(x十y-巴)+f丫f(x,y)=,e2(1-p2)NS丿2l。2丿,2兀QQ讥一P212p=0随机变量的函数若X,X,X,X,X相互独立,h,g为连续函数,12mm+1n则:h

22、(X,X,X)和g(X,X)相互独立。12mm+1n特例:若X与丫独立,则:h(X)和g(Y)独立。例如:若X与Y独立U:3X+1和5Y-2独立。(8)二维均匀分布设随机向量X,riSf(x,y)=<D0,Y)的分布密度函数为(X,y)eD其他其中S为区域D的面积,则称X,Y)服从D上的均匀分布,D记为XY)7(D)。例如图3.1、图3.2和图3.3。图3.1x图3.2D3(9)二维正态分布c-a图3.3设随机向量X,Y)的分布密度函数为12(1P2)xyp丫a1丿2P(x-片)(y-比)aa12f(x,y)=.e2兀aa才1-p212其中卩,ya>0,a>0,|p|<

23、1是5个参数,则称X,Y)服从二12,12维正态分布,记为(X,Y)7(y,ya2,a2,p).12,12仍为正态分布,即XN(卩,a2),YN(卩a2).112,2但是若XN(,a2),YN(卩a2),(X,Y)未必是二维正态分布112,2(10)函数分布Z二X+Y根据定义计算:F(z)=P(Z<z)=P(X+Y<z)对于连续型,f(z)=jf(x,z-x)dx两个独立的正态分布的和仍为正态分布(卩+卩,G2+G2)。n个相互独立的正态分布的线性组合,仍服从正分布。卩二工C卩G2二工C2G2ii,iiZ=max,min(X,X,12X)n若X,XX相互独立,其分布函数分别为12n

24、F(x),F(x)F(x),则Z=max,min(XX,X)的X兀宀x12n分1布函数为:nF(x)二F(x)F(x)F(x)maxxxxF(x)二1-1-F(x)1-F(x)lF(x)minxxxX2分布设n个随机变竝,X,,X相互独立",且服从标12n准正态分布,可以证明它们的平方和W=X2i的分布密度为1nuu2-1e-2u>0,f(u)=b:r-12丿0,u<0.我们称随机变量W服从自由度为!的X2分布,记为wX2(n),其中(n、nr-=j+®x2-1e-xdx.12丿0所谓自由度是指独立正态随机变量的个数是随机变量分布中的一个重要参数。X2分布满足可

25、加性:设Y-x2(-),ii则Z=艺Yx2(n+n+卜n).i12ki=1t分布设X,Y是两个相互独立的随机变量,且XN(0,1),YX2(n),可以证明函数T亠JY/n的概率密度为(n+1rf(t)=n+12(g<t<+8).F分布12丿我们称随机变量服从自由度为n的t分布,记为Tt(n)。(n)=t(n)设X咒2(n),Y咒2(n),且X与Y独立,可以证明12F=兰(住的概率密度函数为Y/n21口口(n)rrn)2I2丿I2丿rf(y)=<n+n'122丿(n2专11,ny21+y1n丿In2,y>0、0,y<0我们称随机变量F服从第一个自由度为,第二

26、个,1自由度为n的F分布,记为Ff(n,n).212F(n,n)=-1-a12F(n,n)第四章随机变量的数字特征(1)一维随机变量的数字特征离散型连续型期望期望就是平均值设X是离散型随机变量,其分布律为P(X二x)=kP,k=1,2,n,kE(X)=xpkk(要求绝对收敛)设X是连续型随机变量其概率密度为f(x),+8E(X)=jxf(x)dx(要求绝对收敛)函数的期望Y=g(X)E(Y)=工g(x)pkkk=1Y=g(X)E(Y)=fg(x)f(x)dxg方差D(X)二EX-E(X)2标准差&(x)=Jd(x),D(X)=YxE(X)2pkkkD(X)=+gxE(X)2f(x)dx

27、g矩对于正整数k,称随机对于正整数k,称随机变变量X的k次幂的数学期量X的k次幂的数学期望为望为X的k阶原点矩,记X的k阶原点矩,记为/,为V,即k即kVv二E(X)二Vxkpk11v二E(X)二卜xkf(x)dx,kik=1,2,.gk=1,2,.对于正整数k,称随机对于正整数k,称随机变变量X与E(X)差的k次量X与E(X)差的k次幂的幂的数学期望为(的k阶数学期望为X的k阶中心中心矩,记为1,即矩,记为1,即kR=E(X-E(X)kk1=E(X-E(X)kk=V(x-E(X)kpii,-卜(x-E(X)kf(x)dx,ik=1,2,.-gk=1,2,.切比雪夫不等式设随机变量(具有数学期

28、望E(X)=u,方差D(X)=02,则对于任意正数£,有下列切比雪夫不等式.C2P(|X-1>8)<切比雪夫不等式给出了在未知的分布的情况下对概率P(|X-1>8)的一种估计,它在理论上有重要意义。(21)E(C)二C期望)E(CX)二CE(X)的性)质4)E(X+Y)=E(X)+E(Y,E(工CX)=Ece(X)iiiiE(XY)=E(X)E(Y,充分条件:和1Y独立;充要条件:X和Y不相关。)D(C)=0E(C)=C方差)D(aX)二aD(X);E(aX)=aE(X)的性)D(aX+b)二sD(X);E(aX+b)=aE(X)+b质4)D(X)二E(X)-E2(

29、X)5)D(X±Y)=D(X)+D(Y)充分条件:和Y独立;充要条件:X和Y不相关。D(±Y)=D(X)+D(Y)±2E(X-E(X)(Y-E(Y),无条件成立。而E(X+Y)=E(X)+E(Y,无条件成立。期望方差常见0-1分布B(1,p)Pp(1-p)分布二项分布B(n,p)npnp(1-p)的期泊松分布P(九)九九望和几何分布G(p)11-ppp2方差超几何分布H(n,M,N)nMNnM(M)(N-n)NIN人N-1丿均匀分布U(a,b)a+b2(b一a)212指数分布e(X)1九1九2正态分布N(PQ2)g2X2分布n2nt分布0n(n>2)n一2二

30、维随机变量的数字特征期望E(X)=£xpii=1E(Y)=Yypjjj=1E(X)=fxf(x)dxX-gE(Y)=fyf(y)dyY函数的期望EG(X,Y)=MG(x,y)pijijijEG(X,Y)=+g+gJJG(x,y)f(x,y)dxdy方差D(X)=2x-E(X)2piiiD(Y)=2xE(Y)2pjj/D(X)=fx-E(X)2f(x)dxX-gD(Y)=+gy-E(Y)2f(y)dyY协方差对于随机变量(与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为池或cov(X,Y),即1G=卩=E(X-E(X)(Y-E(Y).与记号M相对应,X与Y的方差D(X)与D(

31、Y)也可分别记为y与g。XXYY相关系数对于随机变量(与Y,如果D(X)>0,D(Y)>0则称gXY'D(Y)为X与Y的相关系数,记作丫(有时可简记为)。|P|W1,当|P|=1时,称X与Y完全相关:P(X=aY+b)=1完全相关1正相关,当P=1时丫>0),负相关,当p=1时(a<0),而当p=0时,称X与Y不相关。以下五个命题是等价的: P=0;XY cov(X,Y)=0; E(XY)二E(X)E(Y); D(X+Y)二D(X)+D(Y); D(X-Y)二D(X)+D(Y).协方差矩阵(gg)XXXY9g丿vYXYYy混合矩对于随机变量X与Y,如果有E(Xk

32、Yi)存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心kl矩记为:u=E(XE(X)k(YE(Y)1.klcov(X,Y)二cov(Y,X);协方)cov(aX,bY)二abcov(X,Y);差的i)cov(X+X,Y)=12cov(XY)+cov(XY);性质)cov(X,Y)=E(XY)-E(X)E(Y).(7)若随机变量(与Y相互独立,则秽=0;反之不真。独立若(X,Y)7(p,p,g2,g2,p),和不则X与Y相互独立的充要条件是和Y不相关。相关(1)大数定律Xfp切比雪夫大数定律设随机变量X,X,相互独立,均具有有限方12且被同一常数C所界:D(X)<C(i=1

33、,2,),则对于任意的正数£,有'1工X1工n1ni=1i=1limPnfg二1.£丿特殊情形:若(,X,具有相同的数学期望12(X)二U,则上式成为IlimpInfg伯努利大数定律1工n:i=i设U是n次独立试验中事件发生的次数,是事件A在每次试验中发生的概率,则对于任意的数£,有(pP<£1n丿二1.limPnfg第五章大数定律和中心极限定理伯努利大数定律说明,当试验次数艮大时,小,即ptp>£n丿二0.limPnfg辛钦大数定律这就以严格的数学形式描述了频率的稳定性。设X,X,X,是相互独立同分布的随机变12n序列,且

34、E(X)=«,则对于任意的正数£有nXP<£=1.丿limPnfg1工nii=i(2)中心极限定理cy2XTN(卩,)n列维林德伯格定理设随机变量X,X,相互独立丿服从同一分布,12且具有相同的数学期望和方差:E(X)二比D(X)二2丰0(k=1,2,),则随机变量kk£XnpkY-gnJny的分布函数F(x)对任意的实数(,有n工X-np-2k1ft2limF(x)-limP<x>Jxe-2dt.ntsnntspny2兀-s此定理也称为独立同分布勺中心极限定理。棣莫弗_拉普拉斯定理设随机变量X为具有参数n,p(0<p<1的

35、二项分n布,则对于任意实数,有fXnp1ft2-limP<n<x>Jxe2dt.ntsJnp(1p)Q2-s(3)二项定理若当Nts时,Tp(n,k不变),贝UNCkCn-kM_N-MTCkpk(1-p)n-k(NTS).Cnn超几何分布的极限分布为二项分布。泊松定理若当nTs时,npT九0,贝»九k/、Ckpk(1p)n-kTe-九(nTs).nk!其中k=0,1,2,,n,。二项分布的极限分布为泊松分布。第六章样本及抽样分布(1)数理统计的基本概念总体在数理统计中,常把被考察对象的某一个或多个)指标的全体称为总体或母体)我们总是把总体看成一个具有分布的随机变量(

36、或随机向量)个体总体中的每一个单元称为样品(或个体)样本我们把从总体中抽取的部分样品x,,x称为样本。样本中所含的样品数称为样本容量,一般用表示。在一般情况下,总是把样本看成个相互独立的且与总体有相同分布的随机变量,这样的本称为简单随机样本在泛指任一次抽取的结果时x,x,,x表示n个随机变量(样本)在具体的一12n.»“次抽取之后,x,兀2,,x表示n个具体的数值(样本值)。我们称之2为样本的两重性。样本函数和统计量设x,x,,x为总体的一个样本,称9=9(x,x,x)为样本函数:其中为一个连续函数。如果中不包含任何未知参数,则称(x,x,,x)为一个12n统计量。常见统计量及其性质

37、样本均值x=丄工x.nii=1样本方差1n-S2=工(x-x)2.n-1ii=1样本标准差S=1Y(x-x)2.1n-1i样本k阶原点矩M=丄工xk,k=1,2,.knii=1样本k阶中心矩M'=丄工(x一x)k,k=2,3,.knii=1Q2E(X)=R,D(X)=,nn1E(S2)=q2,E(S*2)=q2,n其中s*2=丄工(X-X)2,为二阶中心矩。ni(2)正态总体下的四大分布正态分布设x,兀2,,x为来自正态总体N(PQ2)的一个样本,则样本函数"udefx一;N(0,1).Q17'nt分布设x,兀2,,x为来自正态总体N(y,Q2)的一个样本,则样本函数

38、"甘一二t(n-1),s/Jn其中t(nT)表示自由度为hT的t分布。X2分布设x,兀2,,x为来自正态总体N(y,Q2)的一个样本,则样本函数"def(n一1)S2Xc(w=fX2(n一1),Q2其中X2(n-1)表示自由度为nT的x2分布。F分布设x,x,,x为来自正态总体N(2)的一个样12n1本,而y,y,y为来自正态总体N(y,G2)的一个样本,则样本函数dfS2/G2F塹F(n-1,nS2/Q212其中22S2=1Z(x-x)2,1n1i1i=1F(n1,n1)表示第一为n1的F分布。221),S2=Z(yy)2;2n1i-自由度为1:第二自由度1(3)正态X与

39、S2独立。总体下分布的性质(1)点估计矩估计设总体X的分布中包含有未知数,0,,9,则其分布函12m数可以表成F(x;0,9,,9).它的k阶原点矩12mv=E(Xk)(k=1,2,m)中也包含了未知参数,9,,9,k12m即v=v(9,9,9)o又设x,x,x为总体X的n个样本值,其样本做阶原点矩为1Zxkni这样,应的样本矩”的原则建立方程,即有,X2,,Xn(k=1,2,m).我们按照“当参数等于其估计量时,总体矩等第七章参数估计v(9,9,,9A)=1Zx,112mnii=1v(9,9,9A)=丄工x2,212mnii=1v(9,9,9A)=Zxm.m12mnii=1由上面的m个方程中

40、解出的m个未知参数少,y,,9A)即12m为参数9,9,,9)的矩估计量。12m若於为。的矩估计,g(x)为连续函数,则(0)为g(9)的矩估计。极大似然估计当总体X为连续型随机变量时,设其分布密度为f(x;0,0,月),其中,0,为未知参数。又设12m12mx,x,x为总体的一个样本,称12nL(0,0,0)=肝f(x;0,0,0)12mi12m为样本的似然函数,简记为.n当总体X为离型随机变量时,设其分布律为PX=x=p(x;0,0,-,0),则称12mL(x,x,x;0,0,,0)=p(x;0,0,月)12n12mi12mi=1为样本的似然函数。若似然函数L(x,x,x;0,0,,0)在

41、00.0处12n12m2,5m取到最大值,则称0.0分别为0,0,,0的最大似1,2,5m12m然估计值,相应的统计量称为最大似然估计量。dInLn=0,i=1,2,mao'0,/i若0为0的极大似然估计g(x)为单调函数则g(0)为g(0)的极大似然估计。估计量的评选标准无偏性设0=0(x,x,x)为未知参数的估计量。若E(0)=0,12n则称0为0的无偏估计量。E(X)=E(X),E(S2)=D(X)有效性设01=01(x,x,x)和02=02(x,x,x)是未知参数1112n2212n0的两个无偏估计量若D(0)<D(0),则称0比0有效。一致性设0是0的一串估计量,如果对

42、于任意的正数都有nlimP(l0-0|>£)=0,nns则称0为0的一致估计量(或相合估计量)n若0为0的无偏估计,Jb(0)T0(nT8),则0为0的一致估计。只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连:函数都是相应总体的一致估计量。区间估计置信区间和置信度设总体X含有一个待估的未知参数。如果我们从样本x,x,x出发,找出两个统计量=0(x,x,x)与12n1112n0=0(x,x,x)(0<0),使得区间0,0以1-a(0<a<1)的概率包含这个待估参数即P0<0<0=1-a,12那么称区间0,0为0的置信区间,1-a为该区间的置信度(或置信水平。单正态总体的期望和方差的区间估计设X,x,2,,x为总体XN(y,G2)的一个样本,在置信度为下,我们来确霜和g2的置信区间e,o。具体步12骤如下:(i) 选择样本函数;(ii) 由置信度-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论