统计基本概念PPT课件_第1页
统计基本概念PPT课件_第2页
统计基本概念PPT课件_第3页
统计基本概念PPT课件_第4页
统计基本概念PPT课件_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,第二章数理统计的基本概念,作出精确而可靠的结论.,数理统计可以分为两大类:,一类是如何合理地安排试验,,-描述统计学如:试验设计、抽样方法。,另一类是研究如何分析所获得的随机数据,,对所研究,的问题进行科学的、合理的估计和推断,,尽可能地为,采取一定的决策提供依据,,-推断统计学,,如:参数估计、假设,检验等。,以获取有效的随机数据。,数理统计,100个样品进行强度测试,于是面临下列几个问题:,例如某厂生产一型号的合金材料,,用随机的方法选取,1、估计这批合金材料的强度均值是多少?,(参数的点估计问题),2、强度均值在什么范围内?,(参数的区间估计问题),3、若规定强度均值不小于某个定值为合格,那么这,批材料是否合格?,(参数的假设检验问题),4、这批合金的强度是否服从正态分布?,5、若这批材料是由两种不同工艺生产的,那么不同,的工艺对合金强度有否影响?,若有影响,那一种工艺,生产的强度较好?,(分布检验问题),(方差分析问题),6、若这批合金,由几种原料用不同的比例合成,那么,如何表达这批合金的强度与原料比例之间的关系?,(回归分析问题),我们依次讨论参数的点估计、区间估计、假设检验、方差分析、回归分析,下面引入一些数理统计中的术语。,二、统计量,一、总体与样本,抽样和抽样分布,三、几个常用的分布,四、正态总体统计量的分布,1.总体,研究对象的某项数量指标值全体称为总体(母体),个体总体中每个成员(元素),研究某批灯泡的质量,总体,总体,一总体和样本,.,7,破坏性的试验更是不允许对整个总体进行考察.,考察某工厂生产的灯泡寿命,考察某型号手机的质量,考察吸烟和患肺癌的关系,在实际问题中,,要考察整个总体往往是不可能的,,因为它需要耗费太多的资源和太多的时间.,有些,2.样本,.,8,样本中所包含的个体数目称为样本容量.,从国产轿车中抽5辆进行耗油量试验。,样本容量为5。,为了推断总体分布及各种特征,,一个可行的办法,是从该总体中按一定的规则抽取若干个个体进行观察,和试验,,以获得有关总体的信息.,这一抽取过程称为,“抽样”,,所抽取的部分个体称为样本.,方法.,由于抽样的目的是为了对总体进行统计推断,,为了使抽取的样本能很好地反映总体,,必须考虑抽样,统计中,采用的抽样方法是随机抽样法,,即子样中每个个体是从母体中随意地取出来的。,(1)重复(返回)抽样,分量Xk与所考察的总体有相同的分布.,从总体中抽取个体检查后放回,,母体成分不变(分布不变),相互独立的随机变量.,对无限母体而言做无返回抽取,并不改变母体的成分,独立且同分布于母体,(2)非重复(无返回)抽样,取出样本后改变了母体的成分,所以,对有限母体,,不相互独立,,(2)独立同分布性,它要求抽取的样本满足下面两点:,(1)代表性(随机性):,最常用的一种抽样方法叫作,“简单随机抽样”。,其中每一个分量Xk与所考察的总体有相同的分布.,每一个个体被抽到的可能性相同。,从总体中抽取样本的每一个,分量Xk是随机的,是相互独立的随机变量.,若不特别说明,就指简单随机样本.,简单随机样本是应用中最常见的情形,,今后当说到,“X1,X2,Xn是取自某总体的样本”时,,简单随机样本可以用与总体独立同分布的n个相互,独立的随机变量,若总体X的分布函数为,联合分布函数为,若总体X的分布密度函数为,表示.,则其简单随机样本的,则其简单随机样本的,联合密度函数为,离散总体,则样本的分布列,.,14,样本的联合概率密度为,(2)总体X的概率密度为,例1对下列总体分别求出样本的联合分布,我们只能观察到随机变量取的值,而见不到随机变量.,3.总体、样本、样本值的关系,事实上我们抽样后得到的资料都是具体的、确定的值.,它们是样本取到的值而不是样本.,因而可以由样本值去推断总体.,总体分布决定了样本取值的概率规律,,也就是样本,取到样本值的规律,,去推断总体的情况-总体分布F(x)的性质.,样本是联系二者的桥梁,统计是从手中已有的资料-样本值,,4.样本的分布,1)样本的频数分布,将n个样本值,按从小到大排列,把相同,的数合并,并指出其频数(样本中各数出现的次数),1)样本的经验分布函数,样本值,样本值小于或等于x的个数,作,样本的经验分布函数,给出了在n次独立重复试验中,事件,出现的频率,具有分布函数的一切性质。如:,非降,右连续;,由频数分布知,若样本为n维r.v,那么对于每一样本值,就可作一个经验分布函数,故,是随机变量,-n次独立重复试验中,事件,发生的频率。,由伯努利大数定律,,格列汶科进一步证明了:当n时,Fn(x)以概率1关于x一致收敛于F(x),即,这就是著名的格列汶科定理.,格列汶科定理的优缺点1、当样本容量n足够大时,对所有的x,Fn(x)与F(x)之差的绝对值都很小,且这件事发生的概率为1.,.,21,2、Fn(x)是一统计量,则也是一统计量,用来表示Fn(x)与F(x)的最大差异,且概率为1的收敛于零。3、定理没有给出的分布或极限分布这就是我们可以由样本推断总体的基本理论依据,.,22,定理:样本均值以概率收敛于EX,样本方差以概率收敛于总体方差DX,样本矩以概率收敛于总体矩,.,23,五、直方图,(1)离散情况,(2)连续情况,设总体X为连续型随机变量,如何估计未知的密度函数f(x)?,.,24,定义1设,是来自总体X的一个样本,,为一实值连续函数,,其不包含任何,未知参数,则称,为一个统计量。,为,的观测值。,注:,是随机变量的函数仍为随机变量。,便是一个数。,注:统计量是随机变量。,二统计量,1.统计量,.,25,例1,为来自总体的样本,未知,,已知,判断下列函数哪些是统计量。,.,26,2.几个常见的统计量,样本均值,样本方差,它反映了总体均值的信息,是来自总体X的一个样本,,样本标准差,.,27,证左边,重要公式,.,28,样本k阶原点矩,样本k阶中心矩,它反映了总体k阶矩的信息,它反映了总体k阶中心矩的信息,.,29,常见统计量的性质,.,30,.,31,是来自总体,例2,设,的一样本,总,体,的,阶矩,存在,证明,(1),(2),证,由辛钦大数定律,知,.,32,充分统计量与完备统计量,充分统计量定义:设是来自总体X具有分布函数当给定时,若样本的条件分布与参数无关,则称是的充分统计量,.,33,充分统计量含义,样本中包含关于总体分布中未知参数的信息,是因为样本的联合分布与参数有关。对统计量T,如果已经知道它的值以后,样本的条件分布就与参数无关。即在统计量T中包含了参数的全部信息。,.,34,用定义证明T是充分统计量,例1设总体服从两点分布,即是来自总体的一个样本,证明样本均值是参数的充分统计量证明:由于,.,35,当已知时,样本的条件概率,.,36,.,37,例2设是来自泊松分布的一个样本,证明样本均值是的充分统计量,证明:由泊松分布性质知在给定后,对任意有样本的条件概率为:,.,38,.,39,例3设是来自正态总体的样本,证明是充分统计量,证明:由条件知在给定后,对任意有,样本的条件概率密度为:,.,40,.,41,因子分解定理,定理(费希尔奈曼准则)设是来自总体X具有分布函数则为的充分统计量的充要条件是:样本的联合分布密度函数可以分解为,.,42,.,43,用因子分解定理证明充分统计量,例1设总体服从两点分布,即是来自总体的一个样本,证明样本均值是参数的充分统计量证明:由于,.,44,.,45,例2设是来自泊松分布的一个样本,证明样本均值是的充分统计量,证明:样本的联合分布律为,.,46,例3设是来自正态总体的样本,证明是的充分统计量,证明:样本的联合分布密度为:,.,47,.,48,例4设是来自正态总体的一个样本,证明是的充分统计量,证明:样本的联合分布密度为:,.,49,例5设x1,x2,xn是取自总体U(0,)的样本,即总体的密度函数为,于是样本的联合密度函数为,.,50,取T=x(n),并令g(t;)=(1/)nIt,h(x)=1,由因子分解定理知T=x(n)是的充分统计量。,p(x1;)p(xn;)=,0,其它,(1/)n,0minximaxxi,由于诸xi0,所以我们可将上式改写为,p(x1;)p(xn;)=(1/)nI,x(n),.,51,定理:设是单值可逆函数,则也是的充分统计量,结论:1统计量用来推测参数的值;2充分统计量把可能丢失信息的统计量筛选;3最优统计量在充分统计量之中;4一个参数的充分统计量不唯一.问题:在什么情况下,它是唯一的?,.,52,充分性原则:在统计学中有一个基本原则-在充分统计量存在的场合,任何统计推断都可以基于充分统计量进行,这可以简化统计推断的程序。,.,53,完备统计量定义设总体的分布函数族为若对任意一个满足的随机变量,总有则称为完备的分布函数族,若一统计量T的分布函数族是完备的,则该统计量为完备统计量,.,54,性质,.,55,例设是来自总体服从两点分布的样本,样本均值是参数的充分统计量,验证也是完备统计量证明:由于,.,56,.,57,如果一个统计量既是充分统计量,又是完备统计量,则称为充分完备统计量。定理:设来自总体的一个样本,的充分完备统计量,如果无偏估计存在,则是唯一的最优无偏估计量,.,58,指数型分布族,定义:设是来自正态总体X的一个样本,其分布密度为,如果样本的联合分布密度具有形式,其中只与参数有关,只与样本有关,则称为指数型分布族,.,59,定理:设总体的分布密度为指数型分布族,则是参数的充分完备统计量,例1设是来自泊松分布的样本,,则样本的联合分布律为,.,60,例2设是来自正态总体的样本,,它的联合分布密度为:,是的充分完备统计量,.,61,统计量既然是依赖于样本的,而样本是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”.常用的有,三.抽样分布,.,62,(1)标准正态分布,X的上(02,(1)由定义可见,,F(n2,n1),2.性质,.,76,(3)F分布的分位点,对于给定的正数,称满足条件,的点,为,分位点,分布的上,.,77,F分布的性质,.,78,表中所给的,都是很小的数,如0.01,0.05等,当,表中查不出,由性质(2),较大时,如0.95,,.,79,例1,设随机变量,求,的分布。,解,独立,因而,由于,由定理3得,由题可知,.,80,四.正态总体抽样分布定理,的样本,则有,定理1(样本均值的分布),设X1,X2,Xn是来自正态总体,.,81,.,82,定理2(样本方差的分布),设X1,X2,Xn是取自正态总体,样本,分别为样本均值和样本方差.,则有,的,和相互独立。,.,83,.,84,.,85,分别是这两个样本的均值,且X与Y独立,是取自X的样本,样本,分别是这两个样本的样本方差,则有,是取自Y的,定理3(两总体样本均值差的分布),.,86,.,87,.,88,.,89,例2,一个样本,求,(1),(2),由定理2知,解,.,90,例2,一个样本,求,(1),(2),查表可得,.,91,思考与练习,是来自正态总体,的样,1.设,本,则有,.,92,一些非正态总体样本均值得分布,定理:设总体的分布是任意的,但具有有限方差,为来自总体的样本,则当时样本均值有即当充分大时,近似服从正态分布,.,93,定理:设总体的分布是任意的,其均值为方差为且四阶中心矩有限,为来自总体的样本,则当时,样本方差有即当充分大时,近似服从正态分布,.,94,定理:设总体的分布是任意的,其均值为且具有有限方差,为来自总体的样本,则当时有即当充分大时,近似服从正态分布前面三个定理是研究大样本统计问题的理论依据,.,95,次序统计量及其分布,一、次序统计量。,一、定义设x1,x2,xn是取自总体X的样本,x(i)称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。其中x(1)=minx1,x2,xn称为该样本的最小次序统计量,称x(n)=maxx1,x2,xn为该样本的最大次序统计量。,.,96,例设总体X的分布为仅取0,1,2的离散均匀分布,分布列为,在一个样本中,x1,x2,xn是独立同分布的,而次序统计量x(1),x(2),x(n)则既不独立,分布也不相同,看下例。,现从中抽取容量为3的样本,其一切可能取值有33=27种,下表列出了这些值,由此,.,97,.,98,这三个次序统计量的分布是不相同的。,可给出的x(1),x(2),x(3)分布列如下:,.,99,进一步,我们可以给出两个次序统计量的联合分布,如,x(1)和x(2)的联合分布列为,.,100,因为P(x(1)=0,x(2)=0)=7/27,,二者不等,由此可看出x(1)和x(2)是不独立的。,而P(x(1)=0)*P(x(2)=0)=(19/27)*(7/27),,.,101,定理1:次序统计量是充分统计量证明:,.,102,二、单个次序统计量的分布,定理2设总体X的密度函数为p(x),分布函数为F(x),x1,x2,xn为样本,则第k个次序统计量x(k)的密度函数为,.,103,.,104,.,105,三、多个次序统计量的联合分布,对任意多个次序统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论