随机数学 复习宝典  [整理版][第6章][143页]、所有课件、方便打印_第1页
随机数学 复习宝典  [整理版][第6章][143页]、所有课件、方便打印_第2页
随机数学 复习宝典  [整理版][第6章][143页]、所有课件、方便打印_第3页
随机数学 复习宝典  [整理版][第6章][143页]、所有课件、方便打印_第4页
随机数学 复习宝典  [整理版][第6章][143页]、所有课件、方便打印_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本章转入课程的第二部分,数理统计,数理统计的特点是应用面广,分支较多. 社会的发展不断向统计提出新的问题.,计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.,前言:,由于学时有限,课程的这部分内容重点在于介绍数理统计的一些重要概念和典型的统计方法,它们是实际中最常用的知识.,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作 . 但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.,数理统计学,数理统计学是一门应用性很强的学科. 它是研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.,由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.,数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题, 尽可能地作出精确而可靠的结论.,由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息. 因而由此获得的结论必然包含不肯定性.,在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.,下面我们以一例进行说明:,某种子公司A,栽种了几种类别的 鲜花,收获了大量的花籽,并把每25粒花籽扎成一小包出售. 一个零售商批发了若干包,并向顾客保证:在每包25粒花籽中至少有22粒将能发芽,否则的话可免费调换另一包.,每包要是有3粒不发芽,马上免费退换!,每包25粒,每包25粒中至少有22粒将发芽,所有的包都如此吗?,这种类型的不肯定性,即不知道种子公司出售的小包中可接受的比例,它是由于对总体的真实状态(天然状态)无知所引起的不肯定性.,零售商面临如下两种类型的不肯定性:,这就是尽管他知道了一百万包可接受的比例 ,但对他所购买的200包,其中可接受的比例仍旧没有“把握”.,因此他又面临着另一类不肯定性;,零售商购买的200包仍有可能“碰巧”是从不可接受的一万包中选取的.,即使 是0.99,即种子公司出售的一百万包中有99万包是可接受的,,这样他就要损失一笔资金.,这一类不肯定性是由于“随机性”所引起的.,在已知 的条件下,这种不肯定性的程度已在概率论部分作过讨论.,下面我们回到第一类不肯定性:,零售商对种子公司出售的小包中可接受(即至少有22粒花籽将发芽)的包数所占比例 是多少没有把握.,零售商能够根据试验的方法(请公司进行发芽试验)来改善他的处境.,根据试验他能作出天然状况 是多少的决策.,这就是抽取部分种籽进行发芽试验,通过这部分中发芽数所占比例(频率)来对 的真值进行推断.,(1)怎样设计试验,决定观察的数目;,(2)怎样利用试验观察的结果作出一个“好”的推断等.,这都是数理统计所要研究的问题.,虽然他不能精确地和肯定地确定 , 但可以期望获得一个(在某种意义下)比较好的推断.,这就涉及到,第一个问题是怎样进行抽样,使抽得的样本更合理,并有更好的代表性?这是抽样方法和试验设计问题:最简单易行的是进行随机抽样.,第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?,这是统计推断问题.,本课程着重讨论第二个问题,即最常用统计推断方法.,概率论是数理统计的基础,而数理统计是概率论的重要应用. 但它们是并列的两个学科,并无从属关系 .,可见,在数理统计中必然要用到概率论的理论和方法. 因为随机抽样的结果带有随机性,不能不把它当作随机现象来处理 .,由此也可以说,,统计方法具有“部分推断整体”的特征 .,在结束本前言之前,我们需要强调说明一点:,因为我们是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断全体. 这里使用的推理方法是“归纳推理”.,这种归纳推理不同于数学中的“演绎推理”,,它在作出结论时,是根据所观察到的大量个别情况,“归纳”起来所得,而不是从一些假设、命题、已知的事实等出发,按一定的逻辑推理去得出来的.,例如,在几何学中要证明“等腰三角形底角相等”只须从“等腰”这个前提出发,运用几何公理,一步一步推出这个结论.,而一个习惯于统计思想的人,就可能想出这样的方法:做很多大小形状不一的等腰三角形,实地测量其底角,看差距如何,根据所得资料看看可否作出“底角相等”的结论. 这样做就是归纳式的方法.,现在要问:从局部观察要对总体下结论有没有片面性呢?结论是否可靠?,显然这里不仅依赖于进行局部观察的“样本”是否具有总体的代表性,也依赖于对从这些样本得到数据的合理加工、分析并得出论断.,我们说,如果这一切都建立在可靠的科学基础上,则对总体下结论是可能的也是可靠的. 因为这里存在着样品(随机抽取的一个个体)个性 (特殊性) 和总体共性(普遍性)之间的一种内在的、对立统一的辩证关系 .,我们对每个经过合理手续选取的一个样品也应看到它所具有的两重性:,一方面它具有特殊性,因为它毕竟是个别观察值,不能反映总体的全面性质,有片面性.,因而统计上往往不采用由一次抽取的样品来下结论.,在这个基础上再加上科学的推断方法,对总体下的结论同样也是可靠的.,另一方面也要看到“普遍性即存在于特殊性之中”,即每个样品的情况又必然反映总体的一些普遍性.,当样品有一定数量时总体的普遍性是可以得到比较真实的反映的.,但此时还应记住毕竟是由“局部”推断“整体”,因而仍可能犯错误,结论往往又是在某个“可靠性水平”之下得出的.,这种矛盾的特殊性与普遍性的辩证统一在统计学中贯穿始终,是我们应该记住的基本思想.,第 六 章 样本及其样本函数的分布,第一节 总体与样本,一、总体与个体,二、随机样本,三、统计量,四、小结,1.1 总体与个体,一个统计问题总有它明确的研究对象.,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,研究某批灯泡的质量,总体,总体,然而在统计研究中,人们往往关心每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况. 这时,每个个体具有的数量指标的全体就是总体.,由于每个个体的出现带有随机性,即相应的数量指标值的出现带有随机性。从而可把此种数量指标看作随机变量,我们用一个随机变量或其分布来描述总体。为此常用随机变量的符号或分布的符号来表示总体。 通常,我们用随机变量X , Y , Z, 等表示总体。当我们说到总体,就是指一个具有确定概率分布的随机变量。,如:研究某批灯泡的寿命时,我们关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,总体,某批灯泡的寿命,寿命X可用一概率分布来刻划,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,统计中,总体这个概念 的要旨是:总体就是一个 概率分布.,某工厂10月份生产的灯泡寿命所组成的总体中, 个体的总数就是10月份生产的灯泡数, 这是一个有限总体; 而该工厂生产的所有灯泡寿命所组成的总体可近似地看成一个无限总体, 它包括以往生产和今后生产的灯泡寿命.,有限总体和无限总体,实例,当有限总体包含的个体的总数很大时, 可近似地将它看成是无限总体.,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.,1.2 简单随机样本,1. 样本的定义,样本是随机变量.,抽到哪5辆是随机的,容量为n的样本可以看作n维随机变量.,2. 独立性: X1,X2,Xn是相互独立的随机 变量.,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,1. 代表性: X1,X2,Xn中每一个与所考察 的总体有相同的分布.,2. 简单随机样本,定义:,若总体的分布函数为F(x),则其简单随机样本的联合分布函数为,F(x1) F(x2) F(xn),简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.,3. 总体、样本、样本值的关系,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,4. 样本的分布,解,例1,(教材P139例1.2),解,例2,第二节 直方图与样本分布函数,一、直方图,二、样本分布函数,问题引出: 想了解某个城市的家庭月消费情况。,解决方法: 从这个城市里随机地调查有代表性的一些 家庭,根据收集到的数据去得出这个城市的家庭月消费金额的有关信息。,1. 如何得到样本 ?,各个阶层的比例应该各占多少?样本容量 n 应该取多少才合适?被调查者拒绝调查怎么办?,抽样调查,2. 如何确定总体的分布 ?,这里的总体是这个城市的家庭月消费金额,我们不妨认为家庭月消费金额是一个服从正态分布的随机变量。,根据经验或者是所讨论的问题的实际背景,总体的分布类型一般可以事先确定下来。,( 不同的城市对应的期望、方差也就不相同 ),即,总体随机变量 X N ( ),而这个城市相应的两个参数 与 是未知的。,当不知道或者不好确定总体的分布类型时,在数理统计学中常常采用两种办法来近似得到总体分布的有关信息。,.直方图的方法教材P140,只适用于连续总体,得到的是总体密度函数的近似。,4. 经验分布函数,2.2样本(经验)分布函数的方法,教材P143,性质:,格里汶科定理(定理5.3),例1,例2,第三节 样本函数及其概率分布,二、常用的样本函数概率分布,一、常用的统计量,.统计量,是,不是,例1,2. 几个常用统计量(样本矩)的定义,(1)样本均值,(2)样本方差,其观察值,其观察值,(3)样本标准差,其观察值,(4) 样本 k 阶(原点)矩,其观察值,(5)样本 k 阶中心矩,其观察值,(6) 次序统计量,定义,特别的,说明:,例2,样本矩具有下列性质:,性质1,证明,注:样本方差 与样本二阶中心矩 的不同,2),证明,再根据第四章辛钦定理知,性质2,由第五章关于依概率收敛的序列的性质知,此结论是下一章所要介绍的矩估计法以上的理论根据.,1. 单个正态总体情形,定理3.1,或,正态总体的两个常用样本函数的分布,(见教材P149),用于总体方差已知时,估计或检验总体均值,证明:,(教材149页/例3.3),设总体XN(30,16),从总体X中抽取容量为n的样本.,(1) n=25时,求,例3,(2)要使得,问样本容量n 至少应取多大?,解:,由定理3.1知,(2)设样本容量为n,由于,要使,应有,所以样本容量n至少应取为62.,定理3.2,2. 两个正态总体情形,总体X和Y,则,(见教材P150),解,例4(教材151页/例3.4),例5(教材162页第7题),解,四、小结,个体 总体,有限总体,无限总体,基本概念:,说明1一个总体对应一个随机变量X, 我们将不区分总体和相应的随机变量, 统称为总体X.,说明2在实际中遇到的总体往往是有限总体, 它对应一个离散型随机变量; 当总体中包含的个体的个数很大时, 在理论上可认为它是一个无限总体.,随机样本,总体,样本,样本值的关系,总体(理论分布),样本,样本值,?,数理统计是从手中已有的资料-样本值,去推断总体的情况-总体的分布F(x)的性质.,样本是联系二者的桥梁.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,两个最重要的统计量:,样本均值,样本方差,正态总体的两个常用样本函数的分布,第6.4-6.6节 统计三大分布,一、常见分布,二、概率分布的分位数,三、小结,n = 1 时,其密度函数为,n = 2 时,其密度函数为,为参数为2的指数分布.,一般,其中,,在x 0时收敛,称为函数,具有性质,的密度函数为,自由度为 n 的,性质1,证明:,(见教材P147),性质2,(此性质可以推广到多个随机变量的情形),性质3,同理,(习题课教程P453例17),课堂练习(教材157页第4题),解,根据正态分布的性质,注:P344附表4只详列到 n=45 为止.,例如,利用以上公式,费歇尔(R.A.Fisher)证明:,定理4.1,证明,(见教材P148),用于总体均值已知时,估计或检验总体方差,解:,由定理4.1可知,(教材P148),定理4.2(教材149页),注:,自由度减少一个!,减少一个自由度的原因:,事实上,它们受到一个条件的约束:,例4.2,解 由定理4.2可知,(书P149),例4.3,设总体X服从正态分布,从总体X中抽取容量为16的样本,解: 总体方差,(教材P149-150),查P346附表4,当自由度n=15时,有,t 分布又称学生氏(Student)分布.,2.,当n充分大时, 其图形类似于标准正态变量概率密度的图形.,t 分布具有下列性质:,性质1 设 , 则当 时有性质2 设 , 是T的分布密度,则此性质说明,当 时,T分布的极限分布是标准正态分布。,(教材158页第11题),例5.2,解,由分布的对称性知,定理5.1,且两者独立, 由 t 分布的定义知,证明,(书P151

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论