




已阅读5页,还剩59页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率论与数理统计,1,PPT学习交流,第六章样本及抽样分布,引言随机样本抽样分布,2,PPT学习交流,本章转入课程的第二部分,数理统计,引言,数理统计是以概率论的理论为基础、通过试验所得数据来研究随机现象的一门数学分支,应用广泛,内容丰富。,概率论是数理统计的理论基础,数理统计是概率论的重要应用。,3,PPT学习交流,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.,4,PPT学习交流,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.,数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.,5,PPT学习交流,在概率论中所研究的随机变量,它的分布都是假设已知的,在这一前提下去研究它的性质、特点和规律性,例如求出它的数字特征,讨论随机变量函数的分布,介绍常用的各种分布等。,而在数理统计中的随机变量,它的分布是未知的,或者不完全知道,人们通过对所研究的随机变量进行重复、独立的观察,得到许多观察值,对这些数据进行分析,从而对随机变量的分布作出种种判断。,6,PPT学习交流,现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法.因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的.概括起来可以归纳成两大类:参数估计根据数据,用一些方法对分布的未知参数进行估计.假设检验根据数据,用一些方法对分布的未知参数进行检验.它们构成了统计推断的两种基本形式.这两种推断渗透到了数理统计的每个分支.,7,PPT学习交流,6.1随机样本,总体和样本,8,PPT学习交流,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.,由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.,但客观上只允许我们对随机现象进行,次数不多的观察试验,也就是说,我们获得的只是局部观察资料.,9,PPT学习交流,在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.,数理统计方法具有“部分推断整体”的特征.,10,PPT学习交流,实际上,我们真正关心的并不是研究对象本身,而是其某项数量指标.比如某家工厂的一种产品的使用寿命这样一项数量指标.,1.总体,11,PPT学习交流,对研究对象上的某项数量指标进行观察。试验的全部可能的观察值称为总体.这些值不一定各不相同(可能重复),数目上也不一定有限.每一个可能的观察值称为个体.总体中所包含的个体的个数称为总体的容量.,总体,有限总体,无限总体,12,PPT学习交流,例1研究某地区N个农户的年收人.,总体指他们的年收入的N个数字.,例2用一把尺子去量一个物体的长度.,总体应该理解为一切所有可能的测量值的全体.,13,PPT学习交流,一般,我们所研究的总体的某项数量指标X是一个随机变量,其取值在客观上有一定的分布.因此,对总体的研究,就是对相应的随机变量X的研究。,今后,我们称X的分布函数和数字特征分别为总体的分布函数和数字特征,并不再区分总体与相应的随机变量X.对总体的称呼:总体,总体X与总体F.,2、总体的分布,14,PPT学习交流,例l中,若农户年收入以万元计,假定N户中收入X为以下几种取值:0.5,0.8,l,1.2和1.5.取这些值的农户个数分别为:n1,n2,n3,n4,n5,(这里n1+n2+n3+n4+n5=N).,例3(例l续),则总体X的分布为离散型分布,其分布律为:,15,PPT学习交流,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,寿命X可用指数分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).,寿命总体是指数分布总体,16,PPT学习交流,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,17,PPT学习交流,总体分布一般是未知,或只知道是包含未知参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.,3.样本,从国产轿车中抽5辆进行耗油量试验,样本容量为5,18,PPT学习交流,当n次观察一经完成,得到n个具体的数x1,x2,xn,称为样本X1,Xn的一次观察值,简称样本值.,1.代表性:X1,X2,Xn中每一个与所考察的总体有相同的分布.,2.独立性:X1,X2,Xn是相互独立的随机变量.,对总体X在相同的条件下,进行n次重复、独立观察,其结果依次记为X1,X2,Xn,这样得到的随机变量X1,X2,Xn是来自总体X的一个简单随机样本,与总体随机变量具有相同的分布.n是样本的容量.,这种抽样,叫作“简单随机抽样”,其特点:,19,PPT学习交流,对有限总体,采用放回抽样可得简单随机样本,但放回抽样使用起来不方便,当个体总数N比要得到的样本的容量n大得多时,在实际中可将不放回抽样近似当作放回抽样来处理.,对无限总体,因抽取一个个体不影响它的分布,所以总是采用不放回抽样.,20,PPT学习交流,定义:设X是具有分布函数F的随机变量,若X1,X2,Xn是具有同一分布函数的、相互独立的随机变量,则称X1,X2,Xn为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本,简称样本,它们的观察值x1,x2,xn称为样本值,又称为X的n个独立的观察值.,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,21,PPT学习交流,既然样本X1,X2,Xn被看作随机变量,自然就需要研究它们的分布,4.样本的分布,=F(x1)F(x2)F(xn),若总体的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为,其简单随机样本的联合概率密度函数为,=f(x1)f(x2)f(xn),22,PPT学习交流,假设某大城市居民的收入服从正态分布N(,2),其概率密度函数为:,例5,设X1,X2,Xn是来自总体的一个样本.则XiN(,2),i1,2,n.于是样本X1,X2,Xn的联合概率密度为,23,PPT学习交流,总体X,样本X1,X2,Xn,样本值x1,x2,xn,随机抽样获得样本,完成试验获得数据,整理加工统计推断,统计工作,4.总体、样本、样本值的关系,24,PPT学习交流,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.,25,PPT学习交流,统计是从手中已有的资料样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,26,PPT学习交流,休息片刻继续下一讲,27,PPT学习交流,6.2抽样分布,统计量与经验分布函数统计三大抽样分布正态总体的样本均值和样本方差的分布课堂练习布置作业,28,PPT学习交流,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,1.统计量,这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.,一、统计量与经验分布函数,29,PPT学习交流,定义:设X1,Xn是来自总体X的一个样本,g(X1,Xn)是X1,Xn的函数,若g中不含未知参数,则称g(X1,Xn)是总体X的一个统计量.,设x1,xn是样本X1,Xn的一个观察值,则g(x1,xn)是统计量g(X1,Xn)的观察值.,例:设X1,Xn是总体X的一个样本,XN(m,s2),令T=X1-,若为已知的,则T为统计量;若未知,T就不是统计量.,30,PPT学习交流,几个常用的统计量及其观察值:,1.样本均值,2.样本方差,样本标准差,它反映了总体均值的信息,它反映了总体方差的信息,31,PPT学习交流,3.样本k阶原点矩,4.样本k阶中心矩,它反映了总体k阶矩的信息,它反映了总体k阶中心矩的信息,32,PPT学习交流,统计量的观察值,33,PPT学习交流,结论:若总体X的k阶原点矩,存在,由辛钦大数定理,当n趋于时,证明:辛钦定理及依概率收敛的序列的性质.,第七章矩估计法的理论根据,34,PPT学习交流,经验分布函数是与总体X的分布函数F(x)相应的统计量.,设X1,X2,Xn,是总体F的一个样本,令S(x)表示X1,X2,Xn中不大于x的随机变量的个数.定义经验分布函数Fn(x)为:,对于一个样本值x1,x2,xn,经验分布函数Fn(x)的观察值仍记为Fn(x).,2.经验分布函数,35,PPT学习交流,例1:设总体F具有一个样本值1,2,3,则经验分布函数F3(x)的观察值为,例2:若样本值为1,1,2,则经验分布函数F3(x)的观察值为,36,PPT学习交流,一般地,设x1,x2,xn,是总体F的一个容量为n的样本值,要求经验分布函数的观察值.首先将x1,x2,xn,按由小到大的顺序排列,并重新编号,设为x(1)x(2)x(n),则经验分布函数Fn(x)的观察值为,对不同的样本值,得到的经验分布函数不同.但当样本容量较大时,经验分布函数Fn(x)是总体分布函数F(x)的良好近似.,37,PPT学习交流,统计量的分布称为抽样分布。数理统计中常用到来自正态总体的三个分布:2分布、t分布和F分布。,38,PPT学习交流,1.定义:设X1,X2,Xn相互独立,都服从正态分布N(0,1),则称随机变量:所服从的分布为自由度为n的2分布.,二、三大抽样分布,记为,2分布,39,PPT学习交流,2.2分布的密度函数f(y)曲线,40,PPT学习交流,3.分位点设X2(n),若对于:0b=0.975,求b的值.,b.分布可加性若X2(n1),Y2(n2),X,Y相互独立,则X+Y2(n1+n2).,42,PPT学习交流,c.期望与方差若X2(n),则E(X)=n,D(X)=2n.,d若X2(n),则当n充分大时,近似正态分布N(0,1).,43,PPT学习交流,定义若XN(0,1),Y2(n),X与Y独立,则,t(n)称为自由度为n的t分布.,t分布,44,PPT学习交流,t(n)的概率密度为,45,PPT学习交流,2.性质,46,PPT学习交流,分位点设tt(n),若对:00,满足Ptt(n)=,则称t(n)为t(n)的上分位点.,47,PPT学习交流,注:,48,PPT学习交流,49,PPT学习交流,定义若U2(n1),V2(n2),U,V独立,则,称为第一自由度为n1,第二自由度为n2的F分布。,F分布,注:若FF(n1,n2),则1/FF(n2,n1).,50,PPT学习交流,F分布的概率密度函数,若FF(n1,n2),F的概率密度为,51,PPT学习交流,2.F分布的分位点对于:00,满足PFF(n1,n2)=,则称F(n1,n2)为F(n1,n2)的上分位点;,注:,52,PPT学习交流,53,PPT学习交流,三、正态总体的样本均值和样本方差的分布,54,PPT学习交流,定理1(样本均值的分布),55,PPT学习交流,定理2(样本方差的分布),(1)相互独立,56,PPT学习交流,证明:,且U与V独立,根据t分布的定义,57,PPT学习交流,定理3(样本方差比的分布及样本均值差的分布),(2)当时,58,PPT学习交流,例1:设总体XN(10,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电商行业2025年竞争策略下的用户留存与转化策略研究报告
- 基金从业资格考试江苏及答案解析
- 保险业从业资考试及答案解析
- 压力容器安全管理题库6及答案解析
- 随州货车从业资格证考试及答案解析
- 2025护理文职题库及答案解析
- 2025年b类安全管理人员考试题库及答案解析
- 采购从业人员职业考试及答案解析
- 人伤脊骨骨折一次性了断协议书8篇
- 山东省青岛市南区2026届数学八上期末教学质量检测模拟试题含解析
- 统编版2025-2026学年语文五年级上册期中阶段培优情境卷试题(有答案)
- EHS风险管理监测规范制定
- 2025-2026学年上学期七年级历史第一次月考卷(含答案)
- 广东省深圳市龙岗区2024-2025学年七年级上学期语文第一次月考试卷(含答案)
- DL∕T 1084-2021 风力发电场噪声限值及测量方法
- 幼儿园控笔训练培训
- 木心全集讲稿系列:文学回忆录
- 肿瘤微环境中的细胞间通信
- AE200H变频器使用手册
- 社会调查研究抽样课件
- 英语英语句子成分和基本结构
评论
0/150
提交评论