版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、概率论与数理统计,计算机科学学院 王艳娥,第六章 样本及抽样分布,引言 随机样本 抽样分布,本章转入课程的第二部分,数理统计,引言,数理统计是以概率论的理论为基础、通过试验所得数据来研究随机现象的一门数学分支,应用广泛,内容丰富。,概率论是数理统计的理论基础,数理统计是概率论的重要应用。,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作 . 但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.,数理统计
2、学是一门应用性很强的学科. 它是研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.,在概率论中所研究的随机变量,它的分布都是假设已知的,在这一前提下去研究它的性质、特点和规律性,例如求出它的数字特征,讨论随机变量函数的分布,介绍常用的各种分布等。,而在数理统计中的随机变量,它的分布是未知的,或者不完全知道,人们通过对所研究的随机变量进行重复、独立的观察,得到许多观察值,对这些数据进行分析,从而对随机变量的分布作出种种判断。,现实世界中存在着形形色色的数据,分析这些数据需要多种多样的方法. 因此,数理统计中的方法和
3、支持这些方法的相应理论是相当丰富的.概括起来可以归纳成两大类: 参数估计根据数据,用一些方法对分布的未知参数进行估计. 假设检验根据数据,用一些方法对分布的未知参数进行检验. 它们构成了统计推断的两种基本形式.这两种推断渗透到了数理统计的每个分支.,6.1 随机样本,总体和样本,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.,由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.,但客观上只允许我们对随机现象进行,次数不多的观察试验,也就是说, 我们获得的只是局部观察资料
4、.,在数理统计中,不是对所研究的对象全体 (称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.,数理统计方法具有“部分推断整体”的特征 .,实际上,我们真正关心的并不是研究对象本身,而是其某项数量指标. 比如某家工厂的一种产品的使用寿命这样一项数量指标.,1.总体,对研究对象上的某项数量指标进行观察。 试验的全部可能的观察值称为总体. 这些值不一定各不相同(可能重复),数目上也不一定有限. 每一个可能的观察值称为个体. 总体中所包含的个体的个数称为总体的容量.,总体,有限总体,无限总体,例1 研究某地区N个农户的年收人.,总体指他们的年收
5、入的N个数字.,例2 用一把尺子去量一个物体的长度.,总体应该理解为一切所有可能的测量值的全体.,一般, 我们所研究的总体的某项数量指标X是一个随机变量, 其取值在客观上有一定的分布. 因此, 对总体的研究,就是对相应的随机变量X的研究。,今后, 我们称X的分布函数和数字特征分别为总体的分布函数和数字特征, 并不再区分总体与相应的随机变量X. 对总体的称呼: 总体, 总体X与总体F.,2、总体的分布,例l中,若农户年收入以万元计, 假定N户中收入X为以下几种取值: 0.5, 0.8, l, 1.2和1.5. 取这些值的农户个数分别为:n1, n2, n3, n4, n5, (这里n1+n2+n
6、3+n4+n5=N).,例3 (例l续),则总体X的分布为离散型分布, 其分布律为:,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示 .,寿命 X 可用指数分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体. 如说总体X或总体F(x) .,寿命总体是指数分布总体,类似地,在研究某地区中学生的营养状况时 ,若关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.,总体分布一般是未知, 或只知道是包含未知参数的分布, 为推断总体分布及各
7、种特征, 按一定规则从总体中抽取若干个体进行观察试验, 以获得有关总体的信息 , 这一抽取过程称为 “抽样”, 所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容量.,3. 样本,从国产轿车中抽5辆 进行耗油量试验,样本容量为5,当n次观察一经完成, 得到n个具体的数 x1, x2, xn , 称为样本X1, , Xn的一次观察值, 简称样本值 .,1. 代表性: X1, X2, Xn中每一个与所考察的总体有 相同的分布.,2. 独立性: X1, X2, Xn是相互独立的随机变量.,对总体X在相同的条件下, 进行n次重复、独立观察, 其结果依次记为X1, X2, , Xn, 这样得到
8、的随机变量X1, X2, , Xn是来自总体X的一个简单随机样本, 与总体随机变量具有相同的分布. n是样本的容量.,这种抽样, 叫作“简单随机抽样”, 其特点:,对有限总体, 采用放回抽样可得简单随机样本, 但放回抽样使用起来不方便, 当个体总数N比要得到的样本的容量n大得多时, 在实际中可将不放回抽样近似当作放回抽样来处理.,对无限总体, 因抽取一个个体不影响它的分布,所以总是采用不放回抽样.,定义: 设X是具有分布函数F的随机变量,若X1, X2, , Xn是具有同一分布函数的、相互独立的随机变量,则称X1, X2, , Xn为从分布函数F(或总体F、或总体X) 得到的容量为n的简单随机
9、样本,简称样本,它们的观察值x1, x2, xn称为样本值,又称为X的n个独立的观察值.,简单随机样本是应用中最常见的情形,今后,当说到“X1, X2, Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,既然样本 X1,X2 , ,Xn 被看作随机变量,自然就需要研究它们的分布,4. 样本的分布,=F(x1) F(x2) F(xn),若总体的分布函数为F(x)、概率密度函数为f(x), 则其简单随机样本的联合分布函数为,其简单随机样本的联合概率密度函数为,=f(x1) f(x2) f(xn),假设某大城市居民的收入服从正态分布 N(, 2), 其概率密度函数为:,例5,设X1,X2
10、 , , Xn是来自总体的一个样本. 则 Xi N(, 2), i1, 2, n. 于是样本 X1, X2 , , Xn的联合概率密度为,总 体 X,样本X1,X2,Xn,样本值x1,x2,xn,随机抽样 获得样本,完成试验 获得数据,整理加工 统计推断,统计 工作,4. 总体、样本、样本值的关系,事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.,统计是从手中已有的资料样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样
11、本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,休息片刻继续下一讲,6.2 抽样分布,统计量与经验分布函数 统计三大抽样分布 正态总体的样本均值 和样本方差的分布 课堂练习 布置作业,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,1. 统计量,这种不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.,一、统计量与经验分布函数,定义:设X1, , Xn 是来自总体X的一个样本, g(X1, , Xn )是X1, , Xn的函数, 若g中不含未知参数, 则称g(X1, ,Xn )是总体
12、X的一个统计量.,设x1, , xn 是样本X1, , Xn的一个观察值, 则 g(x1, , xn ) 是统计量g(X1, ,Xn )的观察值.,例:设X1, , Xn 是总体X的一个样本, XN(m, s2), 令T=X1- , 若为已知的, 则T为统计量; 若未知, T就不是统计量.,几个常用的统计量及其观察值 :,1.样本均值,2.样本方差,样本标准差,它反映了 总体均值 的信息,它反映了总体 方差的信息,3.样本k阶原点矩,4.样本k阶中心矩,它反映了总体k 阶矩的信息,它反映了总体k 阶 中心矩的信息,统计量的观察值,结论: 若总体X的k阶原点矩,存在, 由辛钦大数定理, 当n趋于
13、时,证明: 辛钦定理 及依概率收敛的序列的性质 .,第七章矩估计法的理论根据,经验分布函数是与总体X的分布函数F(x)相应的统计量.,设X1, X2, Xn, 是总体F的一个样本, 令S(x)表示X1, X2, Xn中不大于x的随机变量的个数. 定义经验分布函数Fn(x)为:,对于一个样本值 x1, x2, xn, 经验分布函数Fn(x)的观察值仍记为Fn(x).,2. 经验分布函数,例1:设总体F具有一个样本值1, 2, 3, 则经验分布函数F3(x)的观察值为,例2:若样本值为1, 1, 2, 则经验分布函数F3(x)的观察值为,一般地,设x1, x2, xn, 是总体F的一个容量为n的样
14、本值, 要求经验分布函数的观察值. 首先将 x1, x2, xn, 按由小到大的顺序排列, 并重新编号, 设为x(1)x(2) x(n) , 则经验分布函数Fn (x)的观察值为,对不同的样本值, 得到的经验分布函数不同.但当样本容量较大时, 经验分布函数Fn(x)是总体分布函数F(x)的良好近似.,统计量的分布称为抽样分布。数理统计中常用到来自正态总体的三个分布: 2分布、 t 分布和F分布。,1. 定义: 设X1, X2, Xn相互独立, 都服从正态分布 N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的2分布.,二、三大抽样分布,记为,2 分布,2. 2 分布的密度函数 f(
15、y) 曲线,3. 分位点 设X 2(n),若对于:01, 存在 满足 则称 为2(n)分布的上分位点。,4. 性质: 设X1, X2, Xn, 是来自正态总体N(, 2) 的一个样本, 则,当n=25时,通过查表1)求P 234.382的值; 2)若 P 2b=0.975, 求b的值.,b. 分布可加性 若X 2(n1), Y 2(n2 ), X,Y相互独立, 则 X + Y 2(n1+n2 ).,c. 期望与方差 若X 2(n),则E(X)= n,D(X)=2n.,d若X 2(n),则当n充分大时,近似正态分布N(0,1).,定义 若XN(0, 1), Y2(n), X与Y独立,则,t(n)
16、 称为自由度为n的t 分布.,t 分布,t(n) 的概率密度为,2. 性质,分位点 设tt(n), 若对:00, 满足Pt t(n)=,则称t(n)为 t(n)的上分位点.,注:,定义 若U 2(n1), V2(n2),U,V独立,则,称为第一自由度为n1 ,第二自由度为n2的F分布。,F 分布,注: 若FF(n1, n2), 则1/FF(n2, n1).,F分布的概率密度函数,若FF(n1,n2), F的概率密度为,2. F分布的分位点 对于:00, 满足PFF(n1, n2)=, 则称F(n1, n2)为F(n1, n2) 的上分位点;,注:,三、正态总体的样本均值和样本方差的分布,定理 1 (样本均值的分布),定理 2 (样本方差的分布),(1) 相互独
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省泰州市姜堰区溱潼二中达标名校2026届初三5月阶段检测试题英语试题试卷含解析
- 山东省聊城市茌平县重点中学2025-2026学年初三第二学期期末考试语文试题含解析
- 山东省德州市六校2026年高频错题卷(十二)英语试题含解析
- 江阴山观二中2026年初三下学期第四次(1月)月考语文试题试卷含解析
- 辽宁省阜新市名校2026年初三4月联考语文试题试卷含解析
- 投资顾问服务合同
- 危重护理科研方法与技巧
- 2026年人工智能在体育历史数据挖掘与经典战术复盘中的应用
- 2026年地铁商业街商户装修管理及验收标准
- 肝内科慢性乙型肝炎康复管理措施
- 第3课《可爱的小鸟》课件-一年级美术下册(湘美版2024)
- 从事精神科护理十余年感悟
- 办公楼装修改造工程施工方案
- DB51-T 2973-2022 航电系统产品用芳纶纸蜂窝制件工艺质量控制要求
- 全过程工程咨询项目部管理制度
- 模拟电子技术基础 第4版黄丽亚课后参考答案
- 泌尿外科学(医学高级)-案例分析题
- 陕西特色美食文化介绍推介PPT图文课件
- 物理爆炸爆炸冲击波计算
- 地理七年级下册7.2南亚3市公开课一等奖省优质课赛课一等奖课件
- 737NG飞机液压管路材料及力矩介绍
评论
0/150
提交评论