




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章 统计量及其抽样分布,第6章 统计量及其抽样分布,本章将较系统地介绍统计量的概念,以正态分布为基础导出常用的几个重要分布,并给出一些常用统计量的抽样分布。,6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的分布 6.6 两个样本均值之差的分布 6.7 关于样本方差的分布,第6章 统计量及其抽样分布,6. 1 统计量,6. 1 统计量,统计量是样本的函数,它不依赖于任何未知参数; 根据不同的研究目的,可构造不同的统计量; 利用构造的统计量,用样本性质推断总体的性质; 统计量是统计推断的基础,在统计学中占
2、据着非常重要的地位。,6.1.1 统计量的概念,定义6.1 设X1,X2,Xn是从总体中抽取的容量为n的一个样本,如果由此样本构造一个函数 T(X1,X2,Xn),不依赖于任何未知参数,则称函数 T(X1,X2,Xn)是一个统计量。 对于T(X1,X2,Xn), 也称样本统计量。当获得样本的一组具体观测值x1,x2,xn时,代入T,就是一个具体的统计量值T(x1,x2,xn) 。,6. 1 统计量,6. 1 统计量,6. 1 统计量,6.2.2 常用统计量(当n充分大时),6. 1. 3 次序统计量,定义6.2 设(X1,X2,Xn)是从总体X中抽取的一个样本,X(i)称为第i个次序统计量,它
3、是样本(X1,X2,Xn)满足如下条件的函数: 每当样本得到一组观测值x1,x2,,xn时,其由小到大的排序x(1) x(2) x(i) x(n) 中,第i个值x(i)就作为次序统计量X(i)的观测值, X(1), X(2) X(n)称为次序统计量。其中X(1)和X(n)分别为最小和最大次序统计量 。,R(n) = X(n) X(1)称为样本极差,中位数、分位数、四分位数都是次序统计量。,6.1.4 充分统计量 在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,则对以后的统计推断质量具有重要意义。 在统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 因子
4、分解定理是判别充分统计量的方法,由奈曼和哈尔姆斯在20世纪40年代提出的。,【例6.2】某电子元件厂欲了解其产品的不合格率p,质检员抽检了100个电子元件,检查结果是,除了前3个是不合格品(记为X1=1, X2=1, X3=1)外,其他都是合格品(记为Xi=0, i=4,5,100)。当企业领导问及抽检结果时,质检员给出如下回答: (1)抽检的100个元件中有3个不合格; (2)抽检的100个元件中前3个不合格;,充分统计量(算例),在产品检验中,二项分布的统计量 是不合格品率p的充分统计量。,6. 2 关于分布的几个概念,6. 2 关于分布的几个概念,6.2.1 抽样分布,近代统计学的创始人
5、之一,英国统计学家费希尔曾把抽样分布、参数估计和假设检验看作统计推断的三个中心内容。 定义:在总体X的分布类型已知时,若对任一自然数n,都能导出统计量T(X1,X2, ,Xn)的分布的数学表达式,这种分布称为精确的抽样分布。 精确的抽样分布大多是在正态总体的情况下得到的。在正态总体条件下主要有 分布、t分布和F分布,常称为统计的三大分布。,当n无限增大时,统计量T(X1,X2,Xn)的极限分布常称为统计量的渐近分布; 第4节中的中心极限定理揭示的就是样本均值的渐近分布; 不少重要的统计方法就是基于渐近分布提出的。,6.2.2 渐近分布,6.2.3 随机模拟获得的近似分布 1.背景 2.思想 设
6、有一个统计量T(X1,X2,Xn),其中n为样本容量,求统计量T的分布函数F(n)(t); 可连续作一系列类似试验,每次试验都是从总体中抽取容量为n的样本,然后计算其统计量的值; 当这种试验进行了N次时,就得到统计量T的N个观测值:T1,T2,TN; 根据这N个观测值可做其经验分布函数FN(n)(t)的一个很好的近似。,6.3 由正态分布得到的几个重要分布,6.3 由正态分布得到的几个重要分布,6. 3. 1 分布,定义6.3 设随机变量X1,X2,Xn相互独立, 且Xi (i=1,2,n)服从标准正态分布N(0,1),则它们的平方和 服从自由度为n的 分布。,当自由度增加时,卡方分布的概率密
7、度曲线趋于对称。当n趋于无穷大时,卡方分布的极限分布就是正态分布。,定义6. 4 设随机变量XN(0,1), Y ,且X与Y独立,则,其分布称为t分布,记为t(n), 其中n为自由度。,(6. 2),6. 3. 2 t分布,当n充分大时, 其图形类似于标准正态变量概率密度的图形.,1.设X1,X2,Xn是来自正态分布N(,2)的一个样本,,则, t(n-1),(6. 3),称为服从自由度为(n-1)的t分布。,证明: 因为Xi服从正态分布, 所以 也服从正态分布,2.设X和Y是两个相互独立的总体,XN(1,2), YN(2,2),X1,X2,Xn是来自X的样本,Y1,Y2, ,Ym是来自Y的样
8、本,记,(6. 4),证明:,6. 3. 3 F分布 定义6.5 设随机变量Y与Z相互独立,且Y与Z分别服从自由度为m和n的 分布,则称,(6. 5),X服从第一自由度为m,第二自由度为n的F分布,记为F(m,n),简记为XF(m,n) 。,样本均值的抽样分布(一个例子),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下:,总体的均值和方差:, 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表, 计算出各样本的均值,如下表。,3.5,3.0,2.5,2
9、.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个 观察值,16个样本的均值(x),所有样本均值的均值和方差,式中:M为样本数目 结论:1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n,6.4 样本均值的分布与中心极限定理,设X1,X2,Xn为从某一总体中抽出的随机样本,若总体分布为正态分布N(,2),那么 的抽样分布仍为正态分布, 的数学期望为 ,方差为2/n,则,(6. 9),的抽样分布有以下特点:期望值与总体相同,而方差则缩小为总体方差的1/n。,
10、正态总体分布,对于均值为,方差为2的任意总体分布,当n比较大时, 且2有限, 总有,(6. 10),(6. 11),中心极限定理: 设从均值为、方差为2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,最早的中心极限定理是在18世纪初由德莫佛所证明的,即二项分布以正态分布为其极限分布定理。 现在的中心极限定理是19世纪20年代林德伯格和勒维证明的在任意分布的总体中抽取样本,其样本均值极限分布为正态分布。,【例6.4】 设从一个均值=10、标准差=0.6的总体中随机选取容量为n=36的样本。假定该总体不是很偏的,要求: (1)
11、计算样本均值 小于9.9的近似概率。 (2)计算样本均值 超过9.9的近似概率。 (3)计算样本均值 在总体均值=10附近0.1范围内的近似概率。,解: 根据中心极限定理, 不论总体的分布是什么形状,在假定总体分布不是很偏的情况下,当从总体中随机抽取n=36的样本时,样本的均值 的分布近似服从均值为10、标准差为0.1的正态分布。,【例6.5】某汽车电瓶商声称其生产的电瓶具有均值为60个月, 标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否准确, 为此随机抽取了50个该厂生产的电瓶进行试验。 (1)假定厂商声称是正确的,试描述50个电瓶的平均寿命的抽样分布。 (2)假定厂商声称正
12、确,则50个样品组成的样本的平均寿命不超过57个月的概率为多少?,解: (1)根据中心极限定理知, 这50个电瓶的平均寿命近似服从正态分布。其均值为=60, 方差为,(2)如果厂商声称是正确的,则观察到50个电瓶的平均寿命不超过57个月的概率为:,即如果厂商说法正确,则50个电瓶的平均寿命不超过57个月的概率为0.0002。,6. 5 样本比例的抽样分布,6. 5 样本比例的抽样分布,假定总体中对具有某一特征产品的喜好比例为,在此条件下研究当从总体中随机抽取n个个体进行调查时,喜好某一产品的人数X的概率。喜好某产品的比例,(6. 12),用样本比例 来估计总体比例。,由二项分布的原理和渐近分布
13、的理论可知,当n充分大时, 的分布可用正态分布逼近。此时 服从均值为、方差为 的正态分布。,(6. 13),【例6. 7】假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查了一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.0250.070之间的概率有多大?,解: 设600份报表中至少有一处错误的报表所占的比例为 , 由题意知,即pN(0.02,0.00572),即该统计人员所填写的报表中至少有一处错误的报表所占的比例在0.0250.070之间的概率为19.02%。,所求概率为:,6. 6 两个样本平均值之差的分布,6. 6 两个样本平均值之差的分布,定
14、义:设 是独立地抽自总体 X1 N(1, )的一个容量为 n1的样本的均值, 是独立地抽自总体 X2 N (2, )的一个容量为n2的样本的均值,则有,不管两个总体是否为正态分布,只要 ,则均值之差也为正态分布,其均值和方差分别是式(6.14)和式(6.15)。,(6.15),(6.14),两个样本比例之差的抽样分布 设分别从具有参数为1和2的二项总体中抽取包含n1和n2个观测值的独立样本,则两个样本比例差的抽样分布为:,期望值和方差为:,(6.16),(6.17),当n1,n2很大时,,的抽样分布近似为正态分布:,【例.】一项抽样调查表明甲城市的消费者中有15%的人喝过商标为“圣洁”牌的矿泉水, 而乙城市的消费者中有8%的人喝过该种矿泉水。如果这些数据是真实的, 那么当我们分别从甲城市抽取120, 乙城市抽取140人,组成两个独立随机样本时, 样本比例差 不低于0.08的概率有多大?,解:根据题意, 1=0.15, 2=0.08, n1=120, n2=140,的抽样分布近似服从正态分布,即,6. 7 关于样本方差的分布,6. 7 关于样本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 葛洲坝集团投资管理办法
- 虹口区仓库库存管理办法
- 融资性担保公司管理办法
- 衡阳电动车管理办法规定
- 街道无主小区管理办法
- 装配车间易耗品管理办法
- 西安无病例小区管理办法
- 计划外资金审批管理办法
- 证监会内部信息管理办法
- 负责人薪酬管理办法建议
- 实验室技术岗前培训制度
- 临床试验单臂研究
- 露天矿山各工种岗位责任制
- 烟气CEMS在线比对验收调试报告附表D.1-12计算公式(HJ-75-2017)
- 手术间体温下降的后果及预防
- 医院十四五发展规划
- 物业员工节假日安全培训
- 肿瘤化疗导致的中性粒细胞减少诊治中国专家共识解读课件
- 酒店翻新施工合同协议书
- 统编版五年级下册语文第三单元情景化检测题(含答案)
- 细胞治疗GMP质量体系设计
评论
0/150
提交评论