统计量及其抽样分布.ppt_第1页
统计量及其抽样分布.ppt_第2页
统计量及其抽样分布.ppt_第3页
统计量及其抽样分布.ppt_第4页
统计量及其抽样分布.ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计量及其抽样分布,1 统计量,1. 统计量的形成 2. 统计量是样本X1,X2Xn的一个函数 3. 统计量不依赖任何未知参数 4. 将一组样本的具体观测值代入统计量函数,可以计算出一个具体的统计量值。,抽样,样本,构造函数,2 样本均值的抽样分布 和中心极限定理,1.从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。 2.,设X1,X2,Xn是取自总体X的样本,样本 均值,,所有可能样本的均值 构成,的概率分布即为样本均值的抽样分布。,【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下,现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表,计算出各样本的均值,如下表。并给出样本均值的抽样分布,所有样本均值的均值和方差,式中:M为样本均值的个数,样本均值的分布 当总体服从正态分布N (,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为 ,方差为2/n。即XN(,2/n),中心极限定理,设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布,标准误差,标准误差:样本统计量与总体参数之间的平均差异 1. 所有可能的样本均值的标准差,测度所有样本均值的离散程度 2. 样本均值的标准误差小于总体标准差 3. 计算公式为,【例】设从一个均值=8、标准差=0.7的总 体中随机抽取容量为n=49的样本。要求: (1)计算样本均值小于7.9的近似概率 (2)计算样本均值超过7.9的近似概率 (3)计算样本均值在总体均值=8附近 0.1范围的近似概率,【例】某公司有400人,平均工龄为10年,标准 差为3年。随机抽出49名组成一个简单随机样本, 试问样本中工作人员的平均年龄不低于9年的概率 有多大。,解:虽然该总体的分布未知,但样本容量n=49较大 由中心极限定理可知,样本均值的抽样分布近 似服从正态分布。则均值的期望 均值的标准差,=1-(-2.33)= (2.33)=0.9901,练习题,某类产品的抗拉强度服从正态分布,平均 值为99.8公斤/平方厘米,标准差为5.48公斤/平 方厘米,从这个总体抽出一个容量为12的样本, 问这一样本的平均值介于98.8公斤/平方厘米和 100.9公斤/平方厘米之间的概率有多大。,3 由正态分布导出的几个重要分布,卡方 (c2) 分布,定义:设随机变量X1,X2,Xn相互独立,且Xi 服从标准正态分布N(0,1),则它们的平方和 服从自由度为n的c2分布。,c2分布的数学期望为:E( c2)= n c2分布的方差为: D( c2)= 2n,当自由度n足够大时, c2分布的概率密度曲线趋于对称; 当n+时, c2分布的极限分布是正态分布。,t分布和T统计量,1. t分布:设随机变量XN(0,1),Y c2(n), 且X与Y独立,则,其分布称为t分布,记为t(n),其中n为自由度。,当n2时, t分布的E (t)=0 当n3时, t分布的D (t)=n/(n-2),2. T统计量 设X1,X2,Xn是来自正态总体N (,2 ) 的一个样本,,称为T统计量,它服从自由度为(n-1)的t分布。,则,F分布,定义:设随机变量Y与Z相互独立,且Y和Z分别服 从自由度为m和n的c2分布,随机变量X有如下表达式:,则称X服从第一自由度为m,第二自由度为n的F分布, 记为XF(m,n)。,4 样本比例的抽样分布,如果在样本大小为n的样本中具有某一特征的个体数为X,则样本比例用p来表示:,当n充分大时,p近似服从均值为 ,方差为 的正态分布。,【例】已知对某超市服务水平不满意的人数的比例为5%,现随机抽取475名顾客组成的简单随机样本,问这475名顾客中不满意的比例在0.030.075之间的概率有多大?,解:设475名顾客中不满意的比例为p,则 E(p)=0.05, D(p)=0.050.95/475=0.0001 pN(0.05,0.0001),5 两个样本平均值之差的分布,设 是独立地抽自总体 的一个容量 为n1的样本的均值。 是独立地抽自总体 的一个容量为n2的样本的均值,则有,【例】居民区甲有2000个家庭,平均居住时间为130个月,服从正态分布,标准差为30个月;居民区乙有3000个家庭,平均居住时间为120个月,也服从正态分布,标准差为35个月。从两个居民区中独立地各自抽取一个简单随机样本,样本容量为70和100。问居民区甲样本中的平均居住时间超过居民区乙样本中的居民平均居住时间的概率是多大。,例:A班统计学考试平均分为75分,分数服从正态分布,标准差为5分;B班统计学考试平均分为72分,也服从正态分布,标准差为7分。现在从A、B两班分别随机抽出10名学生的统计学成绩,A班10名学生的统计学平均成绩高于B班10名同学的统计学平均成绩的可能性有多大?,两个样本比例之差的分布,设分别从具有参数为1和2的两个总体中抽取包含n1个观测值和n2个观测值的独立样本,当n1和n2很大时,(p1-p2)的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论