第5章抽样与抽样分布2_第1页
第5章抽样与抽样分布2_第2页
第5章抽样与抽样分布2_第3页
第5章抽样与抽样分布2_第4页
第5章抽样与抽样分布2_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、常用的抽样分布,抽样分布的概念,相关知识点:随机变量的概率分布,概率用来度量发生的可能性大小的数值 随机变量X的概率分布X的所有可能取值与其概率之间的对应关系。,概率分布的例子,5件产品中2件优质品,先从中抽取3件的优质品数 随机变量:抽出产品中优质品件数X 分布列: 分布图,0.6 0.3 0,0 1 2 x,P( x ),X的平均水平和波动状况如何?,随机变量:抽出产品中优质品件数X 分布列: 分布图,0.6 0.3 0,0 1 2 x,P( x ),随机变量的数学期望,随机变量的数学期望又称均值, 描述一个随机变量的平均值(理论上的或真实的),记为如E(X),随机变量的方差,方差是随机变

2、量的各个可能取值偏离其均值的离差平方的均值,记为如D(x)或2X,抽样分布(sampling distribution),抽样分布:样本统计量的概率分布。,学生 成绩 30 40 50 60 70 80 90,按随机原则抽选出名学生,并计算平均分数。,样本均值的抽样分布,抽样分布的形成过程,注意点: 样本统计量是随机变量。 抽样分布是一种概率分布,是一种理论分布。 一个样本统计量的抽样分布,是指统计量的所有可能取值与相应概率值的对应关系。 考虑的是来自从同一总体中用相同方法重复抽取的容量相同的所有可能样本的统计量的所有取值的分布,确定抽样分布的步骤 第一步:确定样本个数及每一个样本。 第二步:

3、确定每一个样本对应的统计量的取值。 第三步:确定每一个取值发生的概率。 第四步:确定对应关系,形成抽样分布。,样本统计量的抽样分布,以简单随机抽样为讨论对象 从样本统计量的分布形态及数学特征(期望和方差)两个角度介绍 从重复抽样和不重复抽样两个角度介绍,样本均值的抽样分布,定义:在重复选取容量为n的样本时,由样本均值的所有可能取值形成的概率(相对频数)分布 一种理论概率分布 推断总体均值的理论基础,样本均值的抽样分布,样本均值的抽样分布形状,(注意:中心极限定理),考察样本均值的抽样分布形状,分两种情况: 1)总体分布已知且为正态分布; 2)总体分布未知或非正态分布;,样本均值抽样分布的形状,

4、1)总体分布已知且为正态分布,当总体分布已知且为正态分布或接近正态分布时,则无论样本容量大小如何,样本均值都为正态分布,(2)当总体分布未知或非正态分布需要用到中心极限定理,描述大量随机变量之和的分布趋近于正态分布的一系列定理的统称,中心极限定理(central limit theorem),中心极限定理:设从一个任意总体中抽取容量为n的简单随机样本,当n充分大时,样本均值的抽样分布近似服从正态分布,中心极限定理,x的分布趋于正态分布的过程,样本均值抽样分布形状总结,(1)从正态总体中抽取的全部可能样本,无论样本容量有多大,样本均值的抽样分布必定遵从于正态分布; (2)非正态总体无论它呈现何种

5、分布,只要样本容量n足够大(只要n30) ,那么样本均值的抽样分布,必定趋近于正态分布;,重复抽样下样本均值的数学特征,样本均值的期望(均值)和标准差,样本均值的抽样分布,【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下,总体均值和方差, 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有?个样本。所有样本的结果如下表, 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为, 计算出各样本的均值,如下表。并给出样本均值的抽样分布,3.5,3.0,2.5,

6、2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个 观察值,16个样本的均值(x),重复抽样下样本均值的数学期望与方差,结论:重复抽样下: 样本均值的数学期望等于总体均值 样本均值的方差等于总体方差的1/n,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,总体分布,重复抽样下样本均值的抽样分布,正态总体及大样本(n30 )下,不重复抽样下样本均值的数学特征(补充内容),样本均值的期望(均值)和标准差,思考:不重复抽样的数字特征和重复抽样哪里会有不同?,学生 成绩

7、 30 40 50 60 70 80 90,按随机原则抽选出名学生,并计算平均分数。,不重复抽样下样本均值的数学特征,二者均值相等,不重复抽样下,样本均值的数学特征,不重复抽样下 样本均值的期望 样本均值的标准差 修正系数(因子)的两种表现形式,不重复抽样下样本均值的抽样分布,无限总体不重复抽样,可不使用修正系数(因子),正态总体及大样本下,样本均值抽样分布的总结1、抽样分布的形态,总体分布,正态分布,非正态分布,大样本,小样本,正态分布,正态分布,非正态分布 (t分布近似),样本均值的数学期望 样本均值的方差 重复抽样 不重复抽样,2、样本均值的数学特征(数学期望与方差),样本比率的抽样分布

8、,以简单随机抽样为讨论对象 重复抽样下样本比率(比例)的抽样分布 不重复抽样下样本比率的抽样分布,在经济与商务的许多场合,需要用样本比率p对总体比例进行统计推断。,样本比率抽样分布的相关信息:,p的:期望值、标准差、抽样分布形状,比率是指总体(或样本)中具有某种属性的单位数与全部单位数之比; 样本比率的抽样分布是样本比率所有可能值的概率分布。,合格品率为例,样本比率的均值(数学期望)等于真实的总体比率 2. 样本比率的方差等于总体方差的1/n,重复抽样下样本比率的数学特征,不重复抽样下,样本比率的数学特征,样本比率的均值不变,方差添加修正系数,样本比率抽样分布中大样本的确定,P的频数分布图抽样

9、1(n=20,=0.4),抽样2(n=100,=0.4),抽样3(n=10,=0.5),抽样4 (n=100,=0.01),根据中心极限定理有:当样本容量足够大时(大样本)(np5 且n(1-p)5),样本比率抽样分布趋向于正态分布。,样本比率抽样分布的形状,当样本容量足够大时,样本比率的分布接近正态分布。 样本比率的期望为总体比率,方差为总体方差的1/n(运用中心极限定理),重复抽样下样本比率的抽样分布,当样本容量足够大时,样本比率的分布接近正态分布。 样本比率的期望为总体比率,方差为总体方差的1/n并乘以修正系数。,(二)不重复抽样下样本比率的抽样分布,样本比率的抽样分布总结,大样本下,近

10、似服从正态分布 样本比率的数学期望 样本比率的方差 重复抽样 不重复抽样,统计量(样本均值和样本比率)特点总结,分布形态 数学特征集中趋势(期望) 离散程度(方差),样本比率的数学特征举例,教师是否博士 是(1) 是(1) 是(1) 否(0) 否(0) 是 (1),具有博士学位的总体比率: 4/6=2/3 总体期望=4/6=,样本比率的数学特征举例,教师是否博士 是 是 是 否 否 是,具有博士学位的总体比率 总体期望 总体方差(1- ),从总体中按不重复抽样方法随机抽取人,计算其样本比率的期望和标准差。,练习,一家工厂在正常情况下产品次品率为8%,若产品批量比较大,随机抽取100个产品进行检验,求次品率在7%9%之间的概率?,n=100*0.08=8 n(1- )= 100*0.92=92 E(p)= 8%,样本方差的抽样分布,样本方差的抽样分布,设总体服从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论