第七章 抽样推断_第1页
第七章 抽样推断_第2页
第七章 抽样推断_第3页
第七章 抽样推断_第4页
第七章 抽样推断_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样推断一、抽样推断的一般问题(一)抽样推断的基本特点:

1.按照随机原则抽取样本单位2.抽样调查的目的在于推断总体3.抽样误差可以事先计算并加以控制(二)抽样调查的作用1.用于调查不可能或无必要进行全面调查的现象。2.用于补充和修正全面调查的结果。3.用于生产过程中产品质量的检验和控制。4.用于假设检验。

二、抽样推断的几个基本概念

(一)全及总体和样本总体1.全及总体,也叫母体,简称总体,它是具有某种共同性质或特征的许多单位的集合体,也就是我们所要调查研究的现象的全体。全及总体的单位数通常用N来表示。2.样本总体,又叫子样或抽样总体,简称样本。它是从全及总体中随机抽取出来的那部分单位的集合体。样本总体的单位数称为样本容量,通常用n表示。一般来说,当n》30时,称为大样本;当n<30时,称为小样本。社会经济现象的抽样调查多取大样本。1.全及指标,是反映总体数量特征的综合指标,又叫总体指标或母体参数。在一个总体中,总体指标是唯一确定的量,而且是一个未知量,需要通过样本资料进行推算。常用的全及指标有总体平均数及总体标准差、总体成数及总体成数的标准差。见p172.样本指标,是反映样本数量特征的综合指标,又称样本统计量。样本指标有样本平均数及样本标准差、样本成数及样本成数标准差。由于从一个全及总体可以抽取多个样本,样本不同,样本的数值就不同,所以样本指标的数值不是惟一确定的,它是一个随机变量。见p18(二)全及指标和样本指标1.重复抽样,也称重置抽样或有放回抽样。它是指从总体中随机抽取一个样本单位,把结果登记下来后,重新放回,再从全及总体中抽取下一个样本单位。在这种抽样方式中,同一单位有多次重复中选可能。2.不重复抽样,也称不重置抽样或无放回抽样。它是指从总体中随机抽取一个样本单位后不再放回去,下一次则从剩下的总体单位中继续进行抽取。在这种抽样方式中,每个总体单位只能被抽中一次,不会被重复抽中。(三)重复抽样和不重复抽样

三、抽样的组织方式(一)简单随机抽样简单随机抽样也叫纯随机抽样。它是指在进行抽样时,对全及总体不经过任何形式的整理和加工,完全凭借偶然的机会从总体中抽取样本单位的抽样方式。(二)类型抽样类型抽样也叫分类抽样。它是运用统计分组法,把全及总体按主要标志划分为几个类型组,然后在各组中再按随机原则抽取样本单位的组织形式。(三)等距抽样等距抽样又称机械抽样。它是先将总体单位按一定标志排列起来,而后按固定顺序和一定距离来抽取样本单位的抽样方式。采用机械抽样对总体单位进行排队,必须选择一定的标志。

(四)整群抽样整群抽样与前几种抽样的最大区别在于,它的抽样单位不是单个的个体,而是成群的个体。它是将总体各单位划分成若干群。然后以群为单位,从中随机抽取一些群,对中选群的所有单位进行全面调查的抽样方式。

三、抽样的组织方式

四、抽样误差(一)抽样误差的概念抽样误差是指抽样调查所获得的数据与调查总体真实结果之间的差异。1.登记性误差系统性误差2.

代表性误差随机性误差(二)影响抽样误差大小的因素1.样本单位数的多少。2.总体被研究标志的变异程度。3.抽样方法。4.抽样调查的组织形式。(三)抽样平均误差抽样平均误差是指所有可能样本指标与全及指标之间的平均误差

抽样平均数的抽样平均误差

抽样成数的抽样平均误差(三)抽样平均误差1.抽样平均数的抽样平均误差在重复抽样条件下:在不重复抽样条件下:(三)抽样平均误差2.抽样成数的抽样平均误差在重复抽样条件下:在不重复抽样条件下:例见p23(四)抽样极限误差1.抽样极限误差的概念抽样极限误差又称置信区间和抽样允许误差范围,是指在一定的把握程度(P)下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围,记作Δ。设△x、△p分别表示抽样平均数极限误差和抽样成数的极限误差,则有:

2.抽样极限误差的计算公式

t——概率度,其大小取决于概率保证程度F(t)正态分布条件下,t=1,F(t)=68.27%t=1.96,F(t)=95%t=2,F(t)=95.45%t=3,F(t)=99.73%

五、抽样推断即用样本指标推断或估计全及指标(一)点估计:用样本指标代表全及指标(二)区间估计1.区间估计的思想:在一定概率保证程度下,用样本指标和抽样极限误差推断全及指标落在什么区间内。区间估计的计算公式如下:(1)根据已给定的抽样误差范围,求概率保证程度。【例1】某企业对某批电子元件进行检验,随机抽取100只,测得平均耐用时间为1000小时,标准差为50小时,合格率为97%,求:(1)以耐用时间的允许误差范围Δx=10小时,估计该批产品平均耐用时间的区间及其概率保证程度。(2)以合格率估计的误差范围不超过2.95%,估计该批产品合格率的区间及其概率保证程度。2.区间估计的模式解:求(1)的计算步骤:①求样本指标:②根据给定的小时,计算总体平均数的上、下限:下限上限③根据,查概率表得F(t)=95.45%由以上计算结果,有95.45%的概率保证程度估计该批产品的平均耐用时间在990~1010小时之间。求(2)的计算步骤:①求样本指标:p=97%②根据给定的Δp=2.95%,求总体合格率的上、下限:下限上限③根据t=Δp/μp=2.95%/1.71%=1.725,查概率表得F(t)=91.46%由以上计算结果,估计该批产品的合格率在94.05%~99.95%之间,有91.46%的概率保证程度。(2)给定概率保证程度,求抽样极限误差并对总体指标做出区间估计。【例2】对我国某城市进行居民家庭人均旅游消费支出调查,随机抽取400户居民家庭,调查得知居民家庭人均年旅游消费支出为350元,标准差为100元,要求以95%的概率保证程度,估计该市人均年旅游消费支出额。

解:第一步,根据抽样资料得:样本每户年人均消费支出=350(元)样本标准差σ=100(元)第二步,根据给定的概率保证程度F(t)=95%,查得正态分布概率表得t=1.96。第三步,计算,则该市居民家庭年人均旅游消费支出额:结论:我们可以95%的概率保证程度,估计该市居民家庭年人均旅游消费支出额在340.20元—359.80元之间。

六、样本容量的确定(一)必要样本容量的意义——控制误差,使推断达到预期可靠程度(二)影响必要样本容量的因素1.总体各单位间的标志变异程度——σ2.极限抽样误差的大小——Δ3.调查结果的概率保证程度——F(t)ort4.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论