第七章抽样调查.ppt_第1页
第七章抽样调查.ppt_第2页
第七章抽样调查.ppt_第3页
第七章抽样调查.ppt_第4页
第七章抽样调查.ppt_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样调查、教学目的和要求。通过本章的学习,我们应该了解和掌握抽样调查的概念和特点,抽样误差的含义和计算方法,抽样估计的置信水平,以及推断总体参数的方法,这些都可以结合实际数据进行抽样估计。(1)抽样调查的概念和特征,概念和特征,第1节抽样调查的概念和功能,P165,P165P167,2)抽样推断的内容,参数估计,假设检验,第3节抽样调查的基本原则,(1)总体和样本,总体,也称整体和总体。指所有待识别的研究对象。单位的总数用“n”表示。样本:也称为子样本。它是从整体中随机选择的单元的集合,而整体作为代表整体的部分。样本单位的总数用“n”表示。(2)总体指标、样本指标和总体指标,反映总体量化特征。总体指标、研究人群中的定量指标、总体平均值、人群方差、研究人群中的质量指标、总体百分比、百分比方差、(只有两种表述),总体百分比是多少?根据某个标志,包含在总数中的总单位分为两部分。具有特定特征的单元数量占单元总数的比例就是单元总数。人口的百分比是人口的平均数。产品质量、合格产品、不合格产品、数量(件)、总计、N1、N0、N、总体平均值、x、1、0、f(总体百分比)、样本指数、基于样本数据计算的综合指数。研究数量指标、样本平均值、样本标准差、研究质量指标、样本百分比、百分比标准差、(3)样本大小和样本数量、样本大小:样本中包含的单位数量。用“n”表示。一般要求是n30,样本数:可以从总数和总体中提取的样本数。(4)重复采样、非重复采样和重复采样:也称为反采样。无重复采样:也称为无返回采样。可能样本的数量:n (n-1) (n-2) (n-n 1),可能样本的数量:例如,从a,b,c,d四个单位中,取出两个单位形成一个样本,问可能样本的数量是多少?重复采样,a,a,AC,ad,b,a,bb,BC,BD,ab,c,a,CB,cc,CD,d,a,db,DC,DD,n,n,=42=16(样本),不重复采样,n (n-1) (n-2).43=12(样本),抽样误差,1,抽样误差的含义,由于随机抽样的偶然因素,抽样的每个单位的结构不足以代表整个人口的每个单位的结构,导致抽样指数和总指数之间的绝对偏差。影响抽样误差的因素193,1,人口中每个单位的标记值之间的差异程度,2,样本的单位数,3,抽样方法,4,抽样调查的组织形式,3,平均抽样误差,概念,理解,以及假设人口包含1,2,3,4,5和5个数字。然后:总体平均值:x,=,1,2,3,4,5,=,3,现在,我们使用重复采样抽取其中两个来形成样本。可能的样本数量:52=25(件),例如:13,14,24,35,2、=2、2、=2.5、2、=3、2、=4,平均采样误差是采样平均值或采样百分比的标准偏差,反映了采样指标与总体指标之间的平均误差程度。抽样指数和抽样指数之间的平均误差,(2-3) (2.5-3) (3-3) (4-3),25,抽样平均误差的计算公式,抽样平均的平均误差,抽样百分比的平均误差,实际上,抽样平均误差不能用上述两个公式来计算。想想看,为什么?抽样平均平均误差的计算方法采用重复抽样,该公式表明,抽样平均误差与总体标准差成正比,与样本量成反比。(当总体标准差未知时,可以用样本的标准差代替)。以下几点可以用例子来说明:(1)样本平均值等于总体平均值。抽样平均值的标准偏差仅为总体标准偏差,抽样平均值的误差可以是c它们的平均重量为58公斤,标准偏差为10公斤。抽样推断的平均误差是多少?例2:一家工厂生产了一种新型灯泡,共有2000个灯泡。随机选择400个灯泡进行耐久性试验。测试结果的平均使用寿命为4800小时,样品的标准偏差为300小时。计算抽样推断的平均误差?根据样本学生的平均体重估计所有学生的平均体重时,平均抽样误差为1公斤。计算结果表明,从某些产品推断所有产品的平均使用寿命时,非重复抽样的平均误差小于重复抽样的平均误差。known:then:known:then:n=100,=10,x=58,n=2000,n=400,=300,x=4800,抽样百分比平均误差的计算方法是重复抽样:非重复抽样:例3:某学校随机抽取400名学生,发现80名学生戴眼镜。从样本数据推断学生戴眼镜的比例时,抽样误差是多少?例4:一批罐头食品总计60,000桶,随机抽取300桶。六桶被发现不合格。找出合格品率的平均抽样误差?当戴眼镜的学生在所有学生中的比例从样本数据推断时,平均误差为2%。非重复采样的平均误差小于重复采样的平均误差,但“n”值越大,两种方法计算的采样平均误差越接近。抽样极限误差是指抽样估计时,根据研究对象的变化程度和分析任务的要求,确定的样本指标与总体指标之间的最大允许误差范围。计算方法:它等于样本指标和总体指标允许变化的上限或下限之差的绝对值。抽样平均值的极限误差、抽样百分比的极限误差、置信区间和置信区间,即抽样误差的概率是衡量抽样估计可靠性的一个参数。由符号“t”表示。公式表明(t是极限误差与抽样平均误差之比),(极限误差是抽样平均误差的t倍),上述公式可转化为:估计量的抽样标准,总体参数的良好估计的标准,无偏,一致,有效,2,总体参数的区间估计,区间估计的三要素,估计值,抽样误差范围, 抽样估计的置信水平,总体参数的区间估计的特征:3,总体参数的区间估计方法,(1)根据给定的抽样误差范围计算概率保证度,分析步骤:1,抽样,计算抽样指数。 2.根据给定的极限误差范围,估计总体参数的上限和下限。3.计算概率。4.查表找出概率F(t)并对总体参数进行区间估计。(2)根据给定的概率F(t),计算抽样极限误差的可能范围,分析步骤如下:(1)抽取样本,计算样本指数。根据给定的F(t),查表找出概率T3。根据概率度和抽样平均误差计算极限误差。4.计算估计值的上限和下限,并对总体参数进行区间估计。一个农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用简单随机抽样,不重复,从中选取100亩作为实际刈割测量的样本,测得的样本平均亩产为400公斤,方差为144公斤。(2)在概率保证度不变的情况下,允许的抽样误差不超过1kg,应取多少作为样本?(1)基于95.45%的可靠性,该农场小麦的平均亩产量是多少?该农场每亩小麦平均产量估计为397.62公斤至402.38公斤,可靠性为95.45%。一家棉纺厂在一定时间内生产了10万支纱线,其中2000支是纯随机抽样选出的。检验结果合格率为95%,废品率为5%。尝试以95%的置信度估算所有纱线的合格率范围和合格量范围?为了调查农民的生活状况,采用简单随机抽样的方法在某一地区抽取了400户家庭,发现其中87户有彩电。该地区所有农民中有百分之几的人对彩电有95%的信心?如果允许的抽样误差不超过0.02,其他条件保持不变,应该抽样多少户?例3的问题1的解决方案:已知:N=5000,n=400,1,计算样本百分比:2,计算抽样平均误差:3,计算抽样极限误差:4,计算人口的置信区间p:下限:上限:即以95%的置信度估计该地区拥有彩电的农民数量在17.87%和25.63%之间。在其他条件不变的情况下,1653户,第4节抽样组织设计,1、简单随机抽样,1、含义:根据随机原则,n个单位直接从总n个单位中抽取作为样本。2.样本单元数的计算方法:通过样本极限误差公式计算出所需的样本单元数。重复抽样、非重复抽样、抽样平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论