版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 抽样调查统计学原理(第五版)第八章 抽样调查内容提要第一节 抽样调查的一般问题第二节 抽样误差第三节 总体指标的推断第四节 必要抽样数目的确定本章习题下一章内容提要 本章主要阐述了抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式的抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。抽样调查的一般问题第一节返回2一、抽样调查的概念、特点与作用 (一)抽样调查的概念与特点 抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。抽样调查具有下列三个主要特点:
2、 (1)按随机原则抽取调查单位。 (2)由部分推断全体。 (3)抽样误差可以事先计算并加以控制。 (二)抽样调查的作用 (1)用于不可能进行全面调查的无限总体。 (2)用于不可能进行全面调查而又需要了解全面情况的现象。 (3)用于不必要进行全面调查的现象。 (4)用于对全面调查的资料进行评价与修正。 (5)用于工业生产过程的质量控制。二、抽样调查中的几个基本概念 (一)全及总体和抽样总体 1.全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。 2.抽样总体。抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。(二)总体指标和样本指标 1.总体指标。
3、 总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。2.样本指标。 样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。三、抽样调查的组织方式 (一)简单随机抽样 简单随机抽样也叫纯随机抽样,它对总体单位不作任何分类排队,而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。 (1)抽签法。
4、 (2)随机数字法。 (二)类型抽样 类型抽样又称分类抽样或分层抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组中抽取样本单位的一种抽样方式。 (1)等数分配类型抽样法。 (2)等比例类型抽样法。公式81(3)不等比例类型抽样法。公式82(三)等距抽样 等距抽样也称机械抽样或系统抽样,它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。抽样距离计算公式为:公式83图81 等距抽样示意图 (四)整群抽样 整群抽样也称集团抽样、区域抽样或分群随机抽样,它是将总体各单位按时间或空间形式划分成许多群,然后按纯随机抽样或机械抽样方式从中抽取
5、部分群,对中选群的所有单位进行全面调查的抽样组织方式。公式84公式85抽样误差第二节返回2一、抽样误差的概念 即使遵守了随机原则,也会由于被抽取的样本各种各样,导致样本内部各单位的分布比例结构与总体实际分布状况有偶然性的差异,从而使不同的随机样本得出不同的估计量,造成样本指标数值与总体指标数值之间产生差距,如抽样平均数与总体平均数的离差,抽样成数与总体成数的离差等。这类误差通常称为抽样误差或随机误差。二、影响抽样误差的主要因素 (一)样本单位数(样本容量n)的多少 (二)总体被研究标志变异程度(总体方差)的大小 (三)抽样组织方式 (四)抽样方法三、抽样平均误差 (一)抽样平均误差的概念 抽样
6、平均误差是指以全部可能样本指标为变量,以总体指标为平均数计算得到的标准差,以符号 表示,通常以 代表平均数的抽样平均误差,以 代表成数的抽样平均误差,以K代表可能组成的样本总数。 (二)计算抽样平均误差的理论公式 根据抽样平均误差的概念可得其一般计算公式:公式86公式87 (三)抽样平均误差的计算方法 1.平均数的抽样平均误差 (1)重复抽样条件下:公式88 (2)不重复抽样条件下:公式89 当N很大时,公式810例为叙述简便起见,假设有10,20,30和40四个数字组成一个总体,从中随机抽取两个数字作为样本,求抽样平均误差。 2.成数的抽样平均误差 (1)重复抽样条件下:公式811 (2)不
7、重复抽样条件下:公式812 当N很大时,公式813 例 某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为85%。今按简单随机抽样方式从800只仪表中抽取10%进行检验,求合格品比率的抽样平均误差。 在重复条件下,采用公式811: 在不重复条件下,采用公式813:例83某大学有4500名学生,采用不重复简单随机抽样方式从中抽取10%的学生,调查其每月生活费用支出情况。抽样结果显示,学生平均每人每月生活费支出350元,标准差80元,生活费用支出在500元以上的学生占全部学生的20%。试求抽样平均误差。 (四)其他抽样组织方式抽样平均误差的计算方法 1.类型比例抽样平均误差的计算。 (1
8、)平均数的抽样平均误差 重复抽样条件下:公式814 不重复抽样条件下:公式815 (2)成数的抽样平均误差 重复抽样条件下:公式816 不重复抽样条件下:公式817 其中:公式818 公式819 例84 某县对本县的某种农作物的产量作了一次类型比例抽样调查。调查资料整理的结果见表8-4,试求抽样平均误差。表8-4返回33 2.等距抽样平均误差的计算。 3.整群抽样平均误差的计算。 (1)平均数的抽样平均误差 公式820 (2)成数的抽样平均误差公式821 其中:公式822 公式823例8-5 某商店购进300箱(50只/箱)苹果,入库前随机抽取1%检查其质量。检验结果的整理资料见表8-5,试求
9、抽样平均误差。 例85 首先,分别计算样本平均数和样本成数: 然后,分别求出样本平均数群间方差和成数群间方差: 最后,根据公式820和公式821求出x和p为:总体指标的推断第三节返回2一、统计比较的概念和作用 总体指标的推断是指对总体平均数 总体成数P推断估计的问题。抽样调查的直接目的,就是为了推断 ,P,然后,再结合总体单位数N去推算总体的有关标志总量。总体指标的推断有点估计和区估计两种方法。 一、点估计 点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值( ,p)直接作为总体未知参数 ( ,P)的估计值的一种推断方法。 估计量评判标准: 1.一致性。设
10、为未知参数的估计量,当n时,要求 按概率收敛于,即公式24 2.无偏性。若要求估计量 的数学期望等于未知参数的真值,即公式25 3.有效性。无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。设 , 为的两个无偏估计量,若 的方差小于 的方差,即公式28 二、区间估计 区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。考虑表8-6样本平均数的概率分布由表8-6知: 将表8-6所示的变量数列绘成图形,即可得到一个钟形的平滑曲线,这条曲线叫正态分布曲线。如图8-2图82 正态分布曲
11、线图 根据数理统计证明,总体单位的标志值如果是正态分布,其全部可能样本也一定是正态分布的;如果总体单位的标志值不是正态分布的,只要是大样本(即n30),全部可能样本指标也会接近正态分布。从正态分布图中,可以总结两个特点:一是样本指标高于或低于总体指标的概率分布完全是对称的;二是样本指标接近于总体指标的概率越大(小),出现的可能性也越大(小)。样本指标置信度根据数学证明,在 到 的区间中,这一部分曲线下的面积,占曲线下全部面积的68.27%;在 到 的区间内,这一部分曲线下的面积,占曲线下全部面积的95.45%;在 到 的区间内,这一部分曲线下的面积,占曲线下全部面积的99.73% 。如图8-3
12、 图83 样本指标置信度图 误差范围 与概率度(t)和抽样平均误差 三者之间的关系为:公式827 由此得到平均数和成数的误差范围公式:公式828公式829 进而得到总体平均指标和总体成数指标的区间估计公式为:公式830公式831例8-6某自行车厂从生产的一批10000个自行车轮胎中随机抽取1%进行质量检验。调查结果显示,轮胎的平均寿命为5000英里。试以95%的把握对该批自行车的平均寿命作出估计。(注:根据长期生产这种类型的轮胎数据可知,总体标准差为400公里)例 有了区间估计的结果,就可以对这批轮胎的使用寿命得出结论,因为区间估计最低公里数为4921.99公里,可将4900公里规定为最低可行
13、驶公里数。这样做虽不能保证百分之百的可靠,但可以有95%的把握,还是令人可信的。例7利用例8-3的资料,在95.45%的概率保证下估计全体学生月平均生活费用的可能范围,以及月生活费用在500元以上学生所占比重的可能范围。例8-8 从某县农民家庭中随机抽取100户调查其年收入情况。农民家庭按年人均纯收入额分组的资料如下表8-7所示根据表8-7的资料计算得表8-8例8例8第四节必要抽样数目的确定返回2 一、影响抽样数目的主要因素 (一)总体被研究标志的变异程度 (二)对推断精确度的要求 (三)对推断可靠性的要求 (四)抽样调查的组织方式和方法 (五)人力、物力和财力的允许条件二、确定抽样数目的方法 (一)在重复抽样条件下 推断总体平均数所需要的抽样数目:公式832 推断总体成数所需要的抽样数目:公式833 (二)在不重复抽样条件下 推断总体平均数所需要的抽样数目:公式834 推断总体成数所需要的抽样数目:公式835例8-9假定某乡有农户18000户,在某次调查中采用重复的纯随机方式进行抽样,要求人均收入的极限误差控制在150元内,把握程度为95.45%,该抽多少多少农户?如果极限抽样误差要求控制在75元内,应抽多少户?(注:全乡人均收入标准差为1500元) 例 (1)采用重复抽样公式计算: 可见,在重复抽样中,极限误差缩小一半(即为原来的1/2)时,必须
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海电子信息职业技术学院《临床医学概论》2025-2026学年期末试卷
- 山西警官职业学院《播音主持概论》2025-2026学年期末试卷
- 上海师范大学《国际贸易实务英文版》2025-2026学年期末试卷
- 太原学院《英语语言学导论》2025-2026学年期末试卷
- 沈阳体育学院《当代世界经济与政治》2025-2026学年期末试卷
- 上海外国语大学《会计原理学》2025-2026学年期末试卷
- 上海中华职业技术学院《金融信托与租赁》2025-2026学年期末试卷
- 山西国际商务职业学院《会计学原理》2025-2026学年期末试卷
- 上海行健职业学院《广告文案写作》2025-2026学年期末试卷
- 朔州陶瓷职业技术学院《初级经济学》2025-2026学年期末试卷
- 2026年1月1日起施行新增值税法全文课件
- 山东省蔬菜出口到日本地区的现状及发展的对策
- 组织措施方案
- 健康体检主检报告的内涵
- 铁道概论(高职)PPT完整全套教学课件
- WPS Office办公应用案例教程
- 08D800-7 民用建筑电气设计与施工-室外布线
- 车辆技术档案范本(一车一档)
- 第34届河北省青少年科技创新大赛青少年科技创新大赛查新报告(参考样)
- GB/T 24044-2008环境管理生命周期评价要求与指南
- GB/T 15242.1-1994液压缸活塞和活塞杆动密封装置用同轴密封件尺寸系列和公差
评论
0/150
提交评论