




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
杜子芳 抽样技术课后思考题整理第二章、基本概念1、 简述下面四者之间的关系:根据调查是否针对总体的所有单元进行,调查有全面调查和非全面调查之分全面调查:针对总体中的每一个单元都进行信息搜集的调查,又称为普查。非全面调查:仅仅针对总体中一部分单元进行信息搜集的调查。 狭义的抽样调查是非全面调查中最常用、最重要的一类。而狭义的抽样一般仅指概率抽样调查,广义的抽样调查指的即是非全面调查,分为概率抽样调查和非概率抽样调查概率抽样:按照一定概率从总体的所有单元中随机选择一部分单元进入样本的抽样方法非概率抽样:样本不是按照一定概率抽出,而是由抽样者主观抽出或者是任由受访者自愿进入样本的抽样方法。2、非概率抽样的主要形式有哪些?非概率抽样的缺点是什么?主要有判断抽样,便利抽样,自愿抽样,滚雪球抽样,配额抽样判断抽样也称为立意抽样,是指由抽样者根据自己的主观经验抽取样本。便利抽样是指调查人员根据自己的方便,自行确定入样的单元自愿抽样是指样本由自愿参加的受访者所构成的抽样。滚雪球抽样是利用样本点(构成样本的单元)寻找样本点,即由目前的受访者去寻找新的具有某一特征的受访者。当调查的客体为某一特殊群体时,调查的客体往往不容易取得,只能先取得个别客体。再由他们去联络其他人。配额抽样是指先将总体中所有单元按一定分类标志分为若干类,然后在每类中采用便利抽样或判断抽样的方式选取样本,样本的类别结构与总体大致成比例,在各类的配额内,调查员则根据自身的经验或方便进行选举。 缺点:难以评价样本的代表性;无法估计抽样误差;偏倚往往较大3、概念区分a个体和样本个体:是指构成所谓总体的调查客体。样本:是指按一定程序从总体中抽取的一组个体。从总体全部单元中选出的部分单元,其全体称为样本总体,简称样本。b总体和抽样框总体:对于一次调查活动,所有调查客体的集合称为调查总体抽样框:是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。c个体与抽样单元个体是指构成所谓总体的调查客体。将举凡一切构成总体的个体或子总体泛称为总体单元,其中个体称为总体基本单元,简称基本单元。基本单元是总体里最小的、不可再分的单元。抽样单元是指构成总体的个体项目。抽样单元不仅指构成抽样框的目录项,同时还表示该目录项所对应的实际总体中特定的一个或多个单元。抽样单元不一定是组成总体的最小单位基本单位,抽样单元可能包含一个或一些基本单元,最简单的情况是只包含一个基本单元4、误差主要包括哪两类?引起误差的原因分别是什么?主要包括抽样误差和非抽样误差抽样误差:是指由样本数据对总体特征进行估计时所引起的代表性误差,原因是由于每次抽取一个样本,而样本中包含的哪些单元是随机的,不同的样本由于包含的单元不同,得到的估计值自然不同,各个估计值与总体特征之间不可避免的出现差距,由此产生了抽样误差。非抽样误差:其来源比较复杂,主要有抽样框未能不重不漏包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,还有无回答误差和粗大误差。5、 为什么我们构造的置信区间可以使用标准正态分布的分位数?可以采用其他分布的分位数吗?根据大样本时抽样分布的正态近似性,对于可用估计量,只要样本量n足够大,就可以构造的置信区间。在样本量比较小的时候,用正态分布近似抽样分布可能会有较大的误差,此时可以选用t分布来构造近似置信区间。只要将 换为t分布的双侧a分位数即可6、 简述调查主要步骤,并思考抽样设计在其中的作用。(1)确定调查目标(2)抽样框选择(3)抽样设计(4)问卷设计(5)数据收集(6)数据编码和录入(7)审核与插补(8)参数估计(9)数据分析和调查结果的表述(10)数据发布(11)文档抽样设计包括抽样方法的选择以及样本量的确定,抽样方法的选择受诸多因素的影响:可用的抽样框,总体的散布程度,调查每个单元的费用以及对所取得的数据的分析方法,样本量的大小直接影响着调查费用和调查花费的时间,需要的访员数量等。抽样方法的选择还会影响估计的精度和估计的效果.7.对随机原则的理解抽样调查在选择调查单位时要遵守随机原则。所谓随机原则是指在总体所有单位中选择样本单位时要排除调查者主观意念的影响,也不考虑调查者是否愿意合作,总体每一个单位进入样本的概率都是非负、都是可能的。在操作方法上不应该把随机原则演变成随意原则。随机原则指不受主观因素的影响,使每一个单元都有一定的概率入选样本。要求总体中的每一个单元都有一定的概率被抽中。随机原则并不意味着总体中每个单元都有相同的入样概率。等概率抽样的原则才是如此,而等概率抽样只是概率抽样的一种。在抽样调查中采用随机原则能够随机原则是指在抽样时排除主观上有意识地抽取调查单位,每个受试单位以概率均等的原则,随机地分配到实验组与对照组。使每一个单位都有一定的机会被抽中。例如可以使用随机数表等来保证随机性第四章、分层随机抽样8、简述分层随机抽样中的简单估计和事后分层估计以及子总体估计之间的联系和区别9、分层抽样中的n的分配方法,不同的分配方法对估计精度的影响是什么?a比例分配:按比例分配的分层随机样本,估计量的形式特别简单(而且无偏),可以大大简化调查以后得数据处理,特别是对于大规模的多变量调查,自加权样本的优点尤其明显。但是在大规模的抽样调查中,特别是再涉及多阶段抽样的调查中,很难保证最终获得的样本是严格自加权的。b最优分配:在分层随机抽样中,对于给定的费用,使估计量的方差达到最小,或者对于给定的估计量方差,使得总费用达到最小的各层样本量的分配称为最优分配,从定义看出,在最有分配中,不仅考虑调查的精度要求,而且把费用也纳入考虑的范围之内。选择的线性费用函数形式是其中, CT 为总费用; c0 为与样本量无关的固定费用; ch 为在第h 层中抽取一个单元进行调查的平均费用。c奈曼最优分配是最优分配的特例,在最优分配中,如果假定各层的单位抽样费用相等,即Ch = c那么费用函数就变成CT = C0 + Cn在分层随机抽样中,当样本量n固定时,奈曼分配的样本容量可使方差达到最小值综上所述,比例分配的优点是可以得到自加权样本,抽样实施简单。奈曼分配考虑到层权和各层变异程度的因素,会使抽样精度大大提高。然而现实中往往会存在费用问题,最优分配同时考虑到三者的影响。各层均值之间的差异愈大,则一般的分层的效益就愈高;当分层的标准差相差较大时,最优分配又会比比例分配有更高的效益;而倘若各层的标准差之间的差别不大,那么最有分配的效果不会比比例分配的效果好很多。考虑到比例分配的估计量是自加权的简单形式,并且除非各层的标准差之间的差异十分明显,否则比例分配的精度并不会与最有分配的精度差很多,所以比例分配相对更受实际工作者的欢迎。 对估计精度的影响:最优分配:在分层随机抽样中,对于给定的费用,使估计量的方差最小,或者对于给定的估计量方差,使得总费用达到最小的各层样本量的分配奈曼分配: 10、分层抽样的分层原则,并说明理由分层抽样中将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则,并且遵循层内差异小,层间差异大的原则。理由:a、可同时对子总体进行参数估计,由于抽样在每一层中独立进行,所以各层的数据可以用于对本层进行参数估计,而不单是汇总后用于对总体参数进行估计b、便于依托行政管理机构进行组织实施,同时还可以根据各层的不同特点采用不同的抽样方式c、可使样本在总体中分布更加均匀,从而具有更好的代表性,这样就避免了样本分布不平衡的现象d、可以提高参数估计的精度,抽样调查的目的在于对总体(或子总体)进行估计。事实上,分层抽样的精度一般要高于其他抽样方式第六章:11、什么是整群抽样?整群抽样有那几个步骤? 设总体有N个大单元,即初级单元组成,每个初级单元又由若干个较小的次级单元或二级单元组成,首先从总体按某种方式抽取n个初级单元,然后抽出其中所包含的所有的次级单元,构成一个样本步骤:第一步,将总体划分为若干个群(初级单元)。第二步,以群为抽样单元,从总体中抽取一部分群。第三步,抽取选中选中群中的100%次级单元(也自然是100%的基本单元)构成样本。12、整群抽样有哪些优点? 样本单元集中,如果群是按照空间或系统进行划分的,则调查地点集中,可以减少在不同的单元之间的奔波,从而节约调查费用。整群抽样只需要初级单元的抽样框,而并不要求全部次级单元的名单,简化了抽样框的编制,a 抽样框要求简单在某些调查中,尽管调查客体是较小的单元,但在总体中没有或者不易得到包括所有这些单元的抽样框,有时虽然有相应的资料,但整理、构造抽样框的工作量极大。b 方便经济处于经济上的考虑,采用整群抽样,由于样本相对集中,可以节省调查时间和费用,因而总得抽样效率很高c 特定场合具有较高的精度尽管对于同样数目的基本单元而言,整群抽样的精度可能有所损失,但因每调查一个次级或基本单元的平均费用低,故可以通过适当增大样本量的方法来得到弥补。对于某些情形,由于群的特殊结构,群内次级或基本单元的差异很大,以至于与总体中的次级或者基本单元的差异相差无几,此时即便抽取同样数目的基本单元,整群抽样的精度也不见得比简单随机抽样低。在这种情况下,整群抽样的优点就更为明显。13、整群抽样与多阶段抽样及分层抽样的区别? 分层抽样:先按某规则把总体划分为不同的层,然后在层内在进行抽样,各层的抽样之间是独立进行的,分层抽样估计是先在各层内进行的,在由各层的估计量进行加权平均或求和,从而得出总体的估计量。 整群抽样:如果抽样仅对初级抽样单元进行,对抽中的初级单元中调查其全部的次级抽样单元,对没有抽中的初级单元不进行调整 多阶段抽样:是整群抽样的发展,在抽得初级抽样单元后,并不调查其全部次级单元,而是再进行抽样,从入选的初级单元中抽选次级单元,称为二阶段抽样。依次类推定义多阶段抽样。在两阶段抽样中所有初级单元都被抽中,在每个初级单元中抽取部分二级单元,则这时的抽样称为分层抽样。如果对初级单元进行抽样,并且样本初级单元中所有二级单元都被抽中,则这时的抽样称为整群抽样。 14整群抽样的设计效应及评价设计效应Deff = 所考虑抽样设计下估计量的方差/相同样本量简单随机抽样估计量的方差设计效应有两个作用,一是比较不同抽样设计的效率,二是利用简单随机抽样设计的样本量确定满足相同精度要求的复杂抽样设计所需样本量 第七章什么是系统抽样?系统抽样与分层抽样,整群抽样有何关系?系统抽样是一种特殊的且群的规模大小都相等的整群抽样;系统抽样也可以看做是一种特殊的分层抽样。 15.系统抽样和整群抽样,分层抽样的精度比较:分层抽样。即各层平均数在总体平均数周围的偏离性越大, 则分层抽样误差越小。所以在设计抽样调查方案时, 要尽可能缩小各层内部的差别, 从而扩大各层之间的差异, 增大各层平均数关于总体平均数的偏离, 这样就能得到较好的分层抽样估计效果。系统抽样(等距抽样)效果分析: 对于任一总体, 其总体方差R2 是唯一确定的, 因而要使V (xsy) 减小, 就必须使R2wsy增大, 即增大各等距样本的内部方差。所以在设计等距抽样方案时, 将总体分成N 部分, 要求尽可能做到使各部分K 个单位的差异减小, 从而使各部分之间的差异增大, 这样可以有效地降低抽样误差。整群抽样: 对于一定的总体, 各群内方差平均值较大时, 就有群间方差较小。因此, 要降低整群抽样误差, 则要求群间方差减小, 或要求群内方差增大。这样, 在设计整群抽样时, 为降低抽样误差, 提高估计精度, 就必须在对总体划分群单元时, 尽可能使各群内单位标志值的变异大些, 而使各群间的差异小些。 16.概率和非概率抽样的比较,以及优缺点二者的本质区别是总体单位的入样之前概率是否确定。概率抽样:按照一定概率从构成总体的所有单元随机选择一部分单元进入样本的抽样方法。特点:a.能够表明一个确定的样本包含哪些单元b.对每个可能的样本,都有一个被确定抽取的概率c.以随机原则抽取样本 d.从样本数据估计总体特征时,需要考虑该样本被抽中的概率优点:是能保证样本的代表性,避免人为因素的干扰;用概率抽样取得的样本去估计总体特征时,可以对由抽样产生的抽样误差进行估计。缺点:a.严格的概率抽样几乎无法进行。如调查对象的总体边界不清而无法制作抽样框,有些研究为了更切合研究目的,不得不按照需要从总体中抽取少数代表性的个体作为样本b为了保证随机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考专练:书面表达-(含答案)
- 农业大数据时代2025年农产品无损检测技术与物联网的融合报告
- 两江投资面试题库及答案
- 理财会计面试题及答案
- 兰州护士面试题目及答案
- 农业产业强镇建设资金申请项目产业链优化与整合报告
- 库房会计面试题目及答案
- 康宁会计面试题目及答案
- 电子合同签署流程
- 美术馆展览策划活动规划策略总结计划制定
- 静设备安装质量控制过程
- 学生饮用奶采购服务投标方案
- 《收购兼并和企业重组》
- 醋酯纤维及其面料的知识
- 《大学美育》第1章
- 城里来了大恐龙
- 门诊发药交待注意事项
- 中小学心理健康教育指导纲要考试试题及答案(整理)
- GA/T 115-2020道路交通拥堵度评价方法
- 食品试验设计与统计分析
- 公安民警心理压力应对Baidu课件
评论
0/150
提交评论