抽样调查-第11章调查中的非抽样误差ppt课件_第1页
抽样调查-第11章调查中的非抽样误差ppt课件_第2页
抽样调查-第11章调查中的非抽样误差ppt课件_第3页
抽样调查-第11章调查中的非抽样误差ppt课件_第4页
抽样调查-第11章调查中的非抽样误差ppt课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十一章 调查中的非抽样误差11.1 引言 非抽样误差是指除抽样误差以外的,由于各种缘由引起的误差。 在概率抽样、非概率抽样、其他全面调查和非全面调查已及普查中,非抽样误差都有能够存在。. 同抽样误差相比,非抽样误差有如下特点:1、非抽样误差不是由于抽样的随机性带来的,所以在抽样调查中,它不能够随着样本量的增大而减小;2、在抽样调查中,由于非抽样误差的影响,往往呵斥估计量的有偏;3、有些非抽样误差难以识别和测定。如抽样框是不完善的,而调查设计人员并没有认识到;4、有些非抽样误差成因复杂,对其研讨不够,因此,在很多时候非抽样误差比抽样误差呵斥的影响更严重,对此必需引起高度注重。.根据非抽样误差的

2、来源、性质可分为以下三类: 1抽样框误差,即由不完善的抽样框引起的 误差; 2无回答误差,即由于种种缘由没有从被调 查单元获得调查结果,呵斥调查数据的缺失; 3计量误差,即所获得的调查数据与其真值之间不一致呵斥的误差。.一、概念抽样调查中的总体有两个: 目的总体调查研讨对象的全体。 抽样总体从中抽取样本的总体。 即抽样框 理想抽样框的标志是目的总体和抽样总体完全重合。否那么抽样框就是不完善的。11.2 抽样框误差.二、抽样框误差的类型及影响1 抽样框误差的类型 丧失目的总体单元。 包含非目的总体单元。 抽样框中的单元与目的总体单元不一一对 应。存在一对多或多对一的情况 不正确的辅助信息。如分层

3、抽样、不等 概抽样、比率估计和回归估计等所需的辅助 信息.2对抽样框误差的根本认识 有些误差来自构成抽样框资料本身,而不 是由于抽样设计的问题。 抽样框存在的问题,有些是不容易处理的。因此抽样框的维护、抽样框运用情况的不断总结与研讨,对于经常性的调查工程来说是非常必要的。 抽样框的不完善并不是不能运用。可以进展修补、调整。. 3抽样框误差的影响 设目的总体单元:N 抽样框中单元:N1 抽样框中丧失的单元:N0 N=N1+N0 总体总量的估计 总体总量的真值是: 现从抽样框中的N1个单元中采用简单随机抽样抽出容量为n的一个样本,由于n取自于N1对总体总量的估计为:.显然此时的估计是有偏的,偏倚为

4、:这阐明估计量低估了总体总量,令Y的相对偏倚可以写为. 由上式可知,总体总和的相对偏倚取决于 和 总体均值的估计在抽样框存在丧失单元情况下,均值估计量为:此时估计量的偏倚为:的相对偏倚可以写为:. 由上式可以看出,假设丧失单元的均值与抽样单元的均值一样,即 ,那么估计量 是目的变量 的无偏估计。 反之,假设 ,偏倚情况那么随着 的变化而变化。.三、不完善抽样框的运用 抽样框不完善并不是不能运用,由于构造一个完善的抽样框有时是非常困难的。运用不完善抽样框时假设能采用一些补救措施,有助于减小抽样框误差。主要采用以下三项补救措施: 利用核对,掌握误差情况,对不完善抽样框 进展调整; 事先制定一些规那

5、么,对发现的抽样框问题进 行现场处置; 运用多个抽样框进展抽样。.11.3 无回答误差一、概念 无回答误差是指在调查中由于各种缘由,调查人员没可以从入选样本的单元处获得所需求的信息,由于数据缺失呵斥估计量的偏向。 无回答误差是一种重要的非抽样误差,这种景象非常普遍,对估计量的危害也比较大,所以国际上对这方面的讨论不断比较热烈,目前这种讨论还在继续。.从无回答的内容来看可分为: 单元无回答 被调查单元没有参入或回绝受调查,他们交的是一份白卷 工程无回答 被调查单元虽然接受了调查,但对其中的一些工程没有回答.从无回答的性质来看可分为: 有意无回答 有意无回答经常与调查内容有关,如对调查内容反感,或

6、涉及个人隐私不情愿回答 无意无回答 无意无回答经常与调查内容无关,之所以无回答是由于被调查者生病或很忙,无法接受调查. 有意无回答对数据质量的影响很大,回答者和不回答者之间往往存在系统性差别。这种不回答不仅减少了有效样本量,呵斥估计量方差增大,而且会带来估计偏倚。 无意无回答可以看成是随机的,这种不回答虽然会呵斥估计量方差增大,但通常以为不会带来估计偏倚。 . 二、无回答产生的缘由及影响 假设把采集数据的过程划分为查找、接触和采访三个阶段,三个阶段都有能够出现无回答。1、查找阶段 调查人员无法找到被调查者,主要缘由有地址不详、被调查者搬迁、调查人员不熟习地址;2、接触阶段 被调查生病、对调查不

7、感兴趣或别的缘由拒访;3、采访阶段 调查开场后被调查者对某些问题不愿提供答案、调查员由于大意脱漏某些工程等.无回答的影响: 回答层N1 总体N 无回答层N0那么总体均值为: 回答层样本(n1 ) 总体样本n 无回答层样本(n0 ).根据回答层单元计算出的样本均值为用 作为总体真值 得估计量,其偏倚为:偏倚相对偏倚 由上式可以看出:无回答偏倚主要来自两个方面:一个是回答层与无回答层之间的数量差别 ;一个是无回答率 。.三、降低无回答的措施主要措施是预防,预防措施有:问卷设计得具有吸引力;留意适当的长度;充分利用调查组织单位的权威性和影响力;留意调查员的挑选;做好调查员的培训;留意调查过程的监控;

8、奖励措施;再次调查。.四、对存在无回答数据的调整 调查中无回答的情况总是难以防止,由于无回答呵斥数据不全,假设不加处置,就有能够呵斥估计量偏倚。下面引见几种数据调整的方法: 1、再抽样调整 在第一次无回答的单元中随机抽取一个子样本,经过更细致、更充分的任务,获得该子样本的数据,作为整个无回答层的代表值。 . 2、加权调整 对存在无回答数据进展补救的另一种方法是采用加权调整。加权调整法是经过对调查中所获得的回答数据运用加权因子,到达对数据的调整,减小由于无回答呵斥的估计偏倚。 3、相关推估法 相关推估法主要用于调查中的工程无回答,即调查单元不是完全回绝调查,而是回绝其中某些工程的调查。这时可以利

9、用回答工程的信息对无回答数据进展推估。.4、插补调整 在数据整理阶段,利用调查结果,采用一定的方式,为无回答的缺失值确定一个合理的估计值,插补到原缺失数据的位置上。 实践运用时,用得较多的是均值插补,其方法是:首先根据辅助信息将样本分为假设干组,是组内各单元的主要特征类似。然后分别计算各组目的变量Y的均值,将各组均值作为组内一切缺失项的替补值.11.4 计量误差 计量误差是指由于种种缘由,调查中所获得的数据与真值不一致。计量误差主要成因来自于以下几个方面: 设计误差设计方面缘由呵斥计量误差 被调查者误差被调查者提供的数据失真 调查者误差现场调查人员呵斥的误差 其他误差由于丈量工具、编码、录入.

10、减少计量误差的措施 减少计量误差需求对调查全过程进展质量监控: 1调查设计方面 调查询卷设计出来后,应组织有关人员对问卷进展讨论。假设是大型调查活动,还要在正式调查之前进展预调查,在实际中对问卷进展检验。 2现场预备方面 在搜集数据之前,需求做好预备任务:招聘调查员;培训访问员;编写调查手册。. 3调查结果审核方面 审核是对调查质量进展控制的一道重要的工序,也是减少计量误差的有效方法。审核的目的是要保证调查所得数据的完好性、一致性和有效性。 审核可以在调查过程中的任何阶段进展: 收据数据时进展审核 调查员在调查进展过程中根据常识和阅历,可以判别出一些问题的答案能否属于“可接受范围 数据搜集终了

11、后的审核 审核的重点是数据的一致性审核和离群值的检测.11.5 离群值的检测和处置一、离群值的概念 离群值是指调查数据集中的极端值,是指与其他数据明显不一致的观测值。离群值 的出现能够有以下两个缘由: 由于数据本身具有的差别性。看起来值得疑心的东西也许是真实的; 由于被调查者回答数据有错误或调查人员记录数据有错误。.二、离群值确实认 通常离群值的检测是经过丈量它们与数据中心的相对间隔来识别的。 例如,假设 是要观测的样本数据,m 和 s 分别是侧度数据集中趋势和离散趋势的目的,那么, 离数据中心的相对间隔可以定义为 . 假设 越过了预先确定的偏离值,那么该观测值就被以为是离群的。 另外,离群值

12、也可以经过下面的置信区间进展确认:式中 和 分别为根据预先确定的置信度得到的规范正态分布的上限和下限值。落在这个区间之外的观测值被以为是离群值。 .三、离群值的处置 假设在调查进展中发现离群值,就要及时处置,例如进展回访核实,对错误进展更正。 假设在调查终了后的审核中发现离群值,通常对离群值采用插补处置,即将离群值剔除,然后运用插补法调整。 假设在审核时没有进展处置的离群值可以在估计的时候处置。估计时有以下三种方法处置离群值:. 改动数值 这种方法首先要将样本数据按从大到小依次排序,然后再按下面的步骤计算: 在简单随机抽样中,总体总量 Y 的无偏估计公式为: 式中,i表示样本中第i个单元,s为一切样本的集合. 假设样本数据中第k个最大值kth被以为是离群值,单侧k次缩尾估计量就可以经过第n-k个最大值yn-k替代这些离群值,即调整权重 处置离群值的另

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论