敏感性问题调查中有关两总体比较的研究.docx_第1页
敏感性问题调查中有关两总体比较的研究.docx_第2页
敏感性问题调查中有关两总体比较的研究.docx_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

敏感性问题调查中有关两总体比较的研究 摘 要 本文对NNRT中的两个主要模型进行了介绍,并对敏感性问题中有关两个总体比较的方法进行了初步的探索。通过假设检验的方法结合之前有关NNRT中平行模型的结论,进行了基于平行模型的两总体比较,计算出了置信区间和拒绝域。 下载 关键词 敏感性问题调查 非随机化回答技术 三角模型 平行模型 假设检验 中图分类号:O221 文献标识码:A 一、引言 在社会中进行统计调查研究的时候经常会涉及到一些隐私或者不便公开的问题的调查,例如是否有过偷税漏税的行为、是否有过吸毒经历、是否有过受贿行贿行为、是否有过作弊行为等等,我们称这些问题为敏感性问题。对于这些敏感性问题的调查,如果采用直接调查法会让被调查者感到难堪并产生抵触心理,从而不配合调查或者给出与实际不符的错误答案。无法获得真实有效的统计数据,对这些社会问题进行分析研究就无从提起。因此很多学者开展了对于敏感性问题调查方法的研究,并提出了一些有效的调查方法来提高对被调查者的保护性,从而提高统计数据的真实性。 当前对于敏感性问题的调查技术大致有三类:随机化回答技术(Randomized Response Technique-RRT)、非匹配计数技术(UnmatchedCount Technique-UCT)和非随机化回答技术(Non-Randomized ResponseTechnique-NRRT)。其中最著名的当属1965年Warner提出的随机化回答模型,该模型中通过随机化装置保护了被调查者的隐私,后来随机化回答技术中的很多模型都是以此为基础提出改进的。由田国梁等学者于2007年提出的NRRT是一种较新的方法,该方法摆脱了随机化装置,从而可以通过问卷形式获得调查数据,方便快捷。同时该方法具有可重复性,便于对调查过程进行反向检验。对于被调查者而言,这种方法更直观,也能让其心理上获得更高的安全感,促使他们给出最真实的答案。 本文的主要研究内容是基于非随机化回答模型的对于敏感性问题调查中有关两总体比较的研究。以往对于敏感性问题调查的研究大部分是集中于调查方法的设计,以及对于一个总体的研究,很少对两个总体进行比较研究。对于一个敏感性问题,我们有时需要进行多个总体的比较,比如对比两个不同时期有吸毒行为的人群比例,通过比较得出吸毒人群比例的变化从而方便相关部门了解情况制定计划。 二、模型介绍 (一)三角模型。 为了估计对于敏感性问题具有敏感性特征的个体比重 ,在三角模型中引入了两个不相关的问题。一个是敏感性问题Y,比如是否有过吸毒行为,当有过吸毒行为时Y=1,反之Y=0,此时=PY=1。另一个是非敏感性问题W,比如生日是否在1-3月之间,当生日在1-3月之间时W=1,反之W=0。对于非敏感性问题我们要求符合两个假设条件:(1)非敏感性问题与敏感性问题之间彼此独立,(2)对于非敏感性问题具有非敏感性特征的个体比重p已知,即p=PW=1已知。在三角模型中被调查者要求回答以下表格的左部分: 被调查者在回答问卷时,如果既没有敏感性特征,也没有非敏感性特征,比如既没有吸毒行为,生日也不在1-3月之间,则被调查者选择“”,反之选择“.”。当被调查者选择“”时,表明他不具有敏感性特征。相对的,即使他选择了“.”,由于“.”代表了三种情况,因而也无法以此判断被调查者是否具有敏感性特征,从而达到了保护隐私的作用,促使他们给出真实答案。 在表1中的右部分给出了发生每种情况所对应的概率,据此通过概率论与数理统计的知识就可以得到对于敏感性问题具有敏感性特征的个体比重。设表示所有被调查者选择“.”的概率,则的无偏估计量=nN,其中N表示所有被调查者总体数,n表示其中选择“.”的个体数,显然, (二)平行模型。 在三角模型中,对于敏感性问题Y,当Y取0或1不同的两个值时,对于被调查者而言具有不同的敏感性。比如当Y=0时表明无吸毒行为,即无敏感性特征,反之当Y=1时表明有过吸毒行为,即有敏感性特征。然而,在某些敏感性问题调查中,当Y取0或1不同的两个值时,对于被调查者而言均为敏感性的,差异仅在于敏感度的大小,比如当Y=0时表明有过0到1次吸毒行为,Y=1时表示有过1次以上吸毒行为。显然,对于被调查者而言,敏感性问题Y的两个不同的答案均具有一定的敏感性,为了保护他们的隐私,田国梁于2011年针对这种情况提出了平行模型。 平行模型在三角模型的基础上又加入了另外一个非敏感性问题U,对于这个问题要求满足与三角模型中一样的两个假设,即:(1)该非敏感性问题与另外两个问题之间彼此独立,(2)对于该非敏感性问题具有非敏感性特征的个体比重q已知,即q=PU=1已知。在平行模型中被调查者要求回答以下表格的左部分: 调查者根据自己的实际情况来选择“”或者“.”,这两种不同的选择都分别包含两种情况,“”所代表的两种情况均为非敏感性特征,“.”所代表的两种情况既包含了敏感性特征也包含了非敏感型特征,所以同样对被调查者起到了保护隐私的作用。对于表2中标记的这四种情况,必有一种是符合被调查者情况的,且每种情况所对应的概率如表二右部分所示,显然, 三、基于平行模型的两总体假设检验 在此将进行基于平行模型的两总体假设检验,检验两总体中具有较高敏感性特征的个体比重是否相等。 四、小结 本文对NNRT中的两个主要模型进行了介绍,并对敏感性问题中有关两个总体比较的方法进行了初步探索。通过假设检验的方法结合之前有关NNRT中平行模型的结论,进行了基于平行模型的两总体比较,计算出了置信区间和拒绝域。 (作者:首都经济贸易大学统计学院研究生,研究方向:应用数理统计) 参考文献: Tian, G.L., Yu, J.W., Tang, M.L., and Geng,Z. (2007). A new non-randomized model for analyzing sensitive questions with binaryoutcoL. (2011). A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论