




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电话调查中如何进行抽样设计 执行天地 本文章被浏览257次 摘自Marketing Researcher-市场研究者论坛(这是一片比较老的文献,但仍然有价值。听镰刀说CNNIC现在还是委托传媒大学调查统计研究所进行这样的电话调查。文中那四个表没办法弄出来,凑乎看吧。)摘要:通过电话调查来收集数据在市场研究、学术研究中的应用越来越普遍,那么,在电话调查中如何抽取一个有代表性的本呢?本文以中国互联网信息中心第七次全国网民调查的抽样调查方案为例,介绍了电话调查的抽样设计问题。关键词:抽样设计;电话调查;互联网;电脑辅助电话调查(CATI)引言在社会经济和民意的调查研究中,常常要求所获得的样本对目标总体具有代表性,即要采取概率抽样的方法,如收视率调查、居民的家计调查等等。在前些年,为了获得有代表性的样本,经常采取入户面访方式来收集数据。随着我国社会经济的快速发展,安装住宅电话的成本在下降,居民住宅电话的普及率迅速提高;另一方面,经济的快速发展和社会的变迁,使得人际间的信任度越来越低,个人隐私的观念逐渐加强,传统的入户面访实施起来越来越困难。基于上述原因,近两年来,通过拨打居民的住宅电话进行访问越来越多了,电话访问将成为未来的发展潮流。电话访问的盛行使得电话调查的抽样问题引起关注,本文将以中国互联网络信息中心(以下简称CNNIC)第七次调查为例,来介绍电话调查的抽样问题。受国家信息产业部的委托,CNNIC从1997年开始进行中国互联网络发展状况的调查统计工作。其中一个很重要的内容就是了解我国上网人群的数量、分布和基本特征。在2000年底实施第七次调查中,CNNIC委托北京广播学院调查统计研究所来设计抽样方案。调查研究的目标总体界定为“全国所有六岁以上的居民”,为了访问实施的方便,把目标总体进一步分为三个子总体:总体A“拥有住宅电话的六岁以上的居民(不包括住校的高等院校学生)”、总体B“住校的高等院校的学生”以及总体C“没有住宅电话的六岁以上的居民(不包括住校的高等院校学生)”。考虑到上网在我国还是一个新生事物,是一种对文化程度和经济条件都有一定要求的行为,首先是在文化程度较高、家庭经济情况较好的人群中开始流行的,这部分人群绝大多数是拥有住宅电话的;另外,大学生也是上网的先行者,上网的比例非常高;由于经费和时间的限制,选定的抽样总体为总体A和总体B,而忽略了总体C(不可否认,在总体C中也有人是上网的,但人数可能很少,对最终结果的影响不会很大,从效率原则和可操作原则来考虑,忽略了总体C)。对于总体B,采用面访调查的方式收集数据(具体的抽样方法本文没有涉及,可参见参考文献2)。对于总体A则采用计算机辅助的电话调查(CATI)方式进行访问,抽样思路是先按照按省来分层,在每个省内,利用PPS法抽取地区(包括地级市和地区行署,每个地区下都包含城镇和乡村),抽样指标为住宅电话数目;然后在抽中的地区中抽取住宅电话号码,最后在抽中的住宅电话号码的家庭中抽取一人来接受访问。对于网民总量的估计,结合了电话调查和面访调查的结果进行了事后的加权处理。1 住宅电话号码的抽取常见的住宅电话号码的抽取方式有三种方式。每种方式的限制条件不同,各有利弊。1.1 利用电话号码本抽样电话号码本抽样(sampling telephone directory)是获得合适的、包括完整的住宅电话名录作为抽样框,从而采用随机抽样或系统抽样的方式获得住宅电话号码。利用电话号码本抽样,不会发生所拨号码为空号、或所打电话为非住宅电话的情形。要注意的是,在我国,住宅电话的普及率正处于增加比较快的阶段,所以,如果利用电话号码本进行抽样的话,要及时更新作为抽样框的电话号码目录。但值得注意的是,公开发行的住宅电话号码簿是有遗漏,即不是所有的住宅电话号码都登记在住宅电话号码簿上,当这种情况过多的时候,抽取的样本的代表性就会受到影响。有资料表明,在美国,中小城市的住宅电话号码簿上,有10%左右的住宅电话号码没有登录;在大城市,如纽约、芝加哥以及华盛顿等,未将电话号码登录在电话号码簿上的用户,占一半左右。在中国大陆,虽然没有确切的数字来说明公开发行的住宅电话号码簿中刊登的比例是多少,但相信未登的比例会更高。所以,实际中很少采用这种方法。1.2 随机拨号法电话号码是由区号、局号(四位或三位数字)和后四位数字构成的,如北京、上海、广州等中心城市,区号为三位,局号为四位,后四位是局号下数字,北京广播学院调查统计研究所的电话是010(区号)6577(局号)9296(后四位数字);还有一些城市区号是四位,如长春的区号是0431,则城市内电话号码为七位,局号为三位,后四位是局号下数字。就每个地区而言,区号是唯一的、固定的,局号的数目不是很多,大多在几十到几百之间,通过与电信部门联系或查找有关公开资料是可以找到局号的抽样框的。局号下可排列出来的四位数字并不都是电话号码,电信部门在发放电话号码时不会一次把所有电话号码都分配出去,通常考虑到未来的发展,会预留一定的号码的;另外由于所处地理位置的不同,每个局号下的住宅电话的数目也是不同,如商业区局号下办公电话多,住宅电话少;而处于居民区的局号,则是住宅电话多,办公电话少。随机拨号法可以是随机产生七位或八位数字作为电话号码,包括了局号和后四位数字,但由于每个地区的局号是有限的,这种大随机的方法效率很低,实际中很少被采用。通常随机拨号就是利用局号的抽样框资料随机抽取局号,只有后四位的数字随机产生。这种方法是在实践中经常被采用的。1.3 电话号码加一法电话号码加一法(plus one)是电话号码本抽样和随机拨号法抽样的结合,目的是找出没在电话号码簿上登记号码的住宅电话用户。做法是先利用公开的电话号码簿抽取所需的电话号码,然后把这些电话号码的最后一位加1,变成一个新的电话号码,如65779296 加1 变成65779297。用这种方式产生的电话号码同样会存在空号以及是办公电话的情况,但一般说来,空号的机会比直接的随机拨号法要少一些。在CNNIC的抽样中,采用随机拨号法来抽取住宅电话号码。即通过有关部门获得了抽中地区的所有电话局号资料。局号相同,则地理位置可能比较相近,为使样本的代表性更强,每个地区的所有局号都被抽取。平均分配了每个局号下的样本量。利用随机数字表,随机产生四位(或三位)随机数,与区号、局号一起构成号码。这样获得的号码可能是空号(没有这个电话号码)、住宅电话和非住宅电话。如果是住宅电话,则符合要求,进入下一步抽取被访者进行访问。由于每个局号下所包含的电话数目和住宅电话数目都是不同的,所以不同局号下的住宅电话号码被抽中的机会不同,为保证各省的样本近似于自加权样本,理论上此阶段要事后加权,事后加权系数等于每个局号下住宅电话数目占全部有效电话号码数目的比例,但实际上这个数据没有办法得到,只能利用拨打电话时获得的有关记录(如每个局号下有人接听的电话中住宅电话的比例)去估计,但这样做的误差可能很大(因为无法判断无人接听的电话是否住宅电话)。在实际中,把所抽取的住宅电话样本近似地看成了自加权样本。2 受访者的抽选如果所抽取的电话号码为住宅电话,则达到要求,进入了下一步,抽取被访者。一般说来,一个家庭中符合条件的被访对象可能不只一位,那么,应该抽取哪个人作为访问的对象了?如何抽取呢?目前,常见的方法有五种,即是不加选择法、男女轮流选择法、楚德卡特排列法、海根柯林修正法以及最近过生日者法。从样本的代表性以及可操作性来看,每种方法都各有利弊。2.1 不加选择法不加选择法(No-selection Method)就是只要接听电话的人符合调查的要求,那么谁接听电话就访问谁。比如在国外对总统选举的预测调查中,被访对象是选民,年龄在18岁以上,如果接电话者的年龄大于18岁,则访问此人;如果是家中的小孩子接听的电话,请他(她)让家中的大人来接听电话。不加选择法的最大优点就是操作方便。在台湾的民意调查中,经常采用这种方法,并且有关的研究也证明了,用这种方法所抽取的样本在个人特征等方面的构成与总体是一致的。但国外也有研究发现,当电话铃声响起时,女性接听电话的比例通常是男性的两倍,即每打三个电话,有两次是女性接听的。另外,年轻人接听电话的比例也高于老年人。如果是这样的话,样本的代表性就比较差,所抽取的样本不能看成是自加权样本,需要事后进行加权处理。在中国内地,由于电话调查开始的比较晚,有关调查抽样方法的实证研究还比较少,对于居民家庭接听电话的习惯也缺乏了解。如果从操作方便的角度考虑,采用了不加选择法来抽取被访者,那么,为保证样本的代表性,应该根据有关的总体资料,对样本的进行事后加权处理。2.2 男女轮流选择法男女轮流选择法(Male / Female Alternation)是指对每个访问员来说,如果第一个被访者是男性的话,则第二个被访者为女性,然后再是男性,依次类推。男女轮流选择法也可以根据电话号码的尾数是奇数还是偶数来决定是访问男性还是女性。比如如果电话号码的尾数为单数的话,则访问女性,如果电话号码的尾数为偶数的话,则访问男性。有关男女轮流选择法所获样本的代表性如何,还有待于进一步研究证实,也应该对抽中的样本进行事后的加权处理。2.3 楚德卡特排列法楚德卡特排列法(Troldahl & Carter Tables)要求访问员轮流使用以下四个表格来选择受访者。在电话接通以后,访问员要询问第一个接电话的人两个问题,搞清楚家中符合条件(假设为年龄在18岁以上)的人数和男性的人数,然后按照楚德卡特排列表的指示,确定谁是被访者。四张表轮流使用。表一表一 家中十八岁以上人数 1人 2人 3人 4人以上 家中男性人数无 女性 最年长的女性 最年轻的女性 最年轻的女性 1人 男性 男性 男性 最年长的女性 2人 最年长的男性 最年轻的男性 最年轻的男性 3人 最年轻的男性 最年长的男性 4人以上 最年长的男性 表二表二 家中十八岁以上人数 1人 2人 3人 4人以上 家中男性人数无 女性 最年轻的女性 最年轻的女性 最年长的女性 1人 男性 男性 最年长的女性 男性 2人 最年长的男性 女性 最年长的女性 3人 最年轻的男性 最年长的女性 4人以上 最年长的男性 表三表三 家中十八岁以上人数 1人 2人 3人 4人以上 家中男性人数无 女性 最年轻的女性 最年长的女性 最年长的女性 1人 男性 女性 男性 最年轻的女性 2人 最年轻的男性 最年长的男性 最年长的男性 3人 最年长的男性 最年轻的男性 4人以上 最年轻的男性 表四表四 家中十八岁以上人数 1人 2人 3人 4人以上 家中男性人数无 女性 最年长的女性 最年长的女性 最年长的女性 1人 男性 女性 最年轻的女性 男性 2人 最年轻的男性 女性 最年轻的女性 3人 最年长的男性 最年轻的女性 4人以上 最年轻的男性 比如,当访问某一户时,刚好应该使用表三,这一家有四口人,全部符合条件(十八岁以上),其中男性有两人,则参照表三,应该访问这家最年长的男性。楚德卡特排列方法接通电话后,要先询问第一个接听电话的人两个问题,然后访问特定的人,不仅访问时间增长,而且多数时候要换人来接听电话,容易引起被访者反感,而挂断电话,使得访问的成功率偏低。2.4 海根柯林修正法由于楚德卡特排列法操作起来不够简便,很多学者对之提出过修正方法,其中海根(Hagen)与柯林(Collin)所提出的方法较为简单易行。海根柯林修正法是把家中的合格受访者分为四类:最年轻的女性、最年长的女性以及最年轻的男性、最年长的男性。访问时,轮流访问这四种人,不必先问任何问题。海根柯林修正法的优点是可以节省访问的时间。但相关研究发现,按海根柯林修正法所抽出的男性比例偏低,而且无法抽到家中年龄居中的人;另外,受访者可能对“最年长”、“最年轻”的意义感到困惑。还需要进一步地加以解释,使访问时间增加。2.5 下次过生日者下次过生日者法(next-birthday method)就是先询问家中马上要过生日的人是谁,然后请这个人来接听电话。当然,也可以问家中谁刚刚过完生日或“家中谁的生日离访问日期最近?”。有大量的研究表明,下次过生日者法是一种有效的抽样方法,所获得样本代表性比较强。这种方法的缺点是接听电话的人可能不知道家里每个人的生日,或者记忆错误;另外,换人接听电话也容易造成挂断电话的情况发生。总之,每种方法都是有利有弊的。在CNNIC的调查研究中,考虑到电话调查方式在中国是新生事物,人们对此还不熟悉,为了便于访问实施,提高访问成功率,把接听电话的人作为被访对象,询问的问题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 平安银行济宁市邹城市2025秋招笔试英文行测高频题含答案
- 浦发银行温州市苍南县2025秋招笔试创新题型专练及答案
- 课外古代诗词诵读说课稿-2023-2024学年中职语文基础模块 下册高教版
- 观赏园艺考试题及答案
- 古筝招聘考试题目及答案
- 工程考试题库及答案
- 高数专升本考试题及答案
- 腹外疝考试题及答案
- 风力资源考试题目及答案
- 非电气考试题目及答案
- 医院“十五五”发展规划(2026-2030)
- Unit1AnimalFriendsSectionA1a-1d课件-人教版英语七年级下册
- 2025铁路局劳动合同示范文本
- 教育信息化中的数字孪生技术应用案例分析
- T/CSPSTC 15-2018新型智慧楼宇评价指标体系
- T/CCPITCSC 096-2022名表真假鉴定规范
- 美的分权规范手册
- 质量策划培训
- 能源托管协议书范本
- 儿童编发课件
- 膀胱镜检查术后护理常规
评论
0/150
提交评论