第六章 抽样方法.doc_第1页
第六章 抽样方法.doc_第2页
第六章 抽样方法.doc_第3页
第六章 抽样方法.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 抽样方法6.2 非概率抽样非概率抽样是用一种主观的(非随机的)方法从总体中抽选单元。由于不需要完整的抽样框,非概率抽样是一种快速、简单且节省的获得数据的方法。使用非概率抽样的问题是,我们不清楚能否通过样本对总体进行推断,原因是用非概率抽样从总体中抽选单元的方式可能会导致较大的偏差。例如,在非概率抽样中访员经常主观地决定哪些单元入样。由于访员倾向于选择总体中那些最容易接触到和最友好的单元,使总体中很大一部分单元完全没有被抽中的机会,而这些单元与被抽中的单元可能有系统差异。非概率抽样不仅会使调查结果出现偏差,而且由于带有选择平均单元和排除极端值的倾向,将错误地减少总体中明显的变异性。 由于非概率抽样抽取样本有倾向性,我们不可能计算出各个单元的人样概率,从而无法得到可靠的估计值及其抽样误差估计值。此时若能对总体进行推断,必须假定样本对总体有代表性。而这通常需要假定总体指标服从某个模型,或是均匀地或是随机地分布的。由于抽选存在偏差,做这种假定的风险很大。非概率抽样经常被市场研究人员作为一种省钱快速的方法来代替概率抽样。但是由于有上述问题,它并不是概率抽样的一种有效的替代方法。那么,为什么还要费神来讨论非概率抽样呢?这是因为非概率抽样能用在下面几个方面的研究中:- 用来形成一种想法;- 作为设计开发概率抽样调查的初始步骤;- 在后续步骤中帮助理解概率抽样调查结果。比如,非概率抽样能在调查的早期就提供非常有价值的信息。它也可用在探索性或诊断性研究中,以了解人们的态度、信仰、动机和行为,或分析概率抽样调查的结果。有时,非概率抽样是唯一可行的选择?例如,在医学实验中,采用志愿者抽样可能是取得数据的唯一途径。 非概率抽样常被用于抽选参加焦点座谈和深人访问的个人。在加拿大统计局,非概率抽样被用来测试在人口普查调查表中所使用的问题,以确保所问的问题和使用的概念对被调查者是清楚的。如果认为问题的内容会引起争议,则在最有可能有争议的地方抽选一个子总体。如果能通过焦点座谈使问题能被这些人接受,则它们就会在任何地方都能被接受。 非概率抽样的优点是:- 快速简便。一般而言,非概率样本能被很快抽出并进行调查:到外面去,向在街上遇到的前一百个人问问题,这很容易做到; - 费用相对较低。非概率样本的地理分布一般不广,因此,访员的旅费较低;- 不需要任何抽样框;- 非概率抽样对探索性研究和调查的设计开发很有用。非概率抽样的缺点是:- 对总体进行推断,需要对样本的代表性做很强的假定。做这样的假定通常有很大的风险。如果要对总体进行推断,必须使用概率抽样;- 由于不可能确定总体单元的人样概率,故不可能得到可靠的估计值以及抽样误差估计值。下面几小节将介绍五种不同的非概率抽样方法:随意抽样,志愿者抽样,判断抽样,配额抽样,及修正的概率抽样。6.2.1 随意抽样单元的抽选以无目的、随意的方式进行,几乎没有或完全没有计划。随意抽样假定总体是同质的:如果总体单元都相似,那么可以抽选任何单元人样。随意抽样的一个例子是“街道拦截,访问法,访员抽选一个碰巧路过的人进行调查。不幸的是,除非总体真是同质的,否则抽样将受访员的倾向性和谁在抽样的时候碰巧路过的影响。6.2.2志愿者抽样被调查者从志愿者中抽取。一般来说,这种方法会产生较大的抽选偏差,但有时采用这种方法是必要的。例如,出于道德上的考虑,我们可能不得不请求具有特殊病情的人自愿参加某项医疗实验。志愿者抽样的另一个例子是打电话参与广播或电视节目的人:当讨论某一个问题时,主持人邀请听众或观众打电话发表他们的意见。只有那些关心所讨论的主题,且有这样或那样观点的人,才会响应,大多数人不会响应,这样就会导致较大的抽选偏差。志愿者抽样有时用来抽选参加焦点座谈或深人访问的人。6.2.3判断抽样抽样以过去对总体构成与行为的了解为基础,由对总体有很好了解的专家决定总体中哪些单元应该人样。换句话说,由专家有目的地挑选他认为“有代表性”的样本。判断抽样存在研究者个人倾向的偏差,这可能比随意抽样的偏差还要大。由于研究者的主观想象反映到了样本中,如果这种主观想象不准确的话,就会产生攀大的偏差。不过,这种方法在探索性研究,如抽选参加焦点座谈或深人访谈的人员(例如检验问卷的某个特定方面)时也是很有用的。但是这种方法不适用于试调查。6.2.4配额抽样这是最常见的一种非概率抽样。抽样是要从各个子总体中选取特定数量的单元(配额)。由于对如何完成这些配额并没有规定,故配额抽样本质上是一种满足每个特定子总体样本量的一种手段。 配额可以每个子总体在总体中的比例为基础。例如,如果一个总体有100名男性和100名女性,且我们打算抽一个2p人的样本,那么我们可以决定访问10名男性和10名女性。配额抽样可能比其他非概率抽样方法(例如判断抽样)稍好一些,因为它强制性地要求样本包含不同子总体的单元。 从相似的单元都被分到同一组这一点来说,配额抽样与分层抽样有点相似,它们的区别在于单元的抽选方式。在概率抽样中,单元是随机抽选的;而在配额抽样中,是由访员决定谁人样,这会导致抽选偏差。但是,配额抽样由于费用相对较低、易于实施并有能满足总体比例要求等特点,故市场研究人员常用它来代替分层抽样(特别在电话调查中),但同时它也掩盖了潜在的且显著的偏差。和其他所有非概率抽样方法一样,为了能对总体进行推断,我们需要假定被选中的人和没有被选中的人具有相似性,这样强的假定很难成立。6.2.5修正的概率抽样修正的概率抽样是概率抽样与非概率抽样的结合。在抽样的前几个阶段通常都以概率抽样为基础,而最后一个阶段使用非概率抽样,常用的是配额抽样。例如,可以用概率抽样抽地理区域,然后在每一个区域内进行配额抽样。第二节 非概率抽样一、非概率抽样及其优缺点(一)非概率抽样的涵义非概率抽样并没有严格的定义,它也有许多不同的抽样方法,它们的一个共同的特点是用一种主观的(非随机的)方法从总体中抽选单元。由于不需要完整的抽样框,非概率抽样是一种快速、简单且节省费用来获取数据的方法。使用非概率抽样的问题是,我们不清楚能否通过样本对总体进行推断,原因是用非概率抽样从总体中抽选单元的方式可能会导致较大的偏差。例如,在非概率抽样中调查人员经常主观地决定哪些单元入样。由于调查人员往往倾向于选择总体中那些最容易接触到和最友好的单元,使总体中很大一部分单元完全没有被抽中的机会,而这些单元与被抽中的单元之间可能有系统差异。非概率抽样不仅会使调查结果出现偏差;另一方面调查人员也可能有意选择具有平均特征的那些单元,从而有排除极端值的倾向,这将减少总体中明显的变异性。相反,概率抽样能通过随机抽选单元而避免这种偏差。 由于非概率抽样抽取样本有倾向性与偏差,而且没有抽样框,我们不可能计算出各个单元的入样概率,从而无法得到可靠的估计值及其抽样误差的估计值。此时若能对总体进行推断,必须假定样本对总体有代表性。而这通常需要假定总体指标服从某个模型,或是均匀地或是随机地分布的。由于抽选存在偏差,做这种假定风险很大。 非概率抽样经常被市场研究人员作为一种省钱、快速的方法来代替概率抽样。但是由于有上述问题,它并不是概率抽样的一种有效的替代方法。那么,为什么还要费神来讨论非概率抽样呢?这是因为非概率抽样除了简单易行外,还可以用于下面几个方面的研究:用来形成一种想法;作为设计开发概率抽样调查的初始步骤;在后续步骤中帮助理解概率抽样调查结果。 比如,非概率抽样能在调查的早期就提供非常有价值的信息。它也可用在探索性或诊断性研究中,以了解人们的态度、信仰、动机或行为,或分析概率抽样调查的结果。有时,非概率抽样是唯一可行的选择。例如,在医学实验中,采用志愿者样本可能是取得数据的唯一途径。 非概率抽样常被用于抽选一些人来参加焦点座谈和深入访问。在加拿大统计局,非概率抽样被用来测试在人口普查调查表中所使用的问题,以确保所问的问题和使用的概念对被调查者是清楚的。如果认为问题的内容会引起争议,则在最有可能有争议的地方抽选一些人来试点。如果通过焦点座谈证明问题能被这些人接受,则它们在其他地方也能被接受。 另一个能较好发挥非概率抽样作用的例子是预研究。如果正在设计一项新的调查,对调查领域又所知甚少,则试调查时常采用非概率抽样。例如,我们想对一个相对较新的IT行业的从业人员进行一项调查,假定开始我们对有多少人在这个行业工作,他们的工作时间、收入状况及其他情况一无所知,也没有现成的抽样框,我们就只能先作一个试调查,初步设计一个问卷放在网上,通过问卷反馈回来的信息,就可以根据这些人的特点再来正式设计这项调查。 (二)非概率抽样的优点1快速简便。一般而言,非概率样本不需要有完备的抽样框等先决条件,因此能被很快抽出并进行调查。例如,要进行一项市场调查,可以在商店门口或大街上,拦截一些顾客进行调查,这就很容易做到。2费用相对较低。由于非概率样本不受地域的限制,可以使样本比较集中,这样就可以减少调查人员的差旅费,而且时间也可以节省。3不需要任何抽样框。抽样调查中要取得一个完备的抽样框往往是很费时费力的,而非概率抽样就不需要任何抽样框。4非概率抽样对探索性研究和调查的设计开发很有用。(三)非概率抽样的缺点1为了对总体进行推断,需要对样本的代表性做很强的假定。由于所有非概率抽样的样本抽选都存在某种倾向性或偏差,做这样的假定通常有很大的风险。如果要对总体进行推断,必须使用概率抽样。2由于不可能确定总体单元的入样概率,故不可能得到可靠的估计值以及抽样误差的估计值。二、非概率抽样的各种方法 (一)随意抽样随机抽样又称任意抽样,样本单元的抽选以无目的、随意的方式进行,几乎没有或完全没有计划。随意抽样假定总体是同质的,如果总体各单元都相似,那么可以抽选任何单元入样。 随意抽样的例子是“街道拦截”访问法,调查人员可以在街道上抽选一个碰巧路过的人进行调查。不幸的是,除非总体真是同质的,否则抽样将受到调查人员的倾向性和在抽样的时候谁碰巧路过的影响。有时这种方法也是可行的。比如,要调查图书馆读者的情况,可以在图书馆的门口拦截一些读者作为样本进行调查。这种调查的特点是比较方便的,有时也能取得一定的效果。(二)志愿者抽样使用这种方法时,被调查者都是志愿者。一般说来,这种方法会产生较大的抽选偏差,这是因为志愿者调查对象和非志愿者对象之间往往是有差别的。应对志愿人员进行筛选以得到符合调查目标的对象,但这样仍难免有选择产生的偏差。然而有时采用这种方法是必要的。例如,出于道德上的考虑、我们不得不请求具有特殊病情的人自愿参加某项医疗实验。志愿者抽样的另一个例子是打电话给参与广播或电视节目的人:当讨论某一问题时,主持人邀请听众或观众打电话发表他们的意见。只有那些关心所讨论的主题,且有这样或那样观点的人才会响应,大多数人不会响应,这样就会导致较大的抽选偏差。志愿者抽样有时也用来参加焦点座谈或深入访问的人。(三)判断抽样采用这种方法时,抽样以过去对总体构成与行为的了解为基础,由对总体有很好了解的专家决定总体中哪些单元应该入样。换句话说,由专家有目的地挑选他们认为“有代表性”的样本。判断抽样存在研究者个人倾向的偏差,这种抽样很大程度上依赖于调查者的主观判断能力。如果判断准确,它由于组织方便、费用节约,可以取得较好的效果,但是如果判断错误,这可能比随意抽样的偏差还要大。由于研究者的主观想象反映到了样本中,如果这种主观想象有偏差的话,很自然地会随之产生偏差。另外这种抽样很容易低估总体的差异性。有人作过试验,将一堆大小不同的石块,要求挑出若干石块使其平均重量能代表总体石头的平均重量,其结果总是低估总体的差异性,这是由于人们总是想挑选中等大小石头的结果。不过,这种方法在探索性研究,如抽选参加焦点座谈或深入访谈的人员(例如检验问卷的某个特定方面)时也是很有用的。但是这种方法不适用于试调查。(四)配额抽样这是最常见的一种非概率抽样,抽样是要从各个子总体中选取特定数量的样本单元,这种特定数量的比例关系就称作配额。故配额抽样本质上是一种满足每个特定子总体样本量的一种手段。 配额可以按每个子总体在总体中的比例为基础。例如,如果一个总体有l00名男性和100名女性,现在我们打算抽取一个20人的样本,那么我们可以决定访问10名男性和10名女性。配额抽样可能比其他非概率抽样方法稍好一些,因为它强制性地要求样本包含不同子总体的单元。从相似的单元都被分到同一组这一点来说,配额抽样与概率抽样的分层抽样有点相似,它们的区别在于单元的抽选方式。在概率抽样中,单元是随机抽选的;而在配额抽样中,是由调查人员决定哪些单元入样,这会导致抽选的偏差。但是配额抽样由于费用相对较低、易于实施并有能满足总体比例要求等特点,故市场研究人员常用它来代替分层抽样(特别在电话调查中),但同时它也掩盖了潜在的且显著的偏差。 和其他所有非概率抽样方法一样,为了能对总体进行推断,我们需要假定被选中的人和没有选中的人具有相似性,这样强的假定仍很难成立。 (五)滚雪球抽样如果我们想找到在总体中某种较为稀少的个体,而且我们已经知道其中某些个体并有可能与其接触,那么就有可能通过询问这些个体,获得与他们类似的个体。这样所得的样本就像一个从小山上滚下来的雪球那样逐渐增大。滚雪球

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论