抽样方法与样本含量的确定.doc_第1页
抽样方法与样本含量的确定.doc_第2页
抽样方法与样本含量的确定.doc_第3页
抽样方法与样本含量的确定.doc_第4页
抽样方法与样本含量的确定.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样方法与样本含量的确定在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、确定或构置抽样框、选择抽样技术、确定样本量的大小、制定实施细节并实施。这里我们着重介绍一下定量研究的抽样方法和样本量这两个技术环节。最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。一、非概率抽样非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。偶遇抽样(方便抽样)常见的未经许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的(包括经费和时间)。抽样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点,这种形式的抽样还是有严重的局限性。许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此,当我们在进行街头访问或邮寄调查时,一定要谨慎对待调查结果。判断抽样判断抽样是基于调研者对总体的了解和经验,从总体中抽选有代表性的典型的单位作为样本,例如从全体企业中抽选若干先进的、居中的、落后的企业作为样本,来考察全体企业的经营状况。如果判断准,这种方法有可能取得具有较好代表性的样本,但这种方法受主观因素影响较大。配额抽样配额抽样是根据总体的结构特征来给调查员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了。唯一的要求就是所选的元素要适合所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。另外,用这种方法进行选择时,往往存在调查员的选择偏好,因而也难以避免主观因素的影响。如果在严格控制调查员和调查过程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时,要特别注意配额与调查结果之间的密切联系。雪球抽样雪球抽样是先选择一组调查对象,通常是随机地选取的。访问这些调查对象之后,再请他们提供另外一些属于所研究的目标总体的调查对象,根据所提供的线索,选择此后的调查对象。这一过程会继续下去,形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。由于后来被推荐的人可能类似于推荐他们的那些人,因此这种方式的调查也是非概率的。二、概率抽样概率抽样包括简单随机抽样,分层抽样,等距抽样,整群抽样等,每个样本的中选概率是已知的,因此可以计算抽样误差。通常的实地调查中,是把这几种抽样方法相互结合。简单随机抽样总体中的每一个元素都有一个相等的被抽中概率。简单随机抽样可以通过抽签法和随机数字表方法来实现。先确定或搜集一个抽样框,将抽样框中的每个元素都编上号。然后把所有抽签抽中的号码的元素或随机数字对应的号码的元素做为样本进行调查。等距抽样(系统抽样)按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取(如等距原则),这种抽样方法称为系统抽样。其中最常用最简单的系统抽样叫等距抽样。分层抽样分层抽样的特点是先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取元素。其原则是子总体内元素间差异可能小,而不同子总体间差异大。整群抽样整群抽样首先将总体划成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查。多级抽样也叫多阶段抽样。它是在第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查。它与分层抽样的区别在于第一层是抽取部分,与整群抽样的区别在于第二阶段是抽取部分。这在实际实施中是最为常见的一种抽样方式。同时它的抽样精度比整群抽样高,操作性更强。什么时候用概率抽样,什么时候用非概率抽样,应当根据各种条件来决定,例如研究的性质、对误差容忍的程度、抽样误差与非抽样误差的相对大小、总体中的变差、以及统计上的操作上的考虑等。尽管非概率抽样不能推断总体,不能计算抽样误差,但在实际调查中仍常被应用。一方面是操作的考虑,减少非抽样误差的发生,另一方面也是因为所调查内容不需投射总体,而且一般总体的同质性较强。如概念测试、包装测试、名称测试以及广告测试等,这类研究中,主要的兴趣集中在样本给出各种不同应答的比例。概率抽样用于需要对总体给出很准确的估计的情况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究(提供有关产品分类和品牌使用率等信息的研究),以及用户的心理特征和人口分布的研究等,都采取概率抽样。但在概率抽样时要特别注意控制调查过程中的非抽样误差。如何确定样本量在抽样设计中,还要考虑样本含量,即观察单位数的多少问题。因为样本含量过少,所得指标不够稳定,用于推断总体的精确度差;样本含量过多,不但造成不必要的浪费,也给调查的质量控制带来更多的困难。因此,估计样本含量,目的是在保证一定精确度的前提下,确定最少的观察单位数。抽样方法不同,估计样本含量的方法各异,用单纯随机抽样估计总体参数时(率)时,样本n的估计方法。为此要:1)确定容许误差 2)确定标准误差的置信水平U3)了解调查总体的率U2(1-)n=2举例:估计过去一个月内,市民上网的比例。首先要估计此次调查可接受的抽样误差范围,即的值。假设此次可接受的误差范围为4%,那么=0.04假设研究人员要求抽样在总体比例的4%范围内的置信度为95%,则U=1.96在一年前的一次类似调查中,有20%的调查者在一个月内上过网,我们可以用0.20作为值带入公式。U2(1-) 1.9620.20(1-0.20)因此:n= = =3842 0.042研究人员如果缺乏估计的依据,可以对值做最悲观或最糟糕的假设。当=0.5时,(1-)有极大值0.25存在,如此避免n值过小。这是无限总体的样本含量估计方法。,在有限总体中,须用公式作进一步校正。根据经验,但样本容量超过总体的5%时,就需要调整样本容量了。N nNc= 1+(n-1)/N 1+n/N在市场调查的实际抽样中,所代表的城市人口都很大,所以样本含量和所要调查的城市人口多少关系不大,这也是为什么在调查大小不同城市时,每个城市的样本含量一样的原因。在确定样本含量、置信水平下的抽样范围误差估计在实际的工作中,我们常会根据客户的要求或预算来确定样本含量,这时常常想知道,在这样的样本量和确定的置信水平下,估计抽样误差的范围是多少。同理:U2(1-)n=2如此:U2(1-)2=n要求置信度水平为90%时,则U=1;要求置信度水平为95%时,则U=1.96;要求置信度水平为99%时,则U=2.58不同样本含量、置信水平下的抽样范围误差估计表样本量误差90的置信水平95的置信水平99的置信水平1005.00%9.80%12.90%2003.54%6.93%9.12%3002.89%5.66%7.45%4002.50%4.90%6.45%5002.24%4.38%5.77%6002.04%4.00%5.27%7001.89%3.70%4.88%8001.77%3.46%4.56%9001.67%3.27%4.30%10001.58%3.10%4.08%11001.51%2.95%3.89%12001.44%2.83%3.72%13001.39%2.72%3.58%14001.34%2.62%3.45%15001.29%2.53%3.33%16001.25%2.45%3.23%17001.21%2.38%3.13%18001.18%2.31%3.04%19001.15%2.25%2.96%20001.12%2.19%2.88%21001.09%2.14%2.82%22001.07%2.09%2.75%23001.04%2.04%2.69%24001.02%2.00%2.63%25001.00%1.96%2.58%26000.98%1.92%2.53%27000.96%1.89%2.48%28000.94%1.85%2.44%29000.93%1.82%2.40%30000.91%1.79%2.36%31000.90%1.76%2.32%32000.88%1.73%2.28%33000.87%1.71%2.25%34000.86%1.68%2.21%35000.85%1.66%2.18%36000.83%1.63%2.15%37000.82%1.61%2.12%38000.81%1.59%2.09%39000.80%1.57%2.07%40000.79%1.55%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论