基本抽样问题.ppt_第1页
基本抽样问题.ppt_第2页
基本抽样问题.ppt_第3页
基本抽样问题.ppt_第4页
基本抽样问题.ppt_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第13章 基本抽样问题, 13.1 抽样的概念 13.2 设计抽样方案 13.3 抽样误差和非抽样误差 13.4 概率抽样方法 13.5 非概率抽样,学习目标 1.掌握抽样的概念 2.学习制定抽样计划的步骤 3.明确抽样误差和非抽样误差的概念 4.明确随机样本和非随机样本的区别 5.了解互联网调研涉及的抽样问题,1.抽样的概念,抽样的概念 是指从一个较大的群体(范围或者总体)的一个子集(样本)获得信息的过程。 从总体中抽取部分样本进行调研,用所得的结果说明总体情况。 抽样调研 是指从调研总体中抽选出一部分要素作为样本,对样本进行调研,并根据抽样所得的结果推断总体的一种专门性的调研活动。,1.总

2、体 也称调研总体,是在特定调研目的或任务条件下的认识客体,是指实际进行调研对所使用的所有可能被调研的元素的总和,即所要调研研究对象的全体。总体可分为有限总体和无限总体两种。 有限总体,也称目标总体,是指所需要研究说明的所有符合所规定的属性或数量特征的有限单位的集合,就构成一个有限全集总体。即所要调查具有某种共同性质的所有单位对象的全体组成的总体。 无限总体,即所需要研究说明的所有符合规定的属性或数量特征的无限单位的集合,就构成一个全集总体。,2.抽样和普查 普查:是对调研总体中的所有个体进行的全面、普遍的调研。 事实证明:一个相对较小、但精心选择的样本能准确地反映出所抽查的总体的特征 抽样调查

3、与普查的结果会有一定的差别,这种差别叫做抽样误差,3.抽样的条件 抽样的前提条件 费用低 效率高 精度高 信息量大 破坏性小,抽样和普查适宜性比较 一般而言,如果非抽样误差的成本较大,采用抽样就更合适 如果在深入调研中需要关注个案或调研本身的保密性强,采用抽样也是必要的 但是有时,普查时必要的 对破坏性调研应考虑选择抽样,4.抽样调查的优缺点 优点 节省经费 时效性强 易推广 准确性高,缺点 由于抽样调查的样本仅是调研对象中的一部分,抽样调查的结果是从样本中获取的信息资料推断出来的,所以,抽样调查不可避免地存在着抽样误差。控制抽样误差,将其控制在允许的范围内,使其不影响抽样调查的可信度和质量,

4、是抽样调查应注意的问题。,5.抽样调研的特点 (1)在样本的抽取上具有随机性 (2)在调研的功能上,能以样本指标估计总体指标 (3)在推断手段上,是以概率估计的方法对总体进行估计 (4)在推断效果上,可以对抽样误差进行计算并加以控制,2.设计抽样方案,定义总体,选择资料 收集方法,选择抽样 框,选择抽样方 法,确定样本 容量,制定执行 步骤,实际运行 抽样方案,制定抽样计划,1.定义总体 即要调研对象的全体 同质总体:地域特征、人口统计学特征、产品或服务的使用情况、认知程度等。 过滤性问题,例如,一个调研人员正在为一种新型减肥药进行产品创意测试,他也许会认为同质总体包括每个身体较肥胖的人,因为

5、他们使用减肥药的可能性较大。但并非每个身体肥胖的人都会选择减肥或使用减服药进行减肥,只有那些“准备购买或正在使用减肥药的人们”,才应包括在同质总体内。正如木地板生产企业的调研总体是:“现在正在考虑购买和已经购买使用地板的人们”;电慰斗小组座谈调研案的调研对象是“6个月以来,每周至少使用一次电慰斗的人们”等。,one case,在调研中,问卷开始的过滤性问题,可以识别出哪些应答者是属于同质总体即使有总体清单,仍有必要使用过滤性问题识别合格的应答者。,2.选择资料收集方法 3.选择抽样框 定义:总体的数据目录或者单位的名单,从中可以抽出样本单位。 完整理想的抽样框中,抽样框的范围与被抽样总体一致,

6、每个调研对象只出现一次 例如,以学校班级为抽样单元,则该学校100个班级的名册就是完整的抽样框;“沪深两地股票上市公司”,就是在我国境内上市的公司的完整抽样框。,(1)抽样框的形式 名单抽样框:即以名单一览表形式列出总体的所有单位,常见的有;车牌登记簿、工商局企业登记库、电话号码本、职工名单等。 区域抽样框:即按地理区域划分并排列出总体的所有单位,如一块土地划分为若干地块单位并编号、住户门牌号码表、户籍簿,一片森林划分为若干区域单位并编号等。 时间表抽样框,即按时间顺序排列总体单位,如在流水线生产的产品检验抽样调查中把一天时间划分为许多抽样时间单位并按先后顺序排列。,(2)抽样框的编制 遗漏

7、一个名单里有两个或多个样本单位 空缺 重复登记,4.选择抽样方法 (1)概率抽样:指在总体中的每个单位都具有同等可能被选中的机会(选择程序) (2)非概率抽样:是指从总体中非随机的选择特定的要素,概率抽样优缺点:,调研人员可获得被抽取总体的不同年龄、不同层次的人们的信息 能估计出抽样误差 调研结果可以用来推断总体,优点,概率抽样优缺点:,同样规模的概率抽样的费用要比非概率抽样的费用高 概率抽样比非概率抽样需要更多地时间策划和实施,缺点,需要考虑的因素: (1)如果调研人员需要对调研活动的资料进行各种统计、分析与数据处理,则必须采用随机抽样的方法获得调研样本,以保证调研数据对总体具有足够的代表性

8、。 (2)如果市场调研在方案设计中就明确规定最终必须获得具有一定准确性和把握性的调研结果,那么在确定调研单位时,就应该选择随机抽样的方式。,(3)如果市场调研存在一个近乎理想的抽样框,就可以选择随机抽样的抽样方法。例如,中国工商银行调研储户对银行提供新服务的需求时就可以很方便地获取储户的数据库作为相当完整的抽样框,然后经过编程就可以由计算机完成简单随机抽样。 (4)在调研人员没有掌握随机抽样的程序、原理和原则的情况下,或者由于调研的时效性要求越来越高,调研的频度也越来越大时,研究人员常采用非随机抽样方法。,5.确定样本容量 即确定从调研总体重抽取的样本的数量 样本容量的确定原则是控制在必要的最

9、低限度 从极限抽样误差估算公式推导得出 6.制定执行步骤 7.实际运行抽样方案,1.抽样误差 是指所选样本的结果不能完全代表总体而导致的误差 用样本指标推断总体指标时所产生的代表性误差,不可避免 随机抽样误差:偶然因素(增加样本容量) 管理抽样误差:样本的设计和执行中的变化,3.抽样误差和非抽样误差,2.抽样误差产生的原因 (1)被研究总体各单位标志值的变异程度,总体的方差越大,抽样误差就越大;反之,则抽样误差越小。如果总体各单位标志值之间没有差异,那么,抽样误差也就不存在了。 (2)抽取的样本量,抽样误差的规模可由样本旦的调整而得到控制,在其他条件不变的情况下,抽样单位越多,抽样误差就越小;

10、反之,抽样误差就越大。 (3)抽样调查的组织方式,采用不同的抽样组织方式,也会有不同的抽样误差。 (4)抽样方法的不同,抽样误差大小也不相同。一般来说,简单随机抽样比分层、分群抽样误差大,重复抽样比不重复抽样误差大。,3.抽样误差的控制 准确选定抽样方法 要正确确定样本数目 要加强对抽样调查的组织领导,提高抽样调查工作质量,3.非抽样误差 是在研究过程中由于计算的不准确和偏见等原因产生的不同于抽样误差的各种误差。 原因: 抽样调查设计不当 调研实施不当 被调研者应答不当,概率抽样:又叫随机抽样,就是使总体内所有个体具有相同的被抽入样本的概率,即总体中的每一个个体都给予平等的抽取机会的抽样技术

11、简单随机抽样 等距抽样 分层抽样 整群抽样,4.概率抽样方法,概率抽样的优缺点 优点 (1)排除了人为的干扰,抽取的样本可以大致上代表总体 (2)能够计算调研结果的可靠程度,缺点: (1)对所有调研样本都平等看待,难以体现重点 (2)与非随机抽样技术相比,同样规模的调研,抽样范围比较广,所需时间比较长,参加调研的人员和费用多 (3)需要具有一定专业技术的专业人员进行抽样和资料分析,一般调研人员难以胜任。,1.含义 简单随机抽样,又称纯随机抽样或完全随机抽样,是指从总体单位中不加任何分组、划分类别、排序等任何有目的的选择,而是完全按照随机原则,用纯粹偶然的方法抽取样本 该方法适用于调研总体每个个

12、体之间的差异程度较小或者调研数目不多的情况,简单随机抽样,2.概率抽样公式 例如,如果总体单位数是10000,样本单位数是400,那么抽样概率为4%,计算过程为:400/10000=0.4,3.简单随机抽样的应用 (1)抽签法 用抽签法抽样取样本,需先将调研总体的每个个体编上号码,充分混合后任意从中抽选,抽到一个号码,就对上一个个体,直到抽足预先的样本数目为止。这种方法适用于调研总体中个体数目较少的情况。,(2)随机数表法 随机数表法又称乱数表法。它首先将总体中的全部个体分别标上1至n个号码,然后利用随机数表随机抽取所需样本。随机数表是指含有一系列组别的随机数字的表格。一般用特制的摇码及其在0

13、到9的阿拉伯数字中,按照数字位数的要求自动随机逐个摇出一定数目的号码编成,也可利用Excel软件的rand()函数产生随机数,所以在客观上,随机数表内任何数码出现的机会都是相等的。 例如在EXCEL中输入=TRUNC(RAND()*9+1,0)公式,会生成一系列1-10的整数,使用随机数表法时,首先要把调研总体的所有单 位予以编号根据编号的位数确定使用若干位数字, 然后查乱数表。在乱数表中任意选定一行或一列的 数字作为开始数,接着可以从上而下或从左右或 按一定间隔(隔行或隔列)顺序取数,凡编号范围内 的数字号码即为被抽取的样本。如果不是重复抽样, 碰到重复数字应舍掉,直到抽足预定样本数为止。,

14、例如,现在要从80户居民中抽取10户进行收入调研,首先将80户居民从1到80进行编号,然后假设从随机致表中第一行的第六列开始自左向右、自上而下取样那么顺序取得的样本号:36、96、47、36、61、46、99、69、81、62、97、74、24、67,由于96、99、97大于80,36出现重复,故96、99、97和第二个36应舍弃不用。,4.简单随机抽样的优缺点 优点:方法简单,并且保证每个总体单位在抽选时都有相等的被抽中的机会,当进行总体相对较小的调研是这种方法比较有效 缺点:需要以一个完整的总体单位表为依据,但是爱现实中编制这样一个完整的总体单位表往往是极其困难的。 这一方法要求实现对所有

15、研究对象编码,当研究对象较多时,就非常复杂 与其他随机抽样技术相比,这一方法精度较低,标准差较大 该法抽出的样本是否能代表总体值得商榷,特别是当总体较小时。,1.含义:系统随机抽样 是指先将调研总体的各基本单位按一定标志顺序排列然后根据一定的抽样距离从总体中抽取样本,抽样距离是由母体总数除以样本数而得到的。系统随机抽样经常作为简单随机抽样的替代方法使用。,等距抽样,2.等距抽样的应用 (1)先按一定的标志把总体中各基本单元顺序排列。 排列所依的标志有两种: 一种是按与调研项目无关的标志排队。例如,在进行家庭购买力调研时选择住户可以选择住户所在街区的门牌号码排列。 另一种是按与调研项目有关的标志

16、排列。例如,在进行家庭购买力调研时,也可按住户平均月收入排列再进行抽选。总之,必须获得一份总体单位表,这一点与简单随机抽样方式一样。,(2)确定一个抽样间隔 计算公式为:抽样间隔=总体单位数(N)/样本单位数(n) (3)确定起始抽样数,即抽样起点。可以采用简单抽样方式,从第一段距离中抽取一个个体,也可以从第一段距离的1/2处抽取第一个个体。 (4)按照抽样间隔继续抽取余下的个体,直到达到样本单位数为止。,例如,母体若为10000个消费者,采用等距抽样法抽取200人作为样本进行调研,则样本区间(样本间隔或样本距离)为50,假定从01-50之间随机抽取07,则样本单位的号码依次为07、57、10

17、7、157.。直到抽出200个样本为止。,某地区由零售店150户,采用等距抽样法抽取15户进行调研,试说明抽取样本的基本步骤。 首先,将总体各单位进行编号排列,即从1-150号 其次,确定抽样间隔=150/15=10 最后在第一个10个钟用简单随机抽样的方式抽取第一个个体,假定抽到的是9号,那么后续依次是9、19、29、39.。直到抽满为止。,小练习,3.等距抽样的优缺点 优点:(1)简便易行 (2)能使样本均匀地分布在总体中,不会集中于某些层次,增加了样本的代表性,有利于提高调研的精度。 缺点:(1)如果单元的排列存在周期性的变化而抽样者对此缺乏了解或缺乏处理的经验,抽取出样本的代表性就很差

18、。 (2)系统抽样的方差估计较为复杂,1.含义 分层随机抽样又称分类随机抽样,是把调研总体按其属性分成若干层次(或类型),然后再从各层中随机抽取所需数量的个体单位,综合成一个调查样本。 分层抽样能产生更加精确的样本统计量 相对于简单随机抽样,分层抽样的抽样误差更小 通过分层,可以保证拥有不同特征的组都具有充分的代表性,分层抽样,2.分层抽样的应用 分层抽样关键是找出突出的与所研究的行为相关的标志特征和分类特征,将调研总体按照属性不同分成若干层(组),使各层(组)之间具异质性,但同一层(组)内具有同质性。 例如,调研对象可按年龄、收入、职业、位置等标志划分为不同的层(组),然后按照要求在各个阶层

19、中进行随机抽样。,步骤: 1.找出突出的与所研究的行为相关的标志特征和分类特征,使 各层间具有明显的差异,不致发生混淆。例如,我们要进行 一次新产品的销售调研,要预测销售额,通常要按经济收入 进行分组,因为经济收入高的人群购买新产品的可能性比较 大。 2.按照所选定的特征标志把总体分成若干个相互独立的层(组), 层(组)的不宜太多,同时要掌握各层(组)的个体单位数量或占 总体的比例。 3.从每个层(组)中按一定的方式抽出一定数量的调研样本。,从层(组)中抽出一定数量的调研样本的方式有等比例分层抽样和非等比例的分层抽样两种。 1.等比例分层抽样 它是按各层(组)个的单位数占总体单位数的比例分配备

20、层的样本数量。用公式表示为: ni表示第i层抽取的样本数量,n样本数量,Ni第i层(组)的单位数量,N总体单位数量,2.非等比例分层抽样 它又称为分层最佳抽样法,它是按照各层的变异大小调整抽取各层的样本单位数。它不仅考虑了按各层中单位数占总体的比例,而且考虑了各层的标准差的差异程度。按照各层的变异大小抽取各层的样本单位数量的计算公式为: 其中,通过上述计算可以看出,非比例抽样较比例拙样,各层 (组)应抽取的样本数量发生了如下变化:对样本标准差较大 的层,调多了其应抽取的样本单位数,而对样本标准差较少 的层,则调少了其应抽取的样本单位数。本例中,非比例抽 样较比例抽样,大型书店应抽取的样本数量增

21、加了5家,小 型书店应抽取的样本数旦减少了6家,中型书店样本标准差 在三个层中居于中间,所以应抽取的样本数量变化不大。,3.分层抽样的优缺点 优点:(1)分层抽样比简单随机抽样和等距抽样等方法更为精确,能够通过对较少的抽样单位的调研,得到比较准确的推断结果,特别是当总体较大、内部结构复杂时分层抽样常能取得令人满意的效果; (2)分层抽样在对总体进行推断的同时,还能获得对每层的推断。,缺点: 分层抽样要求各层(组)问具有明显的差异,而同层(组) 内每个个体又保持一致性,所以,必须找出与我们的关心的 对象特征相关的标识,同时,还要求掌握各层(组)的单位数 或占总体的比例。这需要收集掌握必要的资料,

22、不仅增加了 抽样设计的复杂性,而且耗费额外的费用。,1.含义 整群抽样又叫分群随机抽样,是指将调研总体划分为若干群体,然后以单纯随机抽样法,从中随机抽取某些群体,进行普查。 在整群随机抽样中,由若干个基本单元所组成的集合称为群体或群调研时抽取某些群体,然后对抽取的群体中所包含的所有基本单元进行普查。,整群抽样,2.整群抽样的应用 (1)首先要把调研总体区分为若干个群。整群随机抽样与分层随机抽样的共同点是:都是首先将调研总体进行分类并且都要求总体中的任何一个基本单位只能属于某个层或群。但是,整群抽样所划分的群之间必须具村同质性,而群内的基本单元之间必须具有明显必异质性,以收入高低整群为例,整群后

23、的各群内的基本单元的收入有高、中、低三种;而分层抽样所划分的层之间必须具有明显的异质性,而层内的基本单元之间必须具有同质性。即所谓的“异质的层,同质的群”。,(2)随机抽取部分群体,以单阶整群抽样或多阶整群抽样两种方式形成调研样本。 单阶整群抽样:如果抽出某些群体后,即将抽出的群体全部作为样本进行调研,称为单阶整群抽样或单段整群抽样。 多阶整群抽样:如果抽出某些群体后,进一步划分为若干个子群体,然后,再按随机原则抽取一个或部分子群体作为样本进行调研,称为多阶整群抽样或多段整群抽样。,3.整群抽样的优缺点 优点:整群抽样抽选工作比较简易方便,抽中的单位比较集中;实施调研便利,节省费用 缺点:由于

24、样本单位集中在某些群体,而不能均匀分布在总体中,如果不同群之间的差异比较大,而一个群内各单元之间的差异比较小,则以抽取的群为样本得出的调研结论代表性较低,抽样误差就会增大。,5.非概率抽样方法,非概率抽样 又叫非随机抽样,是指抽样时不遵循随机原则,总体中每一个单位不具有被平等抽取的机会,而是根据一定主观标准来抽选样本的抽样方法。,1.非随机抽样的伏缺点 优点: (1)可以充分利用已知资料,选择较为典型的样本使样本更好地代表总体。 (2)可以缩小抽样范围,节约调研时间、调研人员和调研费用。 (3)操作方便易于实施,统计上也比随机抽样简单。,缺点: (1)无法判断其误差和检查结果的准确性。因为在用

25、非随机抽样技术进行调研的总体中,每一个样本被抽取的概率不一样,概率值的大小不清楚,无法借助概率计算推算值与实际值的差异。其可靠程度只能由调研人员主观评定。由于主观标准不当或主观判断失误,均会增大抽样误差,所以难以核实出现的差错。 (2)有目的的非随机抽样可能会导致过分强调部分研究对象的个性特征。,1.含义 又称任意抽样、偶遇抽样,是指调研者根据调研方便在总体中随意选取样本的方法。 便利抽样的特点是,调查者把在第一时间、第一环境所遇到的人作为调查对象,其调查样本的选择完全取决于调查人员的方便。,便利抽样,2.便利抽样的应用 便利抽样地点的选取 便利抽样时间的选取 便利抽样的质控(现场秩序、问卷审

26、核、后期复核),1.含义 判断抽样,又称目的抽样,是指调研者根据主观经验判断选定样本的一种非随机抽样法。 例如某批发商要调研各零售商销售其产品的情况;批发商经理根据其本人的判断,选定一些具有代表性的零售商作为调研对象等。 企业管理水平、市场商品消费结构调研、居民家庭收人调研、制定市场物价指数、选定商品日录和地区样本,判断抽样,2.判断抽样的应用 两种做法 1.在调研总体中挑选代表平均水平的所谓“平均型“单位个体或占多数的所谓“多数型”单位个体,作为典型样本,以此来推断总体。 2.利用调研统计资料,让有经验的调研人员或让有见解的专家判断选择样本,以此来推断总体。,3判断抽样的优缺点 (1)优点:

27、判断抽样简便、易行、及时,可以根据调研目的和特殊需要,和已知的资料快速挑选样本,及时收集、掌握调研资料。 (2)缺点:判断抽样易于发生由于主观判断偏差而引起抽样偏差的情况,判断抽样的样本代表性高低,完全取决于调研者对被调研总体了解的程度和自身的知识、经验和判断能力;由于无法计算各个单位个体被抽取的概率因而也无法计算判断抽样的抽样误差和可信度。,1.含义 配额抽样,又称定额抽样,是指依据调研总体中的某些属性特征(控制特性)将总体划分成若干层,依据各层次样本在总体中的比重分配样本数额,然后由调研者主观选定样本单位。配额抽样的目的是为了避免调研所造成的样本偏差,以保证样本的代表性及均衡性。,配额抽样,2.配额抽样的应用 (1)配额抽样的步骤 确定配额控制特性(收入、年龄、职业等) 根据控制特性将总体分层,并确定各层数目在总体中的比例 根据各层数目在总体中所占的比例来决定各层的样本数 进行配额分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论