第十讲抽样设计_第1页
第十讲抽样设计_第2页
第十讲抽样设计_第3页
第十讲抽样设计_第4页
第十讲抽样设计_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十讲抽样设计商学院工商管理系2023/1/152现代抽样方法的先驱——盖洛普“一种客观测量报刊读者阅读兴趣的新方法”是乔治·盖洛普(GeorgeGallup)在艾奥瓦大学写博士论文时用的题目。通过对“DesMoinesRegisterandTribune”和瑞士数学家雅克布·贝努里(JakobBernonlli)具有200年历史的概率统计理论的研究,盖洛普在抽样技术领域取得了进展。他指出,当抽样计划中的调查对象涵盖广泛,涉及不同地域、不同种族、不同经济层次的各种人时,你只需随机抽取而无需采访每个人。尽管当时他的方法不能为每个人理解和认同,但是现在,这已经被广泛使用。2023/1/153盖洛普通常引出一些特例来解释他自己在说什么或做什么。假设有7000个白豆子和3000个黑豆子十分均匀地混在一起,装在一只桶里。当你舀出100个时,你大约可以拿到70个白的和30个黑的,而且你失误的几率可以用数学方法计算出来。只要桶里的豆子多于一把,那么你出错的几率就少于3%。2023/1/15420世纪30年代早期,盖洛普在美国很受欢迎。他成为Drake大学新闻系的系主任,然后转至西北大学。在些期间,他从事美国东北部报刊的读者调查。1932年的夏天,一家新的广告代理商电扬广告公司,邀请他去纽约创立一个旨在评估广告效果的调查部门,并制定一套调查方案。同年,他利用他的民意测验法帮助他的岳母竞选艾奥瓦州议员。这使他确信他的抽样调查方法不仅在数豆子和报刊读者调查方面有效,并有助于选举人。2023/1/155只要你了解到抽样范围具有广泛性:白人、黑人,男性、女性,富有、贫穷,城市、郊区,共和党、民主党。只要有一部分人代表他们所属的总体,你就可以通过采访相对少的一部分人,来预测选举结果或反映公众对其关心问题的态度。盖洛普证实,通过科学抽样,可以准确地估测出总体的指标。同时,在抽样过程中,可节省大量资金。2023/1/156乔治·盖洛普是个了不起的人。作为一个周游各地的哲学家的儿子,他在高中时设法养了一群乳牛,并因此摆脱了贫困。在爱荷华大学上学的时候,他成为学生杂志的主编,并把这本杂志变成一份日报,还发明了一种计算每一条新闻和每一篇特写的阅读人数的方法——一个将给新闻业和广告业带来革命性变化的发明。2023/1/157本讲主要学习内容抽样设计概述抽样误差与样本量抽样调查的步骤抽样调查的实例小结2023/1/158抽样设计概述Ⅰ.抽样调查的概念

抽样调查是指从调研总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。Ⅱ.抽样调查的特点

⒈优点:①时间快,收效快。

②质量高、可信程度好。

③费用省、易推广。

⒉抽样调查的不足:小范围、样本差别较的调查不适合。2023/1/159【案例分析】对一个街道或一个乡内的个体商贩的零售额调查是否适合采用抽样检查方法?【分析提示】由于被调查对象比较集中,个体之间又存在较大差异,抽样调查的优势不能得以充分发挥,这种情况下采用全面调查的方式可能更好。所以总体规模越大,实施全面调查的难度越大,抽样调查的用武之地也就越大。2023/1/1510Ⅲ.与抽样调查相关的重要概念:1.个体与总体个体也称为个案。组成总体的每个元素称为个体。有时也称具有某种统计特征的每一个对象为个案。构成一个总体的个案,可以是人或物,也可以指个性,心理反应等。总体也称为母体,一般总体等。具有某种特征的一类事物的全部个案,在统计学上称为总体。也即是说,研究对象的全体称为总体。例如某批产品、某类病人、某个生产过程等。

总体的单位数常用符号N表示。2.样本、样本单位与抽样单位样本也称为抽样总体、样本总体等。从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。可见,总体是大群体,而样本是小群体。样本的单位数(即样本容量)常用符号n表示。样本单位是按一定的抽样方法从总体中抽取出来。样本单位的多寡又称样本容量的大小。抽样单位是指样本抽取过程中的单位形式。样本单位与抽样单位的区别,见P1052023/1/15113.抽样框抽样框是供抽样所用的所有调查单位的名单。在抽样框中,可以对每个单位编上一个号码,由此可以按一定随机化程序进行抽样。在抽样后,调查人员也可以根据抽样框上所提供的信息找到被选中的入样单位,从而实施调查。抽样框可以有多种形式,常用的有名录框,如企业名录、电话簿、人员名册等。抽样框也可以是一张地图或其他适当形式。不管是什么形式,抽样框中的单位必须是有序的,便于编号。高质量的抽样框应当提供被调查单位更多的信息,并且没有重复和遗漏。4.抽样误差抽样误差是调研所得出的对总体某个特征的推断与总体该特征最终实际结果之间的差距。2023/1/1512抽样调查的应用范围有些事物在测量或试验时有破坏性,不可能进行全面调查对某些有限总体,从理论上讲可以进行全面调查,但实际上根本无法进行对于无限总体只能进行抽样调查,不可能进行全面调查有些调查任务需要在短时间内完成对全面调查统计资料的质量进行检查和修正2023/1/1513抽样误差抽样误差是指调查的结果和客观实际情况的出入和差数,一般有两种误差存在:非抽样误差是基于抽样之外的许多其它原因而产生的误差,其产生原因如下图所示:抽样误差与样本量2023/1/1514非抽样误差观测偏差非观测偏差覆盖不周无回答访问员责任被访问者责任访问员过失误解而错答故意错答拒答不在家访问员作弊2023/1/1515抽样误差是用样本估计总体而产生的误差抽样平均误差的计算影响抽样误差的因素必要样本容量的确定以简单随机抽样方式为例平均数的样本量确定公式:重复抽样:n=不重复抽样:n=t2σ2△χNt2σ2N△χ+t262222023/1/1516成数的样本量确定公式:重复抽样:n=不重复抽样:n=t2PQ△2Nt2PQN△2+t2PQpp2023/1/1517【例1】对生产某型号电池进行电流强度检验。根据以往正常生产的经验,电流强度的标准差σ=0.4安培,而合格率为90%,现在用重复抽样的方式,要求在95.45%的概率保证下,抽样平均电流强度的极限误差不超过0.08安培,抽样合格率的极限误差不超过5%,问必要的样本单位数应该为多少?2023/1/1518根据公式,在重复抽样条件下:抽样平均数的单位数:n===100抽样成数的单位数:n===144

抽样单位应该确定其中比较多的单位数,即抽取144个单位加以检验,以满足共同的要求t2σ2△χ22×0.420.082t2pQ△p22×0.9×0.10.052222023/1/1519例2:某进出口公司出口一种名茶,为检查其每包规格的质量,抽取样本100包,检验结果如下:每包重量(克)包(包)148-14910149-15020150-15150151-15220合计100按规定这种茶叶每包规格重量应不低于150克。试以0.9973的概率(t=3)估计这批茶叶每包平均重量的范围,确定是否达到规格要求。2023/1/1520解:每包重量(克)组中值(h)x包数(包)fxfx-x(x-x)2(x-x)2f148-149148.5101485--1.83.2432.4149-150149.5202990-0.80.6412.8150-151150.55075250.20.042.0151-152151.52030301.21.4428.8合计-10015030--76.0茶叶抽样平均每包重量:茶叶重量抽样方差:[注:这里σ2即抽样的S2]x=∑xf∑f∑xf∑f==150.3(克)σ2=∑(x-x)2f∑f76100==0.762023/1/1521抽样平均误差:极限误差:△x=t·μx=3×(±0.087)=±0.26(克)这批茶叶平均每包重量的范围:x±△x=150.3±0.26即:150.04~150.56(克)从计算可知,这批茶叶达到了重量规格要求。μx=σ2n0.76100==0.0872023/1/1522例3:从某市所有职工家庭中随机抽400户进行调查,调查得知,拥有计算机的家庭有160户,试以95.45%的概率求该市所有职工家庭中拥有计算机家庭的比率区间。如果要求极限误差不超过1%,问最少应抽多少户家庭进行调查?解:p=n1n160400==40%q=1-p=60%=2.4%μp=pqn40%×60%400=2023/1/1523∵F(t)=95.45%∴查表得t=2△p=t·Up=2×2.4%=4.8%下限:p-△p=35.2%上限:p+△p=44.8%所以,在95.45%的概率保证下,该市所有职工家庭中拥有计算机家庭的比率区间在35.2%~44.8%之间。最少应抽9600户家庭进行调查。n=t2p(1-p)△p220.4×0.6(1%)2==960022023/1/1524抽样调查的步骤第一步界定调查总体第二步选择资料收集方式第三步选择抽样框第四步确定抽样方法第五步决定样本大小第六步抽取样本收集资料第七步评估样本正误2023/1/15251、界定调查总体界定调查总体就是要清楚地说明研究对象的范围(时间、地点、人物),如2006年4月,A市B区C街道18~35岁青年对互联网发展的看法。为了满足研究目的的需要,注意详细说明可提供信息或所需信息有关的个体或实体(譬如公司、商店等)所具有的特性。调查总体可以从以下几个方面进行描述:地域特征、人口统计学的特征、产品或服务使用情况、认知程度等。在调查中,从调查表开始部分的过滤性问题,就可以看出某个体是否属于本次调查的总体范围。即使有总体和样本清单,仍有必要使用过滤性问题识别合格的应答者。2023/1/1526第一步界定调查总体第二步选择资料收集方式第三步选择抽样框第四步确定抽样方法第五步决定样本大小第六步抽取样本收集资料第七步评估样本正误抽样调查的步骤2023/1/15272、选择资料收集方式资料收集方式对抽样过程有重要影响。例如采用入户面访、电话调查、街上拦截还是网上调查、邮寄调查对抽样结果都会有不同的影响。2023/1/1528【案例】某商业中心一向注重服务,调查显示,顾客十分看重服务,而且公司自信在这方面的口碑颇佳。他们想在良好的商誉基础上继续提供更为出色的服务。然而,经营规模的不断扩大,使得他们有点力不从心。根据经验,他们选择了两家供应商来设计和制作追踪消费者满意程度的系统。2023/1/1529【案例】(续)这两家公司拟采用不同的资料收集方式。第一家公司建议用电话采访来建立一个调查系统,该公司提议电话号码随机抽取,全部采访由当地电话中心调控。每月对400名消费者进行采访,经计算,该抽样方式所提供的消费者满意程度评估的结果,有95%的把握,误差不超过5%。第二家公司建议通过邮寄调研收集必要资料。他们的理由有两条:第一,此方法成本低、质量高;第二,消费者在回信时比在接受电话访谈时更坦率。电话采访的月成本比邮寄方式的月成本要高。问:如何评价这两种方法?2023/1/1530【从抽样的角度分析】邮寄调查的回收率估计为25%。显然,这表明75%的收信人会不回信。如果回信的人与不回信的人观点截然不同,那么调查结果就有偏差并且不能真实代表公司的顾客。电话采访的回答率估计为70%。这表明1/3以下(30%)的被采访人联系不上或拒绝接受采访。尽管电话采访仍存在很高的不回答率,但潜在的不回答者的不同意见要少得多。调查结果也更接近他们商业中心消费者的真实观点。2023/1/1531另外,电话采访更快捷,因为可以在大约两周内完成调查、制表并提交报告。同样的程序,邮寄调查则需差不多6周时间,因为人们收信、填表、回收都需要时间。而且,邮寄方式如仅收到25%的回信,就需要进行二次调研。从本案例可以看出,在进行抽样设计时,要反复比较不同的资料收集之方式,争取做出最好的选择。2023/1/1532第一步界定调查总体第二步选择资料收集方式第三步选择抽样框第四步确定抽样方法第五步决定样本大小第六步抽取样本收集资料第七步评估样本正误抽样调查的步骤2023/1/15333、选择抽样框抽样框又称为抽样范畴,是抽取样本的所有单位的名单。例如,要调查某大学学生上网的情况,这时抽样框就是该校全体大学生的花名册。在一次抽样中,抽样框的数目是与抽样单位的层次相对应的。若有3个层次的抽样单位,如乡、村、家庭,则抽样框也应有3个,全乡的名单、乡样本中所有村的名单、村样本中所有家庭的名单。2023/1/1534准确的抽样框包括两个涵义:完整性与不重复性。完整性是指不遗漏总体中的任意一个个体;不重复性是指任意一个个体不能重复列入抽样框。在实际抽样操作中,满足这两项原则非常不容易。例如,在城市居民户的抽样中,会经常出现一户有多处住房的情况,这样很容易把这一户重复列入抽样框,使得他们在抽样中的中选概率高于其他居民,从而违背了随机抽样的等概率原则;同样,许多城市居民居住条件较差,很多居民同住在一个门牌号中,因此很容易遗漏。在抽样领域,形成一个适当的抽样框经常是调查者面临的最有挑战性的问题。2023/1/1535【例】在上海,会有10多个家庭居住在一个门牌号的情况,如果出现这种情况,被遗漏掉的户就没有可能被抽中,也就是说,他们中选概率为零,当然也就违背了随机抽取的等概率原则。还有郑州市内的“都市村庄”等情况。又如,电话号码本就可能是电话调查的抽样框。在问卷中,调查总体很有可能是城市中的所有居民。但是,电话号码本就不包括那些没有电话的居民和那些没有公布他们号码的居民。2023/1/1536【抽样框误差的案例】之一1936年总统大选时,《文学文摘》(LiteraryDigest)杂志社从电话簿和汽车主登记表中选出了一大批选民(超过200万人次)作抽样调查,基于这个调查的结果,它预言阿尔弗·兰顿(AlfLondon)会在竞选中击败富兰克林·罗斯福。不幸的是,这份抽样框选择的(电话簿和汽车主登记表中)选民并不能代表1936年整个美国的所有选民。因为,当时大多数人没有电话,没有汽车。并且这部分被忽略的选民收入很低。然而,抽样中作为重点的富裕阶层的选择,更倾向于投共和党的票。当时,盖洛普就对他们电话访问的可信度提出质疑,同时抽取了最具代表性的样本进行民意测验,并预测罗斯福将当选。竞选结果出来后,《文学文摘》因其失误的预言使其可信度急剧下降,最终导致了破产的结局。盖洛普则名声大噪。2023/1/1537【抽样框误差的案例】之二某一个狗食品商在超级商场里对狗的主人进行了广泛的访问调查,他们调查并估计顾客对包装式样和型号的要求,并试探顾客对广告设计方案的反应。产品投入市场初期,经历了一个高销售额的阶段。但数月后,销售额却停滞不前。这家公司讨论研究后,把自己生产的狗食带到当地的流浪狗收容所,然后把狗食放在狗的面前,但它们却连碰都不碰!尽管访问调查所有的狗的主人,但厂家却不知道自己的抽样框是错误的。2023/1/1538【小思考】您所选项目的抽样框应该是什么?为什么?如何能够避免其不重复性,并能够形成一个完整的抽样框?2023/1/1539第一步界定调查总体第二步选择资料收集方式第三步选择抽样框第四步确定抽样方法第五步决定样本大小第六步抽取样本收集资料第七步评估样本正误抽样调查的步骤2023/1/1540抽样调查方式(P108)抽样调查概率抽样非概率抽样简单随机抽样分层抽样整群抽样系统抽样多阶段抽样方便抽样判断抽样配额抽样自愿抽样2023/1/1541简单随机抽样简单随机抽样又称纯随机抽样,它是按随机的原则直接从总体N个单位中抽取n个单位作为样本,保证总体中每个单位在抽选时都有相等的机会。有放回和不放回抽样两种方方法。简单随机抽样的随机化抽样程序主要通过三种方式实现:抽签法随机数字表法计算机抽取2023/1/1542抽签法适用于总体单位数较少的情况。抽签方式在具体应用上有多种方法,如抽纸签法、纸牌法等。基本步骤如下:(P109)将调查总体的每个单位编上号码将号码均匀打乱任意从中抽选,抽到一个号码,就作为一个单位直到抽足预先规定的样本数目为止2023/1/1543随机数字表法(P109)随机数表(乱数表)基本步骤:调查总体中的所有单位加以编号,根据编号的位数确定适用若干位数字查乱数表直到抽足预定样本数目为止2023/1/1544【案例分析】

要从94家上市公司中抽取12家作为抽样样本,可先将94家公司由1至94编号N=94,然后在乱数表上任意一点一行(或一列)中一个数字作为起点数,从这个数字按上下或左右顺序读起,则所抽取单位是:96682731050372931555595635?2023/1/1545【分析提示】在顺序抽取的过程中,遇到比编号大的数字,应该舍去。此例中的96因大于94,故舍去不用。2023/1/1546计算机抽取统计软件中都有抽取随机样本的功能,其原理是利用软件中的相应程序生产管理随机数,然后由计算机完成抽取。通常,抽样框中的信息都可以形成文件,存储于计算机中,因此这种方法抽取样本十分快捷。需要指出的是,通过大量的模拟实验发现,计算机产生的随机数是伪随机数,其随机性并不特别理想,在使用中要意识到这一点。2023/1/1547简单随机抽样的适用范围简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位入样的概率是相同的,因而计算抽样误差和对总体参数进行推断都有比较简单的形式。但是,简单随机抽样没有利用抽样框中更多的辅助信息,所以用样本统计量估计总体参数的效率受到影响。同时,在简单随机抽样条件下,样本的分布可能十分分散,这就增加了调查过程中的费用和时间。这种抽样方法的适用条件是:抽样框中没有更多可以利用的辅助信息;调查对象分布的范围不广阔;个体之间的差异不很大。2023/1/1548分层抽样分层抽样又称类型抽样,它的特点是先对总体各单位按主要标志加以分组,然后再从各组中按随机的原则抽选一定单位构成样本设总体由N个单位组成,把总体划分为K组,使N=N1+N2+N3+…+NK,然后分别从N1、N2、N3…NK中抽取n1、n2、n3…nk个单位构成样本容量为n的样本总体,使n=n1+n2+n3+…nk,这种抽样方法称为分层抽样,分层抽样具体形式主要有两种:2023/1/1549(一)分层比例抽样即按各个层(或各类型)中的单位数占总体单位数的比例分配各层的样本数量各层样本单位数:∵=∴ni=NNiniNnNin2023/1/1550【案例分析】某地共有居民20000户,按经济收入高低进行分类,其中高收入的居民为4000户,占总体的20%,中收入的居民为12000户,占总体的60%,低收入的居民为4000户,占总体的20%。要从中抽选200户进行购买力调查,则各类型应抽取的样本单位数为?2023/1/1551【分析提示】经济收入高的样本数目为:200*20%=40(户)

经济收入中的样本数目为:200*60%=120(户)

经济收入低的样本数目为:200*20%=40(户)样本单位数的抽取是按各种经济收入的单位数量占总体单位数量的比例进行样本的抽选。这种方法简便易行,分配合理,计算方便。适用于各类型之间差异不大的分类抽样调查,如果各类差异过大,则不宜采用而应采用分层最佳抽样法。2023/1/1552(二)分层最佳抽样分层最佳抽样是非比例抽样,它不仅是按各层占母体中的比例来分配样本数,而且还根据各层的样本标准差的大小,调整各层的样本数目的抽样法计算公式为:

ni=n*(NiSi/∑NiSi)式中:ni————各类型应抽选的样本单位数

n

————样本单位数

Ni————各类型的调查单位数

Si

————各类型调查单位数的样本标准差2023/1/1553【案例分析】仍以上述居民收入与购买力之间关系为例。各层样本标准差高收入为300元,中收入为200元,低收入为100元,如:调查单位数与样本标准差乘积计算表

各层次各层的调查单位数(户)

Ni各层的样本标准差(元)Si乘积

NiSi高中低400012000400030020010012000002400000400000∑NiSi2000040000002023/1/1554【分析提示】1样本标准差=√离差的平方和/样本数目上例是假定的,也可通过计算公式。高收入样本单位数目为:200*(1200000/4000000)=60中收入样本单位数目为:200*(2400000/4000000)=120低收入样本单位数目为:200*(400000/4000000)=202023/1/1555【分析提示】2样本单位数是按各种经济收入下的样本标准差的大小进行调整的,按ni=n*(NiSi/∑NiSi)计算。通过上述计算可以看出,用非比例抽样法与比例抽样法,抽取的样本各层次之间不同,特别是高收入与低收入减少20户(20户—40户),中收入不变。由于购买力同家庭经济收入关系很大,因而要增加高收入的样本数,相应减少低收入层的样本数,这种使所抽取的样本更具有代表性。这种以调查单位数和样本标准差两个因素为依据进行的抽样是最佳抽样法。2023/1/1556【案例讨论】设某学生宿舍共有6人,其中3名新生,3名老生。现欲估计该宿舍平均每人拥有书的数目。假设他们拥有书的数目如下表所示:表:6名学生拥有书的数目学生编号老生拥有书(本)学生编号新生拥有书(本)A20D2B22E4C24F6合计66合计122023/1/1557【分析】容易算出,总体均值为:Y=(66+12)/6=13(本)现在用抽样方法随机抽取2人为样本,并用样本数据对总体进行推断。在简单随机抽样下,抽中拥有最少书的2个人的样本均值为3本,即y1=(2+4)/2=3本,最多书的2个人的样本均值为23本,即y2=(22+24)/2=23,显然与总体均值13相比误差都比较大。该如何处理合适?2023/1/1558【简单提示】老生中抽一人,新生中抽一人,共同组成样本。这时样本最小的可能值为y1=(20+2)/2=11,最大的可能值为y2=(24+6)/2=15,它们与总体均值要接近得多。如下图所示:2341110152324简单随机抽样结果所在的范围分层抽样结果所在的范围2023/1/1559通过分类,可以把总体中标志值比较接近的单位归为一组,使各组的分布比较均匀,而且保证各组都有中选的机会,这样计算的抽样平均指标变异程度也就比较小。所以在总体各单位标志值大小悬殊的情况下,动用分层抽样比简单随机抽样可以得到比较准确的结果。在实际中分层抽样应用广泛。例如,农产量抽样按地区分组、家计调查按国民经部门分组、产品质量抽查按各类按类型号的车床分组等等,都能够得到显著的效果。这种方法实质上是分层与单纯随机抽样的结合。简要说明2023/1/1560等距抽样等距抽样又称为机械抽样或系统抽样,它是事先将全部总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的一种组织形式。如逢十抽一,每隔七抽一等。K值指每隔多少个抽一个,计算公式是:K=N(总体个案数)/n(样本个案数)2023/1/1561等距抽样的特点与简单抽样相比,等距抽样易于实施,工作量小;而且样本在总体中分布更为均匀,抽样误差小于简单抽样。因此,等距抽样成为实际中广泛应用的一种抽样方法。这种方法的一个弱点就是容易出现周期性偏差。为了防止这种情况,我们可以取一定数量的样本以后,打乱原来的秩序,建立新的秩序,以纠正周期性偏差。2023/1/1562【案例】某地区有零售店110户,采用等距抽样方法抽取11进行调查。第一步,将总体调查对象(110户零售店)进行编号,即从1号至110号。第二步,确定抽样间隔。已知调查总体N=110,样本数n=11户,故抽样间隔=110/11=10户。第三步,确定起抽号数。用10张卡片(即抽样间隔)从1号至10号编号,然后从中随机抽取1张作为抽数号。如果抽出的是2号,2号则为抽号数。第四步,确定被抽取单位。从起抽号开始,按照抽样间隔选择样本,本例从2号起每隔10号抽选一个,直至抽足11个为止。计算方法如下:2023/1/1563【案例】续22+10=122+10*2=22……2+10*10=102即所抽的单位是编号为2,12,22,32,42,52,62,72,82,92,102的11个零售店。2023/1/1564整群抽样整群抽样也有称聚类抽样、集团抽样,是将市场调查母体先分为若干群,然后按随机原则,成群地抽取样本单位,对抽中的群内所有单位进行调查的一种抽样组织形式。上述3种抽样调查方式,都是以总体中的各个个体为单位进行抽样调查。在实际工作中,当总体特别大时,有时不是一个个单位(个案)抽选,而是整群(组)、整批地抽选,对被抽选的各群(组)中的所有个案毫无遗漏地全部进行调查,这样的抽样方式就称之为整群随机抽样。如我们从几所中学,任意地选几个班级,以班为一整群,对这几个班所有学生进行整体调查。这种方式往往用于同质性比较强的总体。2023/1/1565采用整群抽样的原因实施调查方便,可以节省费用和时间。在总体单位分布很广的条件下,若采用简单随机抽样,样本的分布十分分散,调查实施有一定难度,费时费力。而群中各单位的分布非常集中,抽中一个群后,在一个点可以调查多个单位,调查效率很高。缺乏总体单位的抽样框,不得已而实行之。例如欲对郑州市小学生的视力状况进行抽样调查,全市小学生名单的抽样框是没有的,但有全市小学校的抽样框,所以可以依据该抽样框抽取小学,在中选的小学中抽取班级,这时可以把班级视为群,对中选班中的所有学生进行视力测试。在许多情况下,采用整群抽样的上述原因兼而有之。2023/1/1566整群抽样与分层抽样的比较特征整群抽样分层抽样样本来源一个或几个群所有层抽样目的不提高成本而提高抽样效率不提高成本而提高精度划分原则群中的个体异质,群间同质层中个体同质,层间异质2023/1/1567多阶段抽样这种方法就是从集体抽样到个体抽样,分成若干阶段逐步地进行。如对某县200000人的抽样可分为三个阶段进行:整个过程的各段抽样,都可采取简单的或分层的抽样法。在上例具体的过程中有三段,则可称为三段抽样。也可分为五段抽样:县8个乡15个村500人华中省县乡村农民2023/1/1568说明多阶段抽样这种方法,在大规模抽查时非用它不可,但由于每段抽样都会有误差,经过多段抽样,最后抽样出来的样本误差就会比较大,这是多段抽样的缺点。另外,多阶段的抽样设计比较复杂,不仅涉及如何划分阶段,还包括在每个阶段上应当抽取多大样本量,以及每个阶段的抽样方法。要达到总体的最好效果,需要把多种因素综合考虑,作以平衡或取舍。此外,多阶段的抽样误差计算也比较复杂。2023/1/1569非概率抽样非概率抽样是指抽选样本时不是依据随机原则,而是根据方便原则或研究人员的主观判断选择样本。在市场调查中,非概率抽样也是经常使用的,原因主要有:有些情况下,由于客观条件的限制,比如调查经费有限或没有适当的抽样框,难以采用概率抽样;对调查结果的时间要求紧,无法从容进行概率抽样;调查人员具有丰富的积累,凭经验可以抽出很好的样本。最重要的,采用非概率抽样,都是在对抽样误差没有需求,不必要对总体参数进行区间估计的条件下使用的。2023/1/1570方便抽样顾名思义,方便抽样就是依据方便原则抽取样本,最典型的方式就是拦截式调查,即在街边或居民小区拦住行人进行调查。想要了解消费者对某商场服务状况的看法,在该商场门口向进来的顾客询问调查的问题,想要调查外地居民在本市的购物状况,则机场、火车站、长途汽车站、宾馆等地都是可供选择的调查场所。2023/1/1571方便抽样的特点与适用范围方便抽样操作简便,能及时取得需要的信息,节省调查经费。它的主要局限在于,样本信息无法代表总体,即不能根据样本信息对总体进行任何推论,因而方便样本不适合于描述性研究和因果关系研究,它比较适合于探索性研究,通过调查发现问题,产生想法和假设。方便选择也可以用于正式调查前的预调查。2023/1/1572判断抽样又称目的抽样,它是凭研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性样本的调查对象的一种抽样方法。在判断抽样中,如何确定样本单位,取决于调查的目的。通常有几种情况:一种是选择平均型样本,所谓平均型是指在调查总体中,选定的样本可以代表平均水平。其目的是欲了解总体平均水平的大体位置。二是众数型,即在调查总体中选择能够反映大多数单位情况的个体为样本。特殊型,如选择很好(高)的或很差(低)的典型单位为样本,目的是“解剖麻雀”,分析研究造成这种异常的原因。2023/1/1573判断抽样的特点与适用范围判断抽样简便、快捷,节省费用,符合调查目的和特殊需要。但由于样本选择是主观的,所以样本的质量取决于挑选人员的经验、专业知识和对情况的了解。判断选择的目的多在于了解总体的数量特征和对问题的深入分析,而不是利用调查结果对总体参数进行估计。例如,通过判断抽样,我们可能可以了解到总体均值的大体位置,但是无法从概率的角度推算其置信区间,也缺乏足够的理由说明用样本结果进行推算的客观性。2023/1/1574配额抽样配额抽样类似随机抽样中的分层抽样,它也是首先将总体中的所有单位按一定的标志分为若干类(组),然后在每个类(组)中用任意抽样或判断抽样方法选取样本单位。但配额抽样又不同于分层抽样,分层抽样中的各层的子样本是随机抽取的,而配额抽样中各层的子样本是非随机抽取的。配额抽样分为独立控制配额抽样和非独立控制配额抽样两大类。2023/1/1575独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定单位分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。因此,调查员就有比较大的自由去选择总体中的样本。独立控制配额抽样具有简便易行,费用少等优点,但有选择样本容易偏向某一类型而忽视其他类型的缺点。例如偏重于年龄较轻的低收入或年龄较大的高收入者。这个缺点可以通过相互控制配额抽样来弥补。2023/1/1576月收入(元)人数(人)1000以下281000~1500501500~2000702000以上52合计200年龄人数(人)30以下4030~406040~507050以上30合计200性别人数(人)男100女100合计200例:独立控制配额抽样分配表2023/1/1577相互控制的配额抽样相互控制的配额抽样又称为交叉控制配额抽样,是对调查对象的各个特性的样本数额交叉分配,上例中如果采用相互控制配额抽样,就必须对收入、年龄、性别这三项特性同时规定样本分配数,如下表所示:2023/1/1578交叉控制配额抽样分配表

1000元以下1000~15001500~20002000以上合计男女男女男女男女30以下225577664030~40332061016116040~50101341273307050以上5225833230合计208302037331339200年龄性别月收入2023/1/1579控制配额抽样法的工作程序可分为以下四步:第一步,确定控制特征。调查人员可事先根据调查的目的和客观情况,确定调查对象的控制特征,作为总体分类的划分标准。如年龄、性别、收入、文化程度等。第二步,根据控制特征对总体分层,计算各层占调查总体的比例,确定各层之间的比例关系。例如,以家庭人口和月收入为控制特征,制定相互控制配额比例表:2023/1/1580相互控制配额比例表

家庭人口每月收入4人以下4人以上合计300元以上50%18%68%300元~500元2%20%22%500元以上1%9%10%合计53%47%100%上表中各栏比例是在抽样前根据已有的现成资料确定的,抽样时可根据这项比例进行。2023/1/1581第三步,确定每层的样本数。首先确定样本总数,然后根据每层占总体的比例决定每层应抽取数目。第四步,配额分配,确定调查单位。在各层抽取样本数确定后,调查人员就可在指定的样本配额限度内任意选择样本。2023/1/1582雪球抽样雪球抽样是以“滚雪球”的方式抽取样本。即通过少量样本单位以获得更多样本单位的信息,这种方法的运用前提是总体样本单位之间具有一定的联系,在不甚了解总体的情况下对总体或总体部分单位进行把握。雪球抽样又叫推荐抽样,要求回答者提供附加回答者的名单。有时营销调研者为符合研究的要求,起初汇编一个比总体样本要小得多的的样本名单。在采访了每个回答者之后,要求他或她提供其他可能的回答者名单。如此,先前的回答者就提供了额外的回答者。其他名单意味着样本如雪球滚下坡一样越滚越大。2023/1/1583适用范围当手头只有一份有限的且少得令人可怜的样本构架时,而回答者又能提供对调查可能有用的回答者的名单时,推荐抽样是最合适的。最初的名单在某些方面也可能是特殊的,然而增加样本的主要方法是通过原始名单中那些人的回忆产生的。2023/1/1584自愿样本自愿样本不是经过抽取,而是由自愿接受调查的单位所组成的样本。例如,在有些饭店的餐桌中央有调查表,就餐者可以自愿填答,飞机上也不时有乘务员向乘客发放调查表,乘客自愿参与调查。网络调查是构造自愿样本的另一个例子,调查人员将调查问卷粘贴到相关内容的网页上,上网读者可以自愿参与。还有一些调查,采用将问卷刊登在报刊上这种方式进行。这些调查所得到的样本都可以视为自愿样本。2023/1/1585自愿样本的特点首先样本集中于某些特定的群体,只有能够接触到调查问卷的那些人才有机会参与调查;其次,构成样本的那些单位往往对调查内容感兴趣,并愿意陈述自己的看法,所以这类调查其样本结构具有独特性,通常与总体结构相距甚远,因而调查结果不能反映总体状况。但这种自愿参与性的调查组织方便、成本低廉,而且参与者大多是对调查内容的关心者,调查人员能够了解这个特定群体的意见和看法,这对于了解情况、分析问题、查找原因都是十分重要的信息。2023/1/1586抽样方法的选择因素非概率抽样概率抽样调研性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论