市场抽样调查与预测_第1页
市场抽样调查与预测_第2页
市场抽样调查与预测_第3页
市场抽样调查与预测_第4页
市场抽样调查与预测_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

营销调研

MarketingResearch1第二章抽样调查学习目标理解抽样的内涵、类型及各类型的优缺点理解与抽样有关的相关概念理解并掌握抽样的过程理解并掌握样本容量确定的数学方法2小案例

下表是某学院教师所生子女的性别分布情况,请问男、女教师子女的性别构成有何差异?-------------------------------------------------子女性别父母性别---------------------------------------男女合计性别比-------------------------------------------------男84122.00女46100.33合计1210221.20-------------------------------------------------3第一节抽样调查概述一、抽样调查的基本概念抽样(sampling):是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。原因在于(1)研究成本和总体大小(2)普查工作量较大,而且并非必要抽样调查:抽样调查是从研究对象的整体中选出一部分代表加以调查研究,然后用得出的结论推断和说明总体的特性。41、总体(N)总体(population)是为研究计划的目的所规定的研究对象全体。目标总体(targetpopulation)是按照内容、范围和时间三重标准定义的全部个体的集合。抽样总体(samplingpopulation)从中实际抽取样本的所有个体的集合。讨论:广州地铁顾客满意度研究的目标总体与抽样总体?52、样本(n)能够代表总体情况的总体的子集。从总体中抽取的部分个体所组成的小总体。3、抽样单元研究中最基本的被调查对象。指样本抽取过程中的单位形式。样本单位从抽样单位中产生。64、抽样框抽样框架(samplingframe)用以代表总体,并从中选样本的一个框架(清单)。

在编制抽样框架时常见的问题如下:遗漏-遗漏部分样本单位;聚堆-缺乏个体样本单位信息;重复-同一样本单位重复出现;混杂-抽样框架中包括部分非样本总体成员。例:调查广州市所有的西饼店,用黄页的工商业名单作抽样框7二、抽样调查的特征

1、经济性2、准确性

登记性误差

代表性误差:总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会出现误差,这种误差叫作抽样误差。

决定抽样误差的因素(1)抽样的方法(2)样本的大小3、高效性8三、抽样调查的程序一)确定调查总体1、定义总体对目标总体含糊不清的描述转化为能将目标总体从别的总体中分离出来的明确的人口统计特征或其他特征。总体描述可以由以前的研究确定,也可以是长期迎合特定市场主体需要的营销决策者的集体智慧的结晶。2、获得总体的名单9二)选取抽样框抽样框误差:目录清单与目标总体的差异性。调研人员应该判断抽样框潜在的误差量。10三)设计和抽取样本样本大小抽样的方法(随机、非随机)样本容量的确定关于样本容量的几个判断:1、唯一完全精确的样本是普查2、概率抽样总会有误差(样本误差)3、概率抽样样本容量越大越精确4、概率抽样的精确度能用公式计算,用+n%表示5、使用相同容量的样本重复抽样,在一定误差范围内,会发现比较类似的结果6、概率抽样中,概率抽样的精确度独立于总体的数量7、概率抽样中的样本容量可能只占总体很小比重,但是它仍然是很精确8、概率抽样中的样本容量取决于调研委托者要求的精确度和数据收集的成本11四)收集样本资料,计算样本指标五)推断调查总体指标12第二节随机抽样一、简单随机抽样(simplerandomsampling)

简单随机抽样是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。若总体为N,样本量为n,则每一抽样单位的抽中概率:p=n/N13二、系统(等距)抽样

系统(等距)抽样(systematicsampling)是确定一个随机起点作为第一个样本,然后每个一个恒定的间隔选出其他样本的抽样方法。就是随机抽取第一个样本单位,然后每隔k个单位抽取一个。

系统抽样时每个样本单位抽中的概率相同,为1/k,通过系统抽样也可获得总体参数的自加权估计值。系统抽样具有简单且成本较低的有点,但相对于简单随机抽样来说,其代表性较低,并且对抽样框的要求较高。讨论:什么时候应避免采用系统抽样?14三、分层抽样(stratifiedsampling)分层抽样是将总体按某些重要特征分为数个层,各层之间既不能有重复也不能有遗漏,然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本。比例分层抽样非比例分层抽样15非比例分层抽样如果总体在一个或多个分类因素上具有偏斜分布,调研人员将子总体称为层,然后对每一层进行随机抽样的抽样方法;对于偏态分布的总体,抽样时多采用加权方法。16偏态分布总体的抽样大学学位的重要性?17讨论如果某校有1000名本科生,200名普通硕士生和300名MBA学生,若要比较不同学生之间的平均可支配收入,应采用哪种抽样方法?其总的平均收入应如何计算?18四、整群抽样整群抽样(clustersampling)是将总体分为不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样可分为:一级整群抽样-在抽中群组中抽取所有个体;二级整群抽样-在抽中群组中抽取部分个体。多级抽样-将总体分为多级群组,逐级抽样。

抽样框被分作同质性较高的若干群,其中一个或几个作为样本的抽样方法。

区域抽样是其代表整群抽样对子群之间的同质性要求比较高!19第三节非随机抽样(非概率抽样)非概率样本设计(nonprobabilitysampledesign)p218

事先并不确定每个样本单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,也无法估算样本估计值的抽样误差。20非随机抽样的应用该方法通常用于下列情况:样本量规模很小时;探索性研究或研究的初始阶段;目标总体成员很少或很难寻找;无法采用概率样本时。例:百事可乐的免费品尝促销21一、任意非随机抽样

任意非随机抽样是根据调查者的方便程度任意地抽选样本的方式。也叫便利抽样,按照访谈员的方便程度进行抽样。

目标总体单位差异小时具有代表性适用于探索性调查22任意非随机抽样例在入户调查中,调查员选择家中有人的住户;没有认定被调查者身份的拦截式访问;利用客户的名单进行调查;将问卷登在宣传媒体上,被调查者自填后寄回。特点方便选样样本的信息不适用于总体参数的推断。23二、判断非随机抽样

根据访谈员在专业知识和经验基础上的判断进行抽样。

调研人员使用自己的判断或请其他有相关知识的人来判断那些成员应该被抽取。存在主观性,总体中某些成员被选中的机会比另一些成员少。24调研者(通常是该领域的专家)根据主观经验和判断,从总体中选择“平均”的或认为有代表性的同时又容易取得的个体作为样本。当总体差异较大,而样本容量又不可能大时,判断抽样有可能比概率抽样提供更为准确的估计。判断抽样的精度主要取决于抽样者的经验,与样本量关系不大。缺点是不能获得估计值的精度。25三、配额非随机抽样为各类将要采访的个体确定一个具体的配额。

调研人员确定配额特征(例如人口统计特征或产品使用因素),并利用它们为每类受访者确定配额。配额大小由调研人员认为的总体中每类受访者的相应数量确定。配额抽样通常用来确保便利抽样方法能从不同种类的受访者中抽取要求的比例。26配额非随机抽样第一阶段,给调查员指定不同类型的配额例按性别、年龄、职业、收入等指标确定每类中的被调查者配额。第二阶段,调查员按方便抽样或判断抽样选取样本单位。优点:不用抽样框,以费用较低费用获得与总体特征分布相似的样本。缺点:不能获得估计的精度。27四、滚雪球非随机抽样先抽取少量的样本,然后通过滚雪球的方式扩大。应答者推荐其他有资格应答者的名单。受访者要求推荐一些像他们那样符合条件的人的姓名或身份。那些不为人熟悉、人们不喜欢或看法与别人不一致的受访者被选中的机会较小。

28滚雪球非随机抽样先选择一些调查对象,访问这些调查者之后,再请他们提供另外一些属于所研究的目标总体的调查对象,对这些调查对象调查后,再由他们按相同的要求提供新的调查对象,将这种过程不断继续下去,直到完成规定的样本容量为止。适用于对稀少群体的调查(如私人汽车拥有者)优点:能有效地找到符合要求的被调查者。29例:某市的市民评议某市政府为了让市民对各政府部门工作给予评估,决定在地方报纸上刊登调查表,然后根据寄回的调查表对各部门进行排名。请问这种做法可能带来哪些问题?30

第四节抽样误差一、抽样误差的概念及种类1、登记性误差:工作误差2、代表性误差:抽样误差(以部分推算总体)---系统性误差(偏差,未按随机原则,人为主观因素)---随机误差(偶然误差)31二、影响抽样误差的因素1、总体各单位之间差异程度越大,分布越分散,抽样误差越大2、抽样数目(样本容量)越多,误差越少3、抽样方式32三、抽样误差计算抽样平均误差(Samplingaverageerror)是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。由于从一个总体可能抽取多个样本,因此抽样指标(如平均数、抽样成数等),就有多个不同的数值,因而对全体指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体总数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。33抽样平均误差的计算(一)样本平均数的平均误差以μx表示样本平均数的平均误差,表示总体的标准差。根据定义:1、当抽样方式为重复抽样时,样本标志值是相互独立的,样本变量x与总体变量X同分布。所以得:

(1)34它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。

例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少?35解:根据题意可得:(件)总体标准差(件)抽样平均误差(件)362、当抽样方式为不重复抽样时,样本标志值不是相互独立的,根据数理统计知识可知:(2)当总体单位数N很大时,这个公式可近似表示为:(3)37与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,而总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。如前例,若改用不重复抽样方法,则抽样平均误差为:(件)在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。38二)成数指标的抽样误差

抽样成数的平均误差总体成数P可以表现为总体是非标志的平均数。即E(X)=P,它的标准差。根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。391)重复抽样的条件下:2)不重复抽样的条件下:

当总体单位数N很大时,可近似地写成:

(4)(5)(6)当总体成数未知时,可以用样本成数来代替。40例2:某企业生产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。41解:根据题意,在重复抽样条件下,合格率的抽样平均误差为:在不重复抽样条件下,合格率的抽样平均误差为:42抽样误差的控制措施抽样误差则是不可避免的,但可以减少,其措施有:1、增加样本个案数。2、适应选择抽样方式。不重置抽样,样本平均值的标准差为修正系数。A、无限总体,按照重置抽样计算B、有限总体:N比较大,n/N大于等于5%,修正系数简化为1-n/N;N比较大,n/N小于5%,按重置抽样计算43第五节样本容量的确定一、影响样本容量大小的因素

1、所研究指标在总体中变异程度2、总体大小总体所起的作用视它规模的大小而有所差异小规模总体的大小将起重要作用对于中等规模的总体,其作用中等重要大总体的规模对样本容量确定则不起作用443、调查估计值所能允许的误差的大小估计量的抽样方差较小,估计值是精确的估计值的精度越高,所需的样本容量就越大调查估计值所希望达到的精度,影响精度的因素也同样影响着样本容量的大小4、不同抽样组织方式和抽样方法样本设计和所使用的估计量无回答率45

客户提供的经费能支持多大容量的样本

整个调查持续的时间有多长

调查需要多少访员

能招聘到的访员有多少除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因素。46二、确定概率抽样的样本量样本容量不能决定代表性,但可影响结果的精度。样本的精度样本的统计量(如对一特定问题回答的平均数)与其所代表的总体的值的接近程度。大样本比小样本更精确,但是没有成倍的关系。财务和统计问题一般原则:样本越大,抽样误差越小样本大,耗费的成本也高抽样成本随样本容量直线递增,抽样误差却只是以样本量增长速度的平方根递减

财务、统计、管理47样本容量的确定通常是介于理论上的完善方案与实际上可行方案之间的一个折中方案教条式方法以“经验性”为幌子,认为样本容量应该是“为保证精度,一般至少应该是总体的5%”简单易行,但不是一种高效率、经济的方法,教条式方法忽略了抽样的精确度问题。48约定式方法认为某一个“约定”或某一个数量就是正确的样本容量。样本容量是一个恒量,不受总体容量的影响,但也是其缺点,总体容量可能少于恒量;精度的要求也会发生变化49成本基础法将成本作为确定样本容量的基础。样本容量的确定不是将调查所获得的信息的价值作为首要考虑因素,而是把预算作为考虑因素,通常会忽视调查结果对管理决策的价值。思考:如何才能在不考虑成本的情况下确定样本容量?50传统统计方法运用以下概念来创见一个有效的样本。总体标准差的估计值抽样误差的允许范围抽样结果在特定范围内的预期置信度51

由于我们将在某一给定误差界限下,阐述样本容量确定的过程,所以有必要复习一下置信区间的概念。

对于具有正态分布的估计量来说,95%的置信区间意味着在同样的条件下,反复抽样100次所得的100个样本中,有95个样本的估计值所确定的区间包含总体真值,这个区间以样本的估计值为中心,半径为1.96倍的标准误差。1.置信区间522.误差界限误差界限是标准误差的倍数zt标准误差是估计量抽样方差的平方根乘数因子取决于在调查估计中所希望达到的置信水平(或称置信度/概率度)53对于估计值t,在给定其标准误差t的情况下,置信区间的公式可以表示为:(t-ztt+zt)

这里zt是误差界限,z是对应于某一置信水平的标准正态分布的分位点值该z值可从标准正态分布表中查得,大多数统计学教材中都附有这样的统计表54常用的z值包括对于90%的置信度,对应的z值为1.64

对于95%的置信度,对应的z值为1.96

对于99%的置信度,对应的z值为2.5655

3.多大的抽样方差是可接受的

调查估计值能容忍多大的不确定性?常用的95%的置信度、±5%的误差界限对我们的调查目标是否适宜估计值是否需要更高(或更低)精度如果调查结果将用于进行一项有重大意义或有较大风险的决策,那么,估计值可能需要较高的精度;如果我们只是简单地希望取得所研究总体某个特征的感性认识,那么,稍低一点的精度就可以满足要求了

56多大抽样方差是可以接受

是否需要对调查的子总体(或称作域)进行估计?

调查结果可能需要包括一些细分的数据这些数据称为子总体估计值(或域估计值)为使数据满足调查要求,应该确定合适的精度

与调查估计值有关的抽样方差有多大?57

对于不同的子总体,对精度的要求可能有所不同例如,在一次全国范围的抽样调查中,对国家层次的数据,调查主办者可能需要±3%的误差界限;但对于省级层次的估计值,±5%的误差界限可能就可以满足要求;而对于省级以下层次的估计值,±10%的误差界限可能就足够了。58在这种情况下,通常对每个研究域都进行分层,并单独计算各层的样本容量将各个研究域中所有层的样本容量相加,便得到了调查所需的总样本容量59调查估计值有关的抽样方差有多大

为达到调查结果要求的精度,最小的调查估计值是什么?假设我们进行比例估计。其中,一些指标的比例可能是P=50%或更高,但是其它指标的比例则可能较低,如P=5%或者P=10%

事实上,P可以是P=0到P=1.0之间的任一数值。在确定调查估计值所需的精度时,应该考虑当某个既定精度达到时所得的最小估计值。如果最小的估计值是P=5%,那么误差界限就应该小于5%。60例如:某公司决定,如果公司所在的地区中,至少有P=4%的人群对某一种产品存在需求,那么该公司就决定生产这种产品。因此,该公司的市场调研部准备对当地的居民一项调查,以便估计他们在这种产品上的消费需求。对于P=4%±5%水平左右的调查估计值就不太合适,应规定更小的误差界限,如小于或等于±0.01、±0.02等,这时候置信区间应该是(0.05±0.01)或(0.05±0.02)。61最佳的解决办法

不应为追求最小的误差界限而选择最大可能的样本可以接受一个较大的误差界限,同时有效地利用现有资源在此基础上,获得具有相对较高精度的估计结果采用一个较小的样本而不是大样本而节省下来的费用,可以用来修正其它影响调查结果精度的因素例如减少无回答率(如回访拒答者、实施小型的试点调查、培训访员,等等),这样做可能更有效率62

计算样本容量时,通常假定采用的抽样方式为简单随机抽样(SRS)。所以,如果样本容量计算公式假定为简单随机抽样。

4.样本设计和估计量

分层抽样得到的估计值通常比相同规模的简单随机抽样更精确,或者至少一样精确。

整群抽样得到的估计值,其精度通常低于使用同一估计量进行估计时的简单随机抽样的估计值的精度63设计效果因子

一般来说,当样本容量的计算公式假定为简单随机抽样SRS,但使用的是更复杂的选样方式时,达到既定精度所需的样本容量应该乘以设计效果因子。设计效果=对于同样规模的样本容量,给定样本设计下估计量的抽样方差对简单随机抽样估计量的抽样方差的比率。

对于简单随机抽样设计,设计效果=1

对于分层抽样设计,设计效果1

对于整群抽样设计,设计效果1

64

5.回答率

所有的调查都会遇到无回答的困扰即:由于某些原因,不能获得被抽中样本单位的信息当一个被调查单位的所有或几乎所有的数据都缺失时,我们就称之为完全无回答(或称单位无回答)某次调查的回答率是用调查得到的有效问卷数占预期样本容量的一个百分比来表示的完全无回答会减少有效样本的数量,从而会增加抽样误差,并进而降低估计值的精度65例如,如果初始样本容量是400,而通过上述途径估计的回答率为75%,那么选择的样本容量就应该为:根据预计的回答率调整样本容量66一个最简单的例子没有无回答的简单随机抽样样本容量的计算公式简单随机抽样下,通常使用误差界限和估计量的标准误来确定所需的样本容量。67在无放回(非重复)简单随机抽样情况下总体均值估计量的标准误差的表达式其中,S

是总体的标准差68如果误差界限设为e,那么:解n,得:这里Z是对应于某一置信水平的标准正态分布的分位点值。69

其中,总体方差S2是最不容易得到的,通常需要根据过去对类似总体所做的研究作近似计算。为确定n,需要知道

期望的误差界限e置信水平(对应的标准正态分布的分位点值)Z总体规模N总体方差S270求比例(成数)样本容量的确定下面用一个例子,说明估计比例问题时样本容量的确定过程。在这一例子中,所需的精度是根据误差界限确定的,所研究的指标取两个值,即P和1-P。在这种情况下,对于大总体,且估计量服从正态分布时,P的总体方差为:71若总体真值已知,那么直接将它代入上面的等式就可以得到样本容量若总体真值未知,而且也没有以前的信息可以利用,那么可以P=0.5用,因为这时的方差最大,可以求得一个比较保守的样本容量72计算比例估计样本容量的详细步骤先计算初始样本容量,然后根据总体的大小、设计效果和回答率分别对它进行调整,最后求得最终的样本容量。73第1步:计算初始样本容量注意,公式(1)使用了有限总体校正因子n/N,对总体规模进行校正。如果忽略这个因子,初始样本容量n1就可以按下列公式计算:如果e

和P都不用比例表示,而用百分数表示,

n1的计算公式同样成立。74第2步:使用下列等式对总体的大小进行调整75

第3步:设计效果调整样本容量如果样本设计不是采用简单随机抽样,那么可以使用下列公式,即用抽样设计效果对样本容量进行调整:其中,是设计效果,并且有:在简单随机抽样设计下,B=1,在分层抽样设计下,B1,在整群抽样设计下,B1。76根据无回答再次进行调整,以确定最终的样本容量n其中,r=估计的回答率。

第4步:无回答调整样本容量77样本容量确定的例子下面用实例说明样本容量的计算过程。

例1.

某杂志出版商希望得到读者对该杂志综合满意程度的估计值。通过邮寄调查,出版商可以联系到所有的2500个订户。但是,由于时间的限制,出版商决定使用简单随机抽样进行电话调查。请问应访问多少个读者?78如果真实的总体比例落在总体比例的样本估计值的0.10范围内,则该出版商将感到满意。换句话说,误差界限e为0.10。出版商希望调查估计值的置信度为95%,这就意味着20次抽样中只有1次,所得的样本估计值确定的置信区间不包含总体真值P,而且,Z=1.96。使用简单随机抽样SRS。估计回答率为65%,即r=0.65。由于事先没有关于顾客满意度真实比例P的可利用的信息,因此,我们假定方差取最大的情况,即假设P=0.5。假设79样本容量的计算步骤第1步:计算初始样本容量n1

注意,随着P

趋向0.50,P(1-P)

的值将达到最大值,因此选择P=0.5,可得到最保守的n1的估计值。80第2步:调整初始样本容量将总体的大小这一影响样本容量确定的因素也考虑进来。 (记住,这一步只适于小规模总体以及中等规模的总体)81第3步:根据抽样设计效果来调整样本容量对这个例子来说,由于假设使用简单随机抽样设计,所以取B=1。82第4步:根据无回答情况进行调整确定最终的样本容量n83例2.现准备实施一项民意调查,以决定赞成建立一个公园的居民的比例。总体由所有在两个城市和一个农村地区居住的、年龄在18岁及以上的居民组成。通过从每个城市或农村中各抽取一个简单随机样本,可以得到一个分层随机样本。问:每一层需要多大的样本容量?84总体的单位数为657,500总体在各层的分布情况如下:H层

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论