版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、样本设计 SAMPLE DESIGN,Ch11& Ch12,【案例】 谁会是下一任美国总统?,在社会科学研究中,美国大选前的民意测验对抽样方法的发展起到了重要的推动作用。文学文摘杂志于1936年进行的总统选举结果预测就是一个经典的例子。 为了预测1936年美国总统选举结果,文学文摘开展了一项庞大的民意测验,寄出1000万份问卷,收回了240万份问卷。 电话薄和车牌登记名 该调查结果预测共和党候选人兰登 (Landon) 将以57对43击败民主党候选人罗斯福,但实际结果是兰登以38对62败北。这项耗资巨大的调查使该杂志因资金困难和名誉扫地而破产。,营销研究的基本步骤,定义 研究问题,制订 研究计
2、划,收集信息,分析信息,报告结果,抽样的基本概念 抽样过程 抽样设计类型 样本量的的确定 减少不应答,主要内容,样本与普查的比较,抽样的实质,抽样:通过选择一个总体中的某些元素,我们可以得到一个有关全部总体的结论。 元素/要素(element):被测量的主体 总体(population):研究要素的特定集合体 举例:电脑维修服务满意度研究的总体和要素,抽样过程,一、定义目标总体,目标总体必须定义精确,不精确会使研究无效甚至导致误解 是将问题的定义转换成一个精确的陈述的过程 元素、抽样单位、范围、时间 谁应该包括进去,谁不应该包括进去,讨论:目标总体的确定,北京奔驰有限公司要进行一项用户满意度调
3、查,请问:,狗粮测试的目标总体?,二、确定抽样框架,抽样框架(sampling frame)是抽样总体的可操作性定义,由一份或一组用于识别目标总体的指示说明组成。 在编制抽样框架时常见的问题如下(Kish, 1965:56-59),均导致抽样框架误差: 遗漏遗漏部分样本单位; 重复同一样本单位重复出现; 混杂抽样框架中包括部分非样本总体成员。,过滤问题,过滤问题,为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。 除了某项研究的特殊要求以外,营销研究通常要求研究对象: 过去3个月内没有接受任何产品或广告调查; 本人及家庭成员不在有关的公司工作。,两个基本概念,抽样的最终目的: 通过抽样方
4、法从总体中选择一些要素,并通过对这些要素的描述以精确描述总体的各种特征。 要素:收集信息的单位和进行分析的基础 要素/分析单位,【例】中国女性减肥品市场细分研究:定义总体,目标总体:2009年中国大中城市女性减肥品的现有消费者和潜在消费者 抽样框架:十个代表城市中,A公司销售人员在其产品销售终端可以接触到的年龄在1850周岁之间的女性减肥品现有消费者和潜在消费者,三、抽样设计类型,Non-probability sampling,Cluster,Probability sampling,Multistage area,Stratified,Simple random,Systematic,No
5、n-proportion,proportion,sampling,p213,两种抽样类别,概率抽样:社会科学研究中选取大型和具有代表性样本的主要方式 非概率抽样,通常用于下列情况: 样本量很小时; 探索性研究或研究的初始阶段; 目标总体成员很少或很难寻找; 概率抽样不可能或不合适时,(一)概率样本设计,概率样本设计(probability sample design)采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。 简单随机抽样 系统抽样 分层抽样 整群抽样,概率抽样的原则和优势,概率抽样的原则:总体中的每个个体被抽取为样本的概率相同。这种抽样具
6、有代表性。具有这一性质的样本称为EPSEM(Equal probability of selection method)样本。 概率抽样的优势: 比非概率样本对总体更有代表性 概率理论使我们能构估计样本的精确度和代表性。,随机抽样,随机抽样是概率抽样过程的核心 任何要素都具有等同的、独立于任何其他事件的被抽到的概率 如:掷硬币 方法:随机数表、电脑程序 使用的原因: 避免研究者的偏见 为进入概率理论提供了契机,1、简单随机抽样,简单随机抽样(simple random sampling) 是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率。 若总体为N,样本量为n,则每一
7、抽样单位的抽中概率:p = n/N 机读格式的抽样框 随机数表的应用: 要素的顺序标号 从随机数表的任一列某数开始,选取号码的后几位或几位数来抽取。 可以随意确定选取数字的顺序,但要始终如一,2、系统抽样,系统抽样(systematic sampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。 抽样间距:总体大小/样本大小 抽样比率:样本大小/总体大小 系统抽样时每个样本单位抽中的概率相同,为1/k。 个体按某一顺序排列 顺序与研究特征无关 顺序与研究特征有关, 如:行业中按销售额增序排列,信用卡用户(欠款)余额 个体排序呈现周期性特征, 如:对一个班一个班的方式编排的士兵抽样(
8、班内按级别排),楼宇抽样 讨论:什么时候应避免采用系统抽样?,3、分层抽样,分层抽样(straitified sampling) 同质总体抽样比异质总体抽样的误差小 确保总体内同质的次级集合会被抽出适当数量的要素 最终功能在于将总体分成几个同质的次级集合(之间则有异质性),确保每个重要的次级集合终抽出适当数量的样本。 先根据分层变量将总体分成不同的层, 层中抽样有两种方法: 比例分层抽样 按该层在总体的相对比例从各团体终抽出样本 非比例分层抽样 每层抽的样本量与该层的相对量成正比, 且与该层个体当中需要研究的特征分布的标准差成比例,分层抽样与配额抽样的区别,4、整群抽样(cluster sam
9、pling),不可能或不方便编制一个完整的个体名单形成目标总体的时候,采用。 没有总体的个体列表,抽样框架是群 要素已经被分为较小的次级团体,而次级团体中的要素名册是存在的或可以列出的。 教会成员:全国教会名册单个教会会员名册 城市人口:街道样本街道的居住人口名册 单阶段整群抽样 两阶段抽样的两个步骤:列表名册抽样 先分群,然后将不同类别的个体放到一个连续性的表中,在对整个列表进行随机起始的系统抽样 适用于各群在量上相等时 有点:可行性高,成本低 两次抽样误差:群的代表性误差,要素的代表性误差,相互制约(样本量一定) 当被抽样的群的规模很大时,应采用修正的抽样设计概率比例抽样。即每个群被选取的
10、概率与其大小成比例。,整群抽样与分层抽样的关键差别 1、目的的不同 2、操作的不同 3、层与群的标准相反,讨论,如果某校有1000名本科生,400名普通硕士生和600名MBA学生,若要比较不同类别学生对教学的满意度,请问: 应采用哪种抽样方法? 总体满意度应如何计算?,(二)非概率抽样技术,依赖于研究人员的个人判断而非随机原则选择样本个体,事先并不确定每个样本单位被抽中的概率。 便利抽样 目标式或判断式抽样 滚雪球抽样 配额抽样,1、方便抽样,例如:学生样本,不加资格认证的商场拦截访问 经常使用 但非常冒险 采取更少冒险性的抽样不可能时,才有其合理性 做推论时要非常小心,提醒读者 可用于专题组
11、预测试问卷等,2、目标式或判断抽样,便利抽样的一种形式 根据对研究目的的判断来选择适当的抽样方法 如根据对总体构成要素和研究目标的认识 如:试销市场,B2B市场中的采购工程师,法庭上使用的陪审团,3、滚雪球抽样,在特定总体的成员难以找到时,最合适 程序: 先选择一组最初的调查对象(目标群体少数成员) 再向其访谈有关信息 要求推荐他们认识的其他总体成员 样本方差和成本相对较低 如:研究流动劳工、非法移民等,4、配额抽样,强调样本的代表性 两个极端的有约束的判断抽样 程序: 建立描述目标总体特征的不同类别个体的配额 每个配额有相应的比例 如性别,年龄等 根据研究目的从不同配额中抽取样本 唯一的要求
12、:个体必须符合控制特征 各自相对于总体的比例:同/不同 缺陷: 配额的框架必须十分精确。但, 包括多项控制特征在实际操作红往往比较困难,相关的控制特征经常被忽略。 每个配额内的个体是在便利或判断的基础上选出,会存在偏误,【例】中国女性减肥品市场细分研究:样本设计,抽样方法:配额抽样 样本城市:北京、广州、深圳、昆明、贵阳、重庆、成都、沈阳、乌鲁木齐、济南 样本总量:每个城市100份,共1000份 配额:实行现有和潜在消费者配额,城市配额,甄选问卷对抽样配额进行控制。,四、样本量的确定,确定样本量的方法可分为两大类: 经验方法:根据业界常规来确定样本的大小 统计学方法:根据统计公式计算样本量,确
13、定了所需的样本量后,还要根据以下因素,调整要抽取的样本量: 发生率:样本总体中符合条件的百分比 完成率:完成访谈的合格对象的百分比,(一)确定样本量的经验方法,最简单的方法是根据研究的类型和经验,以及以下因素确定样本量: 决策的重要性; 研究的性质; 单位成本; 发生率和完成率; 其它。,表2 营销研究中常用的样本量,可支配预算法,可支配预算法,根据进行某项研究可支配的预算,在扣除其他支出后,按单位样本的成本决定样本量。 例:进行某项研究的总预算是50,000元,研究设计、人员培训、问卷测试和数据分析等其它费用共需10,000元,完成每份调查问卷(含数据录入)的平均费用是50元,请问可以抽取多
14、大的样本?,(二)确定样本量的统计学方法,对于概率样本可用统计公式计算所需样本。这时样本量与下列因素有关: 样本设计类型; 要求的精度; 总体内部的同质性; 分组的详细程度。,几个概念,参数:对总体中的某变量的概括性描述 当从样本开始进行推论时,就是试图用样本观察来估计总体的参数统计推断,概率理论为估测总体参数提供基础 统计量: 对样本中的某个变量的概括性描述 有限总体校正: 样本量占总体量10%以上,估计值过高 校正因子(N-n)/(N-1) 置信区间(confidence interval): 对于一个给定的置信水平,真实的总体参数将会落入的范围 置信水平(Confidence level
15、): 置信区间将包括总体参数的概率 例子:95的信心保证样本统计值会落在参数值正负5的范围内,Symbols for Population and Sample Variables,抽样分布,抽样分布: 如果根据一个特定的抽样方案,从总体中随机抽取许多独立的样本,其相应的统计结果以一种可知的方式分布在总体参数的附近。 10人抽样分布举例 样本容量与估计平均值的抽样分布之间的关系 均值的抽样分布和比例的抽样分布: 对于大样本,正态分布,抽样分布的重要性质,概率理论提供计算公式,估计样本统计值和真实值之间的差距 标准差S(标准误):用来衡量抽样结果集中在总体参数的多大范围内 均值的标准误: = /
16、n*0.5 =s/n*0.5 (总体的方差 未知,用统计量估计) 比例的标准误: S=((P*(1-P))/n)*0.5 (总体比例未知,用样本比例来估计),几个推论,每个例子中的标准误,是总体参数与样本大小的函数 总体参数特征的影响 样本容量的影响 直接影响样本量的是总体中特征的差异性(总体方差或样本方差),以此计算样本量,正态分布、Z值及其应用(P244:附录12A),Z值:抽样分布下任意两点之间的面积用Z值计算 Z=(X-u)/ 某一点的Z值指的是以标准差为单位表示的该点与均值的差值 一定比例的样本估计值会落在总体参数值的某个增量内。一个标准误为一个标准误增量单位(34) 。 正态分布的
17、变量的全距大约是正负3个标准误,对应的均值和Z值为1.0,2.0,3.0的各点之间的双侧面积为68、95、99.9 估计标准差:全距/6 找出与已知的X或Z值对应的概率 找出与已知概率对应的X或Z值,正态概率表,确定样本量的统计学方法: 置信区间方法,以传统的统计推断为基础 精确度是预先指定的 使用标准误公式构建围绕样本均值或比例的置信区间为基础的 置信水平与置信区间也提供了决定研究样本大小的基础P231 关于抽样结果准确度的所有叙述都必须这两个数值表示,95% Confidence Interval,假设研究人员用一个300 户家庭的简单随机样本估计每月在百货商店购物的指出,并发现该样本的平
18、均家庭月支出182美元,过去的研究指出,总体标准差假定为55美元,估计均值时样本量的确定,对于简单随机抽样:(估计月家庭支出) 1. 确定允许误差D,d = $5.00 2. 确定置信水平CL, CL = 95% 3. 确定与置信水平相应的z值,z = 1.96 4. 确定总体的标准差s(通过一个初步研究估计:全距/6), s = 55 5. 计算所需样本量n, n = s2z2/d2 = 465 6. 当样本量超过总体的5%时, nc = nN/(N+n-1),估计比例时样本量的确定,对于简单随机抽样(如:估计拥有一种百货商店卡的家庭比例) 1. 确定允许误差D,d = .05 2. 确定置信水平CL
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年兰州资源环境职业技术大学单招职业倾向性考试题库带答案详解(黄金题型)
- 2026年内蒙古阿拉善盟单招职业倾向性测试题库附答案详解(综合题)
- 2026年内蒙古电子信息职业技术学院单招职业适应性考试题库及1套参考答案详解
- 2026年南昌影视传播职业学院单招职业适应性测试题库附参考答案详解(完整版)
- 2026年兰州科技职业学院单招综合素质考试题库含答案详解(黄金题型)
- 2026年内蒙古北方职业技术学院单招职业适应性测试题库附答案详解(完整版)
- 2026年包头钢铁职业技术学院单招职业倾向性考试题库附参考答案详解(a卷)
- 2026年南京城市职业学院单招职业倾向性测试题库附答案详解(轻巧夺冠)
- 2026年保定理工学院单招职业倾向性考试题库及一套完整答案详解
- 中式烹调师安全生产知识考核试卷含答案
- 【新教材】2026年春季人教版八年级下册英语 Unit 8 Making a Difference 教案(共9课时)
- 交通行业驾驶员安全驾驶与行车记录考核表
- 甘肃天水仙人崖课件
- 2026年春季学期全体教师大会校长讲话:点燃新学期教育奋进之力
- 零碳园区建设与实践指南
- 监狱安全防范教学课件
- 2026年初中物理中考必背复习提纲
- 手部关节损伤的人工关节置换
- 标准日本语高级课件
- 2025年中考语文真题分类汇编专题《综合性学习》
- 护理院入住协议书
评论
0/150
提交评论