市场调查-第六章抽样技术_第1页
市场调查-第六章抽样技术_第2页
市场调查-第六章抽样技术_第3页
市场调查-第六章抽样技术_第4页
市场调查-第六章抽样技术_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样技术 主要内容 一 抽样在市场调查中的作用 二 随机抽样技术 三 非随机抽样技术 四 抽样中几个基本问题 本章要求 正确理解抽样调查的有关基本概念 掌握随机抽样和非随机抽样技术 在抽样的实施中掌握防止误差的实用技术 第一节抽样在市场调查中的作用 本节要求 了解市场普查和抽样调查的意义以及抽样调查的特点 掌握总体和样本 总体指标和样本指标 抽样单元和抽样框 抽样误差和非抽样误差等概念 市场调查的目的是获取研究总体的信息以及特征 一般来讲 有两种方法可以采用 一是市场普查二是抽样调查 一 市场普查 一 市场普查意义市场普查是以市场调查总体中每一个个体单位为研究对象 对每一个个体单位一一做调查 如我国定期举行的人口普查 2004经济普查 1市场普查耗费大量的人力 物力 财力 2市场普查需要花费较长的时间 3市场普查不能确保达到预期的准确性要求 二 市场普查的局限性 三 市场普查的困难 市场普查除了具有以上的局限性之外 还在操作实施过程中存在一定的困难 例如总体中的有些个别对象难于接触无法进行调查 如有些对象居住在孤岛 高山上 有些对象是传染病患者等等 二 抽样调查 一 抽样调查的意义抽样调查是指从总体中抽取能代表总体的一部分 即样本 进行调查 然后根据样本中所包含的信息对总体的状况进行估计和推算的一种市场调查方法 包括随机抽样调查和非随机抽样调查两种 在抽样调查中 必须解决如下的问题 采用什么样的方法抽样才能使样本具有代表性 如何由样本对总体进行估计和推算 如何估计抽样误差 如何保证抽样过程的正确实施 思考题 针对普查的局限与不足 请思考抽样方法和普查相比较有什么优越性 1 费用省 易推广 由于只对总体中的部分个体进行调查 所需费用显然大大减少 为一般企业所能够承受 二 抽样调查的优越性 2 时间短 收效快 由于样本容量较小 调查所需的时间也较短 这就能够在不长的时间内完成资料收集及数据统计工作 保证调查的时效性 3 质量高 可信程度好由于样本容量较小 调查工作量较少 便于精心组织 可对访问员进行更好的训练 更好地控制调查过程 以确保调查质量 4 抽样调查易于增加调查深度 1 总体和样本总体指的是市场调查所研究对象的全体 样本由从总体中抽取的部分个体所组成 三 抽样调查的基本概念 上海市洗衣机市场拥有率调查 如何确定总体和样本呢 上海市所有家庭户就构成了调查的总体 其中 被抽中的某一居委会中的居民户就构成了一个样本 例如 调查某学校学生的平均月生活费收入和支出 采用抽样调查方法 如何确定总体和样本呢 该校全部学生构成了调查总体 而抽中的那部分学生构成了样本 例如 总体指标就是调查的目标量 也就是总体的有关参数 是根据总体各个体标志值综合计算的综合指标 样本指标就是根据样本中各个体标志值计算的综合指标 2 总体指标和样本指标 抽样单元是指对总体进行划分后得到的每一部分 抽样单元是可以分级的 例如在上海市洗衣机拥有率调查中 建立了区 街道 居委会的三级地区居民数据库 那么各区就是一级单元 在每区中又可分成较小的街道 这就是二级单元 下面还可把居委会作为三级单元 3 抽样单元和抽样框 要从总体中抽选单元 必须有一个包括全部单元的框架 我们把这它称为抽样框 抽样框应该包括几个部分内容 识别资料 如姓名 身份证 等联系资料 如电话号码 地址等辅助资料 如性别 年龄 文化程度等 抽样框的主要类型有两种 名录框 如电话号码簿 邮政编码册等区域框 如地图等 4 抽样误差和非抽样误差 抽样误差 利用样本估计总体时产生的误差 非抽样误差 由于人为的差错而造成的误差 第二节随机抽样技术 本节要求 正确理解随机抽样的意义 掌握抽签法 乱数表法 计算机随机程序法的实际实施方法 基本掌握总体均值和比例的估计及抽样误差的估算 了解样本含量确定的基本方法 五 多级随机抽样 三 分群随机抽样 二 分层随机抽样 四 等距随机抽样 一 简单随机抽样 议题 随机抽样的形式 一 简单随机抽样 简单随机抽样是最基本的一种抽样方式 是指从含有N个抽样单元的总体中 随机抽取n个单元为样本 使每一个单元都有相同的机会被抽中 即都有相同的入样概率 Eg 从6张卡片中抽取2张组成一组 思考共有几种抽法 简单随机抽样两种操作方法 从总体中逐个无放回地抽取单元 直到抽足 个为止 这是一种不重复的抽样 从总体中逐个有放回地抽取单元 直到抽足 个为止 这是一种重复的抽样 当总体中的单元数 非常大 所抽取的样本单元数 相对又比较小 有放回和无放回的抽样误差几乎是一样的 否则两者还是存在差异 简单随机抽样的具体抽样方法 1 直接抽签法 2 随机数表法 3 计算机随机数程序法 操作 先把总体中的每个单元编上不同的号码 写在签上 将签充分搅拌均匀 从中任意抽取一个号码 将对应的单元选入样本 直到抽足预先规定的样本数目 为止 操作 先将总体中的每个单元编上不同的号码 根据最大编号的位数 确定使用若干位数字 然后查乱数表 先在乱数表中任意选定一个数字作为开始数字 随后向任何一个方向连续摘取数字 得出一系列规定位数的数 凡编号范围内的数对应的单元即被入样 如果不是重复抽样 碰上重复的数应舍去 直到抽足预定的样本数目 为止 操作 简单随机抽样还可以方便地应用计算机随机数程序 起动这一程序 在计算机屏幕上将连续出现随机数 由此可以确定入样单元的编号 简单随机抽样优点及局限性 简单随机抽样方便 简单易行 调查总体较庞大 个体非常多 逐一编号几乎是不可能的 如果总体标志变异程度大 简单随机抽样的代表性就差 由于随机抽选的样本分散 所以调查成本比较高 简单随机抽样一般适应调查总体中各个体之间差异较小 或者调查对象不明 难以分组 分类时的情况 如果市场调查范围较大 总体内部各个体之间的差异程度较大 则要采用其他抽样方法 简单随机抽样的适用条件 二 分层随机抽样 分层比例抽样法分层最佳抽样法 分层随机抽样是先将总体所有单位按某一重要标志进行分层 类 然后在各层 类 中采用简单随机抽样方式抽取样本单位的一种抽样技术形式 在划分层次时应注意 各层次内部保持确定的同质性 而各层次之间又应有明显的异质性 1 分层比例抽样法 分层比例抽样法 指各层抽取的样本单元数是按各层单元数占总体单元数的比例加以确定 某地共有居民4000户 按经济收入水平高低进行分层 其中高收入的居民占20 为800户 中收入的居民占总体的60 为2400户 低收入居民占20 为800户 某公司拟调查某种商品在该地区的销售前景 因该商品的消费与居民的收入水平有关 故以经济水平高中低分层并采用分层抽样法 抽取的样本单元数为200户 各层抽取的样本单元数如下 分层比例抽样法 demo 分层比例抽样法 高收入层抽取的样本单元数为 200 20 40 户 中收入层抽取的样本单元数为 200 60 120 户 低收入层抽取的样本单元数为 200 20 40 户 在各层抽样时 只需采用简单随机抽样法即可 2 分层最佳抽样法 由于不同层次所含单元的差异程度是不一样的 有的层次差异较大 有的层次差异较小 如果都按同样的原则来分配样本单元数目就不尽合理 一般 差异小的层次应取较少的样本单元 差异大的层次应取较多的样本单元 因为层次中个体单元的差异程度是可以用该层的标准差予以反映的 于是提出了以各层次标准差与该层单元数之积为权重来对样本单元数进行分配的又一种分层抽样方法 ni是各层应抽取样本单元数 n是样本单元总数 N是各层的单元数 s是各层单元的标准差 上例中改用分层最佳抽样法 设各层样本标准差分别为150 100 50可得表所示的数据 各层单位数与各层样本标准差乘积计算表 分层最佳抽样法 高收入层抽取的样本单元数为 中收入层抽取的样本单元数为 低收入层抽取的样本单元数为 分层最佳抽样法 分层随机抽样优点和适用条件 三 分群随机抽样 分群随机抽样是指将总体各单位划分成许多群 然后用简单随机抽样方法从中抽取部份群 对中选的群中所有单位逐个进行调查的一种抽样调查技术形式 分群随机抽样的优点和适用条件 四 等距随机抽样 等距随机抽样是先按某一标志对总体各单位进行排队 然后按一定的间隔来抽取样本单位的一种抽样技术形式 间隔是根据总体单元数和样本单元数来确定的 要用等距随机抽样法从总体的N个单元中 抽取容量为 个单元的样本 可先对总体中的N个单元进行排列编号 在这一基础上 求出每两个样本单元之间的距离K K采用最接近的一个整数 用抽签法或随机数表法随机地在1至N之间确定一个数 如这个数为i 则对应编号为i的单元入样 然后编号依次增加K 得出其他样本单元 依次的编号为 等距随机抽样 demo 等距随机抽样 demo N 721 n 10 K 721 10 72 某居委会拥有居民721户 在某次市场调查中需在这一居委会中抽取10户样本单元 采用等距随机抽样法 用随机数表法 如果第一个确定的数字为102 则各样本单元编号依次为 102 174 246 318 390 462 534 606 678 29 其中最后一个编号应为678 72 750 因大于N 故减去721 实际编号取为750 721 29 等距随机抽样特点和适用条件 如果抽选间隔和被调查对象本身的节奏性 循环周期 相重合时 会影响调查的精度 等距抽样一般适用于调查总体标志变异程度大 而又不能抽选更多样本个体的情况 等距抽样与简单随机抽样相比 可使抽中的个体比较均匀分布在调查总体中 减少误差 五 多级随机抽样 多级随机抽样是先把总体划分为若干一级单元 再把各个一级单元划分为若干个二级单元 直至不再划分的个体单元 在抽样时 先用简单随机抽样方法抽取部分一级单元 再在抽中的一级单元中抽取部分二级单元 依次操作 直到抽得个体单元为止 多级随机抽样 demo 多级抽样特点和适用条件 多级随机抽样在抽取样本及组织调查时很方便 但在设计抽样调查方案 计算抽样误差和推断总体上比较麻烦 在许多情况下 特别是在复杂的大规模市场调查中 抽取的个体一般不是一次性直接进行的 通常采用两级或多级抽样办法 第三节非随机抽样技术 非随机抽样是指在抽样时不按照随机原则 而是由调查者根据调查目的和要求 主观设立某个标准从总体中抽选样本的抽样方式 非随机抽样主要有四种具体方式 方便抽样是根据调查者的方便与否 以尽可能使调查对象对总体具有代表性为原则的一种调查方法 任意抽样的可行性在于假定调查总体的各个个体单元对调查目标而言具有同质性 一 方便抽样 任意抽样 方便抽样法任意 方便地选择访问对象 因此 简便 费用又低花时少 调查的偏差较大 可信度较低 方便抽样法一般要适用于个体单元对调查目标而言具有同质性 注意选样中增加筛选访问对象的程序 方便抽样的特点和适用条件 二 判断抽样 是指市场调查者根据自己的主观判断经验和知识 从总体中选择具有典型代表性的单位作为样本的一种抽样方法 判断抽样法的特点和适用条件 要求调查者对总体情况有一定的经验积累资料掌握 由于主观判断的偏差必然会导致抽样偏差 抽取样本数较少 问卷回收率也较高 总体中存在典型单位 适合用判断抽样 三 配额抽样 它是先按照市场调查对象的某种特征 将总体分为若干类 然后按一定的比例在各类中分配样本单位数额 并按各类数额在每类中任意或主观抽样 在实际市场调查中可以针对各个指标所得分层规定样本数 这里分两种情况 一种是各层之间没有相互束约 另一种是各层之间有相互交叉 一 独立控制配额抽样独立控制配额抽样 对于各个分层指标单独规定样本的配额 各层的配额相互独立无约束关系 在某项市场调查中 需抽取200个样本单元 可按性别 年龄 月均收入三个指标单独规定配额如表所示 二 交叉控制配额抽样 交叉控制配额抽样和独立控制配额抽样的不同之处在于按各指标分层后 各层抽取的样本单元数相互之间有制约关系 这种制约关系往往应用交叉控制表予以反映 操作时只需按控制表中的规定要求及数额抽取样本单元 在某次市场调查中 需抽取200个样本单元 现按性别 年龄 月均收入三个指标交叉规定配额如表所示 是通过以一触十 以十触百 类似 滚雪球 的方式抽取样本 运用这种方法的前提是样本单位之间具有一定的联系 是在不了解总体的情况下去了解总体的一种方式 适用于特殊群体的调查 四 滚雪球抽样 第四节抽样中的误差问题和样本量的确定 一 抽样中几个具体问题 如果我们的学生是一名访问员 当他按公司设计的抽样方案来到某一小区每室居民户时 敲开房门第一个要碰到的问题就是究竟访问哪位 是随便找一位还是有具体的操作技术 这是本节课前首要解决的问题 一 入户访问对象的确定方法 二 实际访问时误差产生的原因 1 样本选择误差2 无反应误差3 访问误差 三 实际访问时误差的防止 严格甄选访问员加强对访问员的职业道德和业务能力的培训加强现场的监控加强现场监导加强复查 常用的总体指标有总体平均数 总体标准差 总体比例 和总体比例标准差 常用的样本指标有样本平均数 样本标准差 样本比例 和样本比例标准差 二 简单随机抽样条件下总体均值和比例的估计及抽样误差的估算 一 总体均值和比例的估计 1 总体均值的估计 设总体 含有 个单元 总体均值为 在简单随机抽样中 样本含量为 则可用样本平均值作为总体均值的估计值 2 总体比例的估计 设总体含有 个单元 其中有N1个单元具有某种特性 那么总体中含有该种特性单元的比例样本含量为 其中具有该种特性的单元数为n1 则可以用样本比例作为总体比例的估计值 从某区50家超市中随机抽取10家超市 他们的日销售量分别为51 67 45 37 81 49 72 65 43 75万元 1 试求该区超市平均日销售量的估计值 2 试求该区销售量低于60万元的超市比例的估计值 例如 解 1 样本的平均日销售量 的平均值因此 可用 58 5万元作为该区超市平均日销售量的估计值 2 样本中日销售量低于60万元的超市有5家 因此 样本比例因此 可用p 50 作为日销售量低于50万元的超市比例的估计值 二 抽样误差的估算 1 总体均值的抽样误差在不重复随机抽样情况下 均值的抽样误差有如下的计算公式 其中 表示均值的抽样误差 S表示样本标准差 N表示总体单元数 表示样本单元数 重复随机抽样情况下 均值的抽样误差有如下的计算公式 其中 表示均值的抽样误差 S表示样本标准差 表示样本单元数 例如 某饮料公司进行一次居民户平均饮料消费量的抽样调查 在总体10万户居民家庭中 抽选样本2000户 已知 样本标准差为2 5升 试求在重复抽样和不重复抽样条件下的抽样误差 解 N 100000 户 2000 户 S 2 5升设 为抽样误差 1 在不重复随机抽样条件下 2 在重复随机抽样条件下 比例的抽样误差和均值的抽样误差有类似的公式 不同之处是用代替S 其中p是样本比例 在不重复随机抽样情况下 比例的抽样误差有如下的计算公式 其中 表示比例抽样抽差 P表示样本比例 N表示总体单元数 n表示样本单元数 2 比例的抽样误差 在重复简单随机抽样情况下 比例的抽样误差有如下的计算公式 其中 表示比例抽样误差 P表示样本比例 n表示样本单元数 例如 从总体10万户居民中抽取2000户调查 发现饮用果汁饮料的户数为450户 求其抽样误差 解 N 100000 户 n 2000 户 P 设 为抽样误差 则 在不重复随机抽样情况下 在重复随机抽样情况下 例题 随机抽选某校学生100人 调查他们的体重 得到他们的平均体重为58公斤 标准差为10公斤 问抽样推断的平均误差是多少 已知 解 例题四 一批食品罐头共60000桶 随机抽查300桶 发现有6桶不合格 求合格品率的抽样平均误差 已知 则 样本合格率 根据概率原理 用一定的概率可以保证抽样误差不超过某一给定的范围 这一范围称为允许的抽样误差 t t是概率度 概率度和概率F t 置信度 成正比 在概率表中可以查表 3 抽样调查的允许误差 误差范围 其中 t代表概率度 F t 代表概率 通过查概率表查得 t 1时 F t 68 27 t 1 645时F t 90 t 1 96时F t 95 t 2时 F t 95 45 t 3时 F t 99 73 说明了在一定的抽样误差条件下 概率度t越大 误差允许的范围就越大 则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论