




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
修正调研数据 扩展使用限度(下)2010年07月02日 | 用户研究如何加权单变量比例加权 为了比较初级买家与高级买家之间对某一产品的体验差异,采用非等比随机抽样,事先增加了高级买家的抽中比例。 当需要推及总体买家对这一产品的体验情况时,需要对数据进行加权,结果如下:上表第d列 (S/P) 是用各级别买家在调研样本中占的比例除以其在总体中占的比例,其值越接近1,说明该级别买家在调研样本中的比重越合适;反之,其值越背离1,其在调研样本中的比重越不合适。 若恰巧各组的这一比值均接近1,可以近似等同总体分布,而不对调研样本进行加权。本例显然需要对调研样本进行加权。 首先要确定加权的起点在哪里?这里有三种选择: 1)以S/P的最小值(本例0.69)为起点,将其他组的S/P值都降低到这个水平,因此叫做Scale-down weighting(“水落石出”法)。其结果是将原调研样本缩小S/P最小值倍(本例0.69,原调研样本7200人,每组权重为0.69/d列相应值,加权后减至4968),放水过多,不合适 2)以S/P的最大值(如本例的8.33)为起点,将其他组的S/P值都提高到这个水平,这种策略叫做Scale-up weighting(“水高船涨”法)。其结果也就是将原来的调研样本放大S/P最大值倍(本例8.33倍,原调研样本7200人,每组权重为8.33/d列相应值,加权后会增至59976人),可见水分太大,不可取。 3)以S/P的加权平均值为起点,将大于1的S/P值调低至1而将小于1的S/P值调高至1,因此叫做Zero-sum weighting(“有增有减但总数不变”法)。加权后的样本数与原调研样本相同、还是7200(见表第f列)。可见这种方法相比之下最合理,学术界和调查业界通常都用它来加权。比例加权需要注意的几个问题: 1)加权只能调整样本各组之间的相对比例、并不会产生任何新的信息。2)一个重要细节是如果S/P值中有小于0.5(也即P/S值或权数大于2)的,则不能靠过分灌水来解决问题。这时的对策有三个: l 增加那些采样不足的(under-sampled)组别的case数量(上策) l 用S/P值最小值(Scale-down的策略)来加权(最保守、浪费资源、但不犯I类错误) l 前两者的结合,即增加部分case数然后按新的最小S/P值来加权3)如果那些采样不足的(under-sampled)组case数量太少(一般不能少于30),需要按2)同样的原则来处理。对于2)和3)中提到的情况,另外一种变通的方法就是重新划分组,此法省时省力。4)经过加权的样本,能够推算总体的常规统计量,但计算误差时则不能用加权样本直接计算。5)为了便于解释,上述例子只涉及一个变量(买家级别)的加权。实际上,研究买家除了级别,注册时长、月成交量/额等也很重要。所以需要用多个变量同时加权 (weighted by several variables simultaneously)。(本小节以上内容参考了香港城市大学祝建华博士的BLOG文章如何对样本进行加权?/post.2695611.html,在此表示感谢,愿祝老师健康、笔耕不辍!)总结一句话:在随机抽样的前提下,比例加权的本质就是将调研样本分布修正为等比随机抽样分布。如何加权单变量推及量加权为什么用推及量加权: 1) 上小节提到的获取总体参数的变通方法:在总体中用简单随机抽样抽取一定数量的样本,能够获得一个较大的样本,用来推及总体依然带有少许误差。用加权处理的调研样本推及这个大样本群体的行为和态度更为恰当,有时候需要直观的知道这个大样本群体中每种划分的组内有多少人。2)比例加权的运算方法有些麻烦;而推及量加权的运算方法简便。推及量加权的依据: 1)加权的前提与比例加权相同:修正非等比随机抽样NPPS和等比随机抽样PPS2)两种方法等价: 比例加权:Pn%/Sn%推及量加权:Pn/Sn=(Pn%*P)/(Sn%*S)=(Pn%/Sn%)*P/S 由于每一组case相对于比例加权都扩大了P/S倍,即每一个样本都扩大了P/S倍。绝大部分研究结果都以比例呈现,而计算比例的时候,每一个样本扩大的P/S倍没有影响,因此推及量加权适用。 推及量加权需要注意的事项与比例加权相似,此不赘述。如何加权多变量推及量加权加权的步骤和方法相同单变量加权时,以买家级别组为例,需要分别统计三组的总体比例(量)和调研样本的比例(量) 多变量加权时,各个变量进行交叉,如三组级别、三组注册时长、三组月成交量,即组合出27组,分别统计这27组的总体比例(量)和调研样本的比例(量) 总结一句话:多变量加权实际上就是单变量加权的复杂版。如何加权实际操作通过EXCEL和SPSS对数据进行加权:1)通过SPSS计算总体中大样本的有关参数和调研样本相应的统计量2)将结果放入EXCEL进行整理,注意单变量或多变量交叉后的对应,并批量编写SPS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外贸公司停车位管理制度
- 旅游集团营销管理制度
- 暖通公司员工管理制度
- 个人电动车仓库管理制度
- 危化品购销运输管理制度
- 培训班安全制度管理制度
- 学校一生一特长管理制度
- 互联网公司培训管理制度
- 景区文物安全管理制度
- 2025年年3D打印耗材项目规划申请报告
- python入门培训课件
- 广东开放大学2024秋《大学英语(B)(本)》形成性考核第一次大作业(主观题)参考答案
- 化验室的相关管理要点
- 剪刀式登高车安全技术交底
- 职业生涯提升学习通超星期末考试答案章节答案2024年
- 规章制度之培训学校教学管理制度
- 部编人教版小学4四年级《道德与法治》下册全册教案
- 江苏省盐城市2023年七年级下册《数学》期末试卷与参考答案
- DB34T 4705-2024 职业健康检查工作规范
- 七年级数学下册 专题 不等式(组)中新定义运算&程序性问题(解析版)
- 《 大学生军事理论教程》全套教学课件
评论
0/150
提交评论