对应分析方法与对应图解读方法.doc_第1页
对应分析方法与对应图解读方法.doc_第2页
对应分析方法与对应图解读方法.doc_第3页
对应分析方法与对应图解读方法.doc_第4页
对应分析方法与对应图解读方法.doc_第5页
免费预览已结束,剩余51页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市场研究中的多变量分析技术/tag/%CA%D0%B3%A1%D1%D0%BE%BF/#entry很多人在从事市场研究和经营分析的时候,特别是定量研究方法需要用到统计分析的时候,到底应该采用哪种分析方法,或者应该用哪种方法更适合这个分析,比较困惑。下面我来总结一下,如何选择多变量统计分析方法来适应研究的需要!请大家记住一句话:选择什么样的多变量统计分析方法,主要是根据变量的测量尺度决定的,更明确的说是根据因变量的测量尺度和类型决定的!这就要求研究者能够在从事项目前明确:研究设计和假设,确认因变量,以及如何测量,测量尺度达到什么等级等要素。1. 首先,市场研究公司不断提升自己的竞争力,希望有能力提供更好的市场洞察力,随着研究机构的经验积累,不光是就数据说话,更应帮助解决企业的实际问题,提供更好的研究咨询和解决方案;2. 另一方面,随着技术的发展,采集数据方法更加多样,从传统的面访到在线调查,甚至也进入商业自动化生成的数据分析;3. 再有,从我的感觉大部分市场研究公司都采用SPSS统计分析软件,部分机构因为特定的客户需求采用宝洁要求的软件,现在其实是SPSSMR产品,当然,SPSS软件版本更新太快了,我从3.0DOS版本开始使用,现在都18版本了,而且支持了中文,其实从我个人角度看,SPSS软件的发展更新进程就是从传统的社会科学研究不断向市场领域迈进,现在很多案例都是市场研究和经营分析的内容,甚至纳入了更多的建模技术,也直接指向了数据挖掘和数据库营销,比如RFM模型,直销模型等都有了。(SPSS18 直销模块)我们看到除了SPSS软件,还有就是SAS软件,当然懂得SAS的人不多,但特殊情况下SAS更有效,比如,在进行实验设计,非标准的正交实验设计,Conjoint Analysis等市场研究核心技术方面,SAS更灵活些! 4. 当然,除了我们看到的SPSS和SAS软件以外,要真正在市场研究中利用好各种分析和模型技术,还需要掌握各种专业软件工具。例如: AMOS/Lisrel软件:主要用于顾客满意度研究,品牌驱动研究等; ACA/CBC/VCA软件:主要用于结合分析(联合分析)conjoint analysis以及离散选择模型等,产品开发等都经常用这些软件; Ucinet/Netdraw软件:是社会网络分析工具,主要用于关系研究,开放题和半开放题、相似性和差异性矩阵等都可以用; Clementine/Miner软件:主要是数据挖掘技术; Xcelsius软件:动态报表和分析报告软件,非常炫的Dashbaord仪表盘工具; 其它工具:Yed、Visio、SmartDraw、Mindmanager、Swiff Chart、AnswerTree、DecisionTime&Whatif等等!除此之外,市场研究的定量分析更关注解决非数理化数据的分析以及可视化技术,还有就是市场研究模型技术!我们还是回到市场研究的多变量分析技术吧!这里的多变量分析技术主要是指统计分析和数据挖掘技术: 描述性统计分析技术 频数分析:主要用于数据清洗,调查结果的Q&A,各种统计量、基本报告数据源等 数据探查:探索性分析主要从统计的角度查看统计量来评估数据分布,主要用于异常值侦测、正态分布检验、数据分段、分位点测算等 交叉表分析:交互分析是市场研究的主要工作,大部分市场研究分析到此为止。主要用于分析报告和分析数据源,各种图表等,宝洁公司要求的很多分析就是完成各种交叉表,制作各种报表,当然其中也有卡方检验和T检验,寻找差异;一般我们采用列百分比进行图表分析,记住:如果交叉表单元格数据比较小需要合并或者不要用百分数来说,直接说值就可以了。 T检验:假设检验方法,主要用来比较两个总体均值的差异是否显著; 方差分析:超过两个总体的均值检验,也经常用于实验设计后的检验问题; 相关分析:线性相关性,只有变量呈现相关我们才能进行影响关系的研究,但记住相关主要是线性相关,不相关并不代表没有关系; 多变量分析技术 回归分析技术:是监督类分析方法,最重要的认识多变量分析的基础方法,只有掌握了回归我们才能进入多变量分析,其它很多方法都是变种。主要用在影响研究、满意度研究等,当然市场研究基本上是解释性回归分析,也就是不注重预测而关注解释自变量对因变量的影响。主要把握R平方、逐步回归、标准化回归系数(当作权重或重要性)等;回归也是预处理技术,缺省值处理等 主成分分析和因子分析:是非监督类分析方法的代表,是主要认识多变量分析的基础方法,只有掌握了因子分析我们才能进入多因素相互关系的研究;主要用在消费者行为态度等研究、价值观态度语句的分析、市场细分之前的因子聚类等,问卷的信度和效度检验等,因子分析也可算是数据的预处理技术。主成分分析与因子分析是两种方法,要能够区分。主成分分析可以消减变量,权重等,主成分还可以用作构建综合排名! 判别分析技术:判别分析是最好的构建Biplot二元判别图的好方法,主要用于分类和判别图,也是图示化技术的一种; 对应分析技术:市场研究非常有用的研究技术,主要分析定类变量,构建二元图,也是图示化技术的一种; Logistics回归技术:分类技术,主要针对因变量是0-1情况下的判别,该技术是我们认识非线性关系的重要基础,很多情况下,我们需要作出是与否的判断,基础模型就是它了,像客户离网分析、客户价值分析、客户信用等都用这个模型; 聚类分析技术:主要用在市场细分方面,但聚类分析本质上不是统计分析,是数据处理技术,从事市场细分的人要好好把握,特别是注重聚类分析的细节,可以进行变量和样本的聚类;记住:样本聚类有可能数据排列不同聚类结果不同,要进行聚类后的稳定性测试,一般也要采用方差最大旋转,有时候斜交更适合聚类细分;当然,聚类后的细分市场识别是头痛问题,用到上面的几种技术,也很繁琐!我现在进行市场细分基本上都用数据挖掘软件工具了!现在比较好用的是Two-Step两阶段聚类; MDS多维尺度分析技术:这个技术目前不太用了,但它是认识多变量分析技术,尤其是测量与分析技术好的视角。比如,相似性和差异性测量、语异差异法等,洞察潜在消费者心理和潜在分类维度等。 其它:GLM通用线性模型、Logit回归、Probit分析、可靠性分析等 市场研究分析技术o 结合分析(联合分析)Conjoint Analysis技术:如果一家市场研究公司没有掌握该技术,就不能称为一流的市场研究!可见该技术的地位,应用领域非常广泛,新产品开发、产品重新定位、市场细分、利润分析、偏好分析等,我就是掌握了这个技术后,才发现统计与市场这么紧密联系,学好数学和统计有这么大的用武之地!o 离散选择模型(Choice base analysis):也叫Discrete Choice Analysis分析技术,现在市场研究采用这种方法越来越大,属于结合分析的一种,但更复杂也更反映现实选择行为;主要应用在价格研究中!研究消费者微观选择行为的人得了诺贝尔经济学奖呢!SPSS软件没有这个分析方法,只能用SAS软件,或者选择Sawtooth公司的产品。o 结构方程式模型(SEM):其实SEM本质上是实证研究,证实性分析,特别适合写学术论文和研究性项目,在市场研究主要用在顾客满意度上,也可以用在品牌驱动力研究等方面;主要软件是AMOS;o 多维偏好分析(Multidimensional Preference Analysis):主要用于构建偏好图,进行产品定位,消费者偏好结构,属于图示化技术的一种;SPSS没有专门称呼的模块,可以采用因子分析或主成分分析的转换来完成,但在SAS中就比较方便了;o 决策树技术:属于监督类建模技术,主要用于分类和细分,因为决策树比较好理解,所以可以非常自动和智能化的得到无法感知到的结果;掌握了决策树后,我就不愿意用交互分析了!主要有CHAID、C&RT、QUEST等,当然还有C5.0规则等!o 其它:PSM价格弹性测量、品牌资产指数等等; 数据挖掘和建模技术(数据挖掘技术将来再详细描述)o 分类建模技术:o 预测建模技术:o 细分建模技术:o 关联建模技术:o 序列建模技术:主要的英文描述:多变量分析方法的分类图谱!(主要部分)从图中,大家可以看到,假设你不知道研究目的的意义,但看到数据后,你可以尝试沿着分类图谱去找寻你该选择的分析方法!当然,选择什么样的多变量分析技术,前提还是你的研究设计和假设,也就是说我们设计了什么样的问卷或者说什么样的测量变量及尺度,应该在数据收集回来之前就应该明确的,特别是选择了针对性的研究模型也就意味着分析技术的明确,如果你在调查之前还不知道用什么分析方法,应该不是一个合格的研究人员!多变量分析技术的选择主要看变量测量等级,特别是因变量!学会多变量统计分析法案例与分我写了一篇市场研究中的多变量分析技术博客文章后,不少同学问我,到底该用哪种方法呢?特别是在面对不同的市场研究和经营分析问题时如何选择?对于这个问题,我想首先是你应该了解每种多变量分析方法,然后才能选择适合的。我有时候说:就是因为你不知道,或不会用,所以才不用!正好,我的学生田田说:沈老师,你每天写一讲多变量分析吧,我们可以学到,而且30天后就可以成书了!哈哈!我可没有这么宽松的时间,但还是先制定一个计划,争取每周写一讲! 对我这么一个好为人师的老师来讲,能把分析方法与大家分享是快乐的事情! 我的学习方法是:我一般都是先学软件,因为有了软件我们才可以用和实践,没有软件的方法就不学了,学了也没有办法分析出来,总不能再自己编程吧。我也相信通过软件的学习可以更好的理解多变量的分析方法和应用,因为,编软件的人最应该掌握理论,否则软件编不出来;编软件的人最应该知道应用,否则软件卖不出去!通过学习软件的案例是个好的方法,因为大部分软件所带的案例都是经典的;经典的案例也是简单的,所以我们接下来要实践,现实中解决问题才是真正的分析能力,随机应变去适应各种市场研究和经营分析问题,不断变成研究模型;当然,当老师的还要搞清一点理论问题,再教给大家! 我想在博客上搞个投票,看看大家最关心哪种分析方法,就先写那个分析方法,但还没有找到投票模块,只好先把各种可能的多变量分析方法罗列在此,希望大家给出意见! 多变量分析方法:1. 多重回归分析Regression Analysis2. 逻辑斯蒂克回归分析Logistics Regression Analysis3. 主成分分析Principle Component Analysis4. 因子分析Factor Analysis5. 聚类分析Cluster Analysis6. 判别分析Discriminate Analysis7. 对应分析Correspondence Analysis8. 多维尺度分析MDSMultidimensional9. 社会网络分析Social Network Analysis10. 分层线性模型HLMHierarchical Liner Model11. 实验设计Experimental Design12. 结合分析Conjoint Analysis13. 离散选择模型Choice Based Analysis14. 多维偏好分析概念图Multi-Dimensional Performance Analysis15. 结构方程式模型Structural Equation Model16. 分类决策树CHIAD & CART17. 决策与预测模型Time Serial18. 方差分析ANOVA analysis19. 相关分析Correlation Analysis20. 综合排名法Comprehensive ranking21. 贝叶斯网络Bayesian Network22. 广义线性模型GLM23. 关联分析Association Analysis24. 典型相关分析Canonical Correlation Analysis25. 正交实验设计Orthogonal experimental design26. 时间序列模型Time Serials Model27. 偏最小二乘法回归Partial least square method28. RFM模型29. PSM模型30. Turf模型多变量分析前面的一篇博文介绍了对应分析方法的解读技巧,不少读者看了后非常想知道如何操作多重对应分析。其实多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。对应分析对数据的格式要求: 对应分析数据的典型格式是列联表或交叉频数表。 常表示不同背景的消费者对若干产品或产品的属性的选择频率。 背景变量或属性变量可以并列使用或单独使用。 两个变量间简单对应分析。 多个变量间多元对应分析。现在,我们还是来看看如何操作多重对应分析并如何解读对应图;我们假定有个汽车数据集,包括:来源国(1-美国、2-欧洲、3-日本),尺寸(1-大型、2-中型、3-小型),类型 (1-家庭、2-运动、3-工作),拥有(1-自有、2-租赁)性别(1-男、2-女),收入来源(1-1份工资来源、2-2份工资来源),婚姻状况(1-已婚、2-已婚有孩子、3-单身、4-单身有孩子);从数据集看,我们有7个定类变量,如果组合成简单的交叉表是困难的事情,此时采用多重对应分析是恰当的分析方法。下面我还是采用SPSS18.0,现在叫PASW Statistics 18.0来操作!注意:不同版本在多重对应分析方法有一些不同,但大家基本上可以看出了,高版本只能是更好,但选择会复杂和不同!在进行多重对应分析之前,研究者应该能够记住各个变量大致有多少类别,个别变量如果变量取值太偏或异常值出现,都会影响对应分析的结果和对应图分析!在SPSS分析菜单下选择降维(Data Redaction-数据消减)后选择最优尺度算法,该选项下,根据数据集和数据测量尺度不同有三种不同的高级定类分析算法,主要包括:多重对应分析、分类(非线性)主成分分析、非线性典型相关分析;注意:随着版本的增高,研究人员在统计分析时就要各位主要变量的测量尺度,并且最好在进行数据清理和分析前,明确定义好测量尺度;当然也要做好Lable工作!接下来,我们就可以选择变量和条件了!大家可以把要分析的变量都放到分析变量内,补充变量的含义是如果有哪个变量你并不想作为对应分析的变量,而只是作为附属变量表现在对应图上可以加入!这一点其实在简单对应分析也有这种定义。(我们将在专门的简单对应分析方法中再讲!)然后我们要选择“变量”选项,大家可以选择类别图:每一个变量的分类图,重点是选择联合类别图,我们把7个变量全部放入,执行!(其它选项大家可以测试,我还有一些没有搞清楚)下面我们看结果:从图中我们可以看出:美国车都比较大,家庭型,主要购买者是已婚带孩子的;日本和欧洲车主要是小型、运动的和已婚没有孩子的人购买;特别注意:单身和单身带孩子的往往是租赁汽车,收入单一来源,但这个地区没有车满足这个市场,或许是市场空白;具体的解读大家可以根据自己的研究设计和假设去寻找答案!主要统计指标可以看:上图主要给我们了对应图维度的解释比率,最下面的图大家会看吗?提示:夹角是锐角意味着相关,所以:定类变量的相关性是不是可以解释啦!总结:(同样适合简单对应分析)对应分析的优点: 定性变量划分的类别越多,这种方法的优势越明显。 揭示行变量类别间与列变量类别间的联系。 将类别联系直观地表现在二维图形中(对应图)。 可以将名义变量或次序变量转变为间距变量。对应分析的缺点: 不能用于相关关系的假设检验。 维度要由研究者决定。 有时候对应图解释比较困难。 对极端值比较敏感。调查数据的加权处理技术很多人在进行统计分析和市场研究的时候,都涉及到对数据进行加权的问题,这是一个搞数据分析和从事市场研究的人都会碰到的问题,需要大家正确理解并解释,并采用合理的操作技术和处理方法。什么是加权呢? 简单地说,就是要“让一些人变得比另一些人更重要!”要能够比较好的理解加权,首先你要了解抽样设计,特别是设计权数:每个样本单位所代表的被调查总体的单位数。设计权数由抽样设计决定,用Wd表示。设计权数Wd=1/入样概率;入样概率:在抽样设计中,如果一个样本的入样概率=1/50,那么该样本的设计权数=50。也就是说,这个样本代表了总体中的50个单位。 关于自加权抽样设计:如果所用样本的设计权数是相等的,那么这样的抽样设计是自加权的。也就是说,总体中的每个单元被抽中的可能性相等,具有等可能性、具有相等的入样概率。如果是自加权的,在总体均值、比例估计时不用考虑设计权数,对总量的估计只要扩大样本。 满足自加权的抽样设计:等概率抽样、简单随机抽样、系统抽样、分层抽样各层大小成比例,每层内简单随机抽样、多阶段抽样最后阶段等概率,其它阶段与单位大小成比例概率抽样。 不等概率抽样往往不满足自加权,对于不等概率抽样,正确使用设计权数就尤为重要了!下面我们看看如何进行加权处理!加权:通过对总体中的各个样本设置不同的数值系数(即加权因子-权重),使样本呈现希望的相对重要性程度;基本加权等于:设计加权=某个变量或指标的期望比例/该变量或指标的实际比例;什么情况下要进行加权?情景1:我们在抽样调查得到的样本结构与总体人口统计结构状况不相符,我们可以通过加权来消除/还原这种结构差异,达到纠偏的目的; 例如,在城市和农村各调查300样本,城市与农村人口比例“城市:农村=1:2”(假设),在分析时我们希望将城市和农场看作一个整体,这时候我们就可以赋予农村样本一个2倍于城市样本的权重;情景2:除了人口统计结构,有时候我们在调查样本的某些变量或指标上样本的代表性可能也会相对总体的实际状况过高/过低,此时,需要加权进行调整; 这类不匹配大多是我们“故意”而为(通过“追加”样本实现),比如在配额抽样的时候,设置配额要求某类被访者对某产品的使用者必须达到50%,但实际情况是总体市场中实际使用者仅有10%;有时,则是“非情愿”的出现,比如设置了能反映总体的配额比例,但实际操作却出现了比例偏高/偏低;情景3:在样本组配额实验设计中,进行不同子总体对比检验,也会通过加权来调整不同组间的样本属性不相匹配的情形(通常设有相同的配额,但执行有可能会出现差异);通常,加权对结果产生的差异很小,更多的是对结果从准确度上进行修饰;情景4:所测试样本出现了较多的缺失值,需要加权来纠正结果;对于面向特定客户的专项研究,在调查前基本都协议有要完成的样本量,故这种情形较少;加权方法: 采用因子加权:对满足特定变量或指标的所有样本赋予一个权重,通常用于提高样本中具有某种特性的被访者的重要性;例如,研究一种香烟的口味是否需要改变,那么不同程度吸食者的观点也应该有不同的重要性对待:例如:重度吸食者=3,经常吸食者=2,偶尔/不抽烟=1,记住:实际应用时候,如果“经常/偶尔”的基数足够大,往往单独分析,不进行加权处理; 采用目标加权:对某一特定样本组赋权,以达到们预期的特定目标;例如:我们想要:品牌A的20%使用者 = 品牌B的50%使用者;或者品牌A的20%使用者 = 使用品牌A的80%非使用者; 采用轮廓加权:多因素加权,因子/目标加权不同(一维的),轮廓加权应用于对调查样本相互关系不明确的多个属性加权;面对多个需要赋权的属性,轮廓加权过程应该同时进行,以尽可能少的对变量产生扭曲;我们应该知道,无论加权的动机是什么,但操作过程是一样的:1. 依不同属性变量/指标将样本分为多个组(加权组),然后根据所希望各个组代表的个体规模赋予不同的权重;即明确分析子集/样本组,通常,经常以人口结构变量、地域变量作为分类指标;明确各个分析子集/样本组中个体的代表性强弱(权重);2. 加权是在数据收集结束后采取的数据“纠偏”行为,但一定要清醒的知道:配额设置不合适、FW执行差或其他错误而造成的“不好”的原始数据收集,即使加权也一定是“无效的”;3. “提前避免错误/失误发生,总好过事后的任何补救!”事后加权案例:例如:我们为了研究,得到某小公司职员吸烟习惯的信息,进行了一项调查。从N=78个人的目录中抽出了一个n=25人的简单随机样本。在调查的设计阶段,并没有可用于分层的辅助信息。在收集关于吸烟习惯的信息的同时,还收集了每个回答者的年龄和性别情况。总共有nr=15个人作出了回答。 由此得到样本数据的下列分布: 假设我们估计知道某公司约有16个男性职员和62个女性职员,而且男女的吸烟比例不同。经过加权后我们得到该公司吸烟的比例估计在53%; 我们总是希望调查所得的估计值与已知的男性和女性数量比例相一致,当我们认为一个人是否吸烟与他的性别之间可能存在相关性,因此他们认为,使用事后分层能够提高估计的精度。 然而实际上,如果在调查的设计阶段就已经获得这些信息的话,就可以用性别来进行分层。经过事后加权处理后,我们得到的该公司吸烟者比例为45%。也就是经过权重修订后的估计结果!SPSS软件进行加权处理:就是选择或指定某个变量为权重,你应该能够在状态栏看到Weight On;更复杂的加权,例如可以采用标准差加权、正态分布得分加权以及其它复杂数据变换后情况的处理加权!如果数据有“加权”,我们要明确地告诉客户: 为什么加权? 加权方案的实施过程; 加权对数据的影响,等等;通常,我们应该:在数据报告过程中,在图表上同时标明“未加权”和“加权”的基数;在分析报告可灵活处理,但也应有清晰的、一致的标注;记住一点:加权也是篡改数据的方法!谨慎使用!判别分析技术判别分析(Discriminate Analysis)是市场研究的重要分析技术,也是多变量分析技术。判别分析是一种进行统计判别和分类的统计技术手段。它可以就一定数量的个体的一个分类变量和相应的其它多元变量的已知信息,确定分类变量与其它多元变量之间的数量关系,建立判别函数,并利用判别函数构建Biplot二元判别图(概念图)。同时,利用这一数量关系对其他已知多元变量的信息、但未知分组的子类型的个体进行判别分组。 判别分析属于监督类分析方法,例如:市场细分研究中,常涉及判别个体所属类型的问题,也常涉及不同品牌在一组产品属性之间的消费者偏好和认知概念,判别分析可以很好地对这种差异进行鉴别。并在低维度空间表现这种差异。 一般来讲,利用判别分析首先要明确变量测量尺度及变量的类型和关系; 因变量(dependent variable): 分组变量定性数据(个体、产品/品牌、特征,定类变量)。 自变量 (independent variable):判别变量定量数据(属性的评价得分,数量型变量)。 明确因变量后:我们需要明确我们分析的目的; 确定分组变量与判别变量间的关系建立判别函数,找到自变量的最佳区分因变量的各个类别的线性组和。 可以确定后验概率,计算每个个体落入各个类别的概率。 确定哪些判别变量x1、x2、x3、xk对区分类别差异的影响最大。 考察各个类别在判别变量方面是否存在显著差异。 确定判别变量是以什么形式影响因变量的,即D是 x1 x2 x3 xk 什么形式的函数。 根据判别变量的值对个体进行分类。 对分析的准确程度进行评价。判别分析的应用领域非常广泛,例如: 用户和非用户 经常购买者和非经常购买者 新用户、流失用户和忠实用户 忠诚用户和非忠诚用户 新产品早期使用者和后期使用者 消费者心目中喜欢的品牌和不喜欢的品牌 消费者对我们的品牌和竞争品牌的不同属性偏好 偏好图 市场细分 新产品开发等 一般来讲,判别变量是数量型测量尺度变量,分析样本个数至少比判别变量多两个,我们为了得到判别函数,经常需要把样本随机分成训练样本和检验样本等工作! 判别函数=分组数-1(一般情况)下面我们通过案例来操作判别分析并得到判别分析图!注:分别用第一和第二个判别函数为坐标轴作个体和中心的散点图偏好图 我们得到数据集,描述了100家用户对某公司产品的7项指标的满意度打分,因变量Y-客户类型:1-新客户、2-犹豫后再次购买、3-再次直接购买; 我们分析的目的是期望得到不同类型的客户,在选购该公司产品方面的影响因素和偏好结构!这样我们可以根据客户类型进行有针对性的改进和营销策略!7个自变量,也就是影响客户类型的因素指标:当数据收集好后,这时候要考虑数据集是否有缺省值、是否有未分类等基本描述性统计分析;我们接下来选择判别分析:判别分析在分析菜单的分类子菜单下在对话框中,我们分别定义自变量和分组变量,其中分组变量要说明组编码取值范围!(我们有三类) 判别分析与多元回归分析一样,都有逐步进入方式,主要目的是通过软件程序和统计算法决定进入判别函数的自变量重要性程度,我们因为需要进行判别图分析,我采用一起全部进入判别方程。 接下来,我们需要在统计量中选择Fisher函数;我们希望看看判别效果如何,我们可以选择判别图形输出,可以让我们直观看到判别效果!下面我们看分析结果:首先看判别图,从图中很明显,看到三个组中心也就是客户类型,以及围绕着组中心的样本,说明分组判别还是不错的,当然这只是直观感觉,我们再看判别分析解释情况:从表中我们看到,因为分组变量是三类,所以我们得到两个判别函数,其中第一判别函数解释了数据的85.1%,第二判别函数解释了14.9%;两个判别函数解释了100%;当然,两个判别函数直接具有显著的差异和判别力! Fisher线性判别函数,我们主要用来构建判别方程,理论上说:如果我们知道某个客户在7个指标上的满意度打分,我们就可以估计出该客户应该是哪种类型的客户了!利用的是线性判别函数的得分,得分越大归到某类!接下来我们考察判别图:(市场研究领域经常采用概念图-偏好图方法解释数据,特别说明的是:判别分析是最理想的构建判别偏好图的方法) 在判别分析结果中,我们可以得到两个典型判别函数的方程系数,分组变量的组中心坐标;我们利用7个指标和组中心的坐标进行偏好图制作,我们把这两张表输出到Excel里,然后再导入到SPSS软件中作散点图; PASW Statistics也就是SPSS18.0功能有比较大的改进,当然作图方式也有了变化!从上面的判别分析图中,大家是否会解读呢?我们可以从圆心向组中心做向量,进行分析,看投影垂点等,解读方法大家可以参考前面的博客文章,对应分析的七种解读方法,偏好图和概念图都是一样的解读技术!结合分析技术结合分析(Conjoint Analysis)是一种应用广泛,非常流行和有效的市场研究技术。近些年来,结合分析广泛地应用在消费品、工业产品和商业服务等相关领域的市场研究中,在我国越来越受到市场研究公司和企业的重视,尤其是在汽车行业的市场研究领域,结合分析在汽车的新产品开发、市场占有率分析、竞争分析、市场细分和价格策略等方面都发挥了积极而有效的作用。结合分析也叫联合分析技术!结合分析适用于测量消费者的心理判断,如理解(Perceptions)和偏好(Preferences)。在结合分析中,产品/服务被描述为“轮廓”(Profiles),每一个轮廓是由能够描述产品/服务重要特征的属性(Attributes)以及赋予每一个属性的不同水平的组合构成的。结合分析的一个重要的基本假定是:消费者是根据构成产品/服务的多个属性来进行理解和作偏好判断;也就是说,消费者对产品/服务的偏好每次并不是基于一个因素而是基于几个因素的结合来判断的,消费者对某一轮廓的偏好可以分解成构成该轮廓的多个属性的偏好得分(Preference Scores)。在结合分析中用效用值(utilities)来描述。结合分析是一种多元统计分析方法。其因变量是消费者对某一轮廓的整体偏好评价。某一轮廓的整体也称为全轮廓(full profiles),是由全部属性的各个水平组合构成的。自变量是组成各轮廓的不同属性(因子)水平。因此,结合分析是在已知消费者对全轮廓的评价结果(overall evaluations)的基础上,经过分解的方法(decompositional approach)去估计其偏好结构的一种分析法。在结合分析中,轮廓是由研究人员事先按照某种因子结构(factorial structure)采用部分因子正交实验加以设计的。结合分析有三个主要目的:(1)确定消费者赋予某个预测变量(水平)的贡献和效用(utilities)以及属性的相对重要性(2)寻找消费者可接受的某种产品的最佳市场组合,这种组合最初可能并没有被消费者所评价(3)模拟市场,估计市场占有率和市场占有率变化。为了达到这些研究目的,首先要估计不同属性水平的效用,进一步计算出属性的相对重要性(Attributes relative importance)和轮廓效用(profile utilities),以便定量化地测量消费者的偏好,然后基于消费者的偏好采用最大效用模型或者Bradley-Terry-Luce(BTL)模型和logit模型估计市场占有率。 全轮廓方法:每一个属性同时展现给消费者 样本量:一般消费者研究 100到400之间 调查方法:派调查员面访face-to-face 因子设计:属性和水平数目不太多 (20个最多不超过30个) 部分因子设计: 正交排列法 orthoplan 估计主效应 ( main effect ) 产品/服务的概念(轮廓)事先设计和确定。 调查可以采用纸张或计算机辅助访问。 最小轮廓数选择:NC=NL - NA + 1 , 其中: NC: 最小组合轮廓数 NL: 所有属性水平数的和 NA: 所有属性数的和 例如:六个属性,每个属性有4个水平,可能组合数=444444=4096(种), 最小组合数=(4+4+4+4+4+4)- 6+1=19(种) 推荐组合轮廓数:最小轮廓数的 1.5 到 2 倍下面我们通过一个案例:赛欧轿车上市前的市场分析,阐述了结合分析在汽车市场的应用,以及采用一般最小二乘法(OLS)回归估计主效应的全轮廓结合分析法的基本概念、原理、步骤和方法。(备注:研究的时候产品配置已知,但还没有下线投放市场)根据研究目的和前期的定性研究,最终确定了产品的属性和水平:在确认了属性水平后,我们通过SPSS来进行正交实验设计。我们可以依次定义每一个属性和水平,SPSS软件最多提供每个属性有9个水平的可能性,所以如果水平数太多就要考虑其它方法,或者进行相应的变换,当然,如果属性的水平数越多代表了你越重视它,将来的分析相当重要性就会高! 正交实验设计方法,在SPSS是比较简单的,人为的控制不多,我们只能寄希望SPSS的正交实验设计给我们一个号的结果,但没有评估设计效应的指标。如果你希望下次得到同样的正交设计集,必须设定一样的随机种子! 在这点上说,如果对于复杂的正交实验设计,我还是比较偏向用SAS软件来进行,不仅得到的结果比较好,还有设计效应等各种指标评估,所以,实际市场研究中,大部分情况都是SAS来完成的!其实我用SAS,有时候更简单的,就几个命令:%mktrun和%mktex等; 设计好后,大家记住,先不用运行,先要“粘贴”下来,也就是把语法粘贴下来,因为Conjoint Analysis分析方法在SPSS中没有窗体命令,必须用语法执行! 当然,在细节上还有“Holdout”卡片的问题,(检验问题,但是对于商业研究我基本上都不用了,为了保证更好的建模卡片,为了减轻被访者负担,反正做都做了!这里我没有学术思想啦)正交实验设计生成了16张卡片,同时也是随机卡片集,并产生两个系统变量,不要改变变量名称,其中:STATUS_值标 1-Design 2-Holdout 3-Simulation记住:我们并不关心这16张卡片如何,我们只是关系这16张卡片的对432种组合产品的代表性,原则上即使有不理想或不现实的卡片出现,也不要没理由的删除!在SPSS系统分析中,最好考察属性水平设定的问题,而不要随意改变!下面我们就要考虑收集被访者评价信息了,当然也包括卡片的展示方式!收集到被访者信息后,我们就可以分析了!我这里采用了最一般的离散变量方法,实际上属性变量可以有多种模型(离散、线性、理想点、反理想点等)结合分析既可以分析群体、总体也可以分析每个人的偏好选择!大家可以根据公式自己计算个体和群体的效用值、属性相对重要性等,但是记住:所以群体的效用值、相对重要性来自于个体的平均! 从分析的角度,有时候模拟市场,模拟市场份额是最重要的分析,但是如果研究者不是最终决策者,就必须设计市场组合份额的模拟器,我一般采用Excel来设计,这需要大家懂得结合分析原理,并能够设计Excel应用! 在文章的最上面,我是采用Excel设计的电脑配置的市场研究模拟器,希望对你有所启发! 近年来,结合分析成为市场研究的重要利器,但是它也有着局限性,所以开发了不同的改进方法和软件工具,代表性的就是Sawtooth公司的产品,另外也可以考虑更复杂的CBC技术,离散选择模型!(下次再专题讲) 最后,要说明的是结合分析只是得到了消费者的偏好,喜欢一个人,并不一定会跟她结婚的!对应分析方法与对应图解读方法七种分析角度对应分析是一种多元统计分析技术,主要分析定性数据Category Data方法,也是强有力的数据图示化技术,当然也是强有力的市场研究分析技术。 这里主要介绍大家了解对应分析的基本方法,如何帮助探索数据,分析列联表和卡方的独立性检验,如何解释对应图,当然大家也可以看到如何用SPSS操作对应分析和对数据格式的要求! 对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。交互表的信息以图形的方式展示。主要适用于有多个类别的定类变量,可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。适用于两个或多个定类变量。主要应用领域: 概念发展 (Concept Development) 新产品开发 (New Product Development) 市场细分 (Market Segmentation) 竞争分析 (Competitive Analysis) 广告研究 (Advertisement Research)主要回答以下问题: 谁是我的用户? 还有谁是我的用户? 谁是我竞争对手的用户? 相对于我的竞争对手的产品,我的产品的定位如何? 与竞争对手有何差异? 我还应该开发哪些新产品? 对于我的新产品,我应该将目标指向哪些消费者?数据的格式要求 对应分析数据的典型格式是列联表或交叉频数表。 常表示不同背景的消费者对若干产品或产品的属性的选择频率。背景变量或属性变量可以并列使用或单独使用。 两个变量间简单对应分析。 多个变量间多元对应分析。案例分析:自杀数据分析上面的交互分析表,主要收集了48961人的自杀方式以及自杀者的性别和年龄数据!POISON(毒药)GAS(煤气)HANG(上吊)DROWN(溺水)GUN(开枪)JUMP(跳楼)(我们就不翻译成中文了,读者可以把六个方式想象成品牌或别的什么)当然,我们拿到的最初原始数据可能是SPSS数据格式记录表,其中,性别取值1-male 2-female,年龄取值1-5,分别表示不同年龄段。要回答的问题是:1-不同性别的人在选择自杀方式上有什么差别?2-不同年龄的人在选择自杀方式上有什么差别?3-不同性别年龄的人在选择自杀方式上有什么差别?我们首先,把性别字段乘上10加上年龄字段生成新字段sexage,取值是11-15,21-25,然后分别用M/F和年龄组中值代表Sexage字段的变量值标,这样我们就可以进行简单对应分析了!现在问大家,如果你看到上面的610的矩阵-列联表,你能看出什么差异?现在我们采用SPSS软件进行对应分析!(我现在用的是SPSS17.0多语言版本,前两天听博易智讯的人说,现在SPSS已经有18.0版本了,不过从对应分析方法角度我还是希望用11.5版本,因为可以自己拆分重新组合修改图形,现在的版本是图片了,不能随心所欲的修改,不爽!)分别定义好行列变量以及它们的取值范围!对应分析中,610的列联表(交互表)可以得到行列维度最小值减1的维度,我们看到第一维度Dim1解释了列联表的60.4%,第二维度Dim2解释了列联表的33.0%,说明在两个维度上已经能够说明数据的93.4%,这是比较理想的,当然我们也可以看卡方检验等!下面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论