已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 基于因子分析和聚类分析的客户偏好探究基于因子分析和聚类分析的客户偏好探究 一一 文献综述文献综述 二十世纪五十年代中期 美国学者温德尔史密斯提出了顾客细分理论 该理论指 出 顾客由于其文化观念 收入 消费习俗等方面的不同可以分为不同的消费群体 企业 在经营中应该针对不同的顾客提供针对性的服务 这样才能够利用有限资源进行有效的市 场竞争 对顾客的细分从方法上讲有根据人口特征和购买历史的细分和根据顾客对企业的 价值即基于顾客的消费金额 消费频率的细分 本文的细分是基于购买历史和人口特征的 聚类分析 饭店作为一个古老的服务行业 在现阶段的高度竞争市场下的发展趋势最重要 的方面便是服务趋于个性化 所以针对饭店的消费群体特征的聚类可以对饭店进行定位 在此基础上通过分析目标客户群体对消费质量评价的最主要影响因素可以达到其服务个性 化的目标 波特把顾客的价值定义为买方感知性与购买成本的一种权衡 对顾客的个性化 服务增加了买方的感知度从而加大了他们愿意为此付出的成本 于是饭店便可以增加营业 额 聚类分析是把研究对象视作多维空间中的许多点 并合理地分成若干类 即一种根据 变量域之间的相似性而逐步归群成类的方法 它能客观地反映这些变量或区域之间的内在 组合关系 1故聚类算法是对顾客进行分析的一个有效方式 在聚类分析的众多算法中因子 分析是研究如何以最少的信息丢失 将众多原始变量浓缩成少数几个因子变量 以及如何使 因子变量具有较强的可解释性的一种多元统计分析方法 2而典型的k means算法以平方误 差准则较好地实现了空间聚类 对于大数据集的处理效率较高 3在对顾客细分相关文献的 研究过程中 主要运用的方法有神经网络 分层聚类 因子分析等方法 比如 在关于网络 青少年用户的分类中 作者用层次聚类的方法 通过对青少年年龄 性别 民族 网络可得性 父 母的观点等变量等变量定义不同的上网动机 在此基础上对其进行了分类 而在研究人寿 保险持有者未来购买基金支持寿险可能性的文章中 通过灰度聚类和神经网络利用消费者 的基本信息 财产地位信息 风险承受程度将消费者分为了忠实客户和非忠实客户 在对客 户忠诚度的聚类中 作者用RFM的商业模型用DBI确定了Kmeans的最优K值 并最终用kmeans 对客户忠诚度进行了聚类 经过综合分析 我们选择了这两种方法处理顾客数据和饭店的基本资料 即 通过k means对客户进行聚类后通过因子分析分析不同类别客户的评价影响因素 为分析每类客户倾向的饭店特征 本文根据客户聚类结果对饭店数据进行筛选 由于 1 李蓉 李宇 基与主成分分析与聚类分析方法的我国西部区域划分问题的研究 科技广场 2 李新蕊 主成分分析 因子分析 聚类分析的比较与应用 山东教育学院学报 3 杨善林 kmeans 算法中的 k 值优化问题研究 系统工程理论与实践 2 饭店部分属性之间具有相关性 本文采用因子分析法挖掘其 根本属性 之后对饭店数 据进行聚类 分析得到每类客户评价得分最高的饭店特征 二二 方法论方法论 本文选取UCI上的数据 包括饭店 客户 评价得分等信息 旨在通过划分客户群体 并分析每一类客户对不同饭店的评价得分 得出每一类顾客选择饭店的倾向 即特定类别 客户的喜好和评价饭店时最看重的因素 将结论应用于指导饭店发展路线与目标客户群间 的战略匹配 具体方法步骤如下 1 根据详细的客户信息对客户进行K means聚类 总结出每一类客户的显著特点 2 客户偏好的研究 饭店的多个属性之间存在相互影响的关系 因此本文在研究饭店特点采用因子分析法 将相同本质的属性归入一个因子 既可减少变量的数目 又能得出能够表征饭店属性的影 响因子 在因子分析的基础上 对同类顾客所评价的饭店进行聚类分析 得到每类顾客所选饭 店的种类 然后分析比较各类饭店的特点 选出影响最大的因子 依据系数绝对值大小来 判断 参照因子旋转矩阵后即可得到对顾客评分影响最大的饭店属性 从而分析出特定 类别顾客在选择 评价一家饭店时的偏好 顾客 饭店 顾客类型 聚类分析 可代表饭店各属 性的因子 因子分析 饭店类型 评价者的 顾客类型相同 聚类分析 顾客偏好 Figure 1 研究框架 三三 研究过程研究过程 一 顾客聚类分析 在顾客信息的属性中删去User ID 其余属性作为输入字段进行K均值聚类 模型中的K 3 值默认为5 但是分类结果中不同类型间的差异较小 随即降低K值进行尝试 考虑到顾客 评分分为0 1 2三个等级 而且K 3时分类结果间的差异较显著 因此将顾客分为三类 Cluster 1 此类顾客人数最多 出生日期在1986年之后 绝大多数人学生 其次是工 作者 主要同家人一起就餐 基本不饮酒 兴趣点主要为technology 绝大多数未婚 性 格为thrifty protector Catholic为主 基本不吸烟 公交 Cluster 2 此类顾客人数最少 年龄最大 不愿多透漏个人信息 数据中有大量缺失 值 Cluster 3 此类顾客人数居中 出生年份在1981左右 主要为学生 工作者 多与朋 友一起就餐 大多属于social drinker 多数人是单身 但是单身比率高于类型1 性格为 hard worker car owner为主 聚类分析结果如下图所示 Figure 2 顾客的聚类结果 二 顾客偏好分析 本文通过分析每类顾客关注饭店的特征提取分析顾客的偏好 从而便于饭店把握顾客 需求 指定差异化战略 1 因子分析 i 评价指标的选择及数据预处理 影响顾客在饭店消费体验的影响性变量 本文主要筛选如下 alcohol smoking area dress code accessibili1y price Rambience Franchise area parking acceptance other service 由于因子分析需要数值型数据 本文对饭店数据中定性的变 量量化处理 统计学依据数据的计量尺度将数据划分为三类 定距型数据 Scale 定序 型数据 Ordinal 定类型数据 Nominal 定距型数据通常是指诸如身高 体重 血压等的连续型数据 也包括诸如人数 商品 4 件数等离散型数据 定序型数据具有内在固有大小或高低顺序 职称变量可以有低级 中 级 高级三个取值 可以分别用1 2 3等表示 数据间却是不等距的 测量数值不能直接 比较大小 只能比较优先次序 定类型数据是指没有内在固有大小或高低顺序 一般以数 值或字符表示的分类数据 如性别变量中的男 女取值 本文采用的数据中 饭店的属性包含多个定序型变量 如other variance包含 none Internet 和variety三类 Accessibility包括no accessibility completely和 partially三类 本文采用0 1 2代表上述属性中的值 0 1 2代表依次递增 即0表示 no accessibility 1表示partially 2表示completely 此外 数据集中还有定类型的数据 如franchise有True和false两种取值 本文中将却是指用该属性取值的平均值替代 012 alcoholnowine beerfull bar smoking area not permitted section only at bar permitted dress codeinformalcasual accessibilitynone partiallycompletely pricehighmediumlow Rambiencequietfamiliar franchiseFALSETRUE areaclosedopen other servicesnone Internetvariety Figure 3 因素量化 ii 因子分析 由于饭店的属性之间部分具有相关性 本文采用spss进行因子分析来消除这种相关性 对饭店数据库中的影响性变量相关数据进行因子分析 所得结果见Figure 4 从Figure 4中可以看出 前八个因子的累计方差贡献率已经达到86 028 根据累计方 差贡献率 85 的标准 本文选择前八个作为因子进行分析 5 Figure 4 初始特征矩阵 为了更好地赋予所得因子以合理的解释意义 本文进行了因子旋转 因子载荷矩阵见 Figure 5 从表中的因子载荷可以看出 第一个因子 F1 可以用来解释price 第二个因 子 F2 可以用来解释alcohol 第三个因子 F3 可以用来解释smoking area 第四个因 子 F4 可以用来解释Franchise 第五个因子 F5 可以用来解释Rambience 第六个因子 F6 可以用来解释dress code 第七个因子 F7 可以用来解释Cuisine 第八个因子 F8 可以用来解释Parking 八大因子的累计方差贡献率可以反映顾客对饭店的满意程度 6 Figure 6 因子载荷矩阵 根据表 可由因子方差贡献率计算得出因子解释贡献率 因子解释贡献率 因子方差贡献率 总方差贡献率 从而得到各饭店的因子得分数据 具体数据如附录所示 Figure 7 提取平方和载入矩阵 iii 饭店聚类分析 为分析每类顾客偏好的饭店类型 本文针对每类顾客评价过的饭店进行聚类分析 希 望找出具有不同评分的各类饭店的显著性特征 本文采用K means方法对各类顾客评价过的饭店数据进行聚类分析 以cluster 1客户 为例 筛选出cluster 1 客户评分过的饭店因子得分数据 对该部分数据进行聚类分析 由于顾客对饭店的评分分为三类 0 1 2 此处对饭店聚类K值选取为3 计算每类饭店的 客户评分平均值 可得出cluster 1客户最偏好的饭店类别 通过分析该类饭店的显著性特 征 可得出cluster 1客户最偏好的饭店特征 判断cluster 1 偏好的饭店特征具体步骤如下 7 1 筛选出 cluster 1 评价过的饭店因子得分数据 2 对该数据应用 k means 进行聚类分析 k 取值为 3 3 分析每类饭店的显著性特征 4 计算每类饭店的平均客户评分并对三类饭店进行排名 5 分析排名第一的饭店 cluster 1 客户最偏好的饭店 的显著性特征 在解释聚类分析的结果时 本文采取每类累计方差解释度较高的因子解释每类饭店的 特征 综合考虑各类顾客各类饭店的数据分析结果我们可以看到 无论是哪类饭店 F4 F5 F6均具有较高的方差解释度 因此可以看出无论是哪类顾客都是比较看重 F4 F5 F6这三类因子的 结合Figure 6 因子载荷矩阵 可以分析得出 Franchise Rambience dress code是所有饭店都考虑的普遍性因素 考虑每类饭店除F4 F5 F6之外的因子影响程度 可分析得出不同顾客对饭店的差异 化要求 便于饭店针对顾客指定差异化战略 对cluster 1 参与评价的饭店评价因子得分数据进行聚类分析 其结果如Figure 8所 示 可以看出除F4 F5 F6之外聚类一饭店的特征还可用F2解释 结合Figure 6 可以分 析得出除了cluster 1的顾客对alcohol是较为关注的 同理聚类二的饭店特征除 F4 F5 F6之外还可用F1进行解释 因此cluster 1 的顾客对Price是较为关注的 聚类三 的饭店特征还可用F7进行解释 因此cluster 1 的顾客对Cuisine是较为关注的 计算三类 饭店的客户评分平均值 得到cluster 1的客户对于聚类1的饭店评分是最高的 可以看出 可分析得出该类客户是最看重的差异化服务是alcohol Figure 8 cluster 1 客户聚类分析结果 8 为分析cluster 2客户的差异化要求 对cluster 2 参与评价的饭店评价因子得分数据 进行聚类分析 其结果如Figure 9所示 可以看出除F4 F5 F6之外聚类一饭店的特征还 可用F7解释 结合Figure 6 可以分析得出除了cluster 2的顾客对cuisine是较为关注的 同理聚类二的饭店特征除F4 F5 F6之外还可用F2进行解释 因此cluster 2 的顾客对 alcohol是较为关注的 聚类三的饭店特征还可用F1进行解释 因此cluster 2 的顾客对 price是较为关注的 计算三类饭店的客户评分平均值 得到cluster2的客户对于聚类1的 饭店评分是最高的 可以看出可分析得出该类客户是最看重的差异化服务是cuisine Figure 9 cluster 2 客户聚类分析结果 为分析cluster 3客户的差异化要求 对cluster 3参与评价的饭店评价因子得分数据 进行聚类分析 其结果如Figure 10所示 可以看出除F4 F5 F6之外聚类一饭店的特征还 可用F1解释 结合Figure 6 可以分析得出除了cluster 3的顾客对price是较为关注的 同理聚类二的饭店特征除F4 F5 F6之外还可用F2进行解释 因此cluster 3 的顾客对 alcohol是较为关注的 聚类三的饭店特征还可用F8进行解释 因此cluster 3的顾客对 parking是较为关注的 计算三类饭店的客户评分平均值 得到cluster3的客户对于聚类3 的饭店评分是最高的 可以看出可分析得出该类客户是最看重的差异化服务是parking 9 Figure 10 cluster 3 客户聚类分析结果 对应三类顾客的自身特征与其偏好 本文对顾客偏好的分析基本符合顾客自身特征 Cluster 1 年轻学生与家人就餐 Cluster2 年长 不愿透漏个人信息 Cluster 3 年轻工作者与朋友 car owner 顾客 聚类1 A Al lc co oh ho ol l 聚类2 P Pr ri ic ce e 聚类3 Cuisine 聚类1 C Cu ui is si in ne e 聚类2 Alcohol 聚类3 Price 聚类1 price 聚类2 alcohol 聚类3 p pa ar rk ki in ng g Figure 11 顾客偏好 四四 结论结论 本文综合使用了聚类分析和因子分析 分析出了不同类型顾客的特点 以及每类顾客 的选择 评价饭店的偏好 所得结论对饭店的经营和战略制定有极其重要的指导意义 以第三类顾客为例 顾客主要为 1981 年左右出生的年轻人 多与朋友一起就餐 绝大 多数拥有私家车 该类顾客评价过的饭店进行聚类分析后 发现顾客非常关注泊车这一饭 店属性 因此 当某饭店制定差异化战略时 如若想吸引上述第三类客户 除了关注 dress code ambience 和 franchise 这三个具有普遍性的属性外 还应针对该种顾客的特点 尽量提供停车位 以吸引更多的顾客 10 五五 参考文献参考文献 1 A segmentation of adolescent online users and shoppers William W Hill Ph D Sharon E Beatty Ph D Gianfranco Walsh Ph D 2 Cluster analysis using data mining approach to develop CRM methodology to assess the customer loyalty Seyed Mohammad Seyed Hosseini Anahita Maleki Mohammad Reza Gholamian 3 An anticipation model of potential customers purchasing behavior based on clustering analysis and association rules analysis Horng Jinh Chang a Lun Ping Hung b Chia Ling Ho 4 A two stage clustering method to analyze customer characteristics to build discriminative customer management A case of textile manufacturing business Der Chiang Li a Wen Li Dai b Wan Ting Tseng a 5 Distributing weights under hierarchical clustering A way in reducing performance breakdown Jin Zhang a Dietmar Maringer b 6 李蓉 李宇 基与主成分分析与聚类分析方法的我国西部区域划分问题的研究 科技广场 7 李新蕊 主成分分析 因子分析 聚类分析的比较与应用 山东教育学院学报 8 杨善林 kmeans 算法中的 k 值优化问题研究 系统工程理论与实践 9 奚胜田 詹原瑞 韩著钊 因子分析与聚类分析在企业信用评级中的应用 附录一 饭店因子得分数据 placeIDf1f2f3f4f5f6f7f8 0 0540 2 0 1 1 1 1 1 31120 0 083530 1 0 90689 0 019480 1 31120 0 083530 1 0 90689 0 019480 1 173410 0 0 1 0 0 0 0 916990 0 0 1 1 1 1 0 575420 0 023861 1 585160 0 180580 1 109980 0 0 1 0 0 132231 0 87570 1 1 0 1 0 1 1 010560 0 1 0 0 0 0 62026 0 503980 495981 281751 1 1 0 0 0 410250 0 2 1 0 0 0 1 31120 0 083530 1 0 90689 0 019480 1 31120 0 083530 1 0 90689 0 019480 1 31120 0 083530 1 0 90689 0 019480 1 31120 0 083530 1 0 90689 0 019480 1 31120 0 083530 1 0 90689 0 019480 1 156050 0 1 541731 584890 0 0 22226 1 31120 0 083530 1 0 90689 0 019480 11 0 0 0 1 1 0 0 199151 0 0 0 0 0 0 0 14319 0 03596 0 161170 482570 0 571281 0 0 1 0 253041 0 0 2 0 0 087811 1 022760 0 0 1 0 32442 0 09096 0 17486 0 0 0 3 2 0 0 0 15897 0 983790 1 0 1 0 0 0 29231 0 0 0 031720 1 0 0 20414 0 1855 0 1 0 058382 1 0 0 282480 0 0 0 0 1 0 0 0 0 2 1 1 1 81927 0 139671 0 0 0 0 1 1 0 330580 0 52325 0 0 2 0 1 0 1 0 32854 1 055230 0 0 1 0 63358 0 12681 0 09006 1 31120 0 083530 1 0 90689 0 019480 0 0 0 0 1 0 01525 0 004911 0 0 0 0 1 0 0 18266 0 10837 0 0 003172 0 1 0 1 0 23479 0 0 023630 0 0 0 0 083850 1 173410 0 0 1 0 0 0 0 104971 0 015191 2 0 0 0 1 137271 0 034290 1 0 0 0 1598 1 146030 0 0 1 0 0 0 27428 0 0 0 3 2 0 0 0 452 0 1 0 052782 2 4815 0 725170 0 0 686730 0 007830 1 0 0 0 0 0 0 0 1 0 0 0 0 040170 0 0 1 097620 0 0 12002 0 0 0 1 1 0 0 1 1 1 1 3 1 0 0 0 1 31120 0 083530 1 0 90689 0 019480 1 31120 0 083530 1 0 90689 0 019480 1 200790 678560 0 1 0 0 1 0 926731 1 0 0 0 160771 0 27361 0 620380 1 317280 1 1 1 0 39203 0 529261 0 194060 1 0 0 20542 0 14815 1 290372 0 0 0 1 1 0 22784 1 140940 0 0 1 0 169140 0 0 0 0 2 1 0 0 0 0 371762 0 3 2 0 0 1 26114 0 0 0 3 1 0 0 1 49454 0 3 0 1 2 067220 0 24381 0 99542 0 0 447930 1 1 0 0 0 05644 1 1 0 1 1 0 0 0 12 0 0 0 04091 0 171030 90381 0 0 0 549230 0 0 1 0 0 165160 1 0 0 1 1 0 23852 0 232640 0 0 984051 351120 1 1 0 1 0 0 0720 0 0 0 897640 0 0 0 0 0 1 0 0 18266 0 10837 0 1 0 002852 2 0 0 33685 0 03254 0 0 024620 1 0 0 0 1349 0 05634 0 0 0 0 1 0 0 03534 0 10807 0 0 0 0 1 0 0 18266 0 10837 0 017923 1 1 2 0 0 0 1 432530 0 0 1 0 0 0 01875 0 104940 0 1 1 13320 96711 1 81736 1 427330 0 2 1 0 31858 0 35914 0 98746 0 1 0 07986 0 436240 0 0 0 1 0 0 1 1 522830 34447 0 33893 0 87298 1 0 0 1 1 522830 34447 0 33893 0 87298 0 0 0 0 0 0 0 81673 0 21109 1 0 0 1 1 0 0 1 1 0 0 2 1 0 0 1975 1 08859 1 0 0 2 1 0 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工厂采购部制度流程
- 工程采购流程及制度范本
- 幼儿园采购人员制度
- 幼儿园食堂用品采购制度
- 应急物资采购储备金制度
- 建筑企业采购制度及流程
- 过氧化二异丙苯装置操作工安全防护评优考核试卷含答案
- 上海农林职业技术学院《档案管理学》2025-2026学年期末试卷
- 上海东海职业技术学院《小儿内科》2025-2026学年期末试卷
- 山西师范大学《保险学》2025-2026学年期末试卷
- 2026年江苏省常州市中考英语调研试卷
- 2026年licenseout对外授权交易关键条款与谈判要点
- 2026福建浦开集团有限公司、福建浦盛产业发展集团有限公司、福建浦丰乡村发展集团有限公司社会公开招聘补充笔试模拟试题及答案解析
- (一诊)2026年兰州市高三模拟考试政治试卷(含答案)
- 2026年3月各地高三语文开学模拟考13道作文题目及范文汇编
- 财政局国库内部控制制度
- 2026年成都市公安局招聘警务辅助人员笔试试题(含答案)
- 2026秋招:广州环投集团笔试题及答案
- 2026广西来宾市忻城县国鑫商贸有限责任公司招聘财务人员2人考试参考题库及答案解析
- 2026年二氧化碳罐车运输项目评估报告
- 【新教材】人教PEP版(2024)四年级下册英语全册教案(含教学计划)
评论
0/150
提交评论