版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
无监督学习项目实战-客户市场细分层次聚类尝试CONTENTSOrderNow01任务描述02知识储备03任务实施04任务评价/01任务描述任务描述任务:客户市场细分应用层次聚类技术对《商场顾客数据》(Mall_Custom.csv)中的消费行为数据进行细分,识别具有相似消费行为模式的顾客群体。在此过程中,注重探讨如何在层次聚类过程中有效地定位每个细分群体的中心点,以便更准确地描述各个群体的特征和核心倾向。/02知识储备层次聚类算法定义将每个数据点最初视为一个独立的簇,然后按照一定规则逐步合并最相似的簇,直到达到预定目标链接准则全链接两簇中最远两点的距离单链接两簇中最近两点的距离平均链接所有点对的平均距离工作原理计算距离矩阵根据选定的距离度量方法,计算所有数据点之间的距离,生成距离矩阵。初始化将每个数据点视为一个独立的簇合并最近的簇根据链接准则,找到距离最近的两个簇并将其合并为一个新的簇更新距离矩阵重新计算新簇与其他簇之间的距离,更新距离矩阵优缺点不需要预先指定簇的数量完整的簇层次结构小规模数据集解释性高优点对异常值敏感计算复杂度较高簇的合并过程不可逆早期错误影响大不足VS分裂层次聚类把所有数据点最初视为一个整体簇,然后逐步划分为更小的子簇,直至满足条件。算法步骤01初始化将所有数据点视为一个簇。02计算簇内异质性评估每个簇的内部异质性,选择最不均匀的簇进行分裂。03分裂簇将选定的簇划分为两个或多个子簇04更新簇结构将分裂后的子簇加入簇集合,并重新计算簇的异质性优缺点不需要预先指定簇的数量完整的簇层次结构小规模数据集解释性高优点对异常值敏感计算复杂度较高簇的分裂过程不可逆早期错误影响大不足VS比凝聚层次聚类更高效树状图/03任务实施确定最优簇数1importnumpyasnp2importmatplotlib.pyplotasplt3fromscipy.cluster.hierarchyimportdendrogram,linkage4linked=linkage(X,method='ward')5plt.figure(figsize=(10,7))6dendrogram(linked,orientation='top',distance_sort='descending',show_leaf_counts=True)7plt.title('Dendrogram')8plt.xlabel('Customers')9plt.ylabel('Euclideandistances')10plt.show()凝聚层次聚类1fromsklearn.clusterimportAgglomerativeClustering2hc=AgglomerativeClustering(n_clusters=5,linkage='ward')3y_hc=hc.fit_predict(X)1plt.figure(figsize=(8,6))2foriinrange(5):3plt.scatter(X.iloc[np.where(y_hc==i)[0],0],X.iloc[np.where(y_hc==i)[0],1],label=f'Cluster{i+1}')4plt.show()实施聚类结果可视化凝聚层次聚类1centers=[]2foriinrange(5):3center=X.iloc[[np.where(y_hc==i)[0].tolist()][0],:].mean()4centers.append(center)5plt.scatter(center[0],center[1],s=200,c='black',marker='x',label='Centers'ifi==0else"")6plt.title('ClustersofCustomers')7plt.xlabel('AnnualIncome(k$)')8plt.ylabel('SpendingScore(1-100)')9plt.grid(True)10plt.show()中心点标注凝聚层次
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年智慧园区应用行业分析报告及未来发展趋势报告
- 2026年粉碎设备行业分析报告及未来发展趋势报告
- 2026年幼儿园母亲节活动细节执行与教育成效总结报告
- 2026年孕妇防辐射服内衣行业分析报告及未来发展趋势报告
- 2026年磅秤行业分析报告及未来发展趋势报告
- 2026年建筑轻钢结构行业分析报告及未来发展趋势报告
- 2026年2,4-二氟苯胺行业分析报告及未来发展趋势报告
- 低血糖宝宝的护理技术培训
- 2026年激光焊接机械行业分析报告及未来发展趋势报告
- 2026年紫外线光疗仪行业分析报告及未来发展趋势报告
- 2026浙江杭州萧山水务有限公司春季招聘10人笔试参考题库及答案详解
- 2026广东东莞市松山湖管委会招聘24人笔试备考试题及答案详解
- (二模)保定市2026届高三第二次模拟考试生物试卷(含答案)
- 2026年市政质量员《专业管理实务》综合提升练习题附参考答案详解【研优卷】
- 雨课堂学堂在线学堂云《医学专业英语(中南)》单元测试考核答案
- 江西H高校学生社团运作行政化问题深度剖析
- 2026智能网联汽车与智能家居系统协同应用技术研究报告
- 【新教材】北师大版(2024)八年级下册生物期末复习全册知识点考点提纲
- GB/T 47141-2026食品保质期确定指南
- 2025年中国人寿保险面试题库及答案
- 收心归位全力以赴2025-2026学年新学期收心主题班会
评论
0/150
提交评论