




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
授课教师:赵
宇项目一智慧校园消费数据分析任务四
校园低消费群体分析
模块2:学生校园消费数据的聚类分析任务四
低消费群体分析任务目标:聚类k-meansK-means是最流行的“聚类”算法之一。K-means存储用于定义聚类的k个质心。如果一个点离哪个质心最接近,则该点被视为位于哪个聚类中。K-Means通过交替进行下面两步来找到最佳质心:(1)根据当前质心将数据点划分到某聚类中;(2)根据当前数据点计算聚类的质心。假设你有一个数据集,其中每个观察到的示例都有一组特征,但没有标签。标签是支持向量机等有监督算法的重要组成部分,它学习得到一个假设函数来预测给定特征的标签,所以我们不能运行监督学习。我们能做些什么?我们可以在无标签数据集上执行的最直接任务之一,是在我们的数据集中找到彼此相似的数据组一一我们称之为聚类。1.初始化质心:为每个簇的质心随机选择K个数据点。2.点的分配:将每个数据点分配给最近的集群(质心).3.更新质心:通过取集群中所有点的平均值来重新计算质心。4.重复步骤2-3,直到各点停止更改集群。聚类k-means聚类k-means--两个概念1.簇(cluster)该算法会根据数据样本间的相似性,将数据样本自动分为K个簇(cluster),相似的数据样本会尽可能被聚到一个簇内。簇,指的就是类别或是组。2.质心(centroid)每个簇都有一个中心位置/中心点,被称作为质心(centroid)。聚类k-means--几种距离,几个参数欧式距离、曼哈顿距离、余弦相似度KMeans类的主要参数有:1)n_clusters:即我们的k值,一般需要多试一些值以获得较好的聚类效果。k值好坏的评估标准在下面会讲。2)max_iter:最大的迭代次数,一般如果是凸数据集的话可以不管这个值,如果数据集不是凸的,可能很难收敛,此时可以指定最大的迭代次数让算法可以及时退出循环。3)n_init:用不同的初始化质心运行算法的次数。由于K-Means是结果受初始值影响的局部最优的迭代算法,因此需要多跑几次以选择一个较好的聚类效果,默认是10,一般不需要改。如果你的k值较大,则可以适当增大这个值。4)init:即初始值选择的方式,可以为完全随机选择'random',优化过的'k-means++'或者自己指定初始化的k个质心。一般建议使用默认的'k-means++'。5)algorithm:有“auto”,“full”or“elkan”三种选择。"full"就是我们传统的K-Means算法,“elkan”是我们原理篇讲的elkanK-Means算法。默认的"auto"则会根据数据值是否是稀疏的,来决定如何选择"ful
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 门脸房贷款买卖合同协议
- 项目值班车租赁合同协议
- 防疫租用酒店合同协议
- 雇请保姆带小孩合同协议
- 项目分包合同解除协议
- 集装箱别墅采购合同协议
- 项目合同和补充协议
- 青岛餐饮加盟合同协议
- 门面房招租合同协议
- 预存贷款合同协议
- Festo气动基础知识介绍
- 物流管理专业毕业答辩论文答辩PPT模板
- 乒乓球-循环赛积分表人-人
- HIV实验室SOP文件-新版
- 孤独症儿童评估填写范例(一表两图)
- 贺兰山东麓干红葡萄酒多酚组分与其抗氧化、抗癌活性的关联性研究
- (4.3.1)-3.3我国储粮生态区的分布
- 辽宁盘锦浩业化工“1.15”泄漏爆炸着火事故警示教育
- 2023年衡阳市水务投资集团有限公司招聘笔试题库及答案解析
- 北师大版五年级数学下册公开课《包装的学问》课件
- 北师大版英语八年级下册 Unit 4 Lesson 11 Online Time 课件(30张PPT)
评论
0/150
提交评论