K-means算法及在图像分割中的简单应用.pptx

上传人：飞*** IP属地：河南上传时间：2020-01-26 格式：PPTX 页数：18 大小：598.39KB 积分：12 举报 版权申诉

已阅读5页，还剩13页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

K means算法及在图像分割中的简单应用 1 主要内容算法简介算法要点实例性能分析算法改进在图像分割中的简单应用 2 算法简介 k means算法一种得到最广泛使用的聚类算法算法的主要思想将各个聚类子集内的所有数据样本的均值作为该聚类的代表点通过迭代过程把数据集划分为不同的类别使得评价聚类性能的准则函数达到最优从而使生成的每个聚类内紧凑类间独立使用范围不适合处理离散型属性但是对于连续型具有较好的聚类效果 3 k means算法输入簇的数目k和包含n个对象的数据库输出 k个簇使平方误差准则最小算法步骤 1 为每个聚类确定一个初始聚类中心这样就有K个初始聚类中心 2 将样本集中的样本按照最小距离原则分配到最邻近聚类3 使用每个聚类中的样本均值作为新的聚类中心 4 重复步骤2 3直到聚类中心不再变化 5 结束得到K个聚类 4 将样本分配给距离它们最近的中心向量并使目标函数值减小更新簇平均值计算准则函数E 5 算法要点 1 选定某种距离作为数据样本间的相似性度量在计算数据样本之间的距离时可以根据实际需要选择欧式距离曼哈顿距离或者明考斯距离中的一种来作为算法的相似性度量其中最常用的是欧式距离 6 距离越小样本xi和xj越相似差异度越小距离越大样本xi和xj越不相似差异度越大 2 选择评价聚类性能的准则函数误差平方和准则函数给定数据集X 假设X包含k个聚类子集X1 X2 XK 各个聚类子集中的样本数量分别为n1 n2 nk 各个聚类子集的均值代表点也称聚类中心分别为m1 m2 mk 则误差平方和准则函数公式为 7 3 相似度的计算根据一个类中对象的平均值来进行将所有对象随机分配到k个非空的类中计算每个类的平均值并用该平均值代表相应的类根据每个对象与各个类中心的距离分配给最近的类然后转 2 重新计算每个类的平均值这个过程不断重复直到满足某个准则函数才停止 8 数据对象集合S如表所示作为一个聚类分析的二维样本要求聚类的数量k 2 1 选择为初始的类中心即 2 对剩余的每个对象根据其与各个类中心的距离将它赋给最近的类对显然故将分配给例子 9 对于因为所以将分配给对于因为所以将分配给更新得到新类和计算平方误差准则单个方差为 10 总体平均方差是 3 计算新的聚类的中心重复 2 和 3 得到O1分配给C1 O2分配给C2 O3分配给C2 O4分配给C2 O5分配给C1 更新得到新类和中心为单个方差分别为总体平均误差是由上可以看出第一次迭代后总体平均误差值52 25降到25 65 显著减小由于在这次迭代中类中心不变所以停止迭代过程算法停止 11 性能分析主要优点是解决聚类问题的一种经典算法简单快速对处理大数据集该算法是相对可伸缩和高效率的当结果类是密集的而类与类之间区别明显时它的效果较好主要缺点在类的平均值被定义的情况下才能使用这对于处理符号属性的数据不适用必须事先给出k 要生成的类的数目而且对初值敏感对于不同的初始值可能会导致不同结果它对于躁声和孤立点数据是敏感的少量的该类数据能够对平均值产生极大的影响 12 针对K means算法缺点的改进方法 1 对于不同的初始值可能会导致不同结果多设置一些不同的初值但比较耗时和浪费资源 2 分类数目K不确定通过类的自动合并和分裂得到较为合理的类型数目K 例如ISODATA算法相同点聚类中心都是通过样本均值的迭代运算来决定的不同点主要是在选代过程中可将一类一分为二亦可能二类合二为一即自组织这种算法具有启发式的特点由于算法有自我调整的能力因而需要设置若干个控制用参数如聚类数期望值K 最小类内样本数类间中心距离参数每次迭代允许合并的最大聚类对数L及允许迭代次数I等 13 k center算法解决k means算法对于孤立点是敏感的问题不采用簇中的平均值作为参照点可以选用类中位置最中心的对象即中心点作为参照点划分方法仍然是基于最小化所有对象与其参照点之间的相异度之和的原则来执行的 k means算法的改进方法 k center算法 14 k modes算法实现对离散数据的快速聚类处理分类属性型数据例如姓名性别年龄等采用差异度D来代替k means算法中的距离差异度越小则表示距离越小一个样本和一个聚类中心的差异度就是它们各个属性不相同的个数属性相同为0 不同为1 并计算1的总和因此D越大即他的不相关程度越强 k means算法的改进方法 k modes算法 15 16 K m

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

K-means算法及在图像分割中的简单应用.pptx

文档简介

温馨提示

最新文档

评论

K-means算法及在图像分割中的简单应用.pptx

文档简介

温馨提示

最新文档

评论

相关文档