付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
K-means算法与FuzzyCmeans算法原理介绍分析目录TOC\o"1-3"\h\u9427K-means算法与FuzzyCmeans算法原理介绍分析 1274441.1K-means算法原理与实现 1160831.2FuzzyCmeans算法原理与实现 3本文选用K均值聚类(K-means)算法和模糊C均值聚类(FuzzyCmeans,FCM)算法与本文的随机森林算法形成对比算法,并使用相同测试集进行测试构成本文算法实验结果的对比结果,本节内容将主要介绍上述两种算法的原理与实现。1.1K-means算法原理与实现K-means算法的核心思想是聚类思想,聚类思想认为将样本足够多的特征转化为数值在对应的坐标轴上体现时,类别相同的的样本点总是聚集在一起,并以此为依据对样本集进行分类分割。以聚类思想为基础产生了K-means算法。K-means中的K代表目标样本集所需要被分类的类别数目,以本文的脑肿瘤图像分割为例,需要在图像中分类分割出脑肿瘤区域和非脑肿瘤区域即两类样本,此时K=2。K-means算法实现流程如下:确定K值为2。将没有标签的样本集M中所有的样本根据特征值映射到对应的坐标轴上,在空间中形成样本点。根据K值随机选取两(K=2)个样本点作为分类基准。计算其他样本点对两个基准点的距离(欧氏距离如式3.7或曼哈顿距离如式3.8),离哪个基准点近就将该样本点分为哪一类。重复第4步骤直到完成所有点的分类。开始迭代,先找到这两个类别所有样本点在空间中的中心作为新的分类基准点,再根据距离对所有样本点进行分类。重复第6步骤直到某一次分类的结果与上一次分类的结果相同就停止训练,这时样本点就被分成了两类,即为最终分类结果。欧氏距离:图3.5欧氏距离示意图欧式距离即为A,B两点之间的绝对距离公式如下:(3.7)式中r为特征总数,Ai与Bi为A,B两点在第i个特征上的数值。曼哈顿距离:图3.6曼哈顿距离示意图曼哈顿距离又叫棋盘距离,它指的是A,B两点在空间中坐标轴差值绝对值的总和,沿用式(3.7)的符号,曼哈顿距离的公式如下:(3.8)means算法由于不需要样本集标签信息属于无监督学习。K-means算法的可解释性好,实现起来比较简单,分类效果相比传统方法有一定的改善,但是该算法仍具有一定的不足:他的准确度不如监督学习的算法;对K值的选择十分敏感,导致很难处理没有先验知识的陌生样本集;对分类基准点的随机选取时若选择了噪音点将会对结果产生大幅影响;且由于需要多次迭代,处理高维数据时将会大大抬高时间成本。1.2FuzzyCmeans算法原理与实现FuzzyCmeans算法为K-means的改进算法,其后核心思想同样是聚类思想,fuzzyCmeans中的C与K-means中的K具有相同的含义,即目标样本集所需要被分类的类别数目,同样以本文的脑肿瘤图像分割为例,需要在图像中分类分割出脑肿瘤区域和非脑肿瘤区域即两类样本,此时C=2。与K-means算法不同的是FuzzyCmeans算法引入了模糊的概念,改进了诸如K-means算法的一众硬聚类算法僵硬的分割方式,由于模糊算法中隶属度的引入改善了处于分类边界样本点的分类结果,采用将样本点距样本中心的距离和样本点对种类的隶属度相综合产生分类结果的方法,明显改善了分类结果。隶属度是描述样本从属于某一个类群的概率或模糊程度,例如在一维的特征坐标轴上,规定50为分类临界值,小于50的归类为1类群大于50的归类为2类群,1类群大多数样本点处于30的位置,2类群大多数样本点处于80的位置,此时有一个样本点处于51的位置,在硬聚类算法中该点被改归类为2类群,引入模糊理论之后,可以人为的根据工程需要为样本点对这两个类群赋予隶属度,例如该点对1类群隶属度为0.6,2类群隶属度为0.4,对样本进行分类时综合考虑隶属度和与样本特征值对分类结果的影响,可以有效改善处于分类临界值边界的样本点分类结果。隶属度uc(xi)由隶属度函数U(式3.9)描述,由于隶属度的内在本质是概率,所以在样本集M中每个样本点xi对所有类群的隶属度总和为1,且隶属度越高说明样本点属于该类群的概率越高,反之隶属度为0时说明该样本点完全不属于该类群。(3.9)FuzzyCmeans算法引入隶属度的概念,通过对类群边缘样本的优化,改善了算法迭代中聚类中心的选择,从而有效改善分类输出结果。FuzzyCmeans算法的目标函数如式3.10所示,该算法将图像分类分割过程映射为目标函数的收敛过程,从而实现样本的分类分割。(3.10)式中m代表了聚类的模糊程度即不确定性,m越小模糊程度越小分类结果越接近于硬聚类,反之则聚类的模糊程度将会增大,若m过大将使分类结果严重失真,根据工程经验m的值一般取2。n代表样本集总数,xi代表第i个样本点,c代表类群总数,vj代表第j个类群的聚类中心,uij代表样本点xi对第j个类群的隶属度,d(xi,vj)代表样本点xi到第j个聚类中心vj的欧氏距离。沿用式3.10的符号隶属度函数和聚类中心的迭代公式如下:(3.11)(3.12)FuzzyCmeans算法流程文字表述如下:输入待分割的样本集。设置模糊程度值m=2,最大迭代次数e(e>0),类群数C。初始化聚类中心和隶属度矩阵。根据隶属度矩阵迭代更新聚类中心v和隶属度矩阵U。使目标函数不断收敛,直至聚类中心不再发生变化。输出分类结果。FuzzzyCmeans算法相比于硬聚类算法改善了聚类边缘样本点的分类分割,优化了聚类中心的选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山西中医药大学《货币金融学》2025-2026学年期末试卷
- 上海音乐学院《社会语言学》2025-2026学年期末试卷
- 徐州工程学院《数值分析》2025-2026学年期末试卷
- 上海科创职业技术学院《中国近现代外交史》2025-2026学年期末试卷
- 通化医药健康职业学院《免疫学》2025-2026学年期末试卷
- 山西工程科技职业大学《普通逻辑学》2025-2026学年期末试卷
- 上海对外经贸大学《创新创业导论》2025-2026学年期末试卷
- 邢台新能源职业学院《电气工程基础》2025-2026学年期末试卷
- 七台河职业学院《社会学概论(1)》2025-2026学年期末试卷
- 上海海事大学《公司战略与风险管理》2025-2026学年期末试卷
- 3.31中小学安全教育日校内安全校外安全主题班会模板
- DBJ-T36-073-2026 江西省装配式建筑评价标准
- 2026年全国教育工作会议精神学习传达与贯彻落实指南
- 劳务工奖惩制度
- 投资项目《项目建议书》《可性研究报告》等编制服务方案投标文件(技术方案)
- 5.1《阿Q正传》课件+2025-2026学年统编版高二语文选择性必修下册
- 孟德尔豌豆杂交实验(一)2025-2026学年高一下生物人教版必修2
- 2026年及未来5年市场数据中国公募基金行业市场全景评估及投资策略咨询报告
- 矿泉水安全生产管理制度
- 中国储备粮管理集团有限公司真题
- 2025年浙江村干部考试笔试真题及答案
评论
0/150
提交评论