常用聚类算法原理及应用实验教学探究聚类算法原理及应用课件_第1页
常用聚类算法原理及应用实验教学探究聚类算法原理及应用课件_第2页
常用聚类算法原理及应用实验教学探究聚类算法原理及应用课件_第3页
常用聚类算法原理及应用实验教学探究聚类算法原理及应用课件_第4页
常用聚类算法原理及应用实验教学探究聚类算法原理及应用课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

蔬菜类工具类分类大挑战分类大挑战分类数量及规则自定,可留空有分类标签无分类标签“分

类"“聚

类”常用聚类算法原理及应用学 科:信息技术(粤教版) 年 级:高二年级学 校某省市涪陵实验中学校某新区新建了5个相邻近的小区(A、B、C、D、E),为便利小区居民生活,现需在5个小区范围内选址建设2个菜鸟驿站站点。实验项目探究背景ABCDE1 提出问题如何确定驿站的位置使5个小区的居民都能满意?甲——>A乙——>BCDEA甲B乙你们满意这个选址方案吗?第一轮选址如何确定驿站的位置使5个小区的居民都能满意?ABCDE甲乙甲——>A、C

中间乙——>B、D、E

中间你们满意这个选址方案吗?第二轮选址1 提出问题如何确定驿站的位置使5个小区的居民都能满意?ABCDE甲乙甲——>A、B、C

中间乙——>D、E

中间你们满意这个选址方案吗?第三轮选址1 提出问题如何确定驿站的位置使5个小区的居民都能满意?ABCDE甲乙甲——>不变乙——>不变第四轮选址得到最终选址方案——k-Means聚类的思想1 提出问题【实验结论一】K-Means算法是基于距离的聚类CDEA甲B乙ABCE甲乙DABCD甲乙E第一轮选址第二轮选址第三轮选址ABCD甲乙E第四轮选址如何判断聚类结束,得到最终选址方案?

——选址中心点是否发生变化2 梳理问题,生成算法随机选择2个站点初始位置计算每个小区到站点的距离,距离近的划分一类重新选择该类区域的中心位置为站点位置站点位置与上一轮比较是否变化选址结束随机选择2个站点初始位置计算每个小区到站点的距离,距离近的划分一类重新选择该类区域的中心位置为站点位置站点位置与上一轮比较是否变化选址结束是否分别计算各个点到中心点的距离,并将距离近的归为一类重新计算中心点是聚类中心是否发生变化否结束开始输入n个数据集循环迭代5个小区

2个驿站

随机选取K个点作为初始聚类中心站点站点位置【实验结论二】K-Means算法的核心思想是一个循环迭代的过程3 抽象计算模型实验活动2:完成导学案上的每一轮聚类的甲、乙两个站点的坐标计算。小区X值Y值ABCDE1.82.81.53.6345.82.36.21.80 1 2 3 4 5 6BACDE65432选取A,B小区作为初始聚类中心甲、乙。13 抽象计算模型小区X值Y值ABCDE1.82.81.53.6345.82.36.21.8F4.26.80 1 2 3 4 5 6654321BACDEF实验活动3:利用程序,选择不同的初始聚类中心点,完成对6个小区坐标的聚类。【实验结论三】K-Means聚类的结果受初始聚类中心的影响K-Means聚类算法发现给定数据集的

K

个簇的聚类算法。簇个数

K

是用户指定的,

每一个簇通过其质心(即簇中所有点的中心)来描述。K值 聚类中心点数量 驿站站点的数量4 项目升级实验活动4:在涪陵老城区将建立7~9个物流运输中心,考虑到工作人员的配送量,每个物流中心的服务小区数量最多为12个。如何用聚类算法确定物流中心的位置?运输中心的数量该如何确定?聚类的目标数据是什么?4 项目升级实验活动4:在涪陵老城区将建立7~9个物流运输中心,考虑到工作人员的配送量,每个物流中心的服务小区数量最多为12个。如何用聚类算法确定物流中心的位置?运输中心的数量该如何确定?聚类的目标数据——经纬度数据4 项目升级Orange一个不需要编程知识进行机器学习的python工具箱工作区功能组件区数

据转

换可视化模

型评

估无监督4 项目升级Orange一个不需要编程知识进行机器学习的python工具箱数

据可视化无监督准备并导入经纬度数据算法的选择和训练查看聚类结果K=8K=9K=7×K=8K=9一种评价聚类效果的指标,得分越高,聚类效果越好【实验结论四】聚类的结果受K值的影响,K值的选择由实际情况和聚类评价指标决定K-Means聚类算法总结算法原理简单,可解释性强;在大型数据集上可以快速高效并行计算。K值不好把握;聚类初始值的选取会影响聚类结果。5 应用提升聚类算法在实际生活中的应用选址问题:银行,学校,公园,应急救援中心等客户类型聚类:定向投放广告,消费倾向分析,APP用户画像疾病预测:疾病诊断,流行病学分析等……

课后延伸

在“实验活动4”中根据各小区的经纬度数据进行了聚类,实际应用中,影响物流中心选址的因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论