混合聚类分析方法.ppt_第1页
混合聚类分析方法.ppt_第2页
混合聚类分析方法.ppt_第3页
混合聚类分析方法.ppt_第4页
混合聚类分析方法.ppt_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Anewapproachine learnersgroupingusingHybridClusteringMethod 组员 一种运用混合聚类分析 在线分组学习 的新方法 指导老师 论文研究背景和动机混合聚类分析方法的流程根据论文提供的实例验证方法根据论文留下的对未来聚类分析的市场预测和采用混合分析方法的新挑战进行扩展分析 Abstract 摘要 在线教育是近些年来刚兴起的一种教育模式 相对于传统的教学模式而言 在线教育便捷 实用 跨越时空界限 更接地气 更适应现代人快节奏的生活方式 分组学习是在线教育的一个基本功能和显著特征 分组学习能够根据广大受众体的个体特征 各取所需 因材施教 大大提高了教学及学习的效率 目前 在全球排名靠前的名牌大学都纷纷开设了自己的网络课程 例如耶鲁大学 哈佛大学 北京大学 还有我们厦门理工 在线教育已经成为一种新的发展趋势 朗读 SO 有效的分组能方便进行科学的教育投资分组研究也加强在线教育的效果 反促进其发展 由于教师和基础设备的限制 无法实现一对一在线教育 故采大都采用分组学习根据所观察到学生的行为和学习特征换做维度 进行聚类分析 分析完的簇相当于组 一次进行个性化教育 如何进行相对应的有效分组是在线学习发展的关键 也是我们这次研究的对象 不同研究者对比 HybridClusteringMethod HCM 英语原著 Itseemsclusteringlearnersbybasicmethodsseparatelyandthenhybridtheresulttodecideaboutclustersisbetterthanmodifyingjustonemethod 中文概括 首先先用各种常见聚类分析方法进行聚类分析 再将结果簇进行混合比较 最后修改成最佳结果 开始 计算DB指数 确定簇的最佳个数 选择聚类分析的基本方法 对照不同聚类方法的结果 在每一个对照组中选择最紧凑的簇 重复修改聚类和删除元素 结束 原著 方法流程 步骤1 计算公式 Ti是簇数量i的成员 Ci是是簇的中心i Xj是i集群的成员第j个 dis C C 是左边等式中的中心第i个和第j个之间聚类的欧氏距离 其中N是簇的数量 而Si是簇的成员i和簇的中心之间的平均欧氏距离 这个距离被确定为 步骤2 选择聚类的基本方法 选择聚类的基本算法 如K means C means等 计算它们的DB指数 步骤3 对照不同聚类方法的结果 根据DB指数的定义特征 DB值越小 聚类分析效果越好 对比不同聚类方法下的DB值 筛选DB值最小的值作为簇的划分个数 步骤4 在每一个对照组中选择最紧凑的簇 选择最高的最佳候选压缩标准 压缩标准被定义为 其中aij为第i个到第j个候选簇元素的特征向量 cj是j聚类的特征向量 nj是聚类j的成员的数量 这个关系通过独立集群成员的数量 计算集群密实度的非线性方程 步骤5 重复修改聚类和删除元素 选择最高的最佳候选压缩标准 压缩标准被定义为 有可能被重复元素在多个聚类或不在认可所有的聚类 因为聚类可能属于不同的集群的方法 解决重复元素的问题 在这一步中 确定多个集群成员的元素 然后决定他们的成员是否在一个聚类 以及删除部分内容 标准产生的最好的集群中 定义这些元素是表达式 4 其中是特征向量和是第j个簇的之间的欧几里德距离的平均值元素 并且该集群的中心 HybridClusteringMethod HCM 在上述的步骤叙述中 每一个步骤的时间和空间复杂度并不是算法的关键 在 在线教育 这个研究范围中 不仅包含着大量的数据还有复杂的混合数据维度 所以算法的关键在于如何精确而又快速的进行聚类分析 实现分组学习 方法简评 EVALUATIONOFHYBRIDCLUSTERINGMETHOD 为了评估所提出的方法 向学生收集关于学习风格 ILS 的问卷调查 再将每个学生的不同行为属性换算成0到11 共12个 的纯数字 以此作为各种学习方式的维度 获取实验数据 EVALUATIONOFHYBRIDCLUSTERINGMETHOD ILS的调查项目 将抽象的属性维转换成具体的数字维度 EVALUATIONOFHYBRIDCLUSTERINGMETHOD 用EvolutionaryFuzzyC means EFC C means K means算法进行聚类分析 计算出DB指数 DB指数越低极为最佳簇的划分个数 如图 此处为DB值为4 如图 此为根据DB值为4的新的聚类分析 EVALUATIONOFHYBRIDCLUSTERINGMETHOD 计算各聚类算法精度 进行对比 P G指数独立于集群的形状和数据分布 是用来找到最好的聚类数据集的指标 P G指数越大 聚类精度越高 CONCLUSIONANDFUTUREWORK 任何改进的算法都是试图对聚类分析进行更好地优化 但对于不同的问题 它们还需要正确的对应运用 显然 混合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论