版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一种基于属性加权的聚类算法概述目录TOC\o"1-3"\h\u730一种基于属性加权的聚类算法概述 [64]对光谱数据进行归一化,并根据恒星光谱哈佛分类系统的恒星分类依据以及恒星天体光谱研究领域专家的经验和意见,选定恒星中普遍存在的28个元素的吸收线来构造吸收线特征集,相关信息汇总如表1.5所示。表1.5中“line”表示光谱吸收线的元素符号,“Wavelength”表示光谱吸收线元素对应的波长位置(单位:Å)。本章选择恒星光谱每个吸收线元素周围最近邻的三维Flux数据来构造84维的吸收线特征集。本章构造了不同量级的恒星光谱数据集进行聚类实验分析。恒星光谱测试集分布情况如表1.6所示。表1.6中的数值表示测试数据集中包含某一类恒星光谱的数据总量。图1.5展示了各聚类算法在不同量级的恒星光谱数据集上的准确率对比。图1.5中垂直于纵坐标的黑色实线为辅助线。图1.5显示AWK算法对恒星光谱数据的聚类结果优于其他几种聚类算法,说明该算法具有一定的实用性。结合表1.6和图1.5可以发现,在不同量级的恒星光谱数据集上AWK算法聚类结果的AC保持相对稳定,说明该算法在对光谱数据进行聚类时具有较好的稳定性。表1.5吸收线元素线表Tab.1.5Absorptionlineselementlinetable编号lineWavelength编号lineWavelength1OII3728.315OIII5008.242HeI388916Mg5176.73CaK3934.7817Na5895.64CaH3969.5918OI6302.055He3971.1919OI6365.546SII4072.320NI6529.037Hd4102.8921NII6549.868CaI4227.9222Ha6564.619G4305.6123NII6585.2710Hc4341.6824SII6718.2911OIII4364.4425SII6732.6712Hb4862.6826Ca8500.3513OIII4932.627Ca8544.4414OIII4960.328Ca8664.52表1.6数据类型分布情况Tab.1.6DistributionofdatatypesAFG数据总量Dataset13003203801000Dataset26006407602000Dataset31580162018005000Dataset430003200380010000Dataset515800162001800050000Dataset6300003200038000100000Dataset7500005000050000150000Dataset8632006480072000200000图1.6展示了各算法在不同量级的恒星光谱数据集上独立运行十次的平均时间消耗情况。图1.6中横坐标为光谱数据量,纵坐标为平均运行时间(单位:104ms)。图中子图是图1.6主图的局部放大图,其表示各算法在Dataset1、Dataset2和Dataset3上的平均运行时间。图1.6中用实心方框与实线组合表示AWK算法在不同数据集上的时间消耗情况。分析图1.6可以发现AWK算法在光谱数据集上的平均运行时间与K-means算法相接近且优于其他几种聚类算法。随着数据量的增加本章算法的运行时间与其他算法对比优势明显增加。图1.5恒星光谱数据的聚类结果Fig.1.5Clusteringresultsofstellarspectraldatasets图1.6各算法在恒星光谱数据集上的运行时间Fig.1.6Runtimeofeachalgorithmonstellarspectraldatasets由1.1.3小节可知本章算法的时间开销相比传统K-means算法增加了第一部分数据属性离散程度计算带来的时间消耗,但是结合图1.3和图1.6可以发现AWK算法与传统K-means算法的平均运行时间近似相等,出现这种情况的原因主要有两方面:其一,传统K-means采用欧氏距离来度量样本间的相似性,本章所提算法采用属性间加权属性求和作为样本间的相似度度量方法,而本章算法在计算样本间相似度时的时间开销要小于计算欧氏距离所带来的开销;其二,本章所提的AW方法减少了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年青海省格尔木市高二化学下册期末考试模拟考试卷【含答案】
- 2025-2026学年潺潺的拼音教学设计模板
- 项目四 任务三
- 2025-2026学年积木游戏教案小班
- 2025-2026学年冰淇淋堆堆塔教案
- 2.3.1共价键的极性和分子的极性 教学设计 高二化学人教版(2019)选择性必修2
- 学前班测试卷思维题及答案
- 兄弟姐妹推理题目及答案
- 2025-2026学年表情娃娃教案
- 值班人员备班制度
- 2026年《医用X射线诊断与介入放射学》考试复习题库(共350题)
- 2026年湖北省黄冈市八年级地理生物会考真题试卷(+答案)
- 循环流化床锅炉(CFB炉)设计计算大纲
- 【新教材】人教版三年级音乐下册6.1《彼得与狼》(教学课件)
- 江西省金合控股集团有限公司招聘笔试题库2026
- 2026年ESG数字化与AI赋能项目商业计划书
- d二聚体课件教学课件
- 病理科设备SOP标准化与诊断准确性
- 【语文】北京市中关村第二小学小学二年级下册期末试卷
- 广告位租赁合同15篇
- DB3302∕T 1016-2025 城市绿地养护质量要求
评论
0/150
提交评论