下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于样本类别的邻域粗糙集正域计算
表3的折线图如图6所示。
Sonar0.1958,1,45,37,17,13
,10,19
Ionosphere0.181,5,27,12,24,9,
34,3,8,7,17
58,1,45,37,17,13,
10,19
1,5,27,12,24,9,
34,3,8,7,17
Librasmovement
0.0356,83,18,1356,83,18,13
WDBC0.123,8,22,25,29,19
,10
23,8,22,25,29,19,
10
CreditApproval
0.1614,7,10,2,6,5,8,3
,9,4,11,1,13,12
14,7,10,2,6,5,8,3
,9,4,11,1,13,12
比照两种算法运行时间的折线,可以看出
FARABC算法折线整体处于FHARA算法折线的下方,这说明FARABC算法比FHARA算法具有更少的时间开销。其次,相较FARABC算法,FHARA算法折线波动大,这说明FHARA算法的效率受样本分布的影响,这点符合3.3节性能分析中的结论。
两种算法的度量计算的总次数如表4所示。
表4算法的度量计算次数次
表4的柱状图如图7所示。
通过计算次数的比照,我们发现FARABC算法能明显地减少约简过程中度量计算的次数。
据上可知,和FHARA算法相比,FARABC算法能有效且更快速地得到数据集的属性约简。
5.2.3FARABC算法的效率
由于运行时间受系统误差的影响,且度量计算次数直接影响着算法的时间开销,本局部的分析建立在两种度量计算的次数上。对于各数据集,将其在FARABC算法下得到的计算次数除以其在
FHARA算法下得到的计算次数,用得到的比值表示FARABC算法相对于FHARA算法的效率,其比值越低,说明FARABC算法的效率越高。将数据集按照类别数的大小进展升序排列,如表5所示。
表5度量计算次数的比值(单位:%)
编号数据集类别数比值
1Sonar231.70
2Ionosphere215.17
3WDBC220.76
4CreditApproval212.49
5GermanCredit26.71
6Iris319.73
7Wine328.75
8CMC314.09
9Zoo782.39
10Segmentation773.67
11Librasmovement1550.42
12Abalone2859.79
表5折线图如图8所示。
图8FARABC算法的效率与N的关系
分析图8折线图可知,相对来说,前8个数据集的类别数N较小,其比值也较小,后4个数据集的类别数N较大,其比值也较大。
不失一般性地,通过以上分析可知:数据集的类别数N较小时,度量计算次数的比值较小,即FARABC算法相对FHARA算法的效率较高。这说明FARABC算法对类别数较少的数据集进展属性约简的效率最高,这点符合3.3节性能分析中的结论。
将前8个数据集得到的比值取平均值得18.68,由此得出结论:相比FHARA算法的时间开销,FARABC算法的时间开销最好能缩减5倍左右。
5.3实验结论
上述结论即证明,基于样本类别的正域计算能有效且更快速地得到数据集的属性约简,且对类别数较少的数据集进展计算时效率最高。
6完毕语
本文提出了在邻域粗糙集的正域计算中,同类别样本间的度量计算对正域计算是无奉献的这一结论,进而提出了基于样本类别的正域计算。实验证明了该正域计算有效且更快速,但同时也分析了其适用的范围。对于基于邻域粗糙集的算法,特别是对于因迭代次数多、计算量大而造成时间开销大的算法,在处理样本类别数较少的数据集时都可以采用该正域计算进一步缩减算法的时间开销,优化算法的性能。针对类别数较多的数据集,如何进一步进步基于样本类别的正域计算的效率,我们将在后续的工作中对此问题进展研究。
参考文献:
【1】PawlakZ,So-WinskiR.Roughsetapproachtomul-ti-attributedecisionanalysis[J].EuropeanJournalofOp-erationalResearch,1994,72(3):443-459.
【2】ZadehLA.Towardsatheoryoffuzzyinformationgranu-lationanditscentralityinhumanreasoningandfuzzylogic[J].FuzzySetsandSystems,1997,90(90):111-127.
【3】LinTY.GranularputingonbinaryrelationsI:Dataminingandneighborhoodsystems[J].RoughSetsinKnowledgeDiscovery,1998,18(1):107-121.
【4】HuQ,YuD,LiuJ,WuC.Neighborhoodroughsetbasedheterogeneousfeaturesubsetselection[J].InformationSciences,2022,178(18):3577ndash;3594.
【5】王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2022:147156
【6】胡清华,赵辉,于达仁.基于粗糙集的符号与数值属性的
快速约简算法[J].形式识别与人工智能,2022,21(6):730-738.
【7】胡清华,于达人.应用粗糙计算[M].北京:科学出版社,2022.
[8]LiuY,HuangW,JiangY,ZengZ.Quickattributereduct
algorithmforneighborhoodroughsetmodel[J].Infor-mationSciences,2022,271(7):65-81.
[9]刘勇,熊蓉,褚健.Hash快速属性约简算法[J].计算机学
报,2022,32(8):1493-1499.
[10]MengZ,ShiZ.Afastapproachtoattributereductionininpletedecisionsystemswithtolerancerelation-basedroughsets[J].Informati
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 童年生活(共10篇)
- 交通肇事死亡的和解的协议范文合集
- 房屋转让协议书的范本合集
- 国有企业改制上市立项的申请合集
- 报纸广告合同合集
- 2022年度江西省安全评价师职业资格通关题库(附答案)
- 短期研究实习协议范本经典版合集
- 2023年lolita洋装资金申请报告
- 2023年镂铣机械资金需求报告
- 个人循环借款合同标准格式合集
- 职业技术学院进一步深化校企合作产教融合实施方案
- 高中化学《化学实验基础》练习题(附答案解析)
- 北京市2020年普通高中学业水平考试化学(等级考)抽样试题及评分细则
- 《中国居民膳食指南》
- 足外伤护理查房
- 幼儿园课件:小班数学形状《小熊饼干店》
- 事件的独立性教学设计 高一下学期数学人教A版(2019)必修第二册
- 职业病护理课件
- 中国民间文学概论(第四版)课件 第6、7章 民间歌谣、史诗
- 中国血脂管理指南(2023-年版)解读
- 《麦肯锡咨询工具》课件
评论
0/150
提交评论