基于样本类别的邻域粗糙集正域计算

上传人：凹*** IP属地：上海上传时间：2022-11-06 格式：DOCX 页数：6 大小：12.69KB 积分：18 举报 版权申诉

免费预览已结束，剩余1页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

基于样本类别的邻域粗糙集正域计算

表3的折线图如图6所示。

Sonar0.1958,1,45,37,17,13

,10,19

Ionosphere0.181,5,27,12,24,9,

34,3,8,7,17

58,1,45,37,17,13,

10,19

1,5,27,12,24,9,

34,3,8,7,17

Librasmovement

0.0356,83,18,1356,83,18,13

WDBC0.123,8,22,25,29,19

,10

23,8,22,25,29,19,

CreditApproval

0.1614,7,10,2,6,5,8,3

,9,4,11,1,13,12

14,7,10,2,6,5,8,3

,9,4,11,1,13,12

比照两种算法运行时间的折线，可以看出

FARABC算法折线整体处于FHARA算法折线的下方，这说明FARABC算法比FHARA算法具有更少的时间开销。其次，相较FARABC算法，FHARA算法折线波动大，这说明FHARA算法的效率受样本分布的影响，这点符合3.3节性能分析中的结论。

两种算法的度量计算的总次数如表4所示。

表4算法的度量计算次数次

表4的柱状图如图7所示。

通过计算次数的比照，我们发现FARABC算法能明显地减少约简过程中度量计算的次数。

据上可知，和FHARA算法相比，FARABC算法能有效且更快速地得到数据集的属性约简。

5.2.3FARABC算法的效率

由于运行时间受系统误差的影响，且度量计算次数直接影响着算法的时间开销，本局部的分析建立在两种度量计算的次数上。对于各数据集，将其在FARABC算法下得到的计算次数除以其在

FHARA算法下得到的计算次数，用得到的比值表示FARABC算法相对于FHARA算法的效率，其比值越低，说明FARABC算法的效率越高。将数据集按照类别数的大小进展升序排列，如表5所示。

表5度量计算次数的比值(单位:%)

编号数据集类别数比值

1Sonar231.70

2Ionosphere215.17

3WDBC220.76

4CreditApproval212.49

5GermanCredit26.71

6Iris319.73

7Wine328.75

8CMC314.09

9Zoo782.39

10Segmentation773.67

11Librasmovement1550.42

12Abalone2859.79

表5折线图如图8所示。

图8FARABC算法的效率与N的关系

分析图8折线图可知，相对来说，前8个数据集的类别数N较小，其比值也较小，后4个数据集的类别数N较大，其比值也较大。

不失一般性地，通过以上分析可知：数据集的类别数N较小时，度量计算次数的比值较小，即FARABC算法相对FHARA算法的效率较高。这说明FARABC算法对类别数较少的数据集进展属性约简的效率最高，这点符合3.3节性能分析中的结论。

将前8个数据集得到的比值取平均值得18.68，由此得出结论：相比FHARA算法的时间开销，FARABC算法的时间开销最好能缩减5倍左右。

5.3实验结论

上述结论即证明，基于样本类别的正域计算能有效且更快速地得到数据集的属性约简，且对类别数较少的数据集进展计算时效率最高。

6完毕语

本文提出了在邻域粗糙集的正域计算中，同类别样本间的度量计算对正域计算是无奉献的这一结论，进而提出了基于样本类别的正域计算。实验证明了该正域计算有效且更快速，但同时也分析了其适用的范围。对于基于邻域粗糙集的算法，特别是对于因迭代次数多、计算量大而造成时间开销大的算法，在处理样本类别数较少的数据集时都可以采用该正域计算进一步缩减算法的时间开销，优化算法的性能。针对类别数较多的数据集，如何进一步进步基于样本类别的正域计算的效率，我们将在后续的工作中对此问题进展研究。

参考文献:

【1】PawlakZ,So-WinskiR.Roughsetapproachtomul-ti-attributedecisionanalysis[J].EuropeanJournalofOp-erationalResearch,1994,72(3):443-459.

【2】ZadehLA.Towardsatheoryoffuzzyinformationgranu-lationanditscentralityinhumanreasoningandfuzzylogic[J].FuzzySetsandSystems,1997,90(90):111-127.

【3】LinTY.GranularputingonbinaryrelationsI:Dataminingandneighborhoodsystems[J].RoughSetsinKnowledgeDiscovery,1998,18(1):107-121.

【4】HuQ,YuD,LiuJ,WuC.Neighborhoodroughsetbasedheterogeneousfeaturesubsetselection[J].InformationSciences,2022,178(18):3577ndash;3594.

【5】王国胤.Rough集理论与知识获取[M]．西安：西安交通大学出版社,2022:147156

【6】胡清华,赵辉,于达仁.基于粗糙集的符号与数值属性的

快速约简算法[J].形式识别与人工智能,2022,21(6):730-738.

【7】胡清华,于达人.应用粗糙计算[M].北京:科学出版社,2022.

[8]LiuY,HuangW,JiangY,ZengZ.Quickattributereduct

algorithmforneighborhoodroughsetmodel[J].Infor-mationSciences,2022,271(7):65-81.

[9]刘勇,熊蓉,褚健.Hash快速属性约简算法[J].计算机学

报,2022,32(8):1493-1499.

[10]MengZ,ShiZ.Afastapproachtoattributereductionininpletedecisionsystemswithtolerancerelation-basedroughsets[J].Informati

人人文库> 全部分类> 专业文献 > 学术论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于样本类别的邻域粗糙集正域计算

文档简介

温馨提示

最新文档

评论

基于样本类别的邻域粗糙集正域计算

文档简介

温馨提示

最新文档

评论

相关文档