版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关联分类算法研究HebeiUniversity课题研究目的国际研究现状主要研究内容和创新点研究过程可能遇到的困难及解决方案总结参考文献HebeiUniversity分类问题是通过分析给定的一个带有类别标识的训练数据集,建立一个分类器,然后预测那些未知类别的数据对象关联分类算法数据集中属性的取值是符号型的课题研究目的就是改进、优化关联分类算法提高关联分类算法的分类精度提高关联分类算法的效率提高关联分类算法的可理解性课题研究目的HebeiUniversity国际研究现状1998年Liu等提出了基于类关联规则的分类算法CBA。1999年Dong等提出显露模式分类法CAEP。2000年Wang等结合关联规则分类和决策树分类提出关联决策树。2001年Li等提出基于多条关联规则的分类算法CMAR。2003年Yin等提出预测型关联规则的分类算法CPAR。CPAR采用贪婪方法从数据集中挖掘出较小规则集。2004年Antonie提出正负关联规则的分类算法。2005年Wang提出HARMONY,它直接挖掘覆盖样例置信度最高的规则。2006年AdrianoVeloso等提出的lazy关联分类。2006,2007年Arunasalam提出了适用与类不平衡数据上的关联分类。HebeiUniversity基本概念关联规则:A=>BIfAthenC定义1规则的支持度数据集中匹配规则前件A,并且满足类别属性取值为C的样例的个数.定义2规则的置信度规则的支持度与数据集中匹配规则前件A的样例的个数的比值.HebeiUniversity主要研究内容和创新点关联分类算法的优点分类精度高适应性强关联分类算法存在的问题算法的执行效率 更高效的挖掘方法剪枝的质量和效率 新的规则序关系分类器的可理解性 交叠现象对分类起的影响HebeiUniversity已完成的工作算法的执行效率在构造带类别标识的FP-tree时,在每个节点注册相应类别信息。扩展TD-FP-Growth算法,使它能直接挖掘满足最小支持度和最小置信度的类关联规则。优点:两次扫描数据库,不用重复建立条件FP-tree。减少了内存消耗,提高了运行效率。HebeiUniversity带类别标识FP-tree的构造HebeiUniversity剪枝的质量和效率关联分类中最敏感的问题如何评价类关联规则的质量如何从大量的关联规则中选择有效的规则构造分类器HebeiUniversity如何评价类关联规则的质量经典关联分类规则序关系的定义给定规则Ri,Rj。Ri优于Rj,当且仅当满足以下条件之一:Ri具有比Rj更高的置信度Ri和Rj具有相同的置信度,Ri具有比Rj更高的支持度Ri和Rj具有相同的置信度和支持度,Ri具有比Rj更少的规则项HebeiUniversity经典关联分类规则序关系的缺点其本质是采用置信度,支持度,规则项数目评价顺序。过分强调了置信度,这样在最后构造的分类器中,使得有些规则置信度很高而支持度不高,造成过度拟合。综合考虑置信度和支持度。HebeiUniversityR1:sup(R1)=100,conf(R1)=98%R2:sup(R2)=10,conf(R2)=100%经典序关系R1<R2R1>R2R1有较好的泛化能力,R2可能过度拟合数据。HebeiUniversity15个UCI数据库测试结果HebeiUniversity医疗图像数据库测试结果HebeiUniversity以后要完成的工作完善规则评价函数引入规则的项数考虑类别不平衡情况分类器中规则交叠对分类精度的影响HebeiUniversity分类器的可理解性关联分类构造分类器的方法挖掘满足置信度和支持度阈值要求的类关联规则将规则按定义的序关系排序,基于数据覆盖来选择规则分类器的特点数据集中每条记录都被一条评价值最高的规则覆盖分类器中的规则在训练集中存在相互交叠的现象规则的数目较多HebeiUniversity交叠现象怎样产生的1..10..20..30..40R1:20,100%R4:20,85%R2:20,95%R3:20,90%HebeiUniversity交叠问题解决方法每选择一条规则后,更新剩余规则的置信度,支持度。难度更新的计算量大采用更新,是否比以前的方法有效HebeiUniversity研究过程可能遇到的困难及解决方案规则评价函数的确定不同数据库的影响交叠现象对分类精度的影响选择规则后,更新置信度和支持度比较不同交叠情况的分类精度HebeiUniversity总结针对关联分类算法存在的问题算法的执行效率剪枝的质量和效率分类器的可理解性HebeiUniversity参考文献[1]B.Liu,W.HsuandY.Ma.IntegratingClassificationandAssociationRuleMining.InProc.of1998Int.Conf.onKnowledgeDiscoveryandDataMining(KDD'98),pp.80-86,NewYork,Aug1998.[2]J.Han,J.PeiandY.Yin.MiningFrequentPatternswithoutCandidateGeneration.InProc.oftheACM-SIGMOD2000Int.Conf.onManagementofData(SIGMOD’00),pp.1−12,Dallas,May2000.[3]W.Li,J.HanandJ.Pei.CMAR:AccurateandEfficientClassificationBasedonMultipleClass-AssociationRules.InProc.of2001IEEEInt.Conf.onDataMining(ICDM'01),pp.369-376,SanJoseCA,Nov2001.[4]J.Li,G.Dong,K.RamamohanaraoandL.Wong.DeEPs:ANewInstance-BasedLazyDiscoveryandClassificationSystem.MachineLearning.54,pp.99-124,2004.[5]AdrianoVeloso,WagnerMeiraJr,andMohammedJ.Zaki.LazyAssociationClassification.InProc.of2006IEEEInt.Conf.onDataMining(ICDM'06),pp.645-654,HongKong,Oct2006.[6]Maria-LuizaAntonie,OsmarR.Zaiane,andRobertC.Holte.LearningtoUseaLearnedModel:ATwo-StageApproachtoClassification.InProc.of2006IEEEInt.Conf.onDataMining(ICDM'06),pp.645-654,HongKong,Oct2006.[7]AbdelazizBerrado,GeorgeC.Runger.UsingMetarulestoOrganizeandGroupDiscoveredAssociationRules.DataMiningandKnowledgeDiscover.14:409-431,2007.[8]F.Thabtah,P.Cowling,andY.Peng.MCAR:Multi-classClassificationbasedonAssociationRuleApproach.InProceedingofthe3rdIEEEInternationalConference
onComputerSystemsandApplications.pp.1-7.Cairo,Egypt.HebeiUniversity[17]YanboJ.Wang,QinXinandFransCoenen.ANovelRuleOrderingApproachinClassificationAssociationRuleMining.InProc.MLDM'2007,pp339-348.2007.[18]FransCoenenandPaulLeng.AnEvaluationofApproachestoClassificationRuleSelection.InProc.of2004IEEEInt.Conf.onDataMining(ICDM'04),pp359-362,2004[19]K.Wang,S.Zhou,andY.He.Growingdecisiontreeonsupport-lessassociationrules.InProc.Of2000Int.Conf.onKnowledgeDiscoveryandDataMining(KDD'00),Boston,MA,Aug.2000.[20]FransCoenenandPaulLeng.ObtainingBestParameterValuesforAccurateClassification.InProc.of2005IEEEInt.Conf.onDataMining(ICDM'05),pp.597-600,2005[21]D.MeretakisandB.Wuthrich.ExtendingNaïveBayesClassifiersUsingLongItemsets.InProc.1999Int.Conf.onKnowledgeDiscoveryandDataMining(KDD'99),pages165-174,SanDiego,CA,Aug.1999.[22]BingLiu,YimingMa,andChingKianWong.ImprovinganAssociationRuleBasedClassifier.InProceedingsofthe4thEuropeanConferenceonPrinciplesofDataMiningandKnowledgeDiscovery,
Pages:504–509,2000[23]BavaniArunasalamandSanjayChawla.CCCS:ATop-downAssociativeClassifierforImbalancedClassDistribution.InProc.Of2006Int.Conf.onKnowledgeDiscoveryandDataMining(KDD'06),pp.517-522.2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中道德与法治·中考终极冲刺秘籍备考讲义
- 推动科技与工业深度融合实施办法
- 高中历史学科·跨学科融合·主题班会设计:国殇永铭和平以筑-第12个南京大屠杀死难者国家公祭日主题班会
- 高中一年级心理健康辅导与法治教育融合课教案-青春护航行动:从认知共鸣到共生践行
- 高二物理复盘性班会课的教学论文:系统反思机制与核心素养发展路径
- 高中高一年级主题班会《双休时代的自由时间:你将成为“猎手”还是“猎物”?》教学设计
- 全球城市竞合视域下大都市辐射功能深度复习讲义(高三地理)
- 高中消防安全主题班会教学设计(2025-2026学年第17周示范课)
- 核桃的不饱和脂肪酸作用
- 膀胱结石术后康复锻炼指导
- 河南省顶级名校2026届高三年级5月押题导向卷(一)语文试卷(含答案及解析)
- 2026湖北十堰市茅箭区教育局所属学校招聘教师120人备考题库及答案详解(必刷)
- 《第3课 超越空间》课件
- 外贸公司三年发展战略纲要(2026-2028年)
- 2025云南昆明国有资产管理有限公司招聘3人笔试历年难易错考点试卷带答案解析
- 不动产登记代理人《地籍调查》历年考试真题及答案
- 2026年25届成飞校招笔试题及答案
- 市政污水处理厂工程造价指标分类及编制标准
- 2025年江苏省扬州市初二学业水平地理生物会考真题试卷(含答案)
- 2026年中考道德与法治一轮复习:七八九年级6册教材关键词+一句话核心考点
- 2026年上海市浦东新区社区工作者招聘考试参考试题及答案解析
评论
0/150
提交评论