(农业机械化工程专业论文)基于智能计算的犬病诊断系统研究.pdf_第1页
(农业机械化工程专业论文)基于智能计算的犬病诊断系统研究.pdf_第2页
(农业机械化工程专业论文)基于智能计算的犬病诊断系统研究.pdf_第3页
(农业机械化工程专业论文)基于智能计算的犬病诊断系统研究.pdf_第4页
(农业机械化工程专业论文)基于智能计算的犬病诊断系统研究.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(农业机械化工程专业论文)基于智能计算的犬病诊断系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 分析了目前国内外医疗诊断专家系统,特别是动物疾病诊断领域专家系统 的研究现状,针对存在的一些问题,在做进一步的用户需求分析,并深入研究 原有疾病诊断专家系统和相关文献的基础上,提出了构建基于智能计算的犬疾 病诊断系统的思路和方案。 由于知识获取、高效推理、自学习是开发诊断专家系统的难点,也是传统 疾病诊断系统的不足。根据这些不足和犬疾病智能诊断系统用户需求特点以及 功能要求,研究设计了以粗糙集理论、模糊理论、神经网络为核心的专家系统 知识获取和推理机制。 知识获取。是在领域专家提供的大量确诊案例数据的基础上,用基于粗 糙集的属性约简算法实现对原始案例数据中冗余属性的约简;二是根据犬疾病 诊断手册,直接获取疾病的典型症状属性。由上述方法得到的属性作为输入变 量构造一种基于规则的模糊神经网络也就是将规则以显式形式在神经网络 中表示出来,再用相应案例数据训练神经网络,进而获取犬病诊断知识,建立 知识库。 诊断推理与解释。用户选择症状后,激活相对应的已训练好的网络结构, 经过计算可得到诊断结果,其中推理策略采取混合推理,按后验概率的大小排 列第一次推理结果,如果能得出确诊结论则结束,输出结论;如果不能得到确 诊结论( 疑诊结论) ,则进行二次诊断,调出疑诊结论的相关症状供用户选择, 进一步推理诊断。规则显示的神经网络结构,使神经网络的推理过程能够清楚 地被理解和解释。 自学习。经过实验室临床确诊的疾病,可以作为实例进行训练、完善知识 库。如果系统的诊断与临床诊断一致,则优化权值;反之,如果不一致,则可 以自学习更改相应权值,使知识库自动完善。 在上述工作基础上,应用j a v a 编程,o r a c l e 数据库等技术,设计并实现了 基于智能计算的犬疾病诊断系统。 关键词:智能计算;模糊神经网络;粗糙集;疾病诊断;规则 s t u d yo nd i a g n o s t i cs y s t e mo fd o g d i s e a s eb a s e do ni n t e l l i g e n tc o m p u t i n g a u t l l o r :z e n g “h u a s u p e r v i s o r :“y a m i n m a j o r :a g r i c u i t w a lm e c h a n i z a t i o ne n g i n e e r i n g a b s t r a c t t h i sp a p e ra n a l y s e st h ec u r r e n ts t a t e so fr e s e a r c ho nm e d i c a h r e a t m e n te x p e r t s y s t e m s ,e s p e c i a l l yt h o s eo f 蛆i m a ld i s e a s ed i a g n o s i sd o m a i n t or e s o l v et h e p r o b l e m si nt h en e l d ,w ed i df 打t l l c ru s e r sr e q u i r e m e n ta n a l y s i s 肌ds t u d i e dt l l eo l d d i s e a s ed i a g n o s i se x p e r ts y s t e m s 硒n e r ,a n ds o m ed o c u m e m sw h i c hc o r r e l a t i v e w i t ht h e ma r el u c u b r a t e d o n 1 eb a s i so fm ea b o v ew o r k s ,w ep u tf o r w a r dt h ei d e a a n ds o l u t i o n ,i e t ob u i l dd o gd i s e a s ed i a g n o s i 8s y s t e mb a s e do ni n t e l l i g e l l c e c o m p u t i n g o na c c o u n to fl ( n o w l e d g ea c q u i s i t i o n ,e 瓶c i e n t l yr e a s o n i n ga n ds e l f - s t u d y a b i l i t ya r en l ed i 伍c u l t yo fd i a 肛o s i sc x p e r ts y s t e md e v e l o p m e n t ,a n da l s ot h e ya r e t h es h o r t a g eo ft r a d i t i o n a ld i s e a s ed i a g n o s i ss y s t e m a c c o r d i n gt ot l l o s es h o r t a g ea n d t h ef e a t u r e so fu s e r t sr e q i l i r 栅a ta n dm ef u n c t i o nr e q u i r c db yt h ed o gd i s e a s e i n t e l l i g e n c es y s t e m , t h ek t l o w l e d g e a c q u i s i t i o n a n dr e a s o n i n gm e c h a i l i s mo f i n t e l l i g e n c es y s t e mi ss 叫i c da n dd e s i g n e d ,w h i c hu 8 e sr o u g hs e t st h e o r y ,f u z z y t h e o r ya n dn e u r a ln e t w o r k a st h ek e yt e c h n o l o 舀e s i tc a nb ed e s c r i b e da sf 0 1 l o w s k j l o w l e d g ea c q u i s i t i o n u s et h ea t t r i b u t e sr e d u c t i o na l g o r i m mb a s e do nr o u 曲 s e t st or c d l l c et h er e d l l n d a n c ea t t r i b u t e si nt h ep r i m a r yd a t ao fd o gd i 8 e a s ec a s e s , w h i c hc o m e s o md o m a i nc x p e r t sa i l dm ec a s e si nt h ed a t aa r ev a s ta n dh a db e e n d i a g n o s e d a tt 1 1 es 锄et i m e ,w ec a ng e tt y p i c a lc a s e sd i r e c t l y 疳o md o gd i s e a s e d i a g n o s i sm a n u a l t a k et h ea t t f j b u t e s ,w h i c ha r eg a j n e db ya b o v em e t h o d s ,a sm e i n p u ta r g u m e n t st ob u i l dn e i l r a ln e t w o r k ,w h i c hi sb a s e do nm l e sa n dm a k et h en 1 1 e s e n c o d e d e x p l i c i t ly u s i n g也i s n e u r a ln e t w o r k , r e a s o n i n g p r o c e s s e s c a nb e u n d e r s t o o da n de x p l a i n e dd i s t i n c t l yl a s t ,u s em ec o r r e s p o n d i n gd a t ao ft h ec a s e s t r a i n i n gt h en e u r a ln e 嘶o r kt oa c q u i r et h ed i a g n o s t i ck n o w l e d g eo fd o gd i s e a s ea i l d t h e nc r e a t em ek n o w l e d g eb a s e , r e a s o n i n ga n de x p i a n a t i o n w h e nu s e r s e l e c t s y m p t o m , t h e c o e s p o n d i n g n e t w o r kw i l lb ea c t i v a t i o n h e r e ,h y b r i dl n f e r e n c em e c h a l l i s mi su s e d t h ef i r s t i n f e f e n c er e s u l ti sa r r a y e db yt h ev a l u eo fp o s t c r i o rp r o b a b i l i t yi ft h ec o n c l u s i o ni s d i a g l l o s e d ,t h e no u t p u t t h ec o n c l u s i o n h o w e v e f ,i fi t i s n td i a g 士1 0 s e dm a tm e a n s s u s p e c tc o n c l u s i o n ,t h e nc o n t i n u et h es e c o n dd i a g n o s e a n o 廿l e rr e l a t i o n a ls y m p t o m s s h o wa n dc a nb ec h o o s eb yu s e r ,a n dt h e nc o n t i n u et h es e c o n di n f b r e n c ed i a g n o s e s e l f - s t u d y d i s e a s ec l i n i c a ld i a g n o s e sw h i c ha f t c rt h ei a b o r a t o r y ,m a yc a h yo n t h et r a i n i n g ,a n dp e r f e c tt h ek r l o w l e d g el i b r a r y i ft 1 1 es y s t e md i a g n o s i si sc o n s i s t e n t w i t hm ec l i n i c a ld i a 鳃o s i s ,t h e no p t i m i z e dw e i g h t ;o t h e 研i s e ,i ti si n c o n s i s t e n t ,t h c n s e l f - s t u d ya n dc o r r e c tw e i 曲t ,m a k et h eh o w l e d g el i b m r ya u t o m a t i cc o n s u m m a t i o n u p o nt h ef b u n d a t i o na b o v e ,ad o gd i s e a s ei n t e l l i g e n c ed i a g n o s i ss y s t e mb a s e d o nr o u g hs e t st h e o r y ,如z z yt h e o r ya n dn e u r a ln c t w o r k ,e t c i sd e s i g n e da i l dr c a l i z e d w i t hu s i n gm a n yt e c t l i l o l o 垂e s ,s u c ha sj a v a ,o r a c l ed a t a b a s e ,e t c k e yw o r d s :i n t e l l i g e n tc o m p u t i n g ;f l l z z yn e u r a ln e t w o r k ;r o u 班s e t s ;d i s e a s e s d i a g i l o s i s ;r m l e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得 的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得塑j e 盛些盍堂或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。 学位论文作者签名崤鲜 签字日期:砌年月膨日 关于论文使用授权的说明 本学位论文作者完全了解鲤j t 盘些太堂有关保留及使用学位论文的规定, 有权保留并向国家有关部门( 机构) 送交论文的复印件和磁盘,允许论文被查 ( 借) 阅。本人授权煎j i 壅些盎堂可以将论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等方法加以保存或编成学位论文。 ( 保密的学位论文在解密后应遵守此协议) 学位论文作者签名: 靴犟 导师签名: 签字日期: 枷f 年厂月,矿日 签字日期 亿们 扩水 p 抓, 基于智能计算的犬疾病诊断系统研究 1 1 问题的提出与研究意义 1 引言 随着社会经济的快速发展,人们在享受不断丰富的物质文化生活的同时,也需要丰富 的精神生活来调节,尤其是社会竞争日趋激烈,人们的工作压力不断加大;现代生活和住 房结构的变化,老年人独居或缺少年轻人的陪伴;独生子女的孤寂心理和缺少爱心等社会 现象,通过饲养宠物犬能得到很好的调节。这正是饲养宠物犬的家庭越来越多的主要原因。 犬与人的生活密切相关,因此犬患病后及时发现与对症治疗是至关重要的,特别是人畜共 患病。近几年,发现人类的一些疾病与动物的关系越来越密切,科学家报告说,动物疾病 的爆发流行正超过人类疾病,他们发现过去2 5 年中有3 8 种动物流行病爆发。美、英科学 家在于美国圣路易斯举行的美国科学促进协会年会上报告说,在人类能感染的1 4 0 7 种病原 体( 包括病毒、细菌、寄生虫、原生动物和真菌) 中,5 8 来源于动物【“。犬患病后直接 影响着人类健康和生存。因此,犬患病能得到及时诊断和治疗非常重要。然而,只有少数 人具有足够的知识和经验,能对犬疾病进行充分、有效的诊断和治疗。从另一个角度讲, 也只有少数的专家具有丰富的经验和知识,我们渴望得到这些专家知识,并能很方便地把 它运用到我们日常的犬疾病诊断中。 现代动物疾病诊治面临许多问题:( 1 ) 医疗费用的不断增长,超出了个人和社会的承 受能力: ( 2 ) 知识爆炸性的增长与混乱,用人工阅读方式无法全面掌握;( 3 ) 医疗专家 地区分布不均,大部分地区缺少高水平的兽医:( 4 ) 需要高水平医疗服务的人越来越多与 可能提供的高质量服务产生激烈的矛盾。动物医院的兽医诊断水平良莠不齐,并且直接影 响犬疾病的确诊和及时治疗。如果把对犬的诊断及治疗经验建立一套智能疾病诊断系统, 就能帮助兽医快速准确的进行诊断、治疗。 本课题研究旨在将计算机专家诊断与治疗应用于犬病临床,以满足养狗爱好者、各级 兽医站、小动物门诊、军警犬使用单位及学校小动物疾病临床模拟教学的需要。当犬出现 了异常症状,能够及时发现并迅速处理,既能保证犬类的健康,同时也为人类健康创造了 良好环境。 1 2 国内外研究现状 把计算机技术用于医疗诊断研究一直是人工智能研究最主要和最活跃的领域。医学诊 疗专家系统就是运用专家系统的设计原理与方法,模拟医学专家诊断疾病的思维过程,实 现疾病诊断和治疗的程序系统”。它可以帮助专家解决复杂的医学问题,作为专家诊断的 辅助工具,可以继承和发扬医学专家的宝贵理论以及丰富的临床经验。医学专家系统研究 河北农业大学硕士学位论文 领域包括许多方面,如疾病诊断、医疗测试、数据解释、疾病治疗与控制、医疗管理及医 疗知识教学等。随着专家系统技术的日臻完善,越来越多的专家系统被用于医疗诊断领域。 表l 列出了几个主要的医学专家系统。 表l 部分医学专家系统 t a b l e ls o m ee x a m p l e so f e x p e r ts y s t e m si nm e d i c i n e 国外有关兽医的专家诊断系统有不少,其中最具有代表意义的是2 0 世纪7 0 年代由斯 坦福( s t a l l f b r d ) 大学建立的为细菌感染疾病的诊断和治疗提供咨询的计算机咨询专家系统 m y c i n 系统。该系统用产生式规则的形式体现专家的判断知识,以模仿专家的推理 过程。初始m y c i n 包含有2 0 0 条关于细菌血症的规则,可以识别大概5 0 种细菌,以后该 系统又经过了扩展和改进,使其可以诊断和治疗脑膜炎。m y c i n 取得的成功极大地推动 了专家系统技术在智能疾病诊断领域的应用和发展1 6 】。由ks a i t o 等研制的基于p d p 网络 医疗诊治系统在只有3 0 0 例训练样本的情况下,其诊断准确率与传统的e s 完全一致【”。美 国n o r i h e a s t 大学的g a l l t 教授首次提出并建立了联接专家系统( c o l l l l e c t i o n i s te x p e n s y s t e m ) 弘,1 该系统用于肉蝇病的诊断和治疗,采用了一个三层局部互联网络,其中第一层 为输入层,有6 个节点分别代表症状第二层有2 个节点表示疾病,第三层为输出层,有 3 个节点表示治疗药物。该系统通过从样本学习获取知识并分布于网络权值和闽值中,以 并行计算方式进行推理,并可用i f t h e n 规则对推理结果解释。 可见计算机辅助的疾病诊断系统,都是针对某一类疾病,特别是有关犬病的专家诊断 系统只限于某类疾病上如s a r o y e 等研制的兽医临床专家系统可对犬的神经系统疾病进行 诊断治疗【”j ,c a s a n o v e 研制了犬多尿与烦渴综合症专家诊断系统等j 。 2 基于智能计算的犬疾病诊断系统研究 近几年,国内已有一些关于家畜、家禽疾病专家诊断系统的报道。1 9 8 4 年于船等用电 子计算机对家畜2 1 种病证进行辩证施治,属国内中兽医领域首次尝试。1 9 8 5 年张泉鑫等 应用电子计算机模拟中兽医对牛的前胃疾病进行了鉴别诊断。1 9 9 2 年许剑琴等采用改进的 贝叶斯公式,对鸡常见群发病进行计算机诊断。1 9 9 5 年陆昌华等研制“鸡常见疾病计算机 临床诊断专家系统”经过3 年努力,已建立鸡疾病诊断知识库,可对鸡新城疫、马立克、 法氏囊、支气管炎、喉支气管炎、败血霉形体病等主要鸡传染病、营养代谢病和寄生虫病 作出临床诊断。张克家等设计的猪常见腹泻病电子计算机诊断专家系统,将1 1 0 例病例中 的诊断信息逐个输入电子计算机,用专家系统进行回顾性诊断,以验证本系统的实用性和 正确性。结果完全符合和基本符合的共8 7 例,占7 9 0 9 f 1 2 】。刘孟强等1 9 9 7 年研制“犬病 诊断的计算机模拟研究系统”进行了3 0 多病例的试用。试用情况基本满意,诊断结果的正 确率9 8 。模拟的效果总的来说是好的【”1 ”。吴德华等1 9 9 8 年研制的“犬病专家诊断系 统”先后对临床病历进行验证,准确率为8 7 ,5 ,表明该系统有较高的诊断准确性。2 0 0 1 年汪明磊研究并建立了基于神经网络的鸡病诊断专家系统f 1 7 】。2 0 0 2 年王靖飞与刘东明分别 对奶牛的疾病诊断与治疗进行了研究8 ”】。胥斌结合遗传算法与神经网络理论研究了奶 牛的疾病诊断遗传神经网络模型【2 0 】。 纵观国内外的医疗诊断系统,已经为人类的生产生活提供了极大的便利,有些系统已 经在某一疾病诊断上取得了很好的效果,并且可以看出基于神经网络的专家系统研究越来 越热门,并取得了一些成就。但是还没有成熟的动物智能诊断系统在动物疾病诊断和治疗 中发挥很好的作用,人工智能在动物疾病诊断的应用处于研究、探索阶段。究其原因主要 有以下几个方面: ( 1 ) 知识获取“瓶颈”,知识、规则获取一真是诊断系统的难题。少数几个成功的诊 断系统,只是针对某一疾病或某一类疾病,也是因为某一种疾病的知识较少,较集中,相 对容易获取、整理。 ( 2 ) 推理机制方面,用户提供的信息的模糊性、不确定性给诊断推理带来了不便,使 其必须考虑研究不精确推理。 ( 3 ) 解释机制方面,基于规则的专家系统虽然有知识获取“瓶颈”的不足,但是有较 好的解释能力:基于神经网络专家系统有很好的知识获取及推理能力,但是不能够给出合 理的解释。 现在动物疾病诊断系统的发展趋势就是朝着某种动物的疾病综合诊治,诊断的高准确 率、高效率,以及与时俱进、及时更新知识库、自学习方向等。因此,本文研究了基于智 能计算的犬疾病诊断系统。 1 3 主要研究内容和技术路线 1 3 1 主要研究内容 针对目前动物疾病诊断存在的问题,结合用户实际需求,本论文的主要任务是研究和 河北农业大学硕士学位论文 设计适合用户方便、易使用的犬疾病诊断系统。主要研究内容如下: 根据用户需求,研究合理、适用的犬疾病诊断系统的体系机构和关键技术; 重点研究犬疾病诊断系统的知识获取和推理机制的理论方法及设计、实现: 提出犬疾病诊断系统的总体结构方案,设计出既能为用户提供诊断又能为用户提供参 考治疗方法,并且通过图片、声音、多媒体等方法供用户方便诊断与学习犬疾病知识。 1 3 2 技术路线 4 根据上述工作特点和要求,采用如图l 的技术路线。 i 问题提出 1 0 调研、文献分析 0 理论方法研究 0 知 识 基于粗糙集规则知识获取 获 取 从诊断手册获取知识 模糊神经网络的建立、训练与推理 系统开发实现 结论与展望 图l 技术路线 f i g 1t c c h n i c a lr o u t c 基于智能计算的犬疾病诊断系统研究 2 稠关基本理论 智靛计算( i n t e l l 逸t e o m p u t i n g ) 口o “j ,也有人称之为软计算( s o 矗c o m p u d n g ) ,是 由簇凝祭理论莪翅始又,糟竟稳大学教授l z a d e h 鬟掰来嚣o ”。窀怒黄动褒代诗簿工具模 拟人的智能求解问题( 硪处理信息) 的理论与方法,是人工智能的深化与发展。如果说人 工智能是以知识库为基础、以顺序离散信号推理为特征的;计算智黼则是以模型( 计算模 型、数学模型) 为基础,鞋分布、势符计算为特征。蒋者强调规剥的佟鼹与形成,爵后者 强调筷燮静建立与梅最;藏者依藏专家个太酝诿,掰嚣砻强调鲁缝绞、自学习与鑫逶应。 相互补充可增强彼此的能力,从而获得愿有力的表示和解决实际问题的能力。 自lz a d e h 教授提出“智能计算”概念后,人们对已有计算理论与方法做进一步研究 帮改进,阚隧也发现和掇如了善干薪的蟹携计算方法,使智能计雾壤论褥班逐濒宠罄帮不 断囱前笈麓。磊翦,袭碰较为成熟且翻成体系靛智麓计算接术主癸肖:神经计算、模糊计 算、粗糙集理论、遗传算法、进化策略、进化编程、人工生命、蚁群算法、微粒群算法、 免疫计算、自然计算等。随着计算机技术的发展和凿投,它们在最避一些年得到了突飞猛 进的发壤,;l 起了诸多镁蠛专家学者懿关注,成为一令跨学辩豹礤究热盎。近年来,这些 方法静瘦娜研究呈互榴融合静趋势,下蕊几节对本文主要涉及静营熊计算理论和方法加以 介绍。 2 ,l 精糙集理论 粗糙集作为一种处溅不精确与不完众数据的新的数学工其,最初由波兰数学家p a w l a k z 予1 9 8 2 每提塞,裂9 0 零钱轫已 | 怒了各国学者靛关注。囊糙集蠼论酶特点是不嚣要羲 先给定菜髓特征或属性的数量描述,丽是赢接飙给定闯繇的描述集出发,通过不w 分辨关 系( 等价关系) 确定给定问蹶的近似域,从而找出该问蹶中的内在规律。下面详细介绍一下 粗糙集理论的几个基本概念2 4 。 1 ) 嫠纛系统 租糙絮理论把知识看成是与菜个对象集合枢芙的事窦的集合。这些事实以数据寝格的 形式表示,表格的行代袭每个对象,表格的列代表对苏的每个属性,知识则由属性慎表示, 这样的数搬表格称为信息系统。一个关系数据库就是一个信息系统,关系的元组表示对象 蕤信患,内关系豹属性袋示。逶常选定一个藏缝箨鸯“捷策嚣装”,记鸯蚤,其德耩佳捧 为条件满性,记为c 。 一个信息系统的定义为一个四元组:s = 秒,g ,r ,门。其中,为对象集。即论域; q = c u 妇鸯属性的集会;矿鸯各属性的值域;,为u x q 一矿的映射,它为u 中各对 蒙熬嚣髓籀定罐一筐。 ( 2 ) 分辨矩阵 5 河北农业大学硕士学位论文 信息系统s 中关于属性集c 的分辨矩阵 ,( c ) = ( m “) 。定义为 m t ,x d 的同一个等价类 ,( j f ,c ) ,( x ,c ) ) ,x d 的不同的等价类 肼( c ) = ( m “) 。代表了区分一,的完整信息,它是对称矩阵,所以只需计算 研口( 1 ,f ,z ) 。 ( 3 ) 核心 相对于属性集d ,属于属性集c 的所有归约的交集的属性的集合为属性集c 的核心, 记为c o r e ( c ,d ) 。用核心作为计算归约集的起点,可以简化属性归约集的计算。为 简化计算核心,一般通过分辨矩阵进行。具体计算的公式如下: c 0 衄= c c :珑f = c ) ,对于所有l ,f s n ) ( 4 ) 不可分辨关系 对于任何一个属性集合p q ,不可分辨关系用d 表示,其定义如下 i n d ( p ) = ( x ,) u u :厂( x ,口) = ,( y ,口) v 口尸, 如果( x ,) 琳d ( p ) ,则石,y 称为相对于p 是不可分辨的。不可分辨关系实际上就是 u 上的等价关系。因此,针对属性集p 上的不可分辨关系,u 可划分为几个等价类,用 u b q d ( _ 尸) 表示。 ( 5 ) 近似集 对任何一个对象子集石u 和属性子集p q ,p 的下近似集和上近似集定义如下: 印( ) = u y v ,j d ( p ) :y z ) 面i ( x ) = u 口u j d ( p ) :y n z 中) ( 6 ) 属性的依赖度 在属性归约中,利用两个属性集合尸,r q 之问的相互依赖程度,可以定义一个属 性口的重要性。属性集p 对r 的依赖程度用,r ( p ) 表示。其定义如下: 蹦p ) = 等 6 p 傩一( 竹2 。( 一婴! ( x ) 其中c a r d ( ) 表示集合的基数,p o s r ( 尸) 是属性集尺在u i n d ( 尸) 中的正区域。 cc ,l ,、l 1 | 、, , m ( 基于智能计算的犬疾病诊断系统研究 ( 7 ) 属性的重要性 不同属性对于决定条件属性和决策属性之间的依赖关系起着不同的作用。属性口加入 属性集r ,对于分类u b 、d ( p ) 的重要程度定义为: s g f ( 口,矗,p ) = ( p ) 一,“m ( p ) 属性的重要性是相对而言的,它依赖于属性p 和r 。因此,在不同的背景下,属性 的重要性可能不同。如果决策属性定义为d ,则s g f ( ,r ,p ) 反映的是,将属性加 入属性集r 中以后,r 与d 之间的依赖程度的改变,从而体现出属性口的重要性。 ( 8 ) 冗余属性 对于属性集d 和r 属性口r ,如果p 0 ( d ) = _ 尸0 s “。l ( d ) ,则4 在属性集r 中 是冗余的,否则口在属性集月是不可缺少的。 ( 9 ) 属性归约 属性集雪c c 是s 的一个归约,当且仅当p 口( d ) = p c ( d ) ,且曰中的每个属性 对于d 都是不可缺少的。属性归约记为r e d ( 口,d ) 。 ( 1 0 ) 最佳属性归约集的评判准则 通常情况下,一个信息系统可能会存在多个属性归约集。在决策过程中,每个归约集 都可以代替整个条件属性集,而不改变原有的依赖关系。为此,需要确定到底哪个属性归 约集为最佳属性归约集。如果能给属性构造一个代价函数,则选择的标准就很自然地基于 塌小综合代价原则。在缺乏代价函数的前提下,选择最佳属性归约集的唯一依据就是数据 表的内容。一般有两种方法,第一种是选择具有最少属性数目的归约集:第二种是选择具 有最少属性复合值的归约集。也可以把这两种方法结合起来,即首先选择具有最少属性数 目的归约集,再在剩下的多个归约集中选择具有最少属性复合值的归约集作为最终的最佳 属性归约集。 2 2 模糊集理论 医疗诊断中,疾病症状信息和专家经验很多都是模糊性的,所谓的模糊性,主要是指 客观事物的差异在中间过渡中的不分明性,模糊性概念是没有明确外延的概念。l a z a d e h 于1 9 6 5 年刨立了模糊集理论【2 ”,用精确的数学语言对模糊性进行描述。下面简单介绍 有关模糊集的相关概念: ( 1 ) 模糊子集概念 设u 是论域,它是一个非空通常集合。每一个映射一:c ,一 o ,l 】都叫做u 的一个f u z z y 子集,也就是说u 的f u z z y 集。一( ) 叫f u z z y 集a 的隶属函数。对每个x u ,j 0 ) 叫元 素工对f u z z y 集一的隶属度。 ( 2 ) 模糊集运算定义 7 河北农业大学硕士学位论文 设彳、台是论域u 的模糊子集,则它们的和集、交集和彳的余集都是模糊集,其隶属 函数分别定义为: ( 一u 雪) o ) = m a x ( 4 ( z ) ,口( x ) ) ,( 4 n b ) ( x ) = m i n ( 一( x ) ,b ( x ) ) 彳( 工) = l 一彳( 工) ,关于模糊集的和、交等运算,可以推广到任意多个模糊集合中去。 ( 3 ) 模糊集与分解定理 1 ) 五截集定义:设彳f ( u ) ,旯 o ,l 】,称以= 缸u | 彳( 功妨为f u z z y 集彳的兄 截集。 2 ) 分解定理:设彳f ( u ) ,则彳= u ( 鸸) 即一个复杂f u z z y 集彳可表达为一簇简 j e 0 ,u 单f u z z y 集 五以i a 【o ,l 】) 的并。 ( 4 ) 模糊关系和模糊矩阵 1 ) 模糊关系定义:设u ,矿是论域,【厂矿= ( “y ) i x u ,y 矿 是u 和y 的笛卡儿 直积。u x 矿的每一个f u z z y 子集r 都叫做u 到矿的一个模糊关系。模糊关系可以用一个 矩阵r 来表示: r = ( 勺) ,= 肚一,0 ) 2 1 模糊矩阵的运算和性质: 定义:若4 和b 是h x 所和m ,的模糊矩阵,则它们的乘积c = 肚为以,阵,其元 索为: q = v0 m ) ,( f = l ,2 ,”;,= 1 ,2 ,) t “ 符号“v ”和“八”含意的定义为:v 6 = m a ) 【犯,6 ) ,口 6 = m i n ( 4 ,6 ) 。 模糊矩阵乘法性质包括:似口) c 钏但c ) :一卢麒利i 彳0 = 伽= o 4 ,= ,爿; 若4 、口为模糊矩阵且d “6 ,( 一切f ,力,则一占;又若曰,则爿c b c ,c 爿c b 。 ( 5 ) 隶属函数的确定 从模糊子集的定义可看到,隶属程度需要指定。常用的隶属函数确定方法有模糊统计 法、三分法、增量法、二元对比排序法和待定系数法等,待定系数法是较常用的方法。 对隶属函数的确定过程的要求以及其本质应是客观的,但也需要一定的经验和技巧, 对于不同的情况和应用隶属函数的确定都有其特定的方法,而这就有赖于对问题的分析与 研究,通过领域知识以及大量的定性信息确定隶属函数。下面是待定系数法确定隶属函数 的一般方法: 1 ) 确定论域,分析问题背景,进行抽象总结: 2 ) 确定隶属函数的整体结构。如模糊概念向下侧重,选择偏下型( z 型) :模糊概念向 上侧重,选择偏上型( s 型) ;模糊概念集中于局部区域,选择中间型( 三角、正态等) : 3 ) 确定隶属度为1 和为o 的论域元素。如肯定某一点隶属度必定为l 且优越显著,选 长 基于智能计算的犬疾病诊断系统研究 择顶部尖锐的隶属函数( 三角、正态) ;对只能肯定一段区间隶属度必定为1 且优越显著, 则选择顶部平坦的隶属函数( 梯形、菱型) ; 4 ) 确定最模糊点( 隶属度为0 5 ) 。隶属度为o 和1 的临界点和最模糊点三点成线性排 列,选择三角或梯形等形式的隶属函数;隶属度为。和l 的边界点和最模糊点成非线性排 列,选择正态、菱型、柯西型等形式的隶属函数; 5 ) 确定分布的对称性。主值区间两侧的不确定性一致或不加区分时,选择对称型分布 ( 正态、对称三角、对称梯形等) 的隶属函数;主值区间两侧的不确定性不一致时,选择非 对称型分布( 非对称三角、非对称梯形等) 韵隶属函数; 6 1 确定过渡带宽度及形式。不确定性大,过渡带要宽;不确定性小,过渡带要窄; 7 ) 综合上述分析结论,确定隶属度分布,估计分布参数。 模糊集理论在利用隶属函数表达不确定性的同时,也带来一些问题,即如何定义一个 合适的隶属函数,这在某种程度上带有一定的主观性,因此也影响了该理论的全面推广。 在后面的内容中会看到模糊神经网络的自学习,优化权值即隶属度,这也是设计的初衷。 2 3 神经计算 神经计算是以人工神经网络畔4 叫为基础的计算。人工神经网络( a n i f i c i a ln e u r a l n e t w o r k ,a n n ) 是在现代神经生理学和心理学研究成果基础上提出的一种数学模型,它反 映了大脑功能的若干基本特征。它是通过模仿人的大脑神经元结构特性而建立起来的一种 非线性动力学网络系统,是由大量简单的非线性处理单元( 或称元件) 高度并联、互联丽成 的复杂系统,具有对人脑某些基本特性的数学模拟能力。这个转化过程从数学角度看就是 一个计算的过程。也就是说人工神经网络的实质体现了网络输入和其输出之间的一种函数 关系。通过选取不同的模型和激活函数,可以形成各种不同的人工神经网络,得到不同的 输入输出关系式,并达到不同的设计目的,完成不同的任务。它具有并行分布、非程序的、 适应性的、大脑风格的信息处理本质和能力。近几年,基于神经网络的医疗智能诊断系统 研究是诊断系统的热点,己取得了不少成果。其中赵卫东 l 】等研究了基于神经网络的案例 推理医疗诊断系统,结合前向神经网络的特点,来实现案例检索,提出用神经元和前向神 经网络集成。构成一种增强型神经网络结构。叶进p 副等利用人工神经网络实现对病症知识 的自动获取。李家林p3 】等利用典型的人工神经( b p ) 网络反向传播模型构建了一个诊断肺 心病的专家子系统,较好地解决了自动知识的获取、表示、自学习等问题。黄雪梅【3 4 1 等以 三层b p 网络为例,建立了基于b p 网络的肺癌智能诊断系统。徐冠” 等提出了一种基于 优化算法的神经网络智能诊断系统。下面我们先了解下有关人工神经网络的一些概念。 2 3 1 人工神经元的模型 一个人工神经网络的神经元模型和结构描述了一个网络如何将他的输入矢量转化为输 出矢量的过程。人工神经元模型“1 如图2 所示。它是神经网络的基本计算单元,是多输入、 9 河北农业大学硕士学位论文 单输出的非线性单元。 输 入 信 号 连接权 图2 人工神经元模型 f 培2m o d e lo f a r t i 丘c i a ln e u r o n 阈值 输出 儿 它有三个基本要素: 一组连接( 对应于生物神经元的突触) ,连接强度由各连接上的权值表示,权值为正 表示激活,为负表示抑制。 一个求和单元,用于求取各输入信号的加权和( 线性组合) 一个非线性激活函数,起非线性映射作用并将神经元输出幅度限制在一定范围内( 一 般限制在( o ,1 ) 或( 一1 ,+ 1 ) 之间) 。 此外还有一个阈值以( 或偏置玩= 一酿) 。 以上作用可分别以数学式表达出来: 上 = 乞0 。,v 七= n 甜t = 一眈,) ,t = 伊( v 七) 式中_ ,z 2 ,为输入信号,l ,2 ,w 扫为神经元i 之权值,为线性组合结 果,吼为闽值,妒( ) 为激活函数,儿为神经元七的输出。 激活函数妒( ) 可以有以下几种形式: ( 1 ) 阈值函数( 图3 ( a ) ) = 怯: 即阶梯函数。这时相应的输出“为: 她,= 怙菘 p 其中h = 0 一吼,常称此种神经元为m p 模型。 = l l q q 吃 吻 r、,l 基于智能计算的犬疾病诊断系统研究 ( 2 )分段线性豳数( 图3 ( b ) ) v l l v o 可控制其斜率。 l + e x p t m j 妒 = 蚰铲三鼍筹,这类箕料漤纛髓鳇,势僳赫萃溉 2 1 3 2 人正神经臃络的学习 l 。学习方式 通过向环境学习获取知识并改进自身性能是神经网络的一个重要特点,在一般情况下, 性能的改善是按某种预定的度量通过调节自身参数( 如权值) 随时间逐步达到的,学习方 式( 按臻凌甄提供信意豹多少分) 嘉三辩: ( 1 ) 监督学习( 霄教师学习) 这种学习方式需要外界存在一个“教师”,他可对一组给定输入提供应有的输出结果 ( 正确答寨) 。这组己知的输入输出数据称为训练样本集。学习系统可根据已知输出与 实酝戆蹬之翔豹差蓬( 谟燕毽号) 来稍警系统参数。 ( 2 ) 非监督学习( 无教师学习) 河北农业大学硕士学位论文 非监督学习时不存在外部教师,学习系统完全按照环境所提供数据的某些统计规律来 调节自身参数或结构( 这是一种自组织过程) ,以表示外部输入的某种固有特征( 如聚类, 或某种统计上的分布特征) 。 ( 3 ) 再励学习( 或强化学习) 这种学习介于上述两种情况之间,外部环境对系统输出结果只给出评价( 奖或惩) 而 不是给出正确答案,学习系统通过强化那些受奖励的动作来改善自身性能。 2 学习算法 ( i ) 误差纠正学习 令n ( n ) 为输入工0 ) 时神经元后在n 时刻的实际输出,以o ) 表示相应的应有输出( 可 由训练样本给出) ,则误差信号可写为 e ( ,1 ) = d ( n ) 一y t ( 押) 误差纠正学习的最终目的是使某一基于( n ) 的目标函数达到最小,以使网络中每一 输出单元的实际输出在某种统计意义上最逼近于应有输出。一旦选定了邑标函数形式,误 差纠正学习就成为一个典型的最优化问题,最常用的目标函数是均方误差判据,定义为 ,= d 吾e 衲i t 其中e 是求期望算子,上式的前提是被学习的过程是宽平稳的,具体方法可用晟陡梯 度下降法。直接用j 作为目标函数时,需要知道整个过程的统计特性,为解决这一困难通 常用j 在时刻n 的瞬时值f ) 代替j ,即 占( 栉) = 。e :( n ) t 问题变为求s ( h ) 对权值w 的极小值,据最陡梯度下降法可得 ( n ) 2 ,弦i ( n ) 工,( 栉) 其中玎为学习步长,这就是通常说的误差纠正学习规则( 或称d e l t a 规则) 。 ( 2 ) h e b b 学习 神经心理学家h e b b 提出的学习规则可归结为“当某一突触( 连接) 两端的神经元的 激活同步( 同为激活或同为抑制) 时,该连接的强度应增强,反之则应减弱”。用数学方式 可描述为 ( n ) = f 帆( n ) ,z ,( 九) j 式中n 0 ) ,石( 以) 分别为”0 两端神经元的状态,其中最常用的一种情况为 膏( n ) = 7 t ( ,1 ) ( m ) 由于w 与儿积) ,z j ( n ) 的相关成比例,有时称之为相关学习规则。 ( 3 ) 竞争( c o m p e t i t i v e ) 学习 1 2 基于智能诗葵夔犬疾痍诊鞭系统研究 顾名恩义,在竞争学习时网络各输出单元互相竞争,最后达到只有一个最强者激活。 最常见的种情况是输出神经元之问有侧向抑制性连接,这样众多输出单元中如有某一单 元较强,刘它将获艟势攒劐其链单元,壤蓐只有魄较强者处于激溪状态。最常用的竞争学 习规刚可鸳为: 2 4 专家系统 吲啦p i , 2 4 i 专家系统的一般缡构 若神经元,竞争获胜 若神经届蘼争失败 专家系统”作为符呼逻辑人工智能中一个最重要、最活跃的分支,其应用已渗避到各 个领域,势蠢发挥了匿夹熬童参强。专家蓉统蕃l 用某一翅瑟矮域孛专家掰掌握瓣甄谖来解决 该领域的阐题,其关键技术在于知识麾结构、推理机制和解释机翻的设计和使用,而且尤 其以知识库中的知识表示方法至关重要,不同的知识表示方法适用于不问性质问题的描述、 不同的推理机制和解释机制。一个典型的专家系统( 如圈4 所示) 主疑包括以下几部分; ( 1 ) 知识薄( x n o w l 硝2 曲8 s o ) : 知识的存储机构,用于存储领域内的原理性知识、专家的经验性知识以及有关的事实 等。从知谈获取机构获取知识,同时为推理机提供阔题求解所需的知识。知识库管理系统 负责对知识麾中的知识进行组织、检索、维护等管理。 ( 2 ) 综合数据痒毯嫩键黔拄o nd a 翻) 鑫s e ) : 又称为“黑板”,它用于存放用户提供的初始事实、问题描述以及系统运行过程中得到 的中间结粜、最终结果、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论