(计算机科学与技术专业论文)基于典型症状匹配的辅助诊断系统的设计.pdf_第1页
(计算机科学与技术专业论文)基于典型症状匹配的辅助诊断系统的设计.pdf_第2页
(计算机科学与技术专业论文)基于典型症状匹配的辅助诊断系统的设计.pdf_第3页
(计算机科学与技术专业论文)基于典型症状匹配的辅助诊断系统的设计.pdf_第4页
(计算机科学与技术专业论文)基于典型症状匹配的辅助诊断系统的设计.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机科学与技术专业论文)基于典型症状匹配的辅助诊断系统的设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

l 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。除了 文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人己经发表或撰写过的研 究成果,也不包含为获得内蒙古大学或其他教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。 学位论文作者签名:兰赴钇丝 日期:丛如:2 :z 三 指导教师签名:鲤幽 日期:尘! ! :! :! 在学期间研究成果使用说明书 、 学位论文作者完全了解内蒙古大学有关保留和使用学位论文的规定,即:内蒙古大学研 究生在校攻读学位期间论文工作的知识产权单位属内蒙古大学。学校有权保留并向国家有关 部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文 的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。作者今 后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学就读期间导师的同意;若 用于发表论文,版权单位必须署名为内蒙古大学方可投稿或公开发表。 学位论文作者签名:兰杰物。 日期:垄f q :! 丕:2 兰 指导教师签名:鹾! 垒 日期:2 生z ! :i 兰:! l j 概念格和连通性分析是近年来获得飞速发展的数据分析的有力工具,已被 广泛地应用于知识发现和数据挖掘领域,并取得了较好的成果。因此研究概念 格及连通性分析的基本理论及其在知识发现领域的应用有着非常重要的意义。 本文首先介绍了辅助诊断系统背景知识及概念格理论。其次描述了病人病历部 分结构,提出一种实用的病历文本特征提取方法。以及利用概念格对医疗知识 的挖掘和处理。随后提出两种典型症状生成办法:1 将模糊概念格引入医学领域, 提出基于模糊概念格的典型症状生成方法;2 将案例库中案例症状通过模糊等价 关系框架内的连通性分析生成典型症状。最后输入的待诊断案例的症状与这些 典型症状进行匹配,找出最相似的案例,实现辅助诊断功能。 关键词:概念格;连通性分析;模糊;典型症状;辅助诊断 通过w a p 交互的基于典型症状匹配的辅助诊断系统的设计 d e s i g n i n gc o m p u t e r - a i d e dd i a g n o s i ss y s t e mt h a tb a s e do nm a t c h i n g r e p r e s e n t a t l v es y m p t o m s 一, a b s t r a c t c o n c e p tl a t t i c ea n dc o n n e c t i v i t ya n a l y s i so b t a i nr a p i dd e v e l o p m e n ti nr e c e n t y e a r s ,a sap o w e r f u lt o o lo fd a t aa n a l y s i s ,t h a th a sb e e nw i d e l ya p p l i e di nt h ef i e l do f k n o w l e d g ed i s c o v e r ya n dd a t am i n i n g ,a n da c h i e v e dg o o dr e s u l t s t h e r e f o r es t u d y i n g c o n c e p tl a t t i c et h e o r ya n di t sa p p l i c a t i o nh a sv e r yi m p o r t a n ts i g n i f i c a n c ei nt h ef i e l d o fk n o w l e d g ed i s c o v e r y t h i sp a p e rf i r s t l yi n t r o d u c e sb a c k g r o u n dk n o w l e d g eo f c o m p u t e r - a i d e dd i a g n o s i ss y s t e ma n dc o n c e p tl a t t i c et h e o r y s e c o n dd e s c r i b e s s t r u c t u r eo ft h ep a t i e n tr e c o r d s ,a n d p u tf o r w a r dap r a c t i c a lm e t h o do ff e a t u r e e x t r a c t i o no fm e d i c a lt e x t ;a n dr e p r e s e n ta n dp r o c e s sm e d i c a lk n o w l e d g eu s i n g c o n c e p tl a t t i c e t h e np u tf o r w a r dt w ok i n d so fm e t h o dt h a tg e n e r a t er e p r e s e n t a t i v e s y m p t o m s :1 i n t r d u c et h ef u z z yc o n c e p tl a t t i c ei n t om e d i c a lf i e l d ,p u tm e t h o do f g e n e r a t i n gt h et y p i c a ls y m p t o mb a s e do nt h ef u z z yc o n c e p tl a t t i c e ;2c a s e sa r e p r o c e s s e db yt h ec o n n e c t i v i t ya n a l y s i si nt h ef l a m eo ff u z z ye q u i v a l e n c er e l a t i o n s , a n dg e n e r a t et h er e p r e s e n t a t i v es y m p t o m s f i n a li n p u t e ds y m p t o m so fc a s et h a tw a i t f o rd i a g n o s i si sm a t c h e dt h e s er e p r e s e n t a t i v es y m p t o m s ,i d e n t i f yt h em o s ts i m i l a r c o n f i r m e dc a s ea n di m p l e m e n td i a g n o s i sf u n c t i o n k e y w o r d :w a p , c o n c e p tl a t t i c e ,c o n n e c t i v i t ya n a l y s i s ,r e p r e s e n t a t i v es y m p t o m s , c o m p u t e r - a i d e dd i a g n o s i s i i 内蒙古大学硕士学位论文 目录 摘要:i a b s t r a c t i i 图表目录:v 第一章引言1 1 1 研究背景与意义1 1 2 本文的主要研究内容1 第二章;系统要素一3 2 1 医学辅助诊断的发展与现状j 3 2 2 概念格理论基础6 、 2 2 1 概念格理论的基本概念一6 2 2 2 概念格上的属性依赖6 2 2 3 概念格的代数性质7 2 2 3 1 概念格上的二元运算7 2 2 3 2 概念格的代数性质9 2 2 3 3 小结:1 2 第三章病历文本特征提取1 3 3 1 住院病历症状描述、诊断部分1 3 3 2 病历文本特征提取1 4 3 2 1 特征词抽取介绍。1 4 3 2 2k e a 算法1 6 3 2 3 特证词抽取例子。2 0 第四章基于概念格和典型症状的知识库2 2 4 1 使用形式概念分析挖掘和处理医疗信息2 2 4 1 1 知识表示和处理介绍2 2 4 1 2 形式概念分析的基本思想2 2 4 1 3 应用。2 5 4 1 3 1 病人案例描述:2 5 4 1 3 2 治疗选项的解释2 8 i i i 通过w a p 交互的基于典型症状匹配的辅助诊断系统的设计 4 1 3 3 推理规则3 0 4 1 4 讨论3 2 4 1 4 1 总体评论3 2 4 1 4 2 优点:3 3 4 1 4 3 存在的问题3 4 4 1 4 4 未来工作3 5 4 2 基于模糊概念格的典型症状生成3 6 4 2 1 连通性介绍。3 6 4 2 2 模糊概念格应用于症状聚类:3 7 4 2 3 结论4l 第五章模糊等价关系框架内连通性分析在有关医疗领域生成典型症状4 2 5 1 疾病诊断及连通性分析介绍4 2 5 2 症状之间的连通性一4 4 5 2 1 连接的正等级4 4 5 2 2 负的连通性等级:4 6 5 2 3 有关连通性分析的一些讨论4 7 5 3 基于模糊等价关系的聚类分析4 8 5 4 模糊等价关系框架内的连通性分析4 8 5 5 结论5 0 第六章总结与未来研究方向:5 1 6 1 辅助诊断系统的性能评价5 1 6 2 总结和未来展望:51 参考文献5 3 致谢5 7 附:攻读硕士期间发表的论文情况。一5 8 内蒙古大学硕士学位论文 图表目录 图2 1 辅助诊断系统框架图5 表2 1 形式背景7 图2 2 表2 1 形式背景对应的概念格的h a s s e 图8 表3 1 三篇文章的主题,作者标注和机器标注的特证词1 5 图3 1 训练和抽取过程1 6 表3 2 一个具体的特征词识别学习模型2 0 表4 1 使用临床术语的疾病描述2 3 图4 1 疾病多重分类j 2 4 表4 2 普外科疾病案例2 6 图4 2 满足集合包含语义的案例结构2 7 表4 3 失去肢体不同替代方法的优劣2 8 图4 3 处置选项评价概念格2 9 表4 4 由蕴含式x 号z 和z 号a 真值表得出的形式背景。3 0 图4 4 规则xj z 并且z 号a 概念格3 2 图4 5 模糊概念格哈希图。j 4 0 图4 6 概念格哈希图。:4 1 表5 1 症状病人连接初始表4 4 表5 2 矩阵( 2 ) 的配对连接_ 4 5 表5 3 表5 2 经过合并和继承后得到的表4 6 表5 4s l 比s 3 更像s 2 4 6 表5 5 相对于表5 2 中病人不共同具有的症状连通性4 7 表5 6 口一切割划分4 9 表6 1 系统性能评价表5 1 图6 1 诊断效率对比图5 1 v 通过w a p 交互的基于典型症状匹配的辅助诊断系统的设计 v i j 内蒙古大学硕士学位论文 第一章引言 近年来由于我国供不应求的医疗服务市场,辅助诊断系统成为应用热点,本文就是由此 而展开,并进一步设计和实现了辅助诊断系统。用户可以通过输入患者症状可得到初步诊断, 从而决定就诊科室或专家。 1 1 研究背景与意义 疾病的诊断不仅是医疗的第一关口,而且对大多数疾病来说,也是决定性的关口。医学 诊断是根据病人的病史、症状等信息得出病因的一个过程。每天都有许多人在做这个普通而 重要的工作,快速地给出一个可靠、一致的诊断结果显然是很重要的。推理是诊断的一个重 要部分,医生对症状的错误推理是造成误诊的一个主要原因。当碰到不知道的或不是充分理 解的领域知识时,专家们经常依靠经验来解决问题。医学专家常常不能精确知道他们是怎样 得出诊断结果的,所以很多人认为诊断很难实现自动化和形式化。很多领域的知识很难推理 或给出形式化的描述,这意味着很难建立一个准确的模型或算法。 纵观专家诊病的过程发现:疾病的诊断过程实际上也是一个疾病分类过程,是根据病人的 疾病特征( 病症) 划归到某个疾病或疾病类的过程,一般的医学书上也是这样一个把复杂的问 题( 疾病类) 逐次分解成一个个小问题( 疾病) 的体系结构,再根据症状特征或不适部位定位到具 体疾病类的具体疾病。 计算机辅助诊断系统介绍 计算机辅助诊断( c a d ) 系统是计算机科学、工程数学、认知科学、逻辑学等学科与医 学相结合的产物,在临床辅助诊断有不少的探索和应用,可明显提高对疾病的诊断效率。 计算机辅助诊断系统的组成 一个完整的c a d 系统是由知识库( k n o w l e d g eb a s e ) 、数据库( d a t ab a s e ) 、推理机 ( i n f e r e n c ee n g i n e ) 、知识获取模块( k n o w l e d g e - a c q u i s i t i o nm o d u l e ) 和解释接口( e x p l a n a t i o n i n t e r f a c e ) 组成的【i 】。知识库中存放系统求解问题所需求的知识;数据库用来存储初始数据和 推理过程中的各种中间信息;推理机是用来控制和协调整个系统的一组程序:知识获取模块 就是学习模块,它为修改和扩充知识库存的原有知识提供相应的手段;解释接口是用户与系 统交互的环节,便于用户了解推理过程,为用户向系统学习提供方便。 1 2 本文的主要研究内容 本文主要研究用户通过输入患者症状就能得到初步诊断的一个辅助诊断系统的设计。而 这个系统是基于典型症状实现的病历库辅助诊断系统。 通过w a p 交互的基于典型症状匹配的辅助诊断系统的设计 近年来,已有若干学者对辅助诊断系统和概念格的各个层次进行了广泛的研究,取得了 较好的研究成果。本文通过分析医学专家的诊断过程,提出了一个实用的病症诊断模型。该 模型接近于一般医学书籍知识表示。 首先,对医院住院病历库每份病历文本进行特征提取,形成病历形式背景。其次,基于 模糊概念格和连通性分析两种方法生成各类疾病的典型症状。最后根据这些典型症状对待诊 病例进行初步诊断。 本文主要的创新点是: 概念格、连通性分析作为对数据进行分析的工具或者方法,已经在很多领域进行了应用。 本文将概念格及连通性分析与医学辅助诊断相结合。首先,使用一种实用的自动特征提取方 法对病历文本特征提取;然后使用概念格对医疗知识进行挖掘和处理;而后使用两种方法生 成典型症状:1 利用模糊概念格生成各类疾病的典型症状2 在模糊等价关系框架内对疾病症 状进行连通性分析得到典型症状;最后通过待诊患者症状与各类疾病典型症状相匹配从而达 到辅助诊断目的。系统会根据匹配结果,找到案例库中最相似的候选案例,形成初步诊断结 果。 2 内蒙古大学硕士学位论文 第二章系统要素 2 1 医学辅助诊断的发展与现状 1 9 5 6 年,美国的l e d l e y 等首次将数学模型引入临床医学,提出了可将布尔代数和b a y e s 定理作为计算机诊断的数学模型,并以此诊断了一组肺癌病例,开创了计算机辅助诊断的先 例;1 9 7 6 年,美国斯坦福大学的s h o r t l i f f e 等研制成功了著名的用于鉴别细菌感染及治疗的医 学辅助诊断系统一m y c 2 1 。m y c i n 是一个用于诊断和治疗细菌感染病的辅助诊断咨询系 统,通过和它的用户( 一般是内科医生) 的交流,在获取病人的病史和各种可能的化验数据后, 该系统可以在化验数据不齐全的情况下进行推理,给出诊断结果。它不仅能对传染性疾病做 出专家水平的诊断和治疗,而且便于使用、理解、修改和扩充。m y c i n 是世界上第一个功能 较全面的医学辅助诊断系统。从此,医学辅助诊断系统正式成为医学领域内一个重要的应用 分支领域。随后,医学辅助诊断系统开发进入一个发展时期,并且逐渐推向临床应用。在 m y c i n 系统框架基础上建立的肺功能辅助诊断系统p u f f 曾在旧金山太平洋医疗中心使用过 相当长的一段时间,开创了医学辅助诊断系统临床应用的先例。与m y c i n 同时问世的 c a s n e t 系统是r u t g e r s 大学的s m w e i s s 和c a k u l i k o w s k i 等人开发的,是用于诊断和治 疗青光眼疾病的辅助诊断系统。1 9 8 2 年,美国匹兹堡大学的m i l l e r 等发表了著名的i n t e r n i s t i 内科计算机辅助诊断系纠3 1 ,其知识库中包含了5 7 2 种疾病,约4 5 0 0 种症状;1 9 9 1 年美国 哈佛医学院b a r n e t t 等开发的“解释 软件【4 】,包含有2 2 0 0 种疾病和5 0 0 0 种症状。除了这些 大型的医学辅助诊断系统以外,人们还设计了一些针对某一种或某一类疾病的专项诊断系统, 如1 9 9 0 年,u m b a u g h 开发了皮肤癌辅助诊断系统【5 】,p r o v a n 等人研制了一种动态图素结构的 实时系统,并用它构造了一个用于诊断慢性腹痛的决策支持系统【6 1 。英国普利茅斯医学院研 究生院妇产科k e i t h 等( 1 9 9 4 , 一1 9 9 5 ) t 7 】开发的智能c t g 分析系统是联合应用数字算法和人工神 经网络算法的系统。1 9 9 6 年,b i m d o r f 等人开发了贫血的辅助诊断系统【8 1 。2 0 0 0 年,w e l l s 等 人开发了提高乳腺癌治疗计划的知识库系统【9 】。这些医学辅助诊断系统的开发和应用不但方 便了医生和病人,也为医学科学的发展起到了极大的推动作用。 我国医学辅助诊断系统的研制起步较晚,七十年代末我国才开始投入巨大的力量进行此 方面的研究与开发,但是发展速度相当快。当时多用概率统计法,即所谓的数字计算法,从 疾病一临床资料( 症状、体征、理化检查) 的发生频率与疾病概率之间的明确统计学分析,得 出最相似的诊断。此方法现己趋于淘汰。8 0 年代后,则多用人工智能的方法,即以疾病的数 值表示与专家的推理相结合导致的一种决策方法。两种方法都要通过一定的数学模型来实现, 通过w a j p 交互的基于典型症状匹配的辅助诊断系统的设计 常见的数学模型有b a y e s 公式,模糊数学及加权求和阈值浮动。8 0 年代中期,国内2 3 的系 统采用了这三种数学模型。 1 9 7 8 年,北京中医医院著名教授关幼波及北京中医医院肝病科与电子计算机室的科研人 员共同合作,开发了“关幼波肝病诊疗程序 ,在国内率先把中医学这门古老的民族科学与先 进的电子计算机技术结合起来,开创了我国最早的中医医学辅助诊断系统。随后,吉林大学 与白求恩医科大学合作,又开发了“中医妇科辅助诊断系统 10 1 。八十年代以后,国内各界 人士也纷纷研究和开发了针对不同医学领域的各种医学辅助诊断系统,比如出现了昏迷诊疗 计算机辅助诊断系统、急性肾功能衰竭辅助诊断系统、颈腰疾病辅助诊断系统、精神疾病诊 断系统、甲状腺功能亢进诊断系统、贫血鉴别辅助诊断系统、肺癌诊断系统、心功能辅助诊 断系统、胃病辅助诊断系统、肺心病辅助诊断系统,外周神经系统疾病辅助诊断系统。1 9 9 7 年,张红梅等提出了一个仿人疾病诊断系统模型【l l 】。张玉璞开发了基于波形分析的心血管 疾病辅助诊断系统,该系统的特点是在知识库中,将每种病当作一个框架,在框架上再分多 项槽,用以存放次症状可能出现的所有症状事实,每一症状事实结构中存在有反应此事实可 信程度的可信度因子。陈国宁等开发了一个中医咳感症辅助诊断系统 13 1 。1 9 9 8 年,周仲宁研 制了用于眼科疾病的辅助诊断系统 1 4 】。徐宁建立了一个基于掌纹病理特征的辅助诊断系统, 并制作了相应的硬件,这一成果己申请了国家专利。西安电子科技大学的马玉祥等研制出了 肺结核辅助诊( t b d c s ) t 1 5 】采用三级汉化知识库,二级模糊推理技术,对研制临床医学 辅助诊断系统作了一定的探索工作。有的还投入门诊与临床医生一起为病人服务,并取得了 较好的效果,使医学诊断系统的开发与研究呈现出勃勃生机,同时也推动了我国医学事业本 身的发展。 在我国,医学辅助诊断系统在八十年代中期到九十年代初期曾经达到了研究和开发的高 潮,然而近几年来,医学辅助诊断系统的发展却有些缓慢,其主要原因有: 计算机技术的制约。建立一个良好的开发环境,提高研制辅助诊断系统队伍的理论和 实践水平是改善辅助诊断系统实用性的必要条件。但由于辅助诊断系统的计算机应用现仍属 于一个前沿性、边缘性的学科,探讨性的理论多于实际应用的理论。而且适合用于开发辅助 诊断系统的工具太少,总体的开发策略和方法只能在实践的基础上进行摸索、总结,这样就 延缓了系统的开发进程,也使得开发出的辅助诊断系统实用性并不理想。 知识领域的限制和脱节。在我国,由于地理环境、心理因素等诸多条件的影响,使得 在某一地区开发的辅助诊断系统到另外一些地区其权威性得不到承认,降低了系统的应用范 围和价值。同时,目前医院计算机应用大多偏重于管理,计算机工程技术人员想开发辅助诊 4 内蒙古大学硕士学位论文 断系统但不懂得医学知识,医务工作者想开发辅助诊断系统,但不懂得如何使自己的知识为 计算机人员所使用,这就形成了知识的脱节,增加了辅助诊断系统的开发难度。 简单化、功利化。避难就易是大多数医学辅助诊断系统开发者共同采取的策略。中医 辅助诊断系统的开发较多,这是因为中医专家系统知识比较固定、易于开发、承担风险小、 成功率高。这固然为继承和发扬传统医学起到了一定的促进作用,但是也使得本就不景气的 医学辅助诊断系统的应用面日趋狭窄。 开发和应用。经费短缺的限制,医学辅助诊断系统的开发本身属于系统工程的范畴, 开发周期长,需要开发人员多,从而需要的开发经费也较多,特别是一些大型项目,要用于 临床,发挥其真正辅助诊断的价值j 需要大量的计算机设备和控制设备投入等,一般中小医 院还不能承受这样大的经费负担。不过,随着社会发展,医院数字化进程加快,医学辅助诊 断系统的开发和应用将面临新的发展机遇。 本文辅助诊断系统设计方法不同于传统的基于知识的系统,其所依赖的知识主要是系统 所存储的相关领域中以前解决问题的具体记录,缓解了在常规的知识库中知识获取的瓶颈。 它的最大优点在于动态知识库,即通过增量学习而不断增加知识的案例库。此方法首先使用 概念格表示和处理相关部门具体的医学病例,然后基于典型症状构造案例库,即对所有案例 通过模糊概念格和连通性分析生成各类疾病典型症状。这是整个智能诊断过程的载体。相当 于一般专家系统的知识库和模型库,辅助诊断系统过程以患者的主观症状为主要诊断依据, 就是在案例库中将当前求解问题案例与各类疾病典型症状匹配,匹配过程也即辅助诊断过程, 如图2 2 所示。 图2 1 辅助诊断系统框架图 f i g u r e2 2f r a m e w o r ko fc a d 5 通过w a p 交互的基于典型症状匹配的辅助诊断系统的设计 2 3 概念格理论基础 2 3 f 概念格理论的基本概念 假设给定形式背景( c o n t e x t ) 是一个二元组( u ,d ,r ) ,其中u 是对象的集合,d 是属性 的集合,r 是u 和d 之间的一个二元关系,则存在唯一的一个偏序集合与之对应,并且这种 偏序集合产生一种格结构,这种由形式背景( u ,d ,r ) 所诱导的格l 就称为是一个概念格。格 中的每个节点是一个序偶( 称为概念) ,记为( x ,y ) ;其中x e p ( 称为概念的外延,y e ( d ) 称为概念的内涵。这里每个序偶关于关系r 都是完备的,即在u 幂集以和d 的幂集尸( d ) 之间存在两个映射f 和g : v 胜尸( 以x ) = y e d v x e x , x r y ) ; vy e p ( d ) g ( 功= x eu v y ey ,x r y ) 。 格l 中所有概念的集合用l ( k ) 来表示。给定l ( k ) 中的两个元素:h := ,k ) 和岛:= 陇, k ) ,定义鼠粕配ck ,疋c 五,则= 就是l ( k ) 中的一个偏序关系。根据此偏序关系可 以生成格的h a s s e 图。 2 3 2 概念格上的属性依赖 知识q 依赖于知识尸是指知识p 具有比知识q 更强,更细的分类能力。在概念格中它 的h a s s e 图就反映了一种概念的层次结构和概念的外延及内涵之间的泛化、例化关系,所以 可以直接通过h a s s e 图及一竹点之间的偏序关系来定义知识的依赖性。 定理2 1 对于简单形式背景( u ,d ,r ) ,设尸、q c _ d 是属性集。 ( 1 ) 属性集q 依赖于属性集p ,当且仅当包含q 的所有概念的最小上界s u p ( c q ) 是包含p 的所有概念的最小上界s u p ( c p ) 的祖先节点。 ( 2 ) 属性集q 和属性集尸是等价的,当且仅当s u p ( c q ) = s u p ( c p ) ,即它们是同一个概念。 ( 3 ) 属性集q 和属性集p 是独立的,当且仅当s u p ( c e ) 和s u p ( c p ) 不具有子孙关系。 证明:( 1 ) 若s u p ( c q ) 是s u p ( c p ) 的祖先节点,则e x t e n t ( s u p ( c e ) ) c _ e x t e n t ( s u p ( c q ) ) , 那么满足属性集p 的对象一定满足属性集q ,即属性集q 依赖于属性集p 。( 2 ) 若s u p ( c q ) = s u p ( c p ) ,则e x t e n t ( s u p ( c p ) ) = e x t e n t ( s u ? ( c q ) ) ,那么属性集p 和属性集q 对应的对象集相 等,则属性集q 和属性集尸是等价的。( 3 ) 若s u p ( c q ) 和s u p ( c p ) 不具有子孙关系,那么它们 所对应的对象集也是独立的,没有交集,即属性集q 和属性集尸是独立的。证毕。 根据概念格中概念之间的关系可导出一个形式背景中所有的函数依赖关系,进而可以进 6 内蒙古大学硕士学位论文 行格上的规则提取。 2 3 3 概念格的代数性质 目前,大家所讨论的概念格是依照概念集上概念之间建立的偏序意义下进行讨论 8 3 , 而这种序结构的概念格对讨论概念格的代数性质带来了诸多不便,使概念格之间的同构和同 态及概念的完备性等性质不能充分得到研究。在本章中,给出了概念格集合上的两个概念的 运算,即u 与n ,使通常序下的概念格成为带有二元运算u 与n 的代数系统,这对揭示概念 格的代数性质提供了一个有力的工具,对讨论两个概念之间的联系提供了一个新的方法,随 着概念格的代数性质和概念之间关系的进一步深入,概念格的数学性质将被发掘,这将为概 念格的理论研究奠定基础,提供新的研究方法。 2 3 3 1 概念格上的二元运算 。 问题的提出 表2 1 形式背景 t 出l e2 1f o r m a lc o n t e x abcd 11 21 31 41 5111 61ll 7 通过w a p 交互的基于典型症状匹配的辅助诊断系统的设计 i 碑) 彩 ,溉投o 田) 图2 2 表2 1 形式背景对应的概念格的h a s s e 图 f i g u r e2 3h a s s ed i a g r a mo fc o n c e p tl a t t i c ec o r r e s p o n d i n gt a b l e2 1f o r m a lc o n t e x t 对于形式背景k = ( u ,d ,r ) ,令且:= ,k ) 和且:= ,k ) 是l ( k ) 中的元素,若 按照饼nt 2 = ( s l n 恐,k uy 2 ) 和题u 2 = ( 局u 恐,所nr 2 ) 来定义概念的交和并运算是不合适的, 因为按照上述方法作成的概念的交与并不一定能得到一个新的概念。例如,在根据表2 1 所 建的h a s s e 图2 3 中,对于( 2 ,5 ,6 ,b ) 及( 4 ,6 ,d ) ,虽然有( 2 ,5 ,6 ) n 4 ,6 ) , b u d ) ) = ( 6 , b ,d ) 及( 6 ) u 3 ,5 ) , a ,b ,d ) r 、 c ) ) = ( 3 ,5 ,6 ) ,f 2 i ) ,但是( 6 , b , d ) ) 和( 3 ,5 ,6 ,f 2 j ) 不是概念,下面我们给出概念的并与交的一个合理定义。 二元关系的建立 定义2 1 设l ( k ) 为形式背景k = ( u ,d ,r ) 上的概念集合,- i := ,y i ) 和飓:= ,兄) 为l ( k ) 上的两个概念,规定: 局u 总= c g ( y i r 、蚝) ,巧r 、1 :2 ) ) 何n 尼= ( 局n 恐,“五n 恐) ) 下面来证明定义中的崩u 岛与儡n 岛为概念。 定理2 2 在定义2 1 的意义下的岛u 绣与h , n 绣为l ( k ) 中的一个元素,即为k = ( u ,d , r ) 的一个概念。 证明: 8 内蒙古大学硕士学位论文 v y ( y luy 2 ) ,有y h 或y y 2 。当y y l 时,v x n x 2 ) 互蜀,显然有x r y 成立, 同理y y 2 时也有x r y 成立。故对v y e ( r l ur 2 ) 总有y 以前n x 2 ) 因此 hu 砼互以蜀n 施) ( 2 1 ) 反过来,v x ( x 1u x 2 ) ,有x 蜀或石x 2 。因为,v y ( nr 、y z ) ,即y y l 且y y 2 时结论x r y 成立。因此z 甙k n 圪) 从而 五u 恐g ( y l ny 2 ) ( 4 2 ) 要证8 n 1 6 = ( 五n x 2 ,八五r 、x 2 ) ) 为概念,只要证明g 抓局n 蜀) ) = 五n x 2 即可。由于 g 抓局n x 2 ) ) = x u iy 以局n x 2 ) ,x r y ,令x eg 抓丑n x 2 ) ) 时,及hu 琏以五n x 2 ) ( 2 1 ) 成立,所以y y l 且y y 2 时总有x r y 成立。因为g ( h ) 瑙,从而x ,同理x ex 2 因此x 点n x 2 ,所以有g ( 厂( 五r 、x 2 ) ) ( 五n x 2 ) 。 反过来,对于石五n x 2 ,v y 以五r 、彪) ,由局n x 2 ) 的定义,有x r y 成立是显然的。 因此有x eg q - ( 局n x 2 ) ) ,从而,g 抓蜀n x 2 ) ) 2 ( 丑n x 2 ) 。证明了g ( 厂( 五n x 2 ) ) = ( 五r 、恐) 。 故有( 局n 局,以玉n x 2 ) ) 为概念,即( 五n x 2 ,八五n 尼) ) l ( k ) o 再来证饼u ,墩q ( kr 、圪) ,h n 圪) 为概念,同样只需要证明几( 所n 圪) ) = h ny 2 即可。 令y y lny 2 ,vx g ( 巧n 娩) ,由g ( kn 圪) 的定义,有x r y 成立,也即,y 几( kn 圪) ) , 因此kn 圪s 几( 所ny 2 ) ) 另一方面,对于y 几( k 厂、圪) ) 及v 石g ( r i ny 2 ) ,x r y 成立是显然的由( 4 2 ) 的定义, 丑u 蜀g ( 巧厂、娩) ,所以当工譬五或x e x 2 时,对于y 他( 巧厂、虼) ) 总有x r y 成立。又由以石) = h ,g ( h ) = 五,和以尼) = y 2 ,g ( y 2 ) = x 2 ,推知y h n y 2 ,从而几( h n 玩) ) k nr 2 ,因 此脯u 恁:q ( kn 圪) ,y ln 兄) 也为概念。证毕。 推论2 1 形式背景下概念集合l ( k ) 对于运算n 和u 是封闭的,从而( l ( k ) ,n ,u ) 作成 了具有二元算子“广、和“u 肛的代数系统。 2 3 3 2 概念格的代数性质 定理2 3 代数系统( l ( k ) ,r 、,k a ) 中的元素凰:= ,k ) 、飓:= ,兄) 及- 3 := , b ) 满足下列运算律: 三1 凰n 凰:局研u - 1 = 局;( 幂等律) 三2 凰n h z = h 2 r 、- 1 ;凰u h 2 = h 2 u - i ;( 交换律) 9 通过w a p 交互的基于典型症状匹配的辅助诊断系统的设计 l 3 ( h ir 、- 2 ) n 飓= 凰n ( h 2n 3 ) ; ( - 1 u 4 2 ) u - 3 = 凰u ( h zu1 4 3 ) ;( 结合律) 三4 局厂、( 两u - 2 ) = 凰; 蜀u ( 凰n - 2 ) = - 1 ;( 吸收律) 证明:由定义三,与厶成立是显然的。下面首先证明三3 成立。 因为 n 飓) n - 3 = ( 五n 噩,八五n 恐) ) r 、( x 3 ,y 3 ) 又因为 = ( ( 五n 噩) r 、x 3 ) ,f ( x l n 恐n 为) ( 墨r 、x 2 nx 3 ,八五n 恐n 硌) ) 凰r 、( h 2nh 3 ) = ( 置,h ) n ( 尼n 局,f ( x 2 c 、玛) ) = ( 墨r 、( 墨厂、恐) ) ,f ( x l n n x 3 ) ) ) ( 蜀厂、恐n 玛,八五n x z n 玛) ) 所以r 、飓) r 、- 3 = 凰n ( 飓nh 3 ) 。 再由 凰u ( 4 2uh 3 ) = ( 蜀,巧) uq ( 匠r 、y 3 ) ,圪n 玛) 及 = ( g ( hn ( 圪厂、y 3 ) ) ,hr 、( 眨厂、y 3 ) ) = ( g ( y 1n 圪n 玛) ,hn 最n 虼) ( 1 - 1 1 u 岛) u1 4 3 = q ( r l c 、y z ) ,k 厂、y z ) u ( x 3 ,y 3 ) = ( kn 圪) nr 3 ) ,( ( kr 、圪) ny 3 ) = 锹巧n 圪nr 3 ) ,kn 蚝nb ) 因此有u 飓) u 3 = 凰u u - 3 ) ,从而三3 成立。 下面来证三4 成立, 蜀r 、( h iu - 2 ) = ( 蜀,h ) nq ( f in 场) ,奸ny z ) = ( 蜀ng ( j ir 、y z ) ) ,xr 、g ( 所r 、耽) ) ) 因为墨) = j j ,有蜀g ( r l n y z ) ,所以 ( x lr 、g ( hr 、y z ) ) ,f o c , 厂、g ( 巧ne ) ) ) = ( 五,) ) = ( x l ,y 1 ) = h i 即两n ( 目u - 2 ) = 凰。又 凰u ( 凰nh z ) = ( x l ,y 1 ) u ( 五n 噩,以丑厂、置) ) 内蒙古大学硕士学位论文 n 噩) ) ,y l n 以局n 噩) ) ( 五,k ) = - 1 = ( u ,d ,r ) 下的概念格,令h i := ,h ) 、h 2 := ,圪) 凰,h z = h iuh 2 ( 最小上界) ,g 1 b 玩,- 2 - - h i n - 2 ( 最大下界) 。 证明:设弘( 咒d 屯胤b 凰,飓 ,那么有凰= h 与h z = h 成立,从而y _ cy i 与y c _ 圪, 因此y 量kr 、圪,故有q ( kny z ) ,r ln 圪) = h 。又因为kny 2 所,r ln 圪圪,有 h 1 = q ( 所厂、y 2 ) ,巧n 圪) ,4 2 = 螗( 所ni :2 ) ,r l 厂、y 2 ) , 由于日为最小上界,因此有 胙q ( r ln 玩) ,r lr 、耽) = 凰uh z ,证得肛- 1uh z 。同理可证g l b 1 - 1 1 ,h z = h 1 nh 2 。 证毕。 定理2 5 形式背景k = ( u ,d ,r ) 下的概念格l ( k ) 在定义2 1 的意义下为代数意义下的格, 它具有代数格的所有性质。 由于概念格是代数意义下的格,定理成立是显然的。同时我们有如下推论。 推论2 2 形式背景k = ( u ,d ,r ) 下的概念格l ( k ) 是一个完备格,它的任何子集有最大下 界和最小上界。 定理2 6 形式背景k = ( u ,d ,r ) 下的概念格( l ( k ) ,n ,u ) 是有单位元1 和零元0 的格。 证明:令0 = ( 1 z f ,d ) ,l = ( 玑1 2 f ) ,v - 1 := ,r 1 ) 倒,由 日u ( 1 2 i ,d ) = q ( y l n n ) ,y i n d ) = ( 甙y 1 ) ,y 1 ) = ( 蜀,y 1 ) = h i 及凰厂、( 阢1 2 j ) = ( 墨n 以矗r 、) = ( 蜀,以蜀) ) = ( x l ,h ) = - 1 故0 与1 分别是( l ( k ) ,n ,u ) 的零元和单位元。证毕。 定理2 7 对于概念格( l ( k ) ,n ,u ) 中的任何两个元素e l := ,y 1 ) 、h 2 := ,圪) , 如果f ( x ln 为) = r lu 娩,g ( y l0y 2 ) = 蜀u 局,则( l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论