基于数据挖掘的骨肿瘤诊断知识自动获取技术_第1页
基于数据挖掘的骨肿瘤诊断知识自动获取技术_第2页
基于数据挖掘的骨肿瘤诊断知识自动获取技术_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于数据挖掘的骨肿瘤诊断知识自动获取技术

0快速、有效的建立不同的:mdrbr的数据挖掘方法随着医院信息基础设施的加快,患者信息数据不断积累,为建立疾病的辅助诊断专家体系奠定了基础。如何快速有效地建立一个完整的数据库是被公认的专家系统的瓶颈。在本研究中,我们使用基于粗厚集理论的挖掘方法,使用mdrbr算法(最小分散理论的搜索方法)来探索受信任的规则,自动获取已知的数据,并自动获得具有价值的信息。1压缩和再提取对已确诊病例数据库进行分析时,在保留基本诊断知识对骨肿瘤疾病诊断的分类能力的基础上,消除重复、冗余以及无用的知识,实现对知识的压缩和再提炼.2数据库的简单数学模型2.1n矩阵中属性组合数所谓的最佳属性化简是指:在保持原有数据的分类能力不降低的情况下,使化简后得到的属性数最少,或最终得到的规则最简,或全部数据化简量最大.这一过程是基于可辨识矩阵完成的.可辨识矩阵定义为:令S={U,A}是一个信息系统,U为定义域且U={x1,x2,...,xn},A是条件属性集合,D是决策属性,a(x)是记录x在属性a上的值,可辨识矩阵可表示为:(cij)=⎧⎩⎨⎪⎪{a∈A:a(xi)≠a(xj)}0−1,a(xi)=a(xj)D(xi)≠D(xj)D(xi)=D(xj)D(xi)≠D(xj)(cij)={{a∈A:a(xi)≠a(xj)}D(xi)≠D(xj)0D(xi)=D(xj)-1,a(xi)=a(xj)D(xi)≠D(xj)其中i,j=1,2,3,...,n矩阵中属性组合数为1时表明:除属性外,其余条件属性无法将信息表中决策不同的两条记录分出来,核属性之外的其余有用属性应从属性组合数不为1的矩阵元素中分析取得.2.2信息过滤算法在决策系统中进行分类规则挖掘时,使用可信度来对一个规则进行评估.但是一个具有正确的高可信度的规则并不能保证其是有效的.当一个信息系统中的信息粒度较高时(规则的统计意义的值往往是很高的),这时我们采用一种基于粗糙集理论的信息过滤算法.下面给出具体的信息过滤算法:步骤1:对每一个信息表记录q,计算其等价类集合P({q});步骤2:对每一个q的属性值进行排序,考虑其任意两个相邻的属性值qi和qj,并假设其对应的对象是ui和uj:如果[ui]q和[uj]q是决策属性D确定的,并且存在Yi0∈P(D)有[ui]q=Yi0和[uj]q=Yi0,则将属性值qi和qj合并,记为qij.步骤3:在上述处理后的信息系统中,如果存在有不同的属性值qi和qj,并假设其对应的对象是ui和uj:如果[ui]q和[uj]q是决策属性D确定的,并且存在Yi0∈P(D)有[ui]q=Yi0和[uj]q=Yi0,则将属性值qi和qj合并,记为qij.步骤4:结束.2.3至上的搜索策略由于属性值的遗漏或噪声,或还存在人们尚未使用的诊断属性,确诊病例中同样的决策属性并不能完全映象到同一分类,而是映象到两个以上的决策类时,这时就会产生默认规则,默认规则尽管不是百分之百正确,在大部分情况下都是可以正确使用的.在用粗糙集产生分类规则时,我们既要考虑所产生规则的信赖度,也考虑规则的支持度.如果某条规则的支持度小于给定的阈值,就可以认为这条规则为噪音干扰所致,不作为合理的规则提交,可以先放在备选案例数据库中,供以后进一步分析使用.医生实际分析问题的过程是一个从粗糙到精密的过程.即首先考虑较少量的属性,再逐渐增加属性,直至问题的解决.基于上述分析,我们采用自下而上的搜索策略.具体算法如下:输入:信息系统I,支持度阈值0≤μs≤1,信赖度阈值0≤μc≤1输出:此信息系统上的确定性规则和默认规则集合:第一步:CNi表示节点Ni上的属性值;RNi表示节点Ni上产生的规则集;算法产生的规则集R=Ф;第二步:设底层节点N0所对应的属性集为CN0,在N0节点上产生的规则RN0=CreateRule(U,D,CN0,μs,μc);R=R+RN0第三步:①循环:j从1到|D|,执行:对第i层上的节点Nij上生成规则RNij=CreateRule(U,D,CNij,μs,μc);R=R+RNij;②生成第i-1层上产生的默认规则的例外(blocks);第四步:结束.3数据库设计与分析从唐都医院全军骨肿瘤研究所获得已确诊病例资料100份,使用SQLSERVER2000数据库作为后台数据库系统,建立患者通用信息表、临床表现记录表、化验检查记录表、X线平片图像参数表、造影检查记录表、MRI及CT检查表和病理检查记录表共7个基本数据表.使用BorlandC++6.0通用程序设计语言进行编程.生成的知识库的决策树形式,在知识数据库中存储.知识自动获取程序模块运行生成一个带有29个节点的决策树,将数据库中的43个条件属性简化为28个,决策属性为6个.数据简约量为34.9%,在不明显降低诊断正确率的条件下,大大缩小了生成的决策树的大小,提高了后续推理程序的运算速度,并为事后的推理解释打下基础.4基于互联网的解决困难的相关研究使用基于粗糙集理论的数据挖掘技术,对已确诊病例数据库进行分析,建立骨肿瘤辅助诊

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论