会员注册 | 登录 | 微信快捷登录 支付宝快捷登录 QQ登录 微博登录 | 帮助中心 人人文库renrendoc.com美如初恋!
站内搜索 百度文库

热门搜索: 直缝焊接机 矿井提升机 循环球式转向器图纸 机器人手爪发展史 管道机器人dwg 动平衡试验台设计

   首页 人人文库网 > 资源分类 > PDF文档下载

数据挖掘技术在中医小儿肺炎辨证规范中的应用.pdf

  • 资源星级:
  • 资源大小:85.16KB   全文页数:5页
  • 资源格式: PDF        下载权限:注册会员/VIP会员
您还没有登陆,请先登录。登陆后即可下载此文档。
  合作网站登录: 微信快捷登录 支付宝快捷登录   QQ登录   微博登录
友情提示
2:本站资源不支持迅雷下载,请使用浏览器直接下载(不支持QQ浏览器)
3:本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

数据挖掘技术在中医小儿肺炎辨证规范中的应用.pdf

第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.2006第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.2006紧迫任务。因此特将近百年来中医儿科四大学派的形成和发展作一扼要阐述。在儿科领域中,历来就有小儿体禀纯阳和稚阳稚阴之争。持纯阳立论者,认为小儿体禀纯阳,罹病容易化热,宜用寒凉。近代名医奚晓岚特别推崇这一观点,故有寒凉学派之称。稚阴稚阳立论者,则认为小儿赖阳以生,依阴而长,然而阴既不足,阳尚未盛。江育仁也主张小儿属稚阳稚阴,但他从阴气以生必赖阳气之旋运悟出脾健不在补贵在运的道理,故成为近代运脾学派的大家。刘弼臣认为纯阳是根据小儿生机蓬勃、发育迅速提出的,稚阳稚阴是根据小儿脏腑柔嫩、形气未充而提出的。各有千秋,互有偏颇。如只强调某个侧面,难免会有割裂和孤立之感,他除了在治疗上精于五脏证治,突出从肺论治外,特别强调小儿体禀少阳,他用少阳阳气渐旺的观点,阐明小儿生长发育的快速,显示了阳气的生发作用,包含了婴幼儿时期以阳为用的特点,也意味着阳气对婴幼儿生长发育的重大意义。小儿虽为少阳之体,但少阳实为稚阳,其阳气并非真正有余,而相对感到不足,从而显示了小儿时期无论在物质基础和功能活动方面,均处于稚嫩脆弱状态,尚未达到完善和成熟,包含了小儿时期脏腑嫩弱、形气未充、稚阳未充、稚阴未长的特点。综观上述,不仅少阳概括了纯阳和稚阳稚阴两种不同观点的含义,而且将其有机地统一于体禀少阳之中,为创立新的少阳学派做出了巨大贡献。续完随着数据库技术的不断发展和广泛应用,产生了大量的数据,人们迫切需要将这些数据转换成有用的信息和知识,数据挖掘技术由此应运而生。数据挖掘1就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、潜在有用的信息和知识的过程。目前,数据挖掘技术已经广泛应用在商业、医药、工程等各个领域,为人们提供了隐藏在大量数据背后的有用的信息,帮助人们做出决策和判断。传统的中医诊断疾病包括辨病和辨证两部分。辨证是中医学中最富有特色的科学精华,也是中医诊断学的主要研究内容。中医辨证标准的研究,对于发展中医理论及提高临床诊治水平,具有极其重要的意义。目前,中医学尚缺乏公认的中医辨证规范。已经出现的中医辨证的方法多采用统计方法和逻辑分析方法,但受人为经验因素的影响,难以摆脱传统的经验模式。本文以小儿肺炎为例,提出运用数据挖掘技术,通过数据预处理、数据挖掘、挖掘结果处理,从而建立中医小儿肺炎辨证规范。1中医小儿肺炎辨证规范数据挖掘的相关技术数据挖掘是在大量的数据中自动发现有用的信息的过程,是知识发现的一部分。运用数据挖掘技术进行知识发现的过程如图1所示。数据挖掘技术在中医小儿肺炎辨证规范中的应用马玉慧1,王波2,张斌2,梁茂新31.渤海大学教育学院,辽宁锦州1210132.东北大学信息科学与工程学院,辽宁沈阳1100043.辽宁中医药大学,辽宁沈阳110032摘要以小儿肺炎为例,采用数据挖掘技术建立中医小儿肺炎辨证规范,并与十五前期的小儿肺炎辨证规范进行对比分析,以期为数据挖掘技术在中医辨证规范化方面做出贡献。关键字辨证规范数据挖掘小儿肺炎中图分类号R203文献标识码A文章编号16734297200606001105收稿日期20060417修回日期20060703基金项目十五国家科技攻关计划项目2004BA721A05作者简介马玉慧1974,女,讲师,医学硕士,研究方向数据挖掘。111.1数据预处理在进行数据挖掘之前必须要经过数据预处理。数据预处理的任务是将现有的数据集转换成符合挖掘算法要求的集中的数据集。预处理工作主要通过以下步骤完成从多个数据源中进行数据的汇集去掉噪声数据和重复数据进行属性选择,可以采用交互的方式让用户自己进行属性筛选,去掉那些与挖掘工作无关的属性维度约简,可以通过某些技术,例如粗糙集技术,约简掉那些对决策不重要的属性数据规范化处理,最终得到符合挖掘要求的数据集。由于数据集可能来自各种不同的途径,因此数据预处理过程是整个知识发现过程中最耗费时间的步骤。1.2数据挖掘数据挖掘过程就是根据挖掘人物的不同,选择不同算法进行数据分析的过程,主要的算法包括关联规则算法、聚类算法、时间序列分析算法。1.2.1关联规则数据库中关联规则的挖掘可形式地定义为设I{i1,i2,im}是所有项目的集合,即数据库中的所有字段D是所有事务的集合,即数据库每个事务T是一些项目的集合,T包含在I中,每个事务可以用唯一的标识符TID来表示。设X为某些项目的集合,如果XT,则称事务T包含X。关联规则表示为XTXYTY,其中,XI,YI,X∩Y。关联模型主要描述了一组数据项目的密切度或关系。1.2.2聚类算法聚类就是把整个数据分成不同的组,并使组与组之间的差距尽可能地大,组内数据的差异尽可能地小。聚类分析时数据集合的特征是未知的。聚类根据一定的聚类规则,将具有某种相同特征的数据聚在一起,也称为无监督学习。聚类的数学描述如下所示给定数据集合V{νi|i1,2,n},其中νi为数据对象,根据对象间的相似度将数据集合分成k组,并满足{Cj|j1,2,k},其中CiVCi∩Cj∪ki1CiV,则该过程称为聚类,Cii1,2,n称为簇。1.2.3时间序列分析时间序列是指系统中某一变量的观测值按时间顺序时间间隔相同排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。它是系统中某一变量受其他各种因素影响的总结果。研究时间序列的实质是通过处理预测目标本身的时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。1.2.4粗糙集粗糙集理论2由波兰科学家Z.Pawlak在1982年提出。它是一种刻划不完整性和不确定性的数学工具,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理3,从中发现隐含的知识,揭示潜在的规律。粗糙集中的一个特点就是对于所需处理的问题无需先验知识,因此具有相当的客观性。目前,粗糙集理论已经被成功地应用于挖掘属性依赖度和属性约简。1.3挖掘结果处理经过数据挖掘之后得到的信息是一些数据,关联分析聚类分析时间序列分析数据输入数据预处理数据挖掘挖掘结果处理信息输出数据清理属性选择异常数据处理维度约简规范化处理可视化处理模式集成图1知识发现的过程第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.2006第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.200612第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.2006第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.20062.1数据预处理在进行数据挖掘之前,必须经过数据预处理。在本系统中,数据预处理完成的任务包括数据导入、缺失值处理、数据规范化处理、异常数据处理、属性约简、数据分割。2.2数据挖掘过程2.2.1聚类分析得到小儿肺炎证型的分布和症状构成系统中挖掘工作的第一步是进行聚类分析。聚类过程是一个无指导地将对象进行归类的过程。图3形式化地表示了聚类算法在系统中的应用。图3聚类算法在系统中的应用并不能直接帮助用户进行决策,需要将挖掘结果进行集成或可视化处理,确保将有效、有用的信息呈现出来,或者从多个不同角度进行数据分析和挖掘结果的分析。2中医小儿肺炎辨证规范数据挖掘系统的实现中医小儿肺炎数据挖掘系统是在前期十五攻关课题小儿肺炎中医证治规律研究的研究成果基础上,通过1000例小儿肺炎前瞻性临床研究建立计算机数据处理平台,应用数据挖掘技术,客观建立中医辨证规范、疗效评价指标和方法体系。通过临床信息采集和数据挖掘,将重新确认小儿肺炎证型的分布各证型症状的基本构成确认症状间的关联关系确认症状对病证诊断和疗效评价的贡献率以及证型之间的转换规律。系统的处理流程如图2所示。数据源CRF表CRF表CRF表专家问卷文献资料数据预处理数据导入统计分析缺失值处理数据规范化处理数据规范化处理异常数据处理属性约简数据分割数据挖掘挖掘用数据验证用数据正常儿童数据聚类分析关联分析粗糙集属性重要度计算时间序列分析证的构成比证的分布症状间的关联关系症的贡献率证转换规律挖掘结果数据混合挖掘结果验证辨证标准经验结果对比分析修正辨证标准标准辨证标准图2中医小儿肺炎数据挖掘系统处理流程G1G2G3G4G1G2G3G4...G1G2G3G4G1G2G3G4...G1G2G3G4G1G2G3G4.........G5G5G6G7G8G9症状表现症状表现症状表现症状表现症状表现症状表现症状表现证证13聚类的结果包括以下两部分1证的分布。证的分布指的是疾病证型的构成,很明显这是一个无指导的过程。聚类的结果形成多个簇,每个簇就是所说的证。证的命名通过与专家的交互,完成了辨证标准的客观功能部分。2证的构成。聚类后,每个证包含了若干症状向量症状、症状表现,可以得到每个证的症状症状表现构成情况。2.2.2关联规则分析得到症状间的关联关系关联规则分析是在聚类挖掘的基础之上,在每个不同的证型中进行关联规则挖掘,得到每个证的症状之间的关联关系。中医小儿肺炎数据的层次关系可用图4表示。系统中数据具有层次关系。在进行挖掘时,一方面,可以在最上层,即症状级,例如发热、咳嗽、气促这样的级别中进行挖掘,寻找关联关系另一方面,也可以在具体的层次中进行挖掘,例如在稽留热、弛张热、间歇热、剧烈咳嗽、咳声无力、咳声重浊、气急、鼻煽、呼吸困难等这些具体的症状表现层次上进行挖掘,得到不同层次的不同的挖掘结果。通过关联规则分析,得到症状之间的关联关系。图4症状的层次模型2.2.3粗糙集属性重要度计算症状对证的贡献率属性的重要度4是指在一个信息系统中,不同的条件属性对于决策属性所起的作用是不同的。有些条件属性可能对于决策属性的取值起着重要作用,但有些可能不起作用。用属性的重要度来表示条件属性对于决策属性的影响程度,可以采用分别去掉各个属性后,检测整个信息系统是否因为去掉了这个属性而导致了分类或决策结果发生了变化。若是,则这个属性对于这个决策属性是重要的,计算的值越大,重要性越大反之,这个属性不是重要的,计算出的值就小。dBBCrBCrBBC,其中rBCcardPOSBCcardU,属性子集BB,POSBC为正域,cardU为该集合的元素的基数。2.2.4时间序列分析挖掘出证的变化规律系统收录了每个病人在整个病程中每天的病情数据,构成了一个带有时序的序列。对这些序列进行分析,获得证随时间过程的演变特性与规律。2.3挖掘结果的验证为验证挖掘结果,将从1000例样本数据中随机取出200例数据作为验证数据,用于多种辨证标准的验证测试。这200例验证数据将不参与数据挖掘,仅仅用于辨证标准的验证。为保证验证结果的可信度,将按照同年龄儿童中小儿肺炎的患病率,通过采集非小儿肺炎儿童的数据,将其与200例验证数据混合构成混合样本数据集。据统计,同年龄儿童中小儿肺炎的患病率为10左右,这样将采集2000例非小儿肺炎儿童的数据,构成2200例数据组成的验证数据及用于辨证标准的验证,认为这一数据量基本能够满足需要。2.3.1验证处理经过数据挖掘处理后,可以得到挖掘的辨证标准、各证所属症状的划分方法以及具体症状的量化赋分方法。这样系统具有四种辨证或诊断标准1中医病证诊断和疗效标准等确立的小儿肺炎辨证标准和各证所属症状二级划分即分为主要症状和次要症状两级方法以及具体症状的量化赋分方法。2进行小儿肺炎辨证规范和疗效评价方法研究之初,先期在逻辑判断基础上建立第二套辨证标准。该标准针对小儿肺炎中医各证的症状,依据各自对病证诊断的贡献情况分为特异症状、主要症状和次要症状三级。并对复合症状、注释性症状、极端症状、起鉴别作用症状、不宜作为疗效判定症状等做出说明和处理,借以对每个症状的程度水平进行三级量化处理。3西医的诊断标准,包括小儿肺炎临床表现呼吸系统、循环系统、神经系统、消化系统以及分级程度温度热型程度声音发热时间气促发热咳嗽症状气急鼻煽呼吸困难稽留热弛张热间歇热咳声重浊咳声无力剧烈咳嗽第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.2006第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.200614第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.2006第2卷第6期中医儿科杂志Vol.2No.62006年11月J.PEDIATRICSOFTCMNov.2006收稿日期20060607修回日期20060723作者简介徐荣谦1950,男,主任医师,教授,博士生导师,从事儿科临床工作。哮喘是目前世界上最常见的慢性疾病之一,2002年我国儿童哮喘流行病学调查显示2年内患病率为0.5~3,个别地区则高达5。我国至少有2千万左右的患者,全世界有1亿5千万哮喘患者。近10多年来,美国、英国、澳大利亚等国家哮喘患病率尤其是儿童及死亡率有所上升,因此哮喘已成为严重的公众卫生问题而引起了世界各国的极大关注。学术探讨小儿哮喘的分期论治徐荣谦北京中医药大学东直门医院,北京100700摘要通过对哮喘病因、病机的分析,结合多年临证经验,将小儿哮喘分为喘前期、发作期、间歇期和缓解期,并分别施以理、法、方、药,取得了较好疗效,并附2则案例以资验证。关键词哮喘分期论治小儿中图分类号R256.12文献标识码A文章编号16734297200606001503并发证小儿肺炎实验室检查病原学检查、外周血检查、X线检查等。4数据挖掘的辨证标准。数据挖掘的辨证标准主要包括辨证指标以及具体症状的量化赋分方法。辨证指标包括关联挖掘证的构成、证的构成比、证的关联度、时序挖掘证的变化、症状的变化、聚类挖掘症状的构成比、症状的贡献率等。可以挖掘出具体症状的量化赋分方法。4种辨证标准分别在验证数据库中进行测试,得出客观度对比表,同时构造出整体的客观度曲线。如图5所示。2.3.2优化辨证标准比较4套标准之间、3套辨证标准与西医诊断标准之间在病证诊断方面的符合情况,修正各证构成比、症状对证诊断的贡献率等确定客观的量化方法,形成新的分级量化表,最终建立小儿肺炎辨证规范和方法体系。2.3.3建立辅助诊断系统在客观辨证标准的基础上,设计辅助诊断系统,辅助专家对小儿肺炎各证进行科学的诊断。3结论利用数据挖掘技术进行中医辨证规范的研究具有重要意义和挑战性。中医海量的病例数据为挖掘工作提供了很好的研究基础,中医复杂的症状间的关系和证型间的变化为研究提出了挑战。数据挖掘过程是一个需要人机交互、多次反馈修正的过程,高质量的数据、相应算法的合理参数是有效挖掘的基础。运用数据挖掘技术建立中医小儿肺炎辩证规范,必将为促进中医规范化做出巨大贡献。参考文献1张云涛,龚玲.数据挖掘原理与技术M.北京电子工业出版社,200434.2Paw1akZ.RoughsetsJ.Int.Jcomput.Inf.Sci.198211341356.3PawlakZ.RoughclassificationJ.Int.JManMach.Stud,198420469483.0.70.60.50.40.30.20.10050100150h20.05h20.20h20.40h20.45图5辨证标准对比图15

注意事项

本文(数据挖掘技术在中医小儿肺炎辨证规范中的应用.pdf)为本站会员(abingge)主动上传,人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知人人文库网([email protected]),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。

copyright@ 2015-2017 人人文库网网站版权所有
苏ICP备12009002号-5