




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学数据挖掘期末论文 数据挖掘技术在中医方剂研究中应用的 探讨 学 生 姓 名 _ 专 业 _ 学 院 _ 2016 年 6 月 数据挖掘技术在中医方剂研究中应用的 探讨 湛薇 摘要: 现有的中医方剂数据存在冗余大的、不一致的、无效的噪声数据,降低了中医方剂 数据的利用,且其方剂数据需要更加高效的存储、查询以及共享。而数据库技术融汇了人 工智能、模式识别、模糊数学、数据库、数理统计等多种技术方法专门用于海量数据的处 理 1,从而解决中医方剂研究中所存在的问题,提高利用效率并且发掘潜在信息。本文利用 关联规则、聚类分析、分类模式等数据挖掘方法,揭示方剂配伍规律的研究,对中医方剂 信息的问题进行探讨。 关键词: 中医方剂;数据挖掘技术;关联规则;聚类分析;分类模式 Data mining technology applied in the study of prescription of traditional Chinese medicine Zhan Wei 【Absract】 :Existing in traditional Chinese medicine prescription data redundancy, big noise, inconsistent, invalid data, reduces the use of traditional Chinese medicine prescription data, and the prescription data need to be more efficient storage, query and sharing. And the database technology of artificial intelligence, pattern recognition, fuzzy mathematics, database, mathematical statistics and so on the many kinds of technical methods specifically for mass data processing 1, so as to solve the problems in the research of TCM prescriptions and improve the utilization efficiency and explore potential information. Based on association rule, clustering analysis and data mining methods such as classification model, reveals the law of herbal research, discusses the problem of prescription of traditional Chinese medicine information. 【Key words】:Prescriptions of traditional Chinese medicine; Data mining technology; Association rules; Clustering analysis; Classification model 1 引言 中医学信息化在这几年来发展迅速,大量中医方剂数据库已被构建与完善,但中医方 剂的数据挖掘方面依然有很多亟待解决的问题。虽然众多已经构建的方剂数据库都是经过 一系列的校正后的结构化数据库,但由于在浩瀚的中医历史之中,其年代跨度实在太大、 朝代变更下使用的文字、记叙方式与特点的差异悬殊,使得方剂信息依然不可避免的会出 现方剂数据不一致、错误、冗余等问题。 数据挖掘技术在数据中正规地发现有效的、新颖的、潜在有用的,并且最终可以被读 懂的模式的过程。具有善于挖掘超大型数据库、非手工地发现隐含知识、增进人类知识的 特点 2,因此,数据挖掘技术对于中医方剂研究所存在冗余的、不一致的、错误的等一系 列噪声数据的解决具有重大意义。另一方面,而中医方剂配伍从本质上来说表现在方与方、 药与药、方与药、药与剂量,以及方药与病、症之间的交叉错综的关联与对应。数据挖掘 正是通过数据特征、关系、聚类、趋向、偏差和特例现象深层的多维分析,来揭示数据间 复杂特殊的关系,发现隐含规则模式和规律。 2 方剂配伍研究中的数据挖掘方法 2.1 关联规则 关联规则是数据挖掘中的一项重要技术,反映大量数据中项目集之间的关联和相关联 系。关联规则也是目前用于中医方剂配伍研究中最经典的一种方法,一般通过降维处理将 复杂的病、症、方、药关系分解,研究药与药、方与方、药与症状等两者之间的关系。 基于关联规则的研究呈现如下特点:主要研究药与药之间的关联关系,其他病症、病 方之间的关系研究得较少,研究对象包括某一类方或者治疗某一病症的方剂。研究方法不 能证明具有普遍适用性;关联规则的算法参数,即最小支持度大部分为 10%左右,支持度 偏小,使得发现的关联关系的可信度不高。 2.2 聚类分析 聚类分析即按照相似性和差异性的分布,将数据对象按照不同的属性特征聚集为不同 的类,然后结合领域知识对方剂的配伍规律进行分析。聚类分析的算法有很多种,如基于 划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于网格的聚类算法等, 不同算法在不同领域以及数据集上得到应用。在方剂配伍规律分析领域,使用较多的事层 次聚类方法,也可采用模糊聚类方法建立模糊相似矩阵类分析药物之间的相似度。 模糊聚类方法以模糊数学中的聚类方法为理论基础,通过建立模糊矩阵最终获得聚类 结果,其方法简单易行,在处理小数据量上可以收到较好效果。 层次聚类算法可以对给定的数据集进行层次的分解,直到某种条件满足为止,具体分 为凝聚和分裂两种方法。该算法简单快捷而且能有效地处理大数据集,但是合并或者分裂 点的选择至关重要,直接决定了聚类结果的质量。 采用模糊聚类的研究对象多是古代经典名方,研究内容是具体方剂的组成原则,即方 中君臣佐使药物的确定,验证结果的方法是中医方剂的传统理论,此种研究尚处于探索阶 段。而其结果的准确性未被广泛验证,但是该方法对于方剂配伍规律的理解以及配伍规范 化具有重要作用。层次聚类算法的研究对象为治疗某一病症的复方,依据单味药功效进行 聚类,获得若干个药物组合类别,结合病的临床症状推断证型和用药,这种研究方法在一 定程度上研究了药证与药方之间的关系,并对临床治疗疾病具有指导意义。 2.3 分类模式 分类模式是根据数据集的特点构造一个分类器,利用分类器对未知的样本赋予类别的 一种技术。分类算法主要有决策树、人工神经网络、贝叶斯网络等。不同分类方法会产生 不同的分类器,分类器的优劣直接影响数据挖掘的效率与准确性。通过分类模式可以实现 多角度的方剂分类和方剂功效的判定。 在方剂的分类模式研究当中,目前常用的分类算法有人工神经网和支持向量机方法。 运用这些方法基于已知的方剂分类标准,可以将大量方剂按照组方药物的功效、性味或归 经等众多维度、多角度分成若干类,或判定单个方剂的功效,从而对理解方剂中药与药、 药与法、药与证等之间的关系奠定研究基础。着方面的研究虽然取得某些成果,形成了多 个方剂分析系统,但是涉及的训练集仅是治疗某些病症或者一部著作记载的方剂,缺乏选 取大量数据对这些系统的分析结果进行验证。因此分类模式研究方剂配伍规律有待选择多 种算法开展深入研究。 2.4 研究方法的分析 首先,从采取的数据来源看,主要有三类。一类是以现有的中医文献数据库或者辞典 为基础选取治疗某类疾病的方剂作为研究的数据;一类是以某段时期的文献为基础选取治 疗某类疾病的方剂作为研究的数据;还有一类是以一些名医的临床治疗处方作为研究数据。 总体来看,方剂文献的来源趋向于多样性,这给方法的有效性和深入性地研究带来了难度。 其次,基于当前的文献研究,可以依据拟解决的问题对前面提到的三种数据挖掘方法 的适用范围归类。关联规则所解决的问题包括:治疗某一病症的用药规律,即药物间的关 系;症状间的关系;药和症状的关系;药和证 的关系。聚类分析所解决的问题包括:方剂 中药物君臣佐使的配伍关系;治疗某一病或证的基础方法。分类模式所解决的问题包括: 方剂的功效归纳,方剂的属性归纳。 最后,从挖掘对象来看,呈现多样性。从单味药到一类药;从单个复方剂或治疗某一 病症的复方。其中关联规则挖掘的对象包括治疗某一病症的复方、某一类复方、某一类药 等,分类模式挖掘的对象包括某一类方 3。 3 数据挖掘 以分类关联规则为例,在分类关联规则挖掘中,支持度和置信度是描述分类关联规则 兴趣度的两项重要指标。支持度反映规则的普遍性,置信度反映规则的可靠性 4。若最小 支持度阈值取 2%,犹豫伤寒杂病论中的方剂数量为 286 首,2862%5,意味着要选 择频次大于 5 的要不进行分析。综合仲景标准 DB 数据库,认为此最小支持度阈值的取值 对研究可行。置信度的公式 Confidence(A-B)=P(AB),揭示了 A 出现时,B 是否也会出 现或有多大的概率出现。如果置信度为 100%则说明 A 出现时 B 必定会出现;如果置信度太 低,则说明 A 的出现于 B 是否出现关系不大,故最小置信度阈值为 50%。 数据挖掘部分结果如表 1 至 3 所示。 通过数据挖掘,发现以下规律: 按病性归类时,多选用麻黄、桂枝、生姜、大葱等辛热之品来治疗寒证;多选用黄苓 与其他补虚或泻火实药配伍来治疗热证;多用茯苓、甘草、附子、白术等来治疗虚证;多 用甘草、麻黄、杏仁等药来治疗在表的疾病;病位在里的疾病,如治疗病位在脾胃的疾病 则多选用细辛、五味子、半夏、干姜等;治疗病位在胆的则多选用柴胡、黄苓等。按病势 归类时,发现治疗太阳病时一般选用桂枝、生姜、甘草、大枣、大黄;治疗阳明病一般选 用黄连、柴胡等;治疗少阳病一般选用桂枝、白芍、大枣、甘草、厚朴等;治疗少阴病一 般选川乌、人参、白芍、黄芪等。 综上,得出伤寒杂病论中的条文在治疗疾病时。多根据所治疾病的病性、病位和 病势的不同来选择、搭配使用不同药物。 4 总结 本文分析了数据挖掘技术在中医方剂研究中应用的探讨,对几种方剂配伍研究中的数 据挖掘方法进行详细的分析,也利用数据挖掘技术研究伤寒杂病论中的方剂药物配伍 规律,通过数学计算的新方法对伤寒杂病论中的方剂进行挖掘研究,是未来完善此
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论