下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中医证候数据挖掘的研究现状与展望
钱学森等人指出,这种复杂的人体系统研究方法是“将专家(相关专家)、数据和信息有机地结合在一起,并将不同学科的科学理论和经验知识结合起来。”。中医证候是一个非线性的复杂巨系统。数据挖掘(datamining,DM)正是适合解决复杂性问题的知识获取技术,在相关领域专家指导下,它可以实现对海量数据的智能分析,得到事物本质及可预测其发展趋势的、隐含的模式或规律。充分利用数据挖掘技术的优势,将其引入到融合了哲理、人文、个人经验等多方面信息的中医证候的研究中,近年来取得了诸多有价值的成果。1预测聚类及偏差检测功能数据挖掘的目标是从数据库中发现隐含的、有意义的知识,其主要有5类功能:自动预测趋势和行为、关联分析、聚类、概念描述、偏差检测。数据挖掘的具体过程分为5个步骤[51:问题定义、数据提取、数据预处理、数据挖掘、知识评估。2中医证候的时空特征中医证候数据挖掘具有医学数据挖掘的共性特点:①异质性;②伦理的、法律的和社会的问题;③隐私性;④多样性;⑤不完整性;⑥冗余性;⑦时间性等。同时,在时间性、异质性方面,中医证候数据的特点更加鲜明。其中,时间性主要体现于证候的动态时空特征。证候是一定时间点与一定状态的产物,时间在推移,状态在变化,证候就有可能发生由此发展为彼的改变。异质性作为中医证候数据的重要特点,其主要体现于以下几个方面。2.1多维交叉的非线性表现证候是由中医四诊获取到的信息综合集成的病象,是疾病某一发展阶段病因、病理、病位、病势的综合表现。证候要素通过不同组合形式体现证候的分布特征和动态演变,具有复杂的多维多阶立体交叉的非线性特征,证候的辨析还是主客观因素交融的结果。因此,证候研究数据处理的大容量和复杂性不言而喻。2.2辨证难,难统一规范由于患者的个体差异及医生临床诊疗的圆机活法,使中医辨证存在一定的模糊性,难以统一和规范,临床上往往因为医生经验不同导致对同一患者的辨证存在差异,科研中也因所遵循辨证标准的不同而得出不同的研究结果。2.3复杂的网络化网络化证候具有庞杂繁复的内涵和外延,是由多种因素(高维)通过多种多样的联结形式和联结强度(高阶)构成的一个复杂的立体网络。该网络随着时间的演进而起伏、涨落,成为具有非线性动力特性的复杂系统,很难用公式、等式以及模式等来描述。2.4临床数据的处理方法中医的因时、因地、因人制宜的“三因理论”,充分体现了辨证论治的灵活性,但这种具体化和针对性也造成了临床数据获取过程中的特异性、敏感性、多变性,增加了数据处理的难度。3数据挖掘的注意事项面对错综复杂、海量的中医证候数据,进行定性与定量结合、主观与客观结合、确定与模糊结合、线性与非线性结合的数据挖掘,尤其需要注意以下几个方面。3.1管理数据科学、严谨的数据采集,合理的数据预处理方法等高质量的数据管理是保证中医证候研究数据可用性、合理性和完备性的重要前提。3.2确定研究目标确定主题、准确地定义数据挖掘任务是数据挖掘成功的关键要素。明确的研究目标决定了中医证候数据挖掘过程的各种运作,并引导了运作的方向。3.3证候的处理各种数据挖掘方法的原理不同,对同一个中医证候数据的处理可能会得出不一致的结果,但都能从不同侧面反映证候的本质。根据数据特点,选择最适合的数据挖掘方法,才能发挥各自的技术优势。3.4基于多种数据挖掘方法的中医证候算法不同的数据挖掘方法适用于不同的需求和环境,在中医证候数据挖掘过程中,综合应用多种数据挖掘方法,可以弥补单一方法的不足,更有效地挖掘出所需要的证候相关知识,使研究结果更为全面和理想。3.5专家的参中医证候数据挖掘的过程必须有中医药领域相关专家的参与。主题的确定和方法的选择,应当基于中医理论体系并结合专业知识,最后研究结果的解释也离不开临床经验的指导和专家的评估判断。4有效挖掘名中医辨证经验的技术手段。在临床组数据挖掘的运用为证候诊断的标准化、规范化提供了强有力的技术支持平台,有效促进了病证结合临床研究、证候与方剂相关性研究的开展,并初步探索了整理挖掘名老中医辨证经验的新途径。现就数据挖掘主要的应用方向举例介绍如下。4.1功能失调性子宫出血证候诊断标准建立尤昭玲等运用数据挖掘、信息处理等多维的数学方法和计算机技术,从大量的数据中发现以功能失调性子宫出血为研究对象的新知识,将机制上还不明确的证候变量关联起来,对其证候要素辨证进行计量分析和判别研究,并制定功能失调性子宫出血证候要素诊断标准。4.2中医证候聚类挖掘刘强等将与心气虚证所含症状有重叠的常见中医证候进行聚类挖掘,发现肺气虚证与心气虚证的相似程度最高,提示临床上应该注意两者的鉴别,避免误诊。4.3毒脆盛、阴虚内热型基因表达差异聚类分析吴元胜等对系统性红斑狼疮(SLE)患者热毒炽盛、阴虚内热型基因表达谱差异进行聚类分析,发现热毒炽盛型代谢相关基因、急性时相炎症反应相关基因表达水平明显高于阴虚内热型。4.4统一判定公式韩佩玉等探索将数据挖掘技术应用于中医方剂的证候判定中,通过方剂的主治症状来分析其主治证候,发现存在复杂的函数关系,设定判定公式进行数学建模,成功建立了两者之间的客观联系,在422首样本方中,判定结果有62.5%令人满意。4.5名中医诊疗眩晕的辨证思维模式田琳等采集5位中医专家路志正、谢海洲、薛伯寿、张云茹、朱建贵在临床诊疗眩晕的病例或医案共计617例(1099例次),运用判别分析、决策树和神经网络等对数据库中与辨证相关的数据进行分析挖掘,总结名老中医诊疗眩晕病的辨证思维模式。5回归分析的研究目前用于中医证候研究的数据挖掘方法主要有:多元线性回归分析、logistic回归分析、判别分析、聚类分析、主成分分析、因子分析、关联规则、粗糙集理论、决策树、人工神经网络、贝叶斯网络、信息熵等。5.1结果的整体作用上述数据挖掘方法均属于多元统计分析,又称多因素统计分析,是定量分析事物间复杂相互关系的一种数理统计方法,能够分析多个因素对结果的单独作用或联合作用。因其能综合体现人体生命活动的特点和规律,与中医理论有内在的切合性,目前应用日趋广泛并已凸显其优势。已有多位学者将各种多元统计分析方法引入证候研究领域,为证候研究从定性描述为主向定量研究过渡做出了诸多有益探索。需要注意的是,由于多元分析方法大多是建立在数据的正态假设的基础上,如果偏离正态假设,结果就可能产生畸变。5.2基于多元共通性的系统论基础数据挖掘方法可以大致分为“监督学习”(supervisedlearning)和“无监督学习”(unsupervisedlearning)两种。监督学习需要先确定一个目标属性或因变量,然后通过监督学习技术筛分数据,尽量找出其他属性和目标属性之间的规律和关系。如:多元线性回归分析、togistic回归分析、判别分析、粗糙集理论、决策树、人工神经网络、贝叶斯网络、支持向量机、双层频权剪叉算法等。无监督学习技术用于缺少目标属性的分析情况,该算法在不依赖任何预设目标的前提下发掘数据的关联和聚类,包括聚类分析、主成分分析、因子分析、关联规则、信息熵、结构方程模型、最优尺度分析等。吴秀艳等认为,当前证候研究中,监督学习在数据分析前存在先验因素,无监督学习在对结果诠释阶段介入人为因素。可见,如果将“监督学习”和“无监督学习”两种方法联合应用,不仅使专家经验可能带来的主观偏见达到最小化,也避免了只进行样本学习带来的有效信息丢失和大量盲目搜索与计算。如可以用聚类分析和关联规则等“无监督学习”的方法做探索性分析,并求助于“监督学习”的方法如贝叶斯网络法、支持向量机方法等求得结果。5.3粗集与svm方法的结合在众多易变的、多层次、多时空的高度非线性关系的症状、体征中,如何把握好证候的内核与外延,常需将高维数据投影到低维空间来进行描述和统计处理,以便进行综合评价、转换和利用。降维技术是目前处理高维数据的主要方法之一。常见的降维方法有:多因素分析统计方法(聚类分析、主成分分析、因子分析、典型相关分析、多维尺度分析等)。在一定情况下,证候诊断数据过少而难以判别证候属性的事例中,亦可进行“升维”处理,如新兴的SVM方法就是将数据投射在高维空间而获得规律性认识。上述各种数据挖掘方法都有自身的优势,如决策树的优点是简明直观、易于理解,决策制定的过程是可见的,主要用于分类和归纳挖掘;粗糙集常用于处理含糊性和不确定性的问题,运用粗糙集进行数据预处理可以提高知识发现的效率;人工神经网络能够对复杂问题进行精确的预测;贝叶斯网络具有丰富的概率表达能力和综合先验知识的增量学习特性,面对大规模数据时能显示出它独特的优势;结构方程模型是分析隐变量的有力工具,能够分析隐变量间,以及隐变量与显变量之间可能存在的因果关系;支持向量机分类的准确率一般要高于人工神经网络,适用于复杂的、不确定性的、非线性的数据。当然,各种数据挖掘方法也存在一定的局限性,依据其不同的特点和适用条件,联合运用,能够提高研究结果的论证强度。如中医症状之间存在着强相关性,强相关的变量同时进入分析,很容易造成聚类结果的区分度不强或者意义不大,针对这种多重共线性问题,可以对变量先进行主成分分析,提取主成分后,再进行聚类分析,这样就能保证结果的相对可靠。总之,利用多种监督学习与无监督学习、降维与升维的多元统计分析方法,可以解决诸如证候构成判断、证候演变规律、证候整体特征、临界证候状态,以及证候与疾病、证候与症状、证候与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临床科室成本核算与绩效联动机制
- 临床数据在医疗成本控制中的应用
- 临床技能考核体系与资源配置的协同优化
- 临床技能混合现实培训:虚实结合与效果评估
- 临床技能培训课程优化设计
- 临床技能培训的伦理规范国际接轨
- 临床技能培训基地教学反馈的标准化流程
- 临床技能培训中腹腔镜临床技能的精细化训练体系
- 临床技能培训中的穿刺操作可视化教学
- 临床技能培训中的医学生临床思维能力训练
- 汽车底盘资料课件
- 2025年大学《核工程与核技术-核电厂系统与运行》考试备考题库及答案解析
- 顶管施工技术培训
- 膀胱切除术后状态的护理
- 2025年国家开放大学(电大)《法学导论》期末考试复习题库及答案解析
- XJJ 088-2018(2019年版) 建设工程监理工作规程
- 《JJG 1081.2-2024铁路机车车辆轮径量具检定规程第2部分:轮径测量器》 解读
- YY/T 1488-2025中医器械舌象信息采集设备
- 2025-2030中国食品保鲜技术市场现状与创新趋势预测报告
- 2024人教版八年级生物上册全册教案
- 2025秋期版国开电大本科《心理学》一平台形成性考核练习1至6在线形考试题及答案
评论
0/150
提交评论