中医科研中几种常用数据挖掘方法浅析.pdf中医科研中几种常用数据挖掘方法浅析.pdf

收藏 分享

资源预览需要最新版本的Flash Player支持。
您尚未安装或版本过低,建议您

思路与方法中医科研中几种常用数据挖掘方法浅析李志更1,王天芳2,任婕2,杜彩凤21中国中医科学院中医基础理论研究所,北京100700;2北京中医药大学中医诊断系,北京100029摘要本文主要是对中医药科研中几种常用的数据挖掘方法进行了归纳和分析,在中医的科研中,无论是临床、实验和文献的研究中都可能遇到需要进行数据分析的情况,初级的分析方法已很难再适应科学发展的需要,掌握好数据挖掘的思路和方法,对中医科研的进步应该是大有裨益。关键词中医科研;数据挖掘中图分类号R203文献标识码A文章编号10022392200802002903收稿日期20071205修回日期20080310作者简介李志更1979,男,汉族,河北唐山人,医学博士,现主要从事于中医基础理论及其交叉学科的研究。中医药的研究中常常运用一些数理统计方法来对科研结果进行探讨以使数据分析的结果更具客观性。多元的统计分析方法主要用来探讨高维数据的内在规律,如研究多元变量间的相互关系、数据结构和数据简化等。这些方法在实际运用中各有自已的特色和适用条件,不同研究目的和不同变量类型往往需要不同的方法,只有正确地运用这些先进的方法,才能得到准确的结果。在一定程度上这种学科的交叉已对中医学的发展起了相当的推动和促进作用,现将一些数理统计方法在中医药中的运用进行浅析。1聚类分析聚类分析是一种探索性的统计分析方法,是在没有先验知识的情况下对数据资料进行分类,其实质就是按照资料的内在相似或相关程度将数据分为若干个类别,以使得类别内数据的“差异”尽可能小,类别间“差异”尽可能大。可分为层次聚类法和非层次聚类法。也可按分类目的分为R型聚类和Q型聚类。聚类分析可用于中医证候的研究,如刘明1等对八纲中的六纲症状及肾虚症状以及张世筠2等对肝证变量的聚类分析等。聚类分析还可用来探讨方剂中药物的组合规律及微量元素含量、中药指纹图谱等,如李国春3等对半夏泻心汤临床案例的用药规律等进行了聚类分析;张巧艳4等对中药蛇床子中的微量元素进行了聚类分析。聚类分析作为一种“无监督”的探索性多元统计方法,可以对资料进行自然分类。但由于中医证候的复杂性,聚类分析在解决中医问题时开始显示出了其方法的局限性。首先,聚类的多结果性。变量究竟被聚为几类要取决于研究者的选择或决定,此分析方法无法根据数据内部特点自主地确定分为几类,研究者要依据其学科知识和经验来确定聚到哪一类为最佳,这就增添了很大的主观性;多结果性还体现在选择不同的类间距离和变量间距离的定义方法,其结果就会大有不同,这就往往需要进行多次尝试,反复分析,才能找到最适合所研究数据的方法。其次,聚类的单分配问题。变量一旦被聚到某一类时,就不能再被聚到其它类。特别是在研究症状的聚类问题时,中医的一个症状可表现在不同的证候中,即一个症状要能被聚到不同的类中,但聚类分析只能将一个症状归入某一个类别里面。2主成分和因子分析主成分分析是考察多个变量间相关性的一种多元统计方法。它是研究如何通过少数几个主分量来解释多个变量间的内部结构。也就是说,从原始变量中导出少数几个主分量,使它们尽可能多地保留原始变量的信息,这些综合指标是原始指标的线性组合,彼此互不相关。主成分分析的应用目的可以被简单地归纳为数据的压缩、数据的解释。在实际应用中,主成分分析更多的只是一种达到目的的中间手段,可对数据浓缩后继续采用其他统计方法以解决实际问题。如卿彬菊5用化学计量学主成分分析法研究了新疆产6种红景天中无机元素含量之间的关系;周漩6等以主成分922008年第36卷第2期VOL136,NO12,2008中医药学报ACTACHINESEMEDICINEANDPHARMACOLOGY分析法对人参皂等在6种不同展开剂下的薄层色谱保留行为进行分析等。因子分析探索性因子分析在某种程度上可以被看成是主成分分析的推广和扩展,它对问题的研究更为深入,是将具有错综复杂关系的变量或样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,探讨多个能够直接测量,并且具有一定相关性的实测指标是如何受少数几个内在的独立因子所支配的,同时根据不同因子还可以对变量进行分类,属于多元分析中处理降维的一种统计方法。如江涛7等采用因子分析法对中风后遗症期中医证候进行非线性降维研究;张晓杰8对古今185首治疗荨麻疹的方剂的因子分析;聂莉芳9等对IGA肾病的中医证候分布进行的因子分析等。证实性因子分析多是指将结构方程模型用于验证某一因子模型是否与数据吻合时,多将其称为证实性因子分析。结构方程模型是一种建立、估计和检验因果关系模型的方法,模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量,这一新的数据分析系统已在社会科学等领域得到广泛的应用,并被称为近年来统计学三大发展之一。结构方程模型在中医中的研究也已兴起,如陈启光10等研究结构方程模型在中医证候规范标准研究中的应用;李国春11等用结构方程模型探讨慢性萎缩性胃炎的证候分型规律。3判别分析判别分析是根据判别对象若干指标的观测结果判定其属于哪一类的统计学方法,其目的在于建立一种线性组合使得用最优化的模型来概括分类之间的差异,其用途是可以根椐已知的样本的分类情况来判断未知待判样本的归属问题等。判别分析的内容相当丰富,其方法体系几乎可以覆盖多元统计的所有内容。经典的判别分析方法有FISHER判别和BAYES判别。判别分析可用于证候的研究。如聂广12等采用逐步判别分析法等,根据判别函数及判别系数归纳出了各证型的主要症状、次要症状及辨证要求,最后得到重型肝炎的辨证标准。罗团连13等采用判别分析的方法,建立了中医肝脏五证的计量鉴别诊断表。判别分析在中药学的研究中应用也较多。陈和利14等建立了辛温解表药与温里药的判别模型;张汉明15等应用逐步回归分析及BAYERS判别分析法对来自全国不同产地的葛根及同属的其它植物进行了模式识别研究。判别分析还可用于舌脉的研究。如许秀森16为了深化血瘀证的定量诊断,对血瘀证舌质进行了判别分析。4LOGISTIC回归分析LOGISTIC回归属于概率型非线性回归,它是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法,在中医数据分析中运用较多。张启明17等采用非条件LOGISTIC多元逐步回归对建立的历代医案数据库进行外感病因症状的筛选,并给出了各症状对诊断这些外感病因的贡献度和特异性。涂福音18等用之探讨慢性胃炎中医证型与胃黏膜活检病理变化之间的内在关系等。LOGISTIC多用于分析某类事件发生的概率与自变量之间的关系,适用于应变量为分类值的资料,并特别适用于应变量为二项分类的情形。建立回归方程后,要参考Ρ值、Β值和OR值,一般统计学认为,当Β0时,OR1,说明因素X对疾病发生不起作用;Β0时,OR1,说明X是一个危险因子;当Β0时,OR1,说明X是一个保护因子。5神经网络神经网络最早由心理学家和神经生物学家提出,旨在寻求开发和测试神经的计算模拟。典型的神经网络模型主要分三大类以感知机、BP反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以HOPFIELD的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以ART模型、KOHONEN模型为代表的,用于聚类的自组织映射方法SOPM。陈伟青19认为中医学辨证施治过程,实质上是对一大堆数据信息作出处理,提取规律的过程。人工神经网络有较好获得数据规律的能力,应用于中医学具有可行性,其中BP网络是目前应用最广泛的神经网络之一。宋小莉20等采用人工神经网络,通过试验建立了半夏泻心汤及其类方中8味药物及药量与药效学指标胃粘液含量的非线性映射模型,该模型的建立可以实现8味药物药味与药量任意配伍组方的胃薪液数值的预测,从而实现了计算机模拟试验的目的。6贝叶斯网络贝叶斯网络是表示变量间概率关系的图模型,由网络结构和一组概率集合组成。结构模型是个有向无环图DAG,其中的节点表示待考察的指标或变量,有向边表示变量间的概率相关关系;概率集合则给出了每个变量以其父节点为条件时的条件概率。贝叶斯网络技术适合于解决中医定量诊断问题,它可以揭示众多症状间以及症状与证候间的复杂关系,从中发现证候的主要症状和次要症状,并定量确定其诊断价值,有03中医药学报ACTACHINESEMEDICINEANDPHARMACOLOGY2008年第36卷第2期VOL136,NO12,2008助于确定证候诊断的标准和规范。而且建立的证候诊断模型以概率形式给出诊断结果,能有效辅助专家做出决策。王学伟21等应用贝叶斯网络方法通过分析474例血瘀证临床诊断数据进行血瘀证定量诊断,发现了血瘀证的7个关键症状,并定量计算其诊断贡献度。王氏认为贝叶斯网络方法在中医定量诊断中具有良好的应用前景。郭蕾22等认为证候的高阶性表现为证候各因素之间相互关系的复杂性,运用贝叶斯网络技术对肺系疾病中证候构成因素之间关联形式进行研究,结果表明各因素之间的联结形式非常复杂,既有线性相关,又有非线性相关,它们相互交织,形成复杂的网络结构,表现出典型的非线性特征。7粗糙集理论粗糙集理论作为智能信息处理技术的一个新成果,是由波兰科学家ZPAWLAK教授提出来的对不完整数据进行分析、推理、学习、发现的新方法。它能有效地处理许多涉及不确定性的问题,主要包括不确定或不精确知识的表达,经验学习并从经验中获取知识,不一致信息的分析,根据不确定、不完整的知识进行推理,在保留信息的前提下进行约简、近似决策分类,识别并评估数据之间的依赖关系等。从它在许多领域成功应用的情况来看,粗糙集是一种优秀的机器学习方法,利用它来分析中医症状辨证要素间相关性,建立定性定量标准,有望获得成功23。将粗糙集理论引入到中医学中来,将为实现中医诊断智能化提供一种方法。王相东24认为粗糙集理论可在证候诊断中应用,从而抽取中医诊断的确定规则和可能规则。秦中广25等把粗糙集应用于中医类风湿证候诊断,并在类风湿病的各证候诊断上临床应用。谢国明26建立了一个基于粗集理论的中医诊断专家系统模型,模拟中医专家诊断的过程。随着粗集理论及技术不断完善,基于粗集理论的中医诊断系统的诊断准确性、可靠性将有望进一步提高。8信息熵理论熵在希腊语中原是“变化”的含义。它首先由德国科学家克劳修斯CLUSIUS引入到热力学中,以后又被用来描述信息,从而逐渐形成了信息熵的概念。1987年西广成教授提出了复杂系统分划的熵方法,从而促进了运用信息熵理论对复杂系统的研究。随着计算机技术的发展,熵方法对于挖掘医学研究中所得的大量数据间的有价值的信息越来越显示出了自身优势。熵方法可以挖掘方剂中药物之间的关联度,如杨洪军27等用熵定义两个随机变量之间的关联度,对中医方剂大辞典收载的治疗中风病方剂,分析了每两味中药之间的关联系数,定量描述它们之间的关联度。孙占全28等运用信息熵的方法,对中国古代中风病的中医文献进行证候与方剂相关性的定量分析,以用来确定证候与方剂之间的关联度。熵方法是一种无监督的数据处理途径,其优点在于可以用于非线性数据的分析以及克服了聚类分析的单分配问题等。中医学本身是一门自然科学与人文哲学相互渗透的综合学科,由于其自身的特殊性及其与现代科技体系的差异等因素,中医学的现代化和国际化进程并不顺利,中医药学的研究要实现客观化、标准化和数量化则必然离不开数理方法的运用。不同的数理方法可能有着不同的应用条件及适用范围,中医学要注意寻找符合自身特点的数理方法,以促进学科之间的交融,同时中医学也要注重运用数理方法来体现自已的特色。现代的数理方法为中医药的研究注入了新的生机和活力,并取得了一定的成绩,但也要看到困难和挑战,要始终以发展中医学和提高临床疗效为目标,促进人民的健康事业,并为构建和谐社会贡献力量。参考文献1刘明,王米渠六纲与肾虚症状聚类分析的方法及问题探索J现代中西医结合杂志,2005,1491117111912张世筠,沈明秀,王先春,等中医肝证的变量聚类分析J中国中西医结合杂志,2004,241757613李国春,史欣德半夏泻心汤临床案例用药量的聚类分析J中医药学刊,2005,23583683814张巧艳,秦路平,于雁灵,等不同地区蛇床子中微量元素聚类分析J中药材,2001,24424524715卿彬菊主成分分析法研究新疆产6种红景天中无机元素在其功效中的协同作用J微量元素与健康研究,2006,232182016周漩,冯毅凡,郭晓玲主成分分析法用于人参皂昔薄层色谱分离的研究J广东药学院学报,2003,1921011037江涛,刘金民,王玉来,等中风病后遗症期165例证候分型因子分析J湖南中医杂志,2004,206138张晓杰荨麻疹方药配伍规律探讨J山东中医杂志,2006,2531591619聂莉芳,于大君,余仁欢,等308例IGA肾病中医证候分布多中心前瞻性研究J北京中医药大学学报,2005,284666810陈启光,申春悌,张华强,等结构方程模型在中医证候规范标准研究中的应用J中国卫生统计,2005,2212411李国春,李春婷,黄蓝平,等结构方程模型探讨慢性萎缩性胃炎证候分型规律J南京中医药大学学报,2006,22421722012聂广,余绍勇,江福生,等重型肝炎中医辨证分型标准的初步研究J中国中西医结合急救杂志,2001,8317217613罗团连,陈国林,赵玉秋,等中医肝病五类证的计量鉴别诊断及其临床评估J中国现代医学杂志,1999,94293014陈和利,孙龙川,洪德臣,等辛温解表药、温里药的功效与15种132008年第36卷第2期VOL136,NO12,2008中医药学报ACTACHINESEMEDICINEANDPHARMACOLOGY生命元素含量相关性的研究J江西中医学院学报,1996,84262715张汉明,曾明,郑水庆,等中药葛根及同属植物的模式识别研究J中草药,2001,32325325416许秀森血瘀证舌质定量诊断研究J中国中医药科技,1994,11101417张启明,王永炎,张志斌,等外感病因中证候要素的提取J山东中医药大学学报,2005,29533934118涂福音,聂明,郑启忠,等慢性胃炎中医证型与胃黏膜活检病理变化的关系J中国中西医结合消化杂志,2004,12632332519陈伟青浅论人工神经网络在中医学上的应用J河南中医学院学报,2004,19113121320宋小莉,牛欣,司银楚基于BP神经网络的半夏泻心汤及其类方配伍模型研究J中华中医药杂志,2005,20638338421王学伟,瞿海斌,王阶一种基于数据挖掘的中医定量诊断方法J北京中医药大学学报,2005,2814722郭蕾,王学伟,王永炎,等论高维高阶与证候的复杂性J中华中医药杂志,2006,212767823晏峻峰,朱文锋粗糙集理论在中医证素辨证研究中的应用J中国中医基础医学杂志,2006,122909324王相东,殷鑫粗糙集理论与证候规范化研究J陕西中医学院学报,2005,282707125秦中广,毛宗源,邓兆智粗糙集在中医类风湿证候诊断中的应用J中国生物医学工程学报,2001,20435736326谢国明基于粗集理论的中医诊断模型的建立J数理医药学杂志,2005,18430230427杨洪军,赵亚丽,唐仕欢,等基于熵方法分析中风病方剂中药物之间的关联度J中国中医基础医学杂志,2005,11970670928孙占全,刘艳骄,西广成,等证候与方剂相关性的研究J中国中医基础医学杂志,2006,122150152浅议辨体养子具有中医特色的儿童保健系统管理殷瑛,王晓鸣指导浙江省中医院,浙江杭州310006摘要中医传统理论中,儿童体质辨识有四大学说,分别为“纯阳说”、“少阳说”、“稚阴稚阳说”、“脏腑说”。作为将在社区医院推广的儿童辨体施养保健系统管理方法,我们专门针对0~3岁儿童的体质特点,选择了便于应用的“脏腑说”,用“寒体、热体”两分法,对健康儿童保健工作进行指导,建立了以常规调护,辨体施养,穴位保健按摩等多种手段为核心的新型保健模式。关键词儿童保健;小儿体质;辨体养子中图分类号R272文献标识码A文章编号10022392200802003203收稿日期20071208修回日期20080302作者简介殷瑛1982,女,研究生在读,专攻儿童保健专业。华夏民族生命传承了数千年,薪火相传、生生不息。孩童作为生命传承中的重要一环,历来为各代医家所重视。中医作为千年的医疗文化积淀,在护养生命方面有着独到的见解。时代进步,现代社会对儿童保健的要求越来越高。于是,我们追根溯源,循流而上,在最传统的学说中寻找最适合中国儿童的保健方式。在这样的前提下提出了“辨体养子”这种具有中医特色的儿童保健系统管理理念,并在浙江省中医院下沙院区推广应用。在常规调护方案被普遍接受的今天,按照中医“治未病”理念对0~3岁儿童的体质进行分型,并根据不同的体质进行具有个性化的养育保健,成为了一种必然的趋势,实践证明,它也确实能更好地满足现代人对儿童保健的需求。1儿童体质学说111儿童体质“四说”翻开厚重的中医儿科古籍,对小儿体质的分型有很多不同的流派。其中有经典出处、占主导地位的有以下四种11111纯阳说在中国最早的儿科专著颅囟经中就有这样的记载“孩子三岁以下,呼为纯阳。”由此历代医家广为推崇的纯阳学说形成。在实际应用中,对何谓纯阳,有很多不同观点。有人认为纯阳是为纯阳无阴,如温病大家叶天士在幼科要略总论中提到“襁褓小儿,体属纯阳,所患热病最多。”也有人指出独阳不生、孤阴不长,纯阳应解释为阳盛阴微,属阳气充23中医药学报ACTACHINESEMEDICINEANDPHARMACOLOGY2008年第36卷第2期VOL136,NO12,2008ABSTRACTSFROMORIGINALARTICLESRESEARCHOFACADEMICTHOUGHTABOUTLIVERDISEASEOFZHANGXI2CHUNZHANGGUANGYE1,XINGJIXIA1,XINGJIHUA2ABSTRACTLIVERISONEOFANIMPORTANTENTRAILINHUMANBODY,WHICHBELONGSTOWOODOFFIVEELEMENTSANDCONTROLABREACTIONANDSTORINGBLOODZHANGXICHUNBELIEVESTHATLIVERISINCHARGEOFQIANDISTHEDEANOFGASIFICATIONALLOVERTHEBODY,THECONCORDANCEOFENTRAIL’SFUNCTIONISDEPENDONLIVER’SGASIFICATION,THEFUNCTIONTHATLIVERINCHARGEOFQIISPERFORMEDBYLIVER’SRISINGPNEUMAANDTHENDOABREAC2TION,LIVERCANACCOMMODATEQIOFINHERENTANDPOSTNATALBECAUSEOFITINCHARGEOFQI,LIVERDISEASENECESSARILYAFFECTSGASIFICATION,BUTTHEREAREDIFFERENTINASTHENIAANDSTHENIA,OBSTRUCTIONOFQIISLIVER’SHYPER2ACTIVITYDISEASE,DEFICIENCYOFQIISLIVER’SDEFICIENTDISEASETHETHERA2PEUTICPRINCIPLEOFLIVERDISEASEISDISPERSINGSTAGNATEDLIVERQI,MEAN2WHILEWESHOULDPAYATTENTIONTONOTINHIBITINGTHESTHENICLIVERENER2GY,NOTRASINGTOOMUCHANDNOTDRYNESSORVIOLENCEAUTHOR’SADDRESS1DEPARTMENTOFGASTROENTEROLOGY,RIZHAOHOSPITALOFTRADITONALCHINESEMEDICINE,RIZHAO276800;2DEPARTMENTOFDER2MATOLOGY,JUXIANPEOPLE’SHOSPITAL,JUXIAN276832KEYWORDSZHANGXICHUN;LIVERDISEASE;ACADEMICTHOUGHT;RE2SEARCHORIGINALARTICLEONPAGE3INVESTIGATIONOFEFFECTIVERECIPEBASEDPATHOMECHANISMEFFECTOFDIFFERENTRECIPESAGAINSTCHOLESTATICCIRRHOSISLONGAIHUA1,LIUPING2,LIFENGHUA1,MUYONGPING1,DUGUANGLI1,WANGLEI1ABSTRACTAIMSTOINVESTIGATEACTIONOFDIFFERENTRECIPESAGAINSTCHOLES2TATICCIRRHOSISINRATSANDVERIFYTHEPATHOMECHANISMOFTHISMODELBASINGONEFFECTIVERECIPE’SACTIONMETHODRATCHOLESTATICCIRRHOSISWASDU2PLICATEDBYLIGATIONOFBILEDUCT1WEEKAFTERMODELING,RATSWEREDIVID2EDINTOMODELCONTROLGROUPANDRECIPESTREATEDGROUPSRATSINRECIPESTREATEDGROUPSWEREGIVENXIAYUXUEDECOCTION,HUANGQIDECOCTIONANDYIGUANJIANDECOCTIONRESPECTIVELYFOR4WEEKS,ANDTHENRATSWERESACRI2FICEDFORDETERMINATIONOFLIVERFUNCTION,LIVERTISSUEHYPCONTENANDHISTOLOGICALCHANGESRESULTSCHOLESTATICCIRRHOSISWASSUCCESSFULLYDU2PLICATEDAFTER5WEEKSMODELINGCOMPAREDWITHTHATOFNORMALGROUP,SERUMGGTANDALPACTIVITY,SERUMTBILCONTENTANDLIVERTISSUEHYPCONTENTINMODELGROUPINCREASEDSIGNIFICANTLLYP005001VSSHAM,WHILESERUMTPANDALBCONTENDDECREASEDSIGNIFICANTLYCOM2PAREDWITHTHATOFMODELGROUP,DEGREEOFCIRRHOSISINHUANGQIDECOC2TIONGROUPANDYINCHENHAODECOCTIONGROUPALLEVIATEDSIGNIFICANTLY,SE2RUMALPANDGGTACTIVITY,SERUMTBILCONTENTANDLIVERTISSUEHYPCONTENTDECREASEDSIGNIFICANTLYP005001VSSHAMCONCLU2SIONHUANGQIDECOCTIONANDYINCHENHAODECOCTIONEFFECTIVELYINHIBITSPROGRESSOFCHOLESTATICCIRRHOSISINRATSAUTHOR’SADDRESS1INSTITUTEOFLIVERDISEASETOSHANGHAIUNIVERSITYOFTCM,SHANGHAI225006;2SHUGUANGHOSPITALAFFILIATEDTOSHANGHAIUNIVERSITYOFTCM,SHANGHAI201203KEYWORDSCHOLESTATICCIRRHOSIS;RECIPEBASEDPATHOMECHANISMORIGINALARTICLEONPAGE9INFLUENCEOFCOMPATIBILITYONPAEONIFLORININHUANGQINDECOCTIONCHENJIANZHEN,LVGUIYUAN,LUOXIAOMIN,YELEIABSTRACT
编号:201312191334495844    类型:共享资源    大小:209.65KB    格式:PDF    上传时间:2013-12-19
  
5
关 键 词:
管理 组织 经营
  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:中医科研中几种常用数据挖掘方法浅析.pdf
链接地址:http://www.renrendoc.com/p-245844.html

当前资源信息

4.0
 
(2人评价)
浏览:12次
abingge上传于2013-12-19

官方联系方式

客服手机:17625900360   
2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   

相关搜索

精品推荐

相关阅读

人人文库
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

网站客服QQ:2846424093    人人文库上传用户QQ群:460291265   

[email protected] 2016-2018  renrendoc.com 网站版权所有   南天在线技术支持

经营许可证编号:苏ICP备12009002号-5