会员注册 | 登录 | 微信快捷登录 支付宝快捷登录 QQ登录 微博登录 | 帮助中心 人人文库renrendoc.com美如初恋!
站内搜索 百度文库

热门搜索: 直缝焊接机 矿井提升机 循环球式转向器图纸 机器人手爪发展史 管道机器人dwg 动平衡试验台设计

   首页 人人文库网 > 资源分类 > PDF文档下载

中医科研中几种常用数据挖掘方法浅析.pdf

  • 资源星级:
  • 资源大小:209.65KB   全文页数:5页
  • 资源格式: PDF        下载权限:注册会员/VIP会员
您还没有登陆,请先登录。登陆后即可下载此文档。
  合作网站登录: 微信快捷登录 支付宝快捷登录   QQ登录   微博登录
友情提示
2:本站资源不支持迅雷下载,请使用浏览器直接下载(不支持QQ浏览器)
3:本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

中医科研中几种常用数据挖掘方法浅析.pdf

思路与方法中医科研中几种常用数据挖掘方法浅析李志更1,王天芳2,任婕2,杜彩凤21.中国中医科学院中医基础理论研究所,北京1007002.北京中医药大学中医诊断系,北京100029摘要本文主要是对中医药科研中几种常用的数据挖掘方法进行了归纳和分析,在中医的科研中,无论是临床、实验和文献的研究中都可能遇到需要进行数据分析的情况,初级的分析方法已很难再适应科学发展的需要,掌握好数据挖掘的思路和方法,对中医科研的进步应该是大有裨益。关键词中医科研数据挖掘中图分类号R203文献标识码A文章编号10022392200802002903收稿日期20071205修回日期20080310作者简介李志更1979,男,汉族,河北唐山人,医学博士,现主要从事于中医基础理论及其交叉学科的研究。中医药的研究中常常运用一些数理统计方法来对科研结果进行探讨以使数据分析的结果更具客观性。多元的统计分析方法主要用来探讨高维数据的内在规律,如研究多元变量间的相互关系、数据结构和数据简化等。这些方法在实际运用中各有自已的特色和适用条件,不同研究目的和不同变量类型往往需要不同的方法,只有正确地运用这些先进的方法,才能得到准确的结果。在一定程度上这种学科的交叉已对中医学的发展起了相当的推动和促进作用,现将一些数理统计方法在中医药中的运用进行浅析。1聚类分析聚类分析是一种探索性的统计分析方法,是在没有先验知识的情况下对数据资料进行分类,其实质就是按照资料的内在相似或相关程度将数据分为若干个类别,以使得类别内数据的差异尽可能小,类别间差异尽可能大。可分为层次聚类法和非层次聚类法。也可按分类目的分为R型聚类和Q型聚类。聚类分析可用于中医证候的研究,如刘明1等对八纲中的六纲症状及肾虚症状以及张世筠2等对肝证变量的聚类分析等。聚类分析还可用来探讨方剂中药物的组合规律及微量元素含量、中药指纹图谱等,如李国春3等对半夏泻心汤临床案例的用药规律等进行了聚类分析张巧艳4等对中药蛇床子中的微量元素进行了聚类分析。聚类分析作为一种无监督的探索性多元统计方法,可以对资料进行自然分类。但由于中医证候的复杂性,聚类分析在解决中医问题时开始显示出了其方法的局限性。首先,聚类的多结果性。变量究竟被聚为几类要取决于研究者的选择或决定,此分析方法无法根据数据内部特点自主地确定分为几类,研究者要依据其学科知识和经验来确定聚到哪一类为最佳,这就增添了很大的主观性多结果性还体现在选择不同的类间距离和变量间距离的定义方法,其结果就会大有不同,这就往往需要进行多次尝试,反复分析,才能找到最适合所研究数据的方法。其次,聚类的单分配问题。变量一旦被聚到某一类时,就不能再被聚到其它类。特别是在研究症状的聚类问题时,中医的一个症状可表现在不同的证候中,即一个症状要能被聚到不同的类中,但聚类分析只能将一个症状归入某一个类别里面。2主成分和因子分析主成分分析是考察多个变量间相关性的一种多元统计方法。它是研究如何通过少数几个主分量来解释多个变量间的内部结构。也就是说,从原始变量中导出少数几个主分量,使它们尽可能多地保留原始变量的信息,这些综合指标是原始指标的线性组合,彼此互不相关。主成分分析的应用目的可以被简单地归纳为数据的压缩、数据的解释。在实际应用中,主成分分析更多的只是一种达到目的的中间手段,可对数据浓缩后继续采用其他统计方法以解决实际问题。如卿彬菊5用化学计量学主成分分析法研究了新疆产6种红景天中无机元素含量之间的关系周漩6等以主成分922008年第36卷第2期Vol136,No12,2008中医药学报ActaChineseMedicineandPharmacology分析法对人参皂等在6种不同展开剂下的薄层色谱保留行为进行分析等。因子分析探索性因子分析在某种程度上可以被看成是主成分分析的推广和扩展,它对问题的研究更为深入,是将具有错综复杂关系的变量或样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,探讨多个能够直接测量,并且具有一定相关性的实测指标是如何受少数几个内在的独立因子所支配的,同时根据不同因子还可以对变量进行分类,属于多元分析中处理降维的一种统计方法。如江涛7等采用因子分析法对中风后遗症期中医证候进行非线性降维研究张晓杰8对古今185首治疗荨麻疹的方剂的因子分析聂莉芳9等对IgA肾病的中医证候分布进行的因子分析等。证实性因子分析多是指将结构方程模型用于验证某一因子模型是否与数据吻合时,多将其称为证实性因子分析。结构方程模型是一种建立、估计和检验因果关系模型的方法,模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量,这一新的数据分析系统已在社会科学等领域得到广泛的应用,并被称为近年来统计学三大发展之一。结构方程模型在中医中的研究也已兴起,如陈启光10等研究结构方程模型在中医证候规范标准研究中的应用李国春11等用结构方程模型探讨慢性萎缩性胃炎的证候分型规律。3判别分析判别分析是根据判别对象若干指标的观测结果判定其属于哪一类的统计学方法,其目的在于建立一种线性组合使得用最优化的模型来概括分类之间的差异,其用途是可以根椐已知的样本的分类情况来判断未知待判样本的归属问题等。判别分析的内容相当丰富,其方法体系几乎可以覆盖多元统计的所有内容。经典的判别分析方法有Fisher判别和Bayes判别。判别分析可用于证候的研究。如聂广12等采用逐步判别分析法等,根据判别函数及判别系数归纳出了各证型的主要症状、次要症状及辨证要求,最后得到重型肝炎的辨证标准。罗团连13等采用判别分析的方法,建立了中医肝脏五证的计量鉴别诊断表。判别分析在中药学的研究中应用也较多。陈和利14等建立了辛温解表药与温里药的判别模型张汉明15等应用逐步回归分析及Bayers判别分析法对来自全国不同产地的葛根及同属的其它植物进行了模式识别研究。判别分析还可用于舌脉的研究。如许秀森16为了深化血瘀证的定量诊断,对血瘀证舌质进行了判别分析。4logistic回归分析logistic回归属于概率型非线性回归,它是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法,在中医数据分析中运用较多。张启明17等采用非条件Logistic多元逐步回归对建立的历代医案数据库进行外感病因症状的筛选,并给出了各症状对诊断这些外感病因的贡献度和特异性。涂福音18等用之探讨慢性胃炎中医证型与胃黏膜活检病理变化之间的内在关系等。logistic多用于分析某类事件发生的概率与自变量之间的关系,适用于应变量为分类值的资料,并特别适用于应变量为二项分类的情形。建立回归方程后,要参考ρ值、β值和OR值,一般统计学认为,当β0时,OR1,说明因素X对疾病发生不起作用β0时,OR1,说明X是一个危险因子当β0.05.ConclusionDeepneedlingatFengchiGBcouldbeabetteradjustmentroleforthemigrainepatientswithcerebralvascularfunctionandchangesincerebralbloodflow.AuthorsaddressDepartmentofTCM,PLANo.211Hospital,Harbin150080,chinaKeywordspointGB20FengchimigrainedeepneedlingroutineneedlingcerebralbloodflowhaemorheologyOriginalarticleonpage68

注意事项

本文(中医科研中几种常用数据挖掘方法浅析.pdf)为本站会员(abingge)主动上传,人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知人人文库网([email protected]),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。

copyright@ 2015-2017 人人文库网网站版权所有
苏ICP备12009002号-5