ustb中医医案采集平台的智能化研究与应用(小论文)_g20128347_张晗_第1页
ustb中医医案采集平台的智能化研究与应用(小论文)_g20128347_张晗_第2页
ustb中医医案采集平台的智能化研究与应用(小论文)_g20128347_张晗_第3页
ustb中医医案采集平台的智能化研究与应用(小论文)_g20128347_张晗_第4页
ustb中医医案采集平台的智能化研究与应用(小论文)_g20128347_张晗_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中医医案采集平台的智能化研究与应用张晗,夏克俭北京科技大学 学院路30号 北京市 100083摘要:中医医案是我国医学的瑰宝,应重视并有效利用其中包含的精华和规律。将名老中医经验运用到现代中医医案临床采集中去,并不断使采集过程智能化、提高诊疗效率,已经成为当前中医医案采集方面需要迫切解决的问题。针对该问题,本文结合数据挖掘方法以及基于用户行为的界面自适应构成策略,建立智能化的中医医案采集的平台。首先,对全国最具代表性的108位名老中医临床经验进行知识挖掘,提供采集过程中的数据推荐;再根据用户行为预测算法,对医案采集界面进行自适应调整。关键词:中医医案采集,数据挖掘,用户行为分析,自适应界面Ab

2、stract: he medical cases of traditional Chinese medicine (TCM) are of great treasure that should not be ignored and discarded and we should pay much attention to and effectively use its essence and rules to donate to the development of modern TCM . Apply the rich experience of famous veteran doctors

3、 of TCM to the collection of modern traditional Chinese cases, continuously intelligentizing the collecting process and improving the treating level has become a crucial problem in modern TCM collection.To solve this problem,Combining with the data mining  method and the composition s

4、trategy of interface adaptive based on user behavior. Established Intelligent Information Collection of The platform of TCM. First of all, mining knowledge for  clinical experience of the most representative 108  doctor of traditional Chinese medicine ,&#

5、160;provide  recommend data for the process of collecting of clinical cases;   Adaptive adjustment of the medical record acquisition interface based on user behavior prediction algorithm.Key Words: Chinese medicine basis collection, data mining, user beha

6、vior analysis, adaptive interface1.引言名老中医的学术经验涵盖每位名老中医毕生的心血,其从师经历包括了对于中医前辈学术经验的传承和改进,衍化为中医几千年来的发展历程1。本文依托于国家“十二五”项目国家服务平台课题六,研究中医经验传承在计算机领域更深层次的应用,其中主要方向为中医医案临床采集的方法及其智能化。中医医案结构复杂、数据量庞大,且全国具有代表性的108位名老中医的学术经验、医学术语相互之间有一定差别,需利用数据挖掘的方法将数据进行预处理并结构化,再通过预处理所得数据结构,制定出适应现代中医临床采集的架构。如此所得的采集模型,即便已经很接近中医医生采集所

7、需,但皆为统一制定的模版,阻碍了中医临床采集的发展。采集模版中包含的属性数据,为全部名老中医医案数据库中所含属性的并集,使临床中医医案采集耗时较长、程序繁杂、效率下降2。当前中医医案临床采集的过程存在复杂及不完善的缺陷,实现对中医临床医案采集技术的优化就显得至关重要。基于此,本论文首先对全国最具代表性的108位名老中医临床经验进行规范化处理,得到符合采集所需的最优数据结构;其次,研究并利用有效的数据挖掘方法,对老中医临床经验进行分析,挖掘其中涵盖的知识,实现在今后中医医案采集过程中,数据的有效推荐及关联,作为中医医案智能化采集过程快速、准确的数据支撑;最后,在对采集内容数据挖掘推荐的基础上,通

8、过对医生长期的采集习惯进行跟踪分析,利用界面自适应构成方法,实现中医医案临床采集界面基于用户行为的智能化自适应。2.智能化中医医案采集框架结合研究需要以及中医数据特征,将中医医案的数据结构制定成符合中医采集,且适合智能化采集研究与实践的架构。首先,需要先对数据属性进行筛选合并,本论文中属性名称由整理后统一规定的中文名称表示,经整理的中医医案中涉及到实验所需属性的数据结构如下表2-1。表2-1 名老中医医案初诊数据结构属性列初诊就诊时间节气主诉既往史四诊信息辅助检查辨证分析中医诊断西医诊断治则治法处方用药针灸治疗推拿治疗其他治疗医嘱为适应中医医案采集在计算机中的应用,同时,为实现智能化提供结构支

9、撑,经过多次修改与研究,将中医医案采集数据结构制定成如下图2-1所示。图2-1中医医案智能化采集框架层次结构示意图为实现中医经验传承系统的智能化采集技术,将对中医医案采集进行两方面的智能优化:其一,是基于关联规则的智能化采集。即对名老中医的学术经验进行挖掘,将名老中医医案中的精华进行分析挖掘,并将有效的知识提取出来,在采集的时候进行基于经验及关联规则的推荐。在本论文中,主要对中医医案信息中症状(即主诉及四诊信息)、辩证分析、治则治法、处方用药进行主要的研究与挖掘,但为了保留医案的完整性,本论文中其他医案属性依旧保留。其二,基于用户行为的自适应交互设计。即对中医医生长期使用采集系统所留下的行为轨

10、迹进行分析,根据分析结果对医生下一次采集的界面做出相应调整,且该调整是顺应用户习惯的、符合采集规律的、提高采集效率的。另外,中医用户行为记录中医案信息部分,也会不断更新由名医经验挖掘得出的频繁项集及其置信度。3. 基于关联规则的智能化医案采集方法经过多年来的研究及分析,中医专家们发现,在中医医案中症状、辩证分析、治则治法、药方之间有较强的关联性,这种关联性及规律也是本论文,所需要运用在智能化采集上的中医医学知识支撑。3.1关联规则挖掘中医知识利用FP-tree增长算法,对中医医案中不同数据间的关联规则进行挖掘,医案格式为多维数据结构,基于本课题的任务,我们仅需挖掘两维关联规则,可化多维为单维关

11、联再进行处理,首先,需合并待挖掘关联规则,将其作为事务数据集来分析挖掘,那么,医案中的二维数据就变为一个事务3。FP增长算法如下:input:事务数据库D, min_support;output:全部的频繁项集。算法:1)new FP-tree;a)scanning D。录入频繁项集&&按其支持度降序排列成频繁项的数据表L。b) scanning D,new FP-tree.root= “null”。 Trans D,thenselect Trans order by L。设p为支持度计数最大元素,P为一个序列表,包含剩余的元素,那么,设为频繁项表。调用insert-tree(

12、p|P,T):if( T exist child C&& C.name=p. name) then C_support+;new C&&C_support = 1;Point To T,C. link to相同name的节点If P then递归地调用insert-tree(P,C)。2)调用FP-gorwth(FP_tree,null)挖掘FP-tree:Procedure FP-growth(FP_tree,)if(Tere exist P) then for(P中的路径)new _model,support=min(. support) ;else for

13、 each (i=Tree.leaf)new _modle=i, support=i .support;new &&(FP_tree,);if TreeThen trigger FP-growth(FP_tree,);通过该方法辩证分析、药物、治则治法、处方用药之间进行关联,并在采集过程中进行相关性推荐。如下表3-1所示,为症状与辩证分析之间的关联规则节选(min_sup=5,min_conf= 80%)。表3-1症状与辩证分析之间的关联规则 关联规则置信度胁痛而疲,胁腹胀痛,胸闷憋气=> 肝气郁结100%口苦而干,耳鸣 ,纳差,舌质红=> 肝经郁热80%面红面赤,

14、左肢无力,舌苔薄黄=> 肝阳上亢100%耳鸣,胸闷心悸,急躁易怒=> 肝阳上亢93%胁肋胀痛灼热,口苦泛恶,腹胀恶心=> 湿热内蕴90%某病患有四种症状体现胁肋胀痛灼热,口苦泛恶,腹胀恶心,四种症状可能由多重辩证因素引起,然而,四种症状同时出现,病因可确定为湿热内蕴证。由辩证分析我们可以清楚的得出其治则治法,其对应关系明晰且具有较强的关联性(最小支持度为5,最小置信度为80%),如下表3-2所示。表 3-2 辩证分析与治则治法之间的关联规则 关联规则置信度气滞血瘀证 => 理气化瘀,祛瘀通络80%肝阳上亢证=>平肝潜阳100%肝阳上亢证、肝肾亏虚证=>滋阴潜

15、阳,平肝熄风88%肝郁气滞证 => 疏肝理气,活血化瘀100%肾气不足证=>补益肾气90%湿热内蕴证,肝气郁结证 => 疏肝理气,清热利湿100%因此,通过病症和辩证分析,即可得相应治则治法。同理,如下表3-3所示,为辩证分析与药物之间的关联规则。表 3-3 辩证分析与药物之间的关联规则关联规则置信度肝气郁结 =>白芍、当归90%肝气郁结=> 厚朴、藿香、佩兰86%肝阳上亢 => 党参、麦冬、丹参、菊花、桑叶86%肝阳上亢 => 天麻、磁石100%气滞血瘀 =>柴胡、枳实、赤芍、甘草97%受中医数据特点及测试样本数据特点的限制,且数据处理无法达到

16、完美状态,可能会存在挖掘结果有一定的误差,虽然这不能表明关联规则的精确无误,但是置信度反映出中医知识关联规则是客观存在的,对现代中医诊疗临床采集是具有价值与意义的。3.2中医知识关联推荐中医专家们认为,从计算机置信度及中医领域进行分析、挖掘所得中医数据之间的关联规则,符合中医诊疗规律。医案采集过程中,我们将这种关联规则用于对采集数据的关联推荐中,假设有关联规则A,B,C,D,E,症状关联分析推荐示意图,如下图3-1所示。图 3-1 症状关联分析推荐示意图例医案采集分析过程选择采集了症状A、症状B、症状E,存在频繁项集A,B, C,D,F,H,B,E,C,D,F,H,I,J则采取频繁项集子集的交

17、集部分排在前,非交集排在后的原则,如下图3-2所示。图 3-2 症状关联分析推荐优先原则示意图由此,我们也可对症状及辩证分析进行测试举例分析,例如,医生在完成病症采集为:面红面赤、急躁易怒、舌质红、舌苔薄黄、脉弦有力,可关联其辩证分析为肝阳上亢,如下图3-3所示。图 3-3 症状与辩证分析关联推荐示意图若医生选择由系统关联推荐的辩证分析“肝阳上亢”,且连翘、菊花、桑叶、薄荷、天麻、磁石、肝阳上亢为一个频繁项集,则推荐连翘、菊花、桑叶、薄荷、天麻、磁石等药物提供选择,如下图3-4所示,为辩证分析与药物之间关联分析推荐示意图。 图 3-4 辩证分析与药物之间关联分析推荐示意图除取交集优先推荐外,还

18、可根据录入症状和选取的药物进行推荐及调整,例如,选择录入症状面红面赤、舌质红、舌苔薄黄,又选取了采集药物桑叶、薄荷,那么可根据频繁项集面红面赤、口干口苦、舌质红、舌苔薄黄=> 桑叶、薄荷、丹皮继续推荐药物丹皮,如下图3-5所示。图 3-5 症状与药物之间关联分析推荐示意图通过对名老中医医案进行关联规则挖掘分析,得到宝贵的中医临床经验,为现代医生临床诊疗及临床医案的采集提供了强大的数据支撑,上述症状、辩证分析、药物之间的关联规则推荐,可为今后临床医案采集提供较大的便利,对我国几千年来的名老中医经验的传承与延续有着深远的意义。4. 基于用户行为的自适应交互设计本论文中谈论到的用户行为,是指长

19、期进行中医医案临床诊疗工作的中医进行医案采集的行为习惯。本章通过研究用户行为轨迹,达到基于用户行为的系统界面自适应及内容个性化推荐。4.1.中医医案采集用户轨迹捕获将用户的行为轨迹记录以对象对的形式存储,可将用户的操作对象,操作动作、临时变量等关联起来,提高用户行为的预测效率5。预测用户行为的原理主要有两个步骤:对各个对象及操作进行监听,被执行操作时位置及时间,并统计对象被触发的次数;2)数据存储及处理,对监听到的记录进行统计及计算,存入数据库用于用户下一次使用时,按照独特的行为记录作个性化界面调整。在系统界面上嵌入行为追踪函数tractEvent(对象,动作,临时变量,相对位置,时间),每当

20、功能对象被触发后,后台将触发后的记录进行处理,为之后使用系统时的推荐作准备0。对功能对象的点击事件轨迹的监听方法为:Document.onClickEvent=clickEvent;/监听点击功能对象事件的轨迹Function clickEvent(clickevent)event= clickevent |window.clickevent;var clickLocation=clickPos(event);/获取对象被点击时绝对位置 ;预测算法的数据支撑为服务器端存储的用户行为记录日志,根据该数据在矩阵中确定在界面中所需的所有对象(预测算法的存储结构会有较大的存储空间占用,但在求用户行为最

21、佳路径的问题上具有较大的优势)5。如下图4-1所示,为处方信息采集的一般轨迹,在采集方药过程中,根据数据挖掘得出药物推荐集进行药物的选用,点击药物按钮;再对药物的用量、单位进行添加;确认无误,点击添加按钮;选择用药方法信息、制法、剂量、服药天数;最后,如有必要添加补充说明。图 4-1 处方信息-药物部分采集轨迹这是我们按照一般医生开方的过程,且假设采集完“当归”的信息后,不需要再采集其他药物模拟出的用户行为轨迹。对用户行为的分析包括了:功能对象被触发的方式、对象与功能之间的关系、功能与功能之间的关系、预示型操作。上图中,点击功能对象“当归”,按钮被激活;将对象数据“当归”传递给药物文本框,文本

22、框被激活;在药物文本框被触发之后,才可能填写用量(且必须要填写),因此药物文本框与用量文本框是有较强的关联性的,同理,用量文本框与单位文本框也是有较强关联性的;用户确定填写正确后点击添加按钮(其间用户也可能放弃之前错误的选择,重新选药、添加用量和单位等选项,这时用户行为轨迹也会发生变化),添加按钮被激活后处方信息列表中增加此药物,药物及用量集文本框被激活;若无需继续添加药物,按照偏好点击用药方法、制法、每日剂量、服药天数文本框之一,被点击的文本框依次被激活,且附带时间序列。系统可运用插件或者嵌入界面方式,运用tractEvent(对象,操作,临时变量,时间序列,纵坐标,横坐标)对上述用户行为轨

23、迹进行记录。如下所示,为图4-1的行为轨迹记录的形式:tractEvent(药物按钮,Onclick,当归,01,30,30 );tractEvent(药物文本框,Writing,当归,02,20,30);tractEvent(用量文本框,Onclick,writing,10,03,20,60);tractEvent(单位文本框,Onclick,Writing,g,04,20,80);tractEvent(添加按钮,Onclick,当归:10g,05,20,20,95);TriggerObject(药物文本栏,Create,Writing,当归:10g,06,100,35)tractEvent

24、(用法文本框,Onclick,Writing,口服,07,130,40);tractEvent(制法文本框,Onclick,Writing,水煎,08,130,90);tractEvent(剂量文本框,Onclick,Writing,10,09,140,40);tractEvent(天数文本框,Onclick,Writing,7,10,140,90);从用户行为记录中提取高频对象对,把各个对象联系起来。假设有n个对象,将它们看作一个n维特征向量A=A1,A2,A3,AnT来表示在界面上各个对象,用特征向量A构造矩阵。矩阵中的值aji为对象Ai在Aj激活后的点击激活率, Ai的活跃度ai通过计算

25、iaij可得,那么, a=jiaij为所有对象活跃度总值。根据上述矩阵A,可利用公式计算得其活跃度矩阵,将该矩阵表示为P,P中元素Pji由Pi =jP(Ai,Aj)计算,那么Pji就表示功能对象对的活跃度值6。首先,调用tractEvent()函数,构建A*初始化矩阵及活跃度矩阵P(P记录矩阵中各元素的被访频率),建立基于A的功能对象的对象对n2的集合Ai,Aj;然后,调用TriggerObject()函数,推荐最优的功能对象集,根据触发频率更新触发总数06。根据预测用户行为轨迹得到的对象对及对象激活率,可以为中医医案采集的界面智能化起到支撑作用,是智能化采集实现的前提和依据,因此,虽然预测用

26、户行为的算法在存储空间上的消耗较大,在本论文中,用来求最优路径时,该方法却是合适且简单有效的。4.2采集推荐集优化中医医生经采集后得到医案在存入数据库后,对症状、辩证分析、治则治法、药方进行FP树的构造,得出各属性数据集,将数据集的子集与已有的频繁项集进行对比,发现频繁项集的子集,对该频繁项集支持度统计增长。首先,当该医案完成采集后,假设存在频繁项集腰酸,腰困,全身乏力,舌质红,舌苔薄黄,细脉,虚火上炎证,肾虚证,那么,该频繁项集的支持度增长,置信度经关联规则算法计算后进行更新;若不存在该频繁项集,对该事务集的子集进行频繁项集的验证,同理,确定为频繁项集后该项集支持度增长,计算其置信度并更新。

27、然后,对于中医医案数据库中的频繁项集的确定,则采用相反的方法,当某位医生采集的医案信息中产生新的频繁项集,记录并计算其置信度;而对于验证已存在的频繁项集则不作任何记录或处理, 这样做是为了避免与前一步中对频繁项集支持度和置信度造成重复及错误更改。如下图4-2所示,为采集推荐集优化的分析及存储过程示意图。图 4-2 采集推荐集优化分析及存储过程示意图其中,针对医生个人频繁项集的存储与名老中医经验的频繁项集存储需分开,每位医生在长期进行采集后都可能产生新的频繁项集,但这类的频繁项集对于其他医生并不是全部有价值,且会对个性化的推荐集造成较大的影响,因此,并不能将这类频繁项集加入从老中医经验中提取的频

28、繁项集中。那么,在结合了现代中医个性化调整后,采集中最优项集应以什么方式确定呢?本论文为延续项目主题思想,实现名老中医经验的传承及智能化医生行为分析,在经过长期医案采集后,取名老中医频繁项集与医生常用频繁项集中置信度最高的频繁项集。设来自名老中医学术精华的频繁项集为X=x1,x2,x3,xn(n为X中元素数量),来自医生常用频繁项集为Y=y1,y2,y3,ym(m为Y中元素数量)。当出现两个频繁项集的置信度不相上下时,取X与Y的交集(XY)中的数据优先推荐,交集(XY)之外的数据序列较靠后。例如,在采集症状信息时,X=胸闷肋痛,口苦而干,舌质红,舌苔薄黄,脉弦有力;Y=两目干涩,胸闷肋痛,五心

29、烦热,舌质红,舌苔薄黄,急躁易怒;XY=舌质红,舌苔薄黄,胸闷肋痛,急躁易怒;(XY)=脉弦有力,五心烦热,口苦而干,两目干涩。在上述例子中采集症状面红面赤后,获得X,Y两个频繁项集,在推荐时则以急躁易怒,两目干涩,五心烦热的顺序排列(舌质红、舌苔薄黄、脉弦有力虽属症状信息,但本论文及本项目中,将主诉与四诊信息分开记录,因此舌诊,脉诊信息在四诊信息采集的时候进行推荐)。4.3中医医案采集的自适应界面对中医医案中的功能对象集在界面层次的上的关联做出划分,设集合A=Al,A2,Ax表示所有功能对象的集合,A=Ai,Aj,Ak(A A)是第i层横向界面上的功能对象集合。自适应对象空间可定义为S=A1

30、s,A2s,Axs。集合A中每个元素可作为其他元素的父类或者子类,则S中存储该对象的指针,指向它的继承或者父类。将中医医案采集框架划分为树形的层次结构,如下图4-3所示。图 4-3 中医医案采集自适应界面树形层次结构示意图由上图所示的界面层次中可见,主诉、四诊信息、辩证分析、治则治法、处方用药具有强关联性,且具有父子类关系;而处方用药、针灸治疗、推拿治疗、其他治疗可能存在一定的关联,但是关联性很弱,在采集的时候也并非需要全部完成,可根据习惯及需要进行选择性采集。利用中医界面中功能对象的活跃度及关联进行界面调整:辩证分析>处方用药if(辩证分析无强关联)then辩证分析进行界面布局else

31、 if (辩证分析与处方用药存在强关联)if (处方用药存在强关联)then处方用药父界面进行界面布局elsethen 处方用药进行界面布局elsethen 辩证分析进行界面布局结果:构建辩证界面,然后构建治法界面,构建处方用药界面。根据功能对象集合的分类,在某界面区域及其自区域内,功能对象将按照分类及功能对象之间的关联进行布局。在没有进行基于用户行为记录的界面自适应时,将采集界面的初诊信息分为如下几层,每一层包含该层必要功能对象集:1) 症状信息采集界面为了采集界面的友好及自适应界面的可行性,结合对名老中医医案的采集规律分析,将症状信息分为了两部分:主诉及四诊信息。主诉部分包含一个症状文本框

32、,主症标识复选框,程度、时长、时长单位下拉框,推荐症状按钮,添加按钮;四诊信息仅需包含望诊及切诊,且望诊信息仅需舌象即可。在望诊界面子区域包含舌体描述文本框,舌质描述文本框,信息推荐按钮;在切诊子区域包含脉象描述文本框,信息推荐按钮;最后,症状信息文本栏中,显示前期所添加全部症状信息文本。2) 辩证分析采集界面辩证分析部分包含一个辩证文本框,添加按钮,辩证分析推荐按钮;非必填部分病因、病位、病势、病性文本框;辩证分析文本栏。3) 治则治法采集界面治则治法部分包含一个治则治法文本框,添加按钮,治则治法推荐按钮;非必填部分包含中医诊断、西医诊断;治则治法文本栏。4) 处方用药采集界面在处方用药部分

33、,将药物信息分为了两类:药物及用药方法。药物部分包含一个药物文本框,用量下拉框,单位下拉框,推荐药物按钮,添加按钮,最后,处方信息文本栏中,显示前期所添加全部药物信息文本。在用药方法界面子区域包含用药方法下拉框,制药方法下拉框,每日剂量下拉框,服用天数下拉框。下列为症状信息界面布局实例,首先,根据界面分层,对症状信息进行采集。症状信息采集界面整体依据主诉与四诊信息所包含功能对象而划分为三个区域,再依据每个区域中所包含功能对象,继续划分子区域。如下图4-4所示,初始化症状信息采集界面,激活功能对象:症状文本框(用来记录病患口述病症),根据浏览器窗口,分配中心坐标(X1,Y1),获取文本框大小S1;主症标识复选框,针对当前录入的症状进行主症标识(在后续的辩证分析,处方用药中主症标识为频繁项集的核心),分配中心坐标(X2,Y2),获取文本框大小S2;程度、时长、时长单位下拉框,对当前录入症状信息的具体描述;推荐症状按钮。图 4-4 主诉信息集合及功能对象集合计算出主诉区域r1的信息量密度r1,再计算出r1初始化的活跃度1,当前主诉子区域的属性包含。5. 智能化中医医案采集实例分析症状信息初始化界面依据用户行为自适应调整后,如下图5-1所示。图 5-1 症状初始界面与其自适应界面对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论