(交通信息工程及控制专业论文)基于特征选择的量表条目筛选方法研究.pdf_第1页
(交通信息工程及控制专业论文)基于特征选择的量表条目筛选方法研究.pdf_第2页
(交通信息工程及控制专业论文)基于特征选择的量表条目筛选方法研究.pdf_第3页
(交通信息工程及控制专业论文)基于特征选择的量表条目筛选方法研究.pdf_第4页
(交通信息工程及控制专业论文)基于特征选择的量表条目筛选方法研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(交通信息工程及控制专业论文)基于特征选择的量表条目筛选方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要:中医一直被认为是一门经验学科,因此研究中医学的规范化是中医学向现 代化和科学化迈进的先决条件。近几年随着西医量表的发展和在临床上广泛应用, 一些学者己将测量学和计量学的有关知识、方法应用于中医学研究,量表成为中 医学规范化的重要手段之一。根据患者的证候和各项生命体征指标的信息,研制 中医证候量表是构建中医临床诊断量表测评体系的重要内容,进一步促进中医诊 断的标准化、科学化。 本论文基于国家重点基础研究发展计划( 9 7 3 ) 课题缺血性中风病证结合的 诊断标准与疗效评价体系研究,以编制中风病证候诊断要素测评量表为背景,利 用前瞻性大样本临床四诊信息调查研究所得数据,将特征选择方法引入到中医量 表的条目筛选中,提高所得量表临床诊断的客观性、准确性。 条目筛选是量表制作最为关键的环节,也是当前专家学者们研究的热点难点。 而特征选择是从输入特征集合中选择使某种评估标准最优的特征子集,从数学本 质上讲,特征选择要达到的目标跟条目筛选是一致的,都是从众多评价指标中挑 选出最有代表性的子集,因此,特征选择的方法实现条目筛选已得到初步的应用。 本文通过对特征选择算法的理解与回顾,对比分析传统条目筛选方法和基于特征 选择的条目筛选方法入手,主要从以下几个方面展开研究: ( 1 ) 分析课题背景,确定研究目标,提出本文要解决的主要问题。在对量表学 原理进行简要概述的基础上,重点研究了量表制作的关键环节条目筛选。同时, 对传统条目筛选方法进行对比研究,详细介绍了常用的因子分析法和逐步判别法, 并提出一种基于逐步判别的改进因子分析方法,给出了医学实验的仿真。 ( 2 ) 引入特征选择的方法。综述了特征选择的定义和主要研究方向,详细介绍 了特征选择的两大类别,即f i l t e r 过滤式和w r a p p e r 容器式,列举了一些常用的经 典算法,研究了f i l t e r 和w r a p p e r 组合式特征选择方法。 ( 3 ) 研究了特征选择在中风病证候诊断测评量表条目筛选中的具体应用,并用 m a t l a b 7 1 实现了仿真。首先,成功地完成了数据的提取,为后续的研究提供了保 障。然后,通过对相似性度量法的研究,类比并仿真了常见的四种距离,从与专 家经验重合度和分类准确率上选择性能良好的j a c c a r d 距离进行条目筛选。其次, 应用粒子群优化算法学习并确定条目的权重,选择k 近邻法为其评价函数。实验 结果分析表明,从特征子集大小,分类准确率等多角度考察,该方法进行条目筛 选比传统的方法具有良好的性能。 关键词:条目筛选;量表;特征选择;相似性度量;粒子群算法 分类号lt p 3 1 1 1 3 ;r 2 5 5 2 a b s t r a c t a b s t r a c t :g e n e r a l l y , t r a d i t i o n a lc h i n e s em e d i c i n e ( t c m ) h a sb e e nc o n s i d e r e d 勰 a l le x p e r i e n c ed i s c i p l i n e s ,t h e r e f o r et h er e s e a r c ho fs t a n d a r d i z a t i o nf o rt c mi sa p r e c o n d i t i o nt h a tf o r w a r d st os c i e n t i f i ca n dm o d e r n i z a t i o n i nr e c e n ty e a r s ,w i t ht h e d e v e l o p m e n to fw e s t e r nm e d i c i n es c a l e ,s o m es c h o l a r s h a v eu s e dt h er e l e v a n t k n o w l e d g ea n dm e t h o d so fs u r v e y i n ga n dm e t r o l o g y 试t c mr e s e a r c h ,w h i c hh a sb e e n u s e de x t e n s i v e l yi nt h ei n t e r n a t i o n a lc o m m u n i t y s c a l eb e c o m e so n eo ft h ei m p o r t a n t m e a n st h a ta c c e l e r a t et h es t a n d a r d i z a t i o no ft c m a c c o r d i n gt ot h ei n f o r m a t i o no ft h e s y n d r o m ea n dv i t a ls i g n si np a t i e n t s , t h er e s e a r c ho ft c ms y n d r o m es c a l ec o n s t r u c t i o n i sa ni m p o r t a n tp a r to f t c mc l i n i c a ld i a g n o s t i cs c a l ee v a l u a t i o ns y s t e m ,f u r t h e r m o r e , i tw i l lh a s t e nt h es t a n d a r d i z a t i o na n ds c i e n t i f i co f t c md i a g n o s i s n i st h e s i si sb a s e do nt h en a t i o n a lk e yf u n d a m e n t a lr e s e a r c h e sd e v e l o p m e n tp l a n p r o j e c t ( 9 7 3p r o j e c t ,) t h es t u d yo nt h ee v a l u a t i o nc r i t e r i ao ft h ed i a g n o s i sa n d t h e r a p e u t i ce f f e c t sw i t ht h ei n t e g r a t i o no fd i s e a s ea n ds y n d r o m eo fi s c h e m i cs t r o k e b yu s i n gt h el a r g es a m p l eo ff o r w a r d l o o k i n gi n f o r m a t i o nc o n s u l t a t i o ns u r v e ya n d r e s e a r c hd a t a , f e a t u r es e l e c t i o nm e t h o di si n t r o d u c e di n t ot h es e l e c t i o no fs c a l ei t e r n si n t h i sp a p e r , w h i c ht or a i s et h eo b j e c t i v i t ya n da c c u r a c yo fs c a l ec l i n i c a ld i a g n o s i s ,n l es e l e c t i o no fs c a l ei t e m si sn o to n l yt h em o s tc r u c i a ls t e p sf o rt h es c a l e p r o d u c t i o n ,b u ta l s oar e s e a r c h i n gh o tt o p i ci nt h ec u r r e n t f e a t u r es e l e c t i o ni sd e f i n e d t h a tf r o mt h ei n p u tc h a r a c t e r i s t i c so fas e to fe v a l u a t i o nc r i t e r i at os e l e c tt h eo p t i m a l s u b s e to ft h ef e a t u r e s f r o mt h em a t h e m a t i c a le s s e n c e ,t h eg o a lo ft h ef e a t u r es e l e c t i o n i sc o n s i s t e n tw i t ht h es e l e c t i o no fs c a l ei t e m s t h e r e f o r e ,f e a t u r es e l e c t i o nm e t h o dc a n b ea p p l i e dt ot h es e l e c t i o no fs c a l ei t e m s t h r o u g ha n a l y z i n ga n dr e c a l l i n gf o rt h e f e a t u r es e l e c t i o na l g o r i t h m ,t h es e l e c t i o no fs c a l ei t e m sb a s e do nt r a d i t i o n a la n df e a t u r e s e l e c t i o na r ec o m p a r e d t h em a i nr e s e a r c hi nt h i sp a p e ri sa sf o l l o w s : ( 1 ) a f t e ra n a l y z i n gt h eb a c k g r o u n do ft h ep r o j e c t ,t h et a r g e t so ft h es t u d yi s d e t e r m i n e da n dt h em a j o rp r o b l e m sa r ep u tf o r w a r d b a s e do nab r i e fo v e r v i e wo nt h e s c a l ep r i n c i p l e ,t h ea p p l i c a t i o no ft h es c a l ei nt c ma tp r e s e n ta n dt h ef a c e dp r o b l e m s a r ei n t r o d u c e d ,e s p e c i a l l yf o rt h es e l e c t i o no fs c a l ei t e m s ,w h i c hi st h em o s tc r u c i a lp a r t i nt h ee s t a b l i s h i n go fs c a l e a tt h es a m et i m e ,t h et r a d i t i o n a lm e t h o d so fs e l e c t i o no f s c a l ei t e m sa r es t u d i e da n dc o m p a r e d ,a n dt h em e t h o do ff a c t o ra n a l y s i sa n ds t e p w i s e d i s c r i m i n a t i o na n a l y s i sa r ed e s c r i b e di nd e t a i l am e t h o dn a m e di r e p r o v e df a c t o r a n a l y s i sb a s e do nt h es t e p w i s ed i s c r i m i n a t i o na n a l y s i si sp r o p o s e dh e r e ,w h i c hi sp r o v e d b yt h em e d i c a le x p e r i m e n t ss i m u l a t i o nf i n a l l y ( 2 ) t h ef e a t u r es e l e c t i o nm e t h o d sa r ei n t r o d u c e d a f t e rs u m m a r i z i n gt h ed e f i n i t i o n , t h eh i s t o r y , t h ec u r r e n ts i t u a t i o n , t h em a i nc o u r s ea n dt h ed i r e c t i o no ft h em e t h o do f f e a t u r es e l e c t i o n , t w ot y p e so ff e a t u r es e l e c t i o na l g o r i t h ma r ei n t r o d u c e di nd e t m l s , w h i c hi sc a l l e da sf i l t e ra n dw r a p p e r an u m b e ro fc l a s s i cm e t h o d sa r ea l s oc i t e dh e r e t h e r e f o r e ,an e wf e a t u r es d e c f i o na l g o r i t h mc o m b i n i n gt h ef i l t e ra n dw r a p p e r t w o - p h a s e si sp r o p o s e d ( 3 ) i nt h i sp a p e r , t h em e t h o do ff e a t u r es e l e c t i o ni su s e di nt h es e l e c t i o no f a p o p l e x ys y n d r o m ed i a g n o s i se v a l u a t i o ns c a l ei t e m s e m u l a t i o ni sp r e s e n t e db y m a t l a b7 1s o f t w a r e f i r s to fa l l ,t h ed a t ae x t r a c t i o ni sc o m p l e t e ds u c c e s s f u l l y , w h i c h i sag u a r a n t e ef o rt h ef o l l o w i n gs t u d y s e c o n d l y , t h r o u g hs t u d y i n gt h es i m i l a r i t y m e a s u r e ,f o u rc o m m o nd i s t a n c e sa r ec o m p a r e dh e r e ,a n dw ec h o o s et h eb e s td i s t a n c e f r o mt h ee x p e r t i s eo fc o i n c i d e n c ea n dc l a s s i f i c a t i o n a c c u r a c yr a t e t h i r d l y , t h e a p p l i c a t i o no fp a r t i c l es w a r mo p t i m i z a t i o n ( p s o ) a l g o r i t h mi si n t r o d u c e dt od e t e r m i n e t h ew e i g h to fs c a l ei t e m s ;k - n e a r e s tn e i g h b o rm e t h o di sc h o s e na st h ee v a l u a t i o n f u n c t i o n f i n a l l y , e x p e r i m e n t so n3 0 7r e l a t i v e l yh i g h - d i m e n s i o n a ld a t a s e t ss h o wt h a tt h e a l g o r i t h mh a sm o r ec o m p r e h e n s i v ep e r f o r m a n c et h a nt h et r a d i t i o n a lm e t h o d sw i t h r e s p e c t st oa c c u r a c y , s i z eo f f e a t u r es u b s e t s k e y w o r d s :s e l e c t i o no fs c a l ei t e m s ;s c a l e ;f e a t u r es e l e c t i o n :s i m i l a r i t ym e a s u r e : p a r t i c l es w a r mo p t i m i z a t i o n c l a s s n o ;t p 3 1 1 1 3 :r 2 5 5 2 v 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:洳莎 导师签名: 彳 签字日期:沙3 年占月l ;日 签字日期:p 扩年月f 3 日 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名: 幻荡 签字日期:咖占年月j ;日 致谢 在本论文即将完成之际,谨向我的导师侯忠生教授表示最诚挚的感谢! 本文 的研究工作正是在他的直接指导和帮助下完成的。在我攻读北京交通大学硕士的 两年中,侯老师给我提供了良好的研究和学习环境,并赋予我很高的期望,另外 侯老师严谨的治学态度和勤奋的工作精神永远值得我敬仰和学习。 同时要衷心感谢张严心副教授给我的指导和帮助,从选题、开题以及论文的 定稿审阅,张老师付出了大量的心血和辛勤的劳动,并以敏锐的科研洞察力指引 着我探索科学的方向。 也要感谢师兄王振华博士,和我一起讨论课题的相关问题,给我很多的启示 和建议。感谢课题组北京中医药大学的高颖教授、刘强博士研究生、钟海珍博士 研究生等,给予我课题上的诸多帮助,弥补我中医知识的严重不足。 也要感谢同实验室和我一起学习的师兄弟和我的各位同学、朋友给予我课题 上的许多建议和帮助,并陪伴了我走过两年的学习生活。 最后要感谢我的父母和家人,在学习和生活上给予我无私的支持,使我在科 研的道路上无所羁绊;并不断给我以激励与鼓舞,使我拥有迎接和战胜一切困难 的勇气和决心。 1 引言 证候研究是近几年来中医研究的热点和难点,科学的阐释证候是中医临床和 科研的需要,也是中医被世界承认的基础条件之一。近年来关于证候的研究颇多, 其中方法学研究是学者们探讨证候的一个重要切入点。从研究结果上看,现有的 通用量表在中医科研中的应用对于中医证候研究和中医疗效评价起着积极的作 用。因此,以中医临床信息数据库为基础,应用现代科学技术对中医药理论和实 践进行科学阐释和解析,特别是进行信息化、数字化和知识化的中医量表研制, 提取临床诊断内在的规则形成知识体系,是促进中医国际化和现代化进程的重要 内容。 1 1 论文背景 规范化是科学的特征之一,是一个学科走向成熟的标志,中医学的规范化是 中医学向现代化和科学化迈进的先决条件。中医证候规范化的目的是实现中医证 候诊断的规范化,使中医的科研、医疗、教学都有一个“统一的标准、“统一 的根据”。从上个世纪5 0 年代,中医学家秦伯未、朱颜、任应秋等倡导辨证论治, 使“证候从中医病症中分化出来,成为一个独立的概念,并逐渐成为研究热点。 证候的规范化研究主要包括证候概念、证候分类及命名、证候诊断标准、证候的 量化研究等几个方面n l 。 在证候的量化诊断研究方面,学者们不只从医学的角度出发,还结合了方法 学的探讨,应用信息学、数学等理论进行多学科交叉研究。1 9 9 4 年国家科委攻关 项目8 5 9 1 9 0 2 0 1 专题组、国家中医药管理局脑病急症科研组共同起草并试用的 中风病辨证诊断标准将中风病证候分为风证、火热证、痰证、血瘀症、气虚 证、阴虚阳亢证6 个基本证候,选择对于证候诊断特异性、敏感性高的症状、体 征,并根据其对症后诊断的权重大小赋以不同分值,每个证以大于7 分为证候诊 断成立,7 1 4 分为轻度、1 5 - 2 2 分为中度、大于或等于2 3 分为重度,最高为3 0 分。 这是中医证候诊断量化研究的初步尝试。王学伟等应用贝叶斯网络方法,通过分 析4 7 4 例血瘀证临床诊断数据进行血瘀证定量诊断,结果该方法发现了血瘀证的7 个关键症状,并定量计算其诊断贡献度1 2 】。陈明等阐述了中医已有诊断标准的问题 及不足,提出了中医证候诊断方程的表达形式,简介关联规则的基本概念和a p r i o r i 算法,并举例说明了关联规则在中医疾病证候诊断中的应用【3 】。徐蕾等采用 b o o t s t r a p 方法对4 0 6 例样本进行扩增以满足数据挖掘对样本量的要求,采用信息 熵的决策树c 4 5 算法,从8 8 项指标中筛选出对中医辨证分型有意义的2 6 个因素, 并对其重要性进行排序,产生清楚易懂可用于分类的决策规则,建立了辨证模型( 4 i 。 综上所述,近些年学者和专家们在中医证候量化诊断方面做了不少有益的尝 试,在思路和方法上进行了新的探索,关于中医证候诊断标准的相关课题研究已 经取得了一定的成果,但在临床应用中也出现了一些问题,因此中医证候诊断标 准尚待进一步的完善和统一。 另外近几年随着心理测量学的发展,一些学者已将心理测量学和计量学的有 关知识和方法应用于中医药研究,量表的使用正逐步得到中医研究者的重视。而 且在西医学上,应用国际测量学及量表学原理编制的各种医学量表应用十分广泛。 使用量表进行证候诊断,具有客观、简便、规范的优点。目前在中医学领域,根 据患者的证候和各项生命体征指标的信息,研制中医证候量表是中医药临床诊断 和疗效合理评价重要手段之一,是构建中医临床诊断量表测评体系的重要内容, 是中医药现代化的重要组成部分。 本论文以中医中风病为背景,利用前瞻性大样本临床四诊信息调查研究所得 数据,采用量表学原理,从数学角度出发,建立中风病证候要素测评量表,以期 为科学规范地建立中风病辨证诊断标准提供一套完整的方法,提高诊断标准的客 观性、准确性,推进我国中医事业的规范化发展。 1 2 研究目标 “辨证论治是中医学理论体系中最具特色的学术精髓,因此对证候及其诊 断的研究非常重要【l 】,量表测评作为行之有效的临床诊断评价方法已经广泛被人们 接受和应用。在中风病的西医评估量表方面,由1 9 9 5 年中华医学会第四届全国脑 血管病学术会议通过的各类脑血管疾病诊断要点采用了美国国立卫生院卒中 量表( a pn n - i s s ) ,n i h s s 是针对神经学状态量化的评估,主要是评估脑中风时神 经损伤的严重度i s 。西医的n i h s s 量表是国际公认的评判中风程度的标准之一。 而我国中医文化博大精深,证候学又是“辨证论治 的核心所在,其特有的概念 和文化精髓难以被其他国家的人理解并采用,那么量表法研究中医辨证是将我国 中医事业发扬光大的有效途径之一。虽然量表法已有实践的可行性,但目前国内 自行研制中医证候诊断量表尚处于探索阶段【6 】。本文以中医中风病的证候学诊断为 切入点开展证候测评量表的研究。 目前,中医中风病的证候诊断一般是根据医生对患者进行望、闻、问、切所 得的四诊信息,对照中风病证候诊断标准量化评分表中的各四诊项给予评分,得 出各个证候的分值进行判断的【7 8 】。量表的临床应用大大提高了医生的诊断准确率。 2 研制中风病证候诊断量表就必须遵循中医神经内科学自身的理论特点和临床 诊断规律,探讨一种切实可行的研究方法。“证”是对疾病过程中所处的一定阶段 的病位、病因病性以及病势等所作的病理概括。证候是指每个证所表现的具有内 在联系的症状、体征,即证候为证的外候。在中风病中主要有内风、内火、内湿、 痰、血瘀、气滞、气虚、阴虚、阳虚、阳亢十个证候,患者各项生命体征与证候 信息之间存在的表征关系,是值得我们探讨的有意义的问题。例如,患者的症状 神疲、乏力和口唇淡白可以表征气虚证,口唇紫暗和舌生瘀点可以表征血瘀证, 黄苔表征内火证,肢体麻木和头摇表征内风证等。 量表制作过程的最关键环节是量表的条目筛选,哪些条目对诊断更重要,哪 些条目可以忽略对量表的应用价值有着至关重要的意义。所以研究哪些是适用于 中风病证候测评量表的条目是本文的主要工作。 目前,在中医量表编制时条目筛选依然是以专家经验为主。虽然中医一直被 认为是一种经验医学,专家的经验在多数证候学研究中都被认为是金标准,但主 观性太强,说服力不够。所以,本论文完全从临床的数据角度出发,不含有任何 人为因素来探讨一套量表条目筛选方法,找到与中风病各证候关系密切的症状, 以期更能真实地反映临床实际,并对专家经验提供数据上的支持。 通过研究现有的量表制作中条目筛选方法,并将其应用到中风病临床采集的 数据中,分析比较其各方法的优缺点及其适用性。再从统计学的角度,对传统条 目筛选方法进行算法改进,并分析实验结果。 中风病相关的条目众多,影响因素纷繁复杂,再加上证候之间有交叉,单纯 从统计学方面来实现完整的条目筛选,总是不尽人意,很难达到专家期望的效果。 特征选择在机器学习和模式识别领域也担当与条目筛选同样的功能,在本质上二 者是一样的,本论文将机器学习的特征选择的思想应用到量表的条目筛选中。 特征选择有两大类方法,一种是f i l t e r 过滤式,一种是w r a p p o r 容器式,二者 各有利弊。本论文针对本身数据的特点,设计了一种基于f i l t e r 式和w r a p p e r 式组 合的特征选择方法,实现中医中风病证候要素测评量表的条目选择和相应的权重 估计。 1 3 论文结构安排 本章为本文的绪论部分,首先介绍了论文的背景,并通过对研究对象和研究 目标的分析,提出了拟采用的方法和本文的创新点。 在后面的各章中,将主要介绍以下内容: 3 第二章,将对现有的量表条目筛选方法及其改进算法进行研究分析。首先介 绍量表的定义和编制的一般步骤、量表在中医领域的发展现状,然后对传统各条 目筛选方法进行综述并对比分析,提出一种改进的因子分析法并进行仿真实验。 最后阐述应用特征选择方法进行条目筛选的可行性、有效性。 第三章,将详细介绍特征选择的基本知识。介绍特征选择的基本概念和思路, 国内外发展应用现状,以及高维数据的特征选择情况,详细阐述了典型的两种特 征选择模式的基本原理和实现过程,并以本文研究内容的目标出发,介绍了组合 模式的特征选择算法。 第四章,阐述针对本文研究目标提出的具体算法实现过程。提出待研究的中 医中风病诊疗数据的特点,具体介绍研究中所进行的数据预处理工作;针对特定 的研究目标和数据特点,应用相似性度量法进行条目的第一次过滤和筛选;介绍 粒子群算法的基本原理,将k 近邻算法作为其评价函数,学习训练第一次过滤得到 的条目的权重,最后权重较大的条目被保留下来:并将得到的条目筛选结果进行 总结、对比和分析。 第五章,将对本文所作的工作进行总结,并指出下一步研究要努力的方向。 本论文的创新之处在于( 1 ) 抛开专家经验等人为因素的干扰,完全从数据的角 度出发探讨研究量表的条目筛选方法,使所编制的证候诊断量表更客观、更全面、 更能体现临床实际;( 2 ) 将特征选择算法应用到量表的条目筛选中,突破了原有统 计学条目筛选的局限性;( 3 ) 针对中风病自身的病理特性、证候要素和临床数据的 特点,研究了一种基于f i l t e r 和w r a p p e r 的组合式特征选择算法,结合了f i l t e r 运 行速度快和w r a p p e r 学习准确率高的优点。在3 0 7 个高维数据上的仿真实验结果 表明,从特征子集大小,分类准确率等多角度考察,该方法均具有良好的性能。 4 2 传统量表条目筛选方法及改进研究 2 1 量表概述 2 1 1量表定义及编制的一般步骤 量表的英文是“$ q a l e ,表示了一个数量的概念。量表是用多个问题来测量一 个概念,因此也可以把量表看作是衡量某概念的综合指标。它的作用在于精确测 量一个较抽象的或综合性较强的概念。量表比单一指标或单个项目的测量能获得 更多、更真实、更精确的信息,因此量表在现代社会中被广泛应用嘲。量表设计就 是设计被访问者的主观特性的度量标准。量表制作的过程就是对某事物进行多因 素综合评价的过程,实质上就是一个科学研究与决策的过程,原则上应当包括设 计、收集资料、整理资料和分析资料等几个基本步骤,具体环节如下。 ( 1 ) 根据评价目的选择恰当的评价指标( e v a l u a t i o ni n d i c a t o r ) ,考查各指标 间的内在联系,选择那些主要的,能反映事物本质的评价指标,这 些指标应当明确、具体、可行、可靠; ( 2 )根据评价目的确定各评价指标在对某事物评价中的相对重要性,或 各评价指标的权重; ( 3 ) 合理确定各单个指标的评价等级( e v a l u a t i o ng r a d e ) 及其界限; ( 4 )根据评价目的、数据特征选择适当的综合评价办法,并根据已掌握 的历史资料建立综合评价模型( e v a l u a t i o nm o d e l ) ,计算综合指标; 确定综合指标的等级数量界限,在对同类事物综合评价的实践应用中,对选 用的评价模型进行考察,并不断修改补充,使之具有一定的科学性、实用性与先 进性,然后推广应用【l 们。 具体在医学领域进行量表的编制工作中,常用的方法步骤是:( 1 ) 明确研究目 的及测量的对象;( 2 ) 设立研究小组;( 3 ) 确定概念的可操作化定义及其构成;( 4 ) 撰 写条目,形成条目池:( 5 ) 筛选条目,形成初步的量表;( 6 ) 预实验,考核量表;( 7 ) 修改和完善量表。其中,在具体的制作过程中评价指标的恰当选择是特别注意的 环节。 2 1 2 量表在中医上的应用 目前,量表在中医临床、科研中的应用主要有以下几个方面:( 1 ) 采用国际或 国内通用量表对疾病一般心理状况或情绪状态进行评定,如汉密顿抑郁量表 j 壁塞銮逼态堂亟堂僮j 金塞佳统量盔釜旦蕴遣友选区煞鲨班塞 m a m d ) 对抑郁症的测定;( 2 ) 采用国际通用量表作为中医药疗效评定的依据,对一 些疾病治疗前后进行评定,如美国国立卫生院卒中量表( n m s s ) 荏神经科方面的应 用;( 3 ) 应用一些自评量表对患者进行心理评定,探索量表测定值与中医辨证分型 的关系,如健康状况调查问卷( s f - 3 6 ) 在中医领域的应用;( 4 ) 编写中医症、证的专 家调查问卷,如亚健康状态中医基本证候特征调查问卷;( 5 ) 根据某病或证的表现 特点,编写辨证量表,如中医肝脏象情绪量表的编制等【l 】。 2 1 3 研制中医量表存在的问题 从现在所制定的比较具有权威性的中医量表来看,都融合了证候规范化、证 候要素、降维升阶、量化诊断等多个现代研究角度,能够灵活的动态的反映病人 的真实病机,使中医研究实现了客观化、定量化,使病情诊断具有了可比性和可 重复性,简化了辩证过程,为临床及科研提供了便利,为加强国际交流创造了条 件。但是,毕竟我国研究中医量表还处于探索阶段,存在的问题值得注意: 1 ) 基本证候要素欠缺 由于证候是一个复杂系统,任何一种证候诊断标准都不能将证候概括无遗, 而只能包括主要证候和常见证候。例如随着对中风病临床和病机的深入研究, 一些新的证候已被逐渐认识。 2 ) 条目分数尚欠合理、条目内容有待商榷 中医中某些指标对证候诊断具有特异性,即“但见某症即某证”,例如爪甲青 紫对于中风病血瘀证具有特异性诊断意义,但临床出现频率低,对诊断的贡 献不大,临床可操作性较低。 3 ) 诊断量表和疗效评价量表混淆不清 诊断量表和疗效评价量表是中医领域应用最为广泛的两类量表,前者偏重于 获得患者的病情,辅助医生的诊断治疗,而后者偏重于对患者的发病之初到 治疗后病情前后交化进行对比评价。两类量表的用途不一样,编制时的出发 点也不一样。 4 ) 自行研制的中医量表难以在国际上通用 我国中医文化博大精深,同时是一门实践科学,专家经验被认为是金标准, 且中医本身有众多特有名词,如证候,因此包含有专家经验研制的量表难以 被其他国家的医生理解,在国际上应用不够广泛。 6 2 2 量表的条目筛选 量表条目筛选即将原始的条目池中的条目按各种不同的类别给以筛选。条目 筛选的原则是要注重所选条目的重要性、独立性、代表性、敏感性。由2 1 1 节可 知,量表条目筛选是量表制作过程的最关键环节,条目选择的好坏直接决定着所 制量表的成功与否。通常量表的条目筛选包括两个方面:评价指标的选择和评价 指标的权重估计。 2 2 1评价指标的选择 目前,在量表的条目测评和筛选中,往往先由专家或议题小组根据个人经验 和集体讨论得到量表的评价指标,形成条目池,然后关键的一步是对条目池中的 各条目做统计学测评,筛选较优条目构成初步量表。人们对条目池中的条目进行 分析,力图分清主次,抓住主要因子,剔除次要因子,一方面使得建立的评价模 型简单化,能就事件的主流或本质进行评价,另一方面条目少可以节省检测量, 使评价模型简单容易掌握,有利于提高模型的准确度与精度【l 。一个好的条目应 具有意义重要、敏感性高、独立性强、代表性好、确定性好的特点,并具有一定 的可检测性和可判断性。 现有的条目筛选方法甚多,常用的主要有以下几种: ( 1 ) 主观评价法; 主观评价法即全凭专家经验选择评价指标。通常,该领域的权威专家通过座 谈或填写调查表的方法获得专家评分,确定各因子的主次,再从中根据需要挑选 主要的因子作为最终的评价因子。此外,也可采用文献资料分析优选法,即全面 查阅有关指标设置的文献资料,通过分析各指标的优缺点加以取舍。在量表的编 制过程中,此法常常用来做统计学分析结果的对照与验证,有一定的必要性和参 考价值。 ( 2 ) 单因素分析法; 对所有的因子逐个进行单因素分析( 如标准差或变异系数) ,依据可能的评价结 果进行分组,并逐个进行单因子的假设检验,挑选那些在某一概率水准上显著的 因子作为评价因子。或将各因子与评价结果进行相关分析,挑选那些较密切相关 的因子作为评价因子。此法通常与其他方法结合使用。 ( 3 ) 相关分析法; 即所谓相关度分析。以诸因子作为自变量,以评价结果作为因变量进行多元 线性分析( 如相关系数、因子分析) ,可根据相关系数的绝对值大小挑选评价因子, 也可以逐个对相关系数进行假设检验,挑选那些相关系数在某一概率水准上显著 7 的影响因子作为评价因子。该法既考虑各因素的单独作用又考虑各因素间的相互 关系。 ( 4 ) 聚类分析法; 在存在众多指标的情况下,采用数据挖掘中的经典聚类算法,将指标中相近 的聚成类,在每类中找一个典型指标作为该类指标的代表,从而达到用少量几个 典型指标作为评价指标代替原来的众多指标来建立评价模型。是一种探索性分析 方法。 ( 5 ) 逐步回归法; 即应用多元逐步线性回归方法( 如l o g i s t i o 回归) 进行选择,在考虑对回归平方和 的贡献大小的基础上逐个选入与剔除自变量,在最终建立的回归方程中只包含对 因变量作用显著的自变量,可直接将保留的因子作为评价因子,也可对回归方程 中的系数的绝对值大小进行排序,挑选系数较大的因子作为评价因子。 ( 6 ) 逐步判别法; 从历史样本数据中挑选出能提供较多信息的因子来建立最优判别函数,然后 对进入判别模型的各因子根据其对判别贡献的大小进行逐步选择,即保留或剔除 瞄3 】 ( 7 ) 克朗巴赫系数法; 从内部一致性的角度对条目进行筛选。计算某一方面的克朗巴赫系数 ( c r o n b a o h 口) 。比较去除其中某一条目后系数的变化。如果某条目去掉后口系数 有较大上升。则说明该条目的存在有降低该方面的内部一致性的作用,应该去掉, 反之则保留。口系数的计算公式如下: 口= b i 卜 兰陆( x ,) i - i v a t ( 日) 叮 其中,q 表示条目数,为各个条目的得分,h = l - i 本文对以上各种方法的优缺点进行了总结归纳,列表如下: ( 2 - 1 ) 表2 i 现有量表条目筛选方法的比较 t a b l e2 1c o m p a r i s o no f m e t h o d s0 1 1s e l e c t i o no fb c a l ei t e m s 优点缺点 主观评价方法简单,多用于其它算法的 人为影响因素大,准确性不高 法 参考验证 单因素分直观简便,可测条目的敏感性缺乏对所有因子的综合考虑,忽略 析法 了指标间的相互作用 相关分析 评价效率高,可测评条目的代计算量大,区分度不高,不能处理 法表性和独立性非线性问题 聚类分析适合于指标众多的情况,可筛 不同的方法会有不同的结果;聚类 法 选出有代表性的指标完后需检验结果的意义;一般要采 取多方法尝试取其最优; 逐步回归自动挑选条目;应用范围广, 对数据的微小变动非常敏感;当因 法 需要对模型作线性假设 子具有高度多元共线性结构时,结 果很不稳定 逐步判别筛选到的条目间有较好的区 维数高时计算量大 法 分度 从表2 1 比较可以得出,根据研究对象的不同评价指标的多少,各种方法各有 优缺点。在实际工作中,为了保证入选条目的质量,往往根据研究目的综合使用 各种方法进行尝试,分别从不同的角度和目的筛选条目,在获得较为满意的专业 解释基础上,综合考虑选择评价指标。 2 2 2评价指标的权重估计 指标的选择是条目筛选的第一步,在利用挑选出来的评价指标建立评估模型 时,还应当考虑各条目对评价结果的影响大小,即各个评价指标在评价模型中的 权重问题【l 们。 目前用于确定指标的权重的方法很多,归纳起来有主观定权法和客观定权法 两类,前者主要包括专家评分法、成对比较法、s a a t y s 权重法等,后者主要包括 模糊定权法、秩和比法、熵权法、相关系数法等。 同时,在用一些统计方法进行分析时,可得到有关因素权重分配的信息,如 在多元回归分析及逐步判别分析中,各自变量的标准化回归系数或判别系数值即 可视为各指标权重分配的依据;计量资料判别分析中的指数、计量资料判别分析 9 中各因子的贡献率、主成分分析和因子分析中得到的因子载荷和贡献率等,都可 为确定指标权重提供必要、有用的信息;还可根据专业需要,自行设计权重计算 的公式。 不论哪一种方法,所定权重分配有相对合理的一面,又有局限的一面。这表 现为定权带有一定的主观性,而且用不同的方法确定的权重分配可能不尽一致, 这些将导致权重分配的不确定性,最终可能导致评价结果的不确定性。因此,在 实际工作中不论用哪一种方法确定权重分配,都应当以较为合理的专业解释为前 提。 2 3 传统条目筛选方法及改进研究 本节在2 2 节讨论了各种条目筛选方法的原理、应用和优劣的基础上,提出了 一种对传统方法的改进算法,即基于逐步判别分析的改进因子分析法,该法综合 了因子分析和判别分析的优点,互补了各自的缺点,使最终保留得到的条目既消 除了属性间的多元共线性,又与样本目标密切相关,有良好的区分度和代表性。 传统的量表制作方法从理论上来讲有一定的可行性,但是实践中因为中医中风 病本身证候与证候间、证候与症状间关系有交叉,以及数据有量大、稀疏、布尔 等特点,通过传统的某一种方法来找到量表制作所需的为数不多的条目将很难达 到理想效果。 2 3 1因子分析法 因子分析( f a c t o ra n a l y s i s ) 是用来寻找那些隐藏在可测变量中,无法直接观测 到,却影响或支配可测变量的潜在因子,并估计潜在因子对可测变量的影响程度 以及潜在因子之间的关联性的一种多元统计分析方法【1 甜。 因子分析的模型是: 五= q l e + 口1 2 r + + q q + 日 五2 吒1 只+ 口船只+ + 吒牙+ e ( 2 2 ) x 3 = 口p l 互+ 口,2 最十+ 口朋+ b 将这个因子分析数学模型写成矩阵形式,可表达为: x 皇a f + e 其中,a 为公因子载荷矩阵,f 为公因子向量,e 为残差向量, 分对数据方差的影响。 1 0 ( 2 - 3 ) 它是g 个主成 建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的 意义,以便对实际问题进行分析。如果求出主因子后,各个主因子的典型代表变 量不是很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。 模型中载荷矩阵中的元素口。是为因子载荷。因子载荷口若是z ,( 自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论