




已阅读5页,还剩55页未读, 继续免费阅读
(计算机应用技术专业论文)动态心电图波形改进分类策略研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要心电图( e l e c t r o c a r d i o g r a m ,简称e c g ) 是反映心脏兴奋的电活动过程,是人类生命活动中一个明显的体现。心电图反映了人体心脏的工作状况,它的各个波形的不同变化往往体现出了某些病变。在现代医学中,心电图正越来越成为医生诊断心脏疾病的依据。动态心电图( d y n a m i ce l e e t r o c a r d i o g r 锄) 长时间地记录心脏的状况,一般在2 4 小时内记录近1 0 万次左右的心跳所产生的心电图。由于记录时间长、数据量庞大等原因,医生不可能阅读每一次心动事件用于心脏病诊断,如何准确、可靠、完整、快速地从中抽取各类典型心电数据充当诊断依据,成为当今研究的热点。机器学习( m a c h i n el e a r n i n g ) 是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习的理论方法可被用于大数据集的数据挖掘这领域。当前,机器学习研究与应用中最常用的关键技术有:集成学习、贝叶斯网络、决策树、统计学习理论与支持向量机、隐马尔可夫模型、神经网络、k 近邻方法、序列分析、聚类、粗糙集理论、回归模型等。本文以动态心电图波形为研究对象,研究动态心电图波形数据的采集、整理、预处理,引入机器学习的概念,通过比较和分析确定一种分类算法并加以改进。具体内容包括采用小波变换及阈值检测的方法检测r 波,并以设计一套动态心电图波形自动分类系统为目的,将聚类方法与分类方法相结合,在已完成聚类策略的筛选之后,通过对比不同分类方法在动态心电图波形分类中的优劣,确定了k 近邻( k n n ) 分类策略,并对波形问的度量加以改进。具体内容为:首先对相似性度量中不同距离度量方法的比较,将传统的欧式距离改为c i t yb l o c k 距离,并引入了核函数的概念,将波形数据间的线性差异转化为非线性,在一定程度上提高了波形间的区分精度,最终使得动态心电图波形的分类准确度得到了提高。提出了基于s o m 和相似性搜索的二次筛选策略,在完成初次筛选后对未满足筛选要求的剩余波形进行了细分筛选,基本达到了用于疾病诊断的要求。关键词:动态心电图分类机器学习k 近邻相似性度量c i t yb l o c k 核函数s o m 相似性搜索a b s t r a c te l e c t r o c a r d i o g r a m ,e c gf o rs h o r t , i sar e f l e c t i o no fh e a r te x c i t e m e n ta n dh u m a nl i f ea c t i v i t y e c gr e f l e c t sh o wt h eh e a r ti sw o r k i n ga n dt h ec h a n g e so fh e a r tw a v e f o r m sa l w a y ss t a n df o rp a t h o l o g i c a lc h a n g e s i nm o d e r nm e d i c i n e , e c gb e c o m e sam o r ea n dm o r ei m p o r t a n tb a s i si nd i a g n o s i n gh e a r td i s e a s e d y n a m i ce l e c t r o c a r d i o g r a m ( h o l t e r ) r e c o r d sa sl o n ga s2 4h o u r sh e a r td a t a - a b o u t10 0 0 0 0w a v e f o r m $ a si ti si m p o s s i b l ef o rad o c t o rt or e a da l lt h ee c gd a t a , h o wt of i n do u tt h et y p i c a lw a v e f o r m sf o rd i a g n o s i n ga c c u r a t e l y , r e l i a b l y ,c o m p l e t e l ya n dr a p i d l yb e c o m e sar e s e a r c hh o t s p o tn o w m a c h i n el e a r n i n gm a i n l yr e s e a r c h e st h a th o wc o m p u t e ri m i t a t e so ri m p l e m e n t sl e a r n i n gb e h a v i o ro fh u m a nb e i n gt ol e a r nm o r ek n o w l e d g em a dr e o r g a n i z ek n o w l e d g es t r u c t u r ei no r d e rt oi m p r o v ei t sc a p a b i l i t yc o n s t a n t l y m a c h i n el e a r n i n gt h e o r i e sc a nb eu s e di nd a t am i n i n go fl a r g es c a l e dd a t a k e yt e c h n o l o g i e so fm a c h i n el e a r n i n gm a i n l yi n c l u d e s :i n t e g r a t e dl e a r n i n g , b a y e sn e t w o r k , d e c i s i o nt r e e s ,a n ds t a t i s t i ct h e o r y , s u p p o r tv e c t o rm a c h i n e s ,h i d d e nm a r k o vm o d e l ,n e u r a ln e t w o r k ,kn e a r e s tn e i g h b o r , s e q u e n c ea n a l y s i s ,c l u s t e r i n g , r o u g hs e tt h e o r y , t h er e g r e s s i o nm o d e l ,a n ds oo n t h i sp a p e rm a i n l ys t u d i e sh o l t e rw a v e f o r m s ,i n c l u d i n gh o l t e rw a v e f o r m sc o l l e c t i o n ,p r e p r o c e s s i n g , c o m p a r i n ga n df i n d i n gac l a s s i f i c a t i o nm e t h o da n di m p r o v i n gi t t h ec o n c r e t ec o n t e n to ft h i sp a p e ri su s i n gw a v e l e tt r a n s f o r ma n dt h r e s h o l dd e t e c t i o nt o g e t h e rt od e t e c t i n grw a v e f o r m s ,d e s i g n i n gah o l t e rw a v e f o r ma u t o m a t i cc l a s s i f i c a t i o ns y s t e m ,w h i c hc o m b i n e sc l u s t e r i n ga n dc l a s s i f i c a t i o nt o g e t h e r t h i sp a p e rc o m p a r e ss e v e r a lc l a s s i f i c a t i o nm e t h o d s ,a n df i n a l l yt a k e skn e a r e s tn e i g h b o ra sc l a s s i f i c a t i o nm e t h o dw i t ht h er e s u l to fc l u s t e r i n g b yc o m p a r i s o no fd i s t a n c em e a s u r e m e n tm e t h o do fs i m i l a r i t ym e a s u r e m e n t ,w eu s ec i t yb l o c kd i s t a n c ei n s t e a do fe u c l i d e a nd i s t a n c ea n dt h i sp a p e ri n t r o d u c e st h ec o n c e p to fk e m e lf u n c t i o n ,w h i c hc h a n g e st h el i n e a rd i f f e r e n c eo fh o l t e rw a v e f o r mi n t on o n l i n e a rd i f f e r e n c e t h ee x p e r i m e n t ss h o wt h a ti td o e si n c r e a s et h ed i s t i n c t i o na c c u r a c yo fh o l t e rw a v e f o r m s ,a n da sar e s u l tt h ec l a s s i f i c a t i o na c c u r a c yi sa l s oi n c r e a s e di nac e r t a i ne x t e n t w ea l s op u tf o r w a r dar e f i l t e r i n gs t r a t e g yb yc o m b i n i n gs o ma n ds i m i l a r i t ys e a r c ht o g e t h e r i ts u b d i v i d e st h eh o l t e rd a t aw h i c hd o e sn o tm e e tt h er e q u i r e m e n to fc l a s s i f i c a t i o na f t e rt h ef i r s tf i l t e r i n gs t a g e t h er e s u l tb a s i c l yf u l f i l l st h er e q u i r e m e n to fh e a r td i s e a s ed i a g n o s i s k e yw o r d s :h o l t e r , c l a s s i f i c a t i o n ,m a c h i n el e a m i n g , kn e a r e s tn e i g h b o r , s i m i l a r i t ym e a s u r e m e n t , c i t yb l o c k ,k e r n e lf u n c t i o n ,s o m ,s i m i l a r i t ys e a r c h独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得墨盗墨兰太至或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:嚎葡鲤签字日期:加7 年,月7 日学位论文版权使用授权书本学位论文作者完全了解墨盗垄兰太至有关保留、使用学位论文的规定。特授权墨盗墨兰盘堂可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编,以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复本和电子文件。( 保密的学位论文在解密后适用本授权说明)学位论文作者签名:【韶司盈导师签名:签字日期:珈7 年f 月7 日签字日期护7 年月7 日,第一章绪论1 1 研究的目的及意义第一章绪论心电图( e l e c t r o c a r d i o g r a m ,简称e c g ) 是反映心脏兴奋的电活动过程,是人类生命活动中一个明显的体现。心脏在每个心动周期中,由起搏点、心房、心室相继兴奋,伴随着生物电的变化,通过心电描记器从体表引出多种形式的电位变化的图形【l 】。心电图检查是临床常用的器械检查方法之一,其临床应用已有百年之余。它在监测心肌缺血、捕捉心律失常,帮助临床医生掌握患者各种情况下的心电变化、了解患者病症和药物疗效与心电活动等方面具有独特的功能,而且由于其简单、方便、无创的特点,在临床得到了广泛的应用【2 】。心电图是心脏事件的电信号的反射,波形很简单,但其内涵高深而且不显露,其理论基础来自多年来创立的各种心电学说,如e i n t h o v e n 原理,单极概念,心向量学说等。心电图反映了人体心脏的工作状况,它的各个波形的不同变化往往体现出了某些病变。医生正是根据这点诊断冠心病,它通常是在病人静息的状态下获取。在现代医学中,心电图正越来越成为医生诊断心脏疾病的依据。由于普通心电图仪仅能记录受检者处于静态时的且为时甚短的心电资料,检查过程仅为短暂的几分钟,记录的心搏一般仅为数十次,对于一过性心律失常和短暂心肌缺血不能轻易发现,尤其对于受检者在睡眠、运动、工作劳累或情绪激动等特定状态下出现的病症和变化,无法记录当时的心电状况。同时许多病人在发生突然死亡之前并没有明显的症状,一些异常心电信息只有在某些特殊情况下才出现,其心律失常的发生频率非常低。针对以上问题,为了及时发现和治疗早期心脏病和各类隐性、偶发性心律失常、心肌局部缺血,就必须有一种心电图仪能让病人随身携带,在病人正常工作、生活状态下,2 4 小时以上长时间对病人进行检测,随时捕捉病人在工作紧张或者精神受到刺激、情绪激动或者特殊状态下心脏发生的病变反应。1 9 5 7 年,美国n o r m a nj h o l t e r 提出设想用于长时间连续的记录体表心电图的动态心电图分析仪( a m b u l a t o r ye l e c t r o c a r d i o g r a p h ,a e c g ) ,并在1 9 6 1年投入临床使用。经过4 0 余年的不断发展和完善,动态心电图分析仪已经成为无创心电辅助诊断技术领域应用非常广泛的、临床上最为常用的心电图检查工具之一。最近2 0 年来,在动态心电图分析仪上又增加了多项新的分析功能,将其临床辅助诊断功能扩展到对临床治疗的随访和愈后的评价,临床己广泛用于:( 1 ) 评价与心律失常有关症状;( 2 ) 诊断和评价心肌缺血;( 3 ) 评价心肌缺血和心律失常的药物疗效;( 4 ) 评价心脏病患者的日常生活能力;( 5 ) 评价心脏病患者愈后;( 6 ) 评价起搏器功能。而随着电子技术和计算机技术的发展,计算机的应用开始渗透到医学领域。计算机在心电信号的自动分析、心电数据的压缩,以及心电仿真建模等领域中都得到了广泛的应用。这也为动态心电图的进一步发展奠定了良好的基础m j 。动态心电图与普通心电图的区别在于,动态心电图可以长时间的、连续的记录心脏第一章绪论的波形,一般最短时间在2 4 小时左右,可以记录1 0 万次左右的心动周期( 平均7 0 次心跳分钟) 。因此在较短时间内检查到病变波形比较困难,如何快速准确的检测到病变波形成为研究的热点p 一1 。本文将机器学习的分类算法引入到动态心电图波形筛选中来,设计了一套聚类和分类相结合的动态心电图波形自动分类系统。聚类的目的是筛选出占大部分的先天波形,并将结果作为分类算法的训练样本。本文在比较多种分类算法之后,确定了一种基于实例的分类方法并加以改进,从而大大提高了波形的分类效率,提高了对心脏疾病诊断的正确率。1 2 动态心电图波形介绍1 2 1 心电波形产生的生理学基础简介心电图反映了心脏电兴奋在心脏传导系统中产生和传导的过程。心脏的传导系统是由心肌分化而来的一种特殊的神经肌肉组织。它们能够自主地产生兴奋,并向心肌细胞传导。心脏传导系统主要由窦房结、心房传导组织( 结间束和房间束) 、房室交界区、心室传导组织( 房室束、左右束支和浦肯野纤维) 等组成,如图1 - 1 所示。囊簟摹v g e ,pp ,房t 曩擘譬r i i 霄哥昔“一图1 - 1 心脏传导系统蠢赢嵩( | l ,d正常情况下,由窦房结作为心脏起搏点,其它的具有自律性的组织作为潜在起搏点。窦房结发出的兴奋通过房间束和心房肌传导到整个心房,通过结i 、日j 束传导到房室交界区,经过一定的时延,经房室束、左右束支传导到浦肯野纤维以及其所支配的心内膜,最后兴奋由心内膜向心外膜扩布,引起整个心室的兴奋和收缩。这样形成的心脏节律为窦性心律。健康人的心律几乎都是窦性心律,而很多器质性心脏病患者的基本节律也是窦性心律,所以窦性心律不一定代表心脏正常。第一章绪论在某些病理情况下,窦房结自律性下降或其产生的兴奋传出受阻,或者潜在起搏点的自律性增高且大于窦房结的自律性时,可由潜在起搏点作为心脏的起搏点引起整个心脏的兴奋。这时产生的心拍即为异位拍,包括早搏( 室性早搏、室上性早搏) 和逸搏等。当异位拍主宰整个心脏节律时,称为异位心律。包括主动异位心律( 如室性、室上性心动过速) 和被动异位心律( 如逸搏心律) 。另外,在某些异常情况下,心脏起搏点传来的兴奋不能顺利地传导于整个心脏,而是在心脏传导系统的某个环节产生延缓或停滞,这种现象称为传导阻滞。其中以房室结和左右束支传导阻滞最常见博】。1 2 2 电图波形简介及临床意义心电图是在心脏有规律地收缩和舒张过程中,各部分心肌细胞产生的动作电位综合而成的电信号由电极从体表或胸腔测得,经放大后显示或描记下来的波形。图1 2 是一个完整的正常心电图波形。黻卜一一一一一i 尹p,和舅pj汇三毒必,j、qs r。矗图1 - 2 正常心电图波形下面简要介绍一下各个波p j 。( 1 ) p 波。p 波是最早出现的波,反映的是心房除极产生的电活动,代表左右心房去极过程的电位变化。历时0 0 8 一o 1 1 s ,波幅不超过0 2 5 m v ,其波形小而圆钝。( 2 ) p r 段。p 波之后出现的水平线段,被称为p r 段,反映的是心电复极过程及房室结、希氏束、束支的电传导时间。( 3 ) p r 间期。p 波与p r 段合计为p r 间期,反映的是自心房除极至心室开始除极所需的时间。( 4 ) q r s 波群。由一组波构成,是心电图波幅最大的波,反映的是心室除极的全过程,代表左右两心室去极化过程的电位变化。历时0 0 6 0 1 0 s 。典型的q r s 波群包含三个紧密相连的波,第一个向下的波为q 波,其后向上的高尔尖的为r 波,继r 波之后的一个向下的波为s 波。( 5 ) s t 段。q r s 波群后出现的一水平段,反映的是心室缓慢复极的电位变化。( 6 ) t 波。紧接s t 段之后出现的与q r s 波群主波方向一致的波形圆钝、占时较长的第一章绪论波,反映的是心室快速复极的电位变化,代表心室复极过程中的电位变化。其波形的前肢较长,而后肢较短。( 7 ) q t 间期。由q r s 波群开始至t 波结束的时间,为心室开始除极至心室复极完毕的全过程的时间。1 2 3 动态心电波形诊断分类动态心电图包含了至少2 4 小时的被检测人的心电波形,其中波形的种类很多,本文的研究目的是将这些种类的波形筛选出来,从每类波形中挑选一部分代表波形用于进一步心脏病诊断。因此需要了解2 4 小时的动态心电图中的波形分布。心电图所记录的心电种类很多包括正常窦性心律、窦性心律失常、心房心室肥大、心绞痛、心肌梗死、先天性心脏病、心律失常等。如果细分还会有更多种。本文的研究中具体是将其分类为三大类波形:先天波形、病变波形、干扰波形。先天波形是指2 4 小时动态心电图中存在的大部分的相似波形,此类波形是动态心电图波形的主体,其数量可达全部波形的9 0 以上。由于心脏器质变的过程比较缓慢,因此被检测人2 4 小时之内心脏状态的波形发生突发性变化的机率较小。在动态心电图记录期间,被检测人的先天波形不会有很大变化。如图1 3 是某一被检测者先天波形图示。n 忤鞘 i i :l _ r 丁鞠静l |1 j l ll f ik l li l隧叶十卜 | 斗fii 6l ll 一 : + 卜 tl 粥硅i 州y ,群舯鼎h i 愚i7 b 瓣 8 ;ih ;,k i 膏叫 嗣堆f 卜:蚪l 旧i1 半1 ,1i 1 kj 削+ 汀 蝴-十r n 够 十pl : lr 1 一i引硐干h 仟一h t f ii il ;一下r 1 t f r 1 + f t 一1 l1 1 一11 1 一广r -l ih l ! i1 ;! 卜卜 h i 十h 一二#蠡捌 = 销一1 im1 :_ i ,l一:1:1i i _ l t -册* 忖。t f 匆 ;h j 昏 a ;件 太 舛一 中乇荇z 卜p 埒一kf 珏薛懵掣k 期一* 睾k 寰戈,璃尚南型溶k。j 上一。,t i bl ly lii _ :上l 上一l 。姒上l la jl。i。l毒f 仁i 1 一 t t t i 。 ;壬器r 了一啊丌n叶 唧麟一王u 刊一 -j 许 7 上b 肛卜碧 一 卜缎一吲,4 牟ow 肼 i w w f r r t 一r 厂i 7 - 一ri j 一 一o * 0 十骣那f 1 vi ;,埔:i :ll 0 獭毫支虻越瀚 j i j0r!- iil kr ul 。 h :皓一 一壤震一阵二;:t 。r 专1 一n r t l _! l1 :i - t t rf耍压匍叁l l :i盎戚一叼叫il 广厂r r一r t r 丁i 卜j “抖h 七 _ + 叶 u ! - i 十 | h + 4h _ 0 一卜t - ! * 一为一 二;舻o 二哏 一:80j 圳:,。删一刖w 一p 删 ,净嘲l ,嘲v1 刑羹罐;、强1 f o嘎h 纠t 址i y l j图1 - 3 心电先天波形例图病变波形:这里所指的病变波形是指被检测人进行动态心电图检测的2 4 小时中发生的突发性心脏事件,例如:房性早搏、室性早搏、房颤、窦性心律过缓等。此类波形与先天波形存在区别,但在数量上相对较少,一般最多占至5 1 0 。这部分波形的种类是筛选的关键,医生的诊断依据也多根据此类波形,图1 4 是几种病变波形的示意图,( a ) :严重心肌缺血;( b ) :房颤;( c ) :室早( 室性早搏) ,从中可以看出其形态与先天波形的差异较大,有利于自动筛选。干扰波形:此类波形,如图1 5 所示,一般发生在数据采集的开始和结束,以及被检测人状态变化初期时,如从静坐到步行、从静卧到站立、从运动到静止等状态,此类第_ 章绪论波形的特点是无规律,它没有心电波形的重复性发生的特点,筛选起来较为复杂。但此类波形性所占比例较小,只有1 以下,对于筛选工作的影响不大。c o )图1 4 心电病变波形例图图1 5 心电干扰波形例图1 3 心机器学习用于动态心电图波形筛选1 3 1 动态心电图波形筛选的特点动态心电图记录了被检测者2 4 小时的心脏状况,在利用计算机进行分析时,与传统的静态心电图不同,其检测内容具有心动事件时间不等性、心电类别完整性、心电波形连续性、分析的实时性等特点。( 1 ) 数据量庞大。动态心电图实时地记录了被检测人2 4 小时的心脏波形,包括近1 0 万次完整的心电波形。这1 0 万次心电波形中的大部分是相似的( 约占9 0 左右) ,这部分波形在进行诊断时只需要很小的一部分既可,般情况下3 0 - - - 5 0 个波形既可。但是对于如此庞大的数据量,如何提取有价值的波形是研究的重点。( 2 ) 心动事件时间不等性。由于人的心跳是有节律的,反映到心电图上,我们见到的心电图的r r 间期( 如图1 6 所示的两个相邻r 波之间的时间差) 是基本上相同的,但实际上每一个r r 间期都是不相同的。因此在对波形进行特征提取的过程中,需要对r r 间期进行归一化处理,使获得的独立心电波形在数据格式上是一致的,保证进步分析的顺利进行。( 3 ) 心电类别完整性。动态心电图的检测内容除了传统e c g 心电图中的波峰检测以外,更加强调e c g 在2 4 小时中的变化情况,特别是寻找一些在短时间内没有发生过的心脏事件所对应的心电图。因此,检测的重点从检测的准确性向检测的完整性方向偏移。除了需要判断e c g 心电图所代表的诊断意义,还需归纳e c g 心电图的类别以辅助医生做出诊断。这就要求,在分析e c g 心电图的过程中,尽量不能漏掉某一类心电波形,第一章绪论即使只包括2 个完整心电波形。袋一_ 一x ? r “一厂l :丛:天二。f图l 石e c g 中r r 间期示意图( 4 ) 心电波形连续性。就物理意义而言,心电图是心电电压随时问变化的曲线表示,因此心电图是连续的。静态心电图记录的时间较短,很难发现突发性、一过性心脏状况变化导致的心电图波形变化。另外,心脏状况发生变化是有前因后果的,单独一段静态心电图不能说明问题。而动态心电图记录了2 4 小时的心电波形,而且记录是连续的,可以发现上述问题的答案。当然这种连续性也使得分析一定程度上变得困难。1 3 2 动态心电图波形筛选中存在的问题利用计算机自动筛选动态心电图波形为众所盼,但在实际工作中会遇到如下问题:( 1 ) 数据量巨大,及其格式化困难问题。如前所述每个人的动态心电图检测中都包含至少2 4 小时的心电图波形数据,以完整波形计算为近1 0 万个,这对于一般的处理来说是巨大的。再者由于心电波形是连续的,人们观察到的每个波形的起始和终止位置很难用量化的位置信息进行标注,因此如何准确地确定一个完整的心电波形是动态心电图波形自动筛选所遇到的第一个问题,只有确定了完整波形,并将其数字化才能利用其他技术进行分析及筛选。( 2 ) 每次心跳间隔的不全等性导致数据格式的变异问题。人们的心跳是有节律的,从自身的感受来看,心跳的问隔相同的,而事实上人们的每次心跳间隔都不尽相同,这对心电波形的数字化会产生影响,这在分析静态心电图时没有太大的影响,因为利用波峰检测技术时并不考虑心电图中r r 间期的变化,只要确定波峰的位置即达到检测的目的。而对于动态心电图来说,波形是连续的,r r 间期的不稳定变化为计算机分析心电波形带来困难。图1 7 展示了心电间隔时间不等性。图1 7 心电间隔的时间不等性6 第一章绪论( 3 ) 当通过转换将心电波形变为向量后单个波形的数据量也很大。因为,本文研究的心电波形的采集频率为2 4 0 秒,普通人的心跳在7 0 次秒,这样通常普通人的一次心跳的采集点位2 0 0 个左右,即取得2 0 0 个左右的心电电压值,向量化后的心电波形的维度在不进行处理的情况下也为2 0 0 维左右。那么,当心电波形进行向量转化后,得到的是l o 万个2 0 0 维左右的数据,这为算法分析带来了一定的困难。( 4 ) 筛选速度问题。动态心电图包含了近1 0 万次完整心跳的心电波形,筛选过程势必存在时间问题,最理想的状态是在心电采集结束后不久即可得到分析结果,这对于筛选系统的可用性来说十分重要。而如何快速、有效地筛选心电图尚待解决。1 3 3 动态心电图波形自动分类策略机器学习从本质上讲是一个多学科领域,它吸取了人工智能、概率统计、计算复杂性理论、控制论、信息论、哲学、心理学和神经生物学、统计学等领域的成果。其成果也有明显的应用如:语音识别,车辆自动驾驶,图像处理,天体分类,信用评估,近年来更多地被用来解决数据挖掘方面的问题,它通过对实例数据的处理、归纳,建立用于分析新数据的模型或归纳形成某种概念。在理论研究方面包含很多内容,如聚类分析,包括基于划分、基于层次、基于模型、基于密度、基于网格等算法;分类分析,包括人工神经网络、贝叶斯分类、决策树,基于案例,回归分析等算法;遗传算法、进化计算等。动态心电图波形自动筛选涉及了很多复杂的数据处理过程,其庞大的数据对数据处理来说是困难,而对于另一领域一机器学习来说,却是一个潜在的优势,在动态心电图自动筛选的诸多重要环节中都可用到机器学习技术。本文致力于利用机器学习技术从动态心电图中筛选具有典型诊断意义的心电波形问题的研究及其应用,它从近1 0 万次心跳产生的心电波形中筛选出医生用于诊断心脏病所需的波形,要求所筛选的波形具备完整性、简洁性,同时要求筛选的过程需在规定时间( 一般为心电数据采集后几小时以内) 内完成。同以往的方法不同,本文采用机器学习技术,将其应用于独立波形格式定义、波形向量化、聚类心电样本波形、建立心电波形检测分类模型过程中,完成最终的心电图波形自动筛选。具体包括下面几项内容:第一步是心电波形预处理,目标是将心电波形转化为具有统一维度的心电波形向量。因此首先通过对r 波进行聚类分析,标定r 波位置,从而确定独立心电波形,然后完成独立心电波形统一维度的向量化处理,完成目标的要求。第二步要解决的问题是如何确定心电样本波形,由于待分析的心电图波形没有统一的类型样本,而筛选过程的初始阶段需要完成波形样本的确定。通过前面对动念心电图波形类型的分布特征的研究,可以得知被检测人的先天心电波形占有很大比例,我们只要选取一段长度的心电波形进行分析即可找到此类心电波形。本文确定样本波形所用的机器学习技术是聚类分析,先利用最大最小距离算法聚类获得聚类类别数和聚类中心,最后利用k m e a n s 算法进行聚类,获得可用于构建分类模型的标定心电波形样本。同时利用类别内向量的紧凑程度评估类的状况。第三步是根据心电样本波形构造分类器,分类的准确与否直接关系到心电波形筛选第一章绪论的结果,因此除了要求样本波形类别准确,有定的数量以外,还需要挑选适于心电波形的分类模型、以及适合的训练策略,并利用分类模型进行在线分类,完成筛选。分类算法引入核函数概念,采用基于实例的非线性分类算法,同时利用类别符合度检测确保分类的正确性1 4 国内外研究现状本文的研究对象是动态心电波形,所做的研究工作是波形筛选,应用的方法是机器学习技术,涉及三个领域的研究。对于心电波形来说,应用计算机技术进行分析已经有近3 0 年的时间,是国内外众多专家的研究热点,目前的研究集中于心电波形的检测识别,获得心电波形所代表的具体含义。心电图的计算机自动分析能明显提高工作效率,便于大量贮存心电图资料,建立数据库,便于资料检索,e c g 自动分析的内容主要包括t 信号的预处理、数字滤波、波形检测、特征提取与分类、数据压缩等。随着计算机技术的不断发展,自动分析技术的内容也在不断地增加。心电信号比较微弱,极易受到环境的干扰。为了增强心电信号中的有效成分、抑制噪声和干扰、提高波形检测的准确率,除了对心电记录仪的硬件抗干扰能力有较高的要求外,还需要对e c g 信号进行滤波预处理。预处理之后的波形检测和特征参数是心电自动分析系统的关键,其准确性和可靠性决定着诊断的效果t m j 。1 4 1e c g 波形的预处理及检测传统的滤波方法有很多,例如t h a k o r 设计的巴特沃斯型带通滤波器,考虑了心电图信号的频谱分布特性;l y n n 提供的整系数数字滤波器具有线性相位,可以实现低通、高通和带通等不同形式的滤波。也有入用n o t c h 、改进的l e v k o v 法滤除工频干扰,用自适应相干模板法同时抑制工频干扰和基线漂移等l l 。近几年来,小波分析被引入到e c g 滤波处理中【i - 1 4 j 。小波变换具有良好的时频局部化特性,实现了信号从时频到时间一尺度相平面的转换。通过多尺度分析可以在不同尺度下观察信号不同的局部化特征,十分适用于像e c g 信号这样的具有较强随机性、信噪比较低、非线性、非平稳和奇异点较多的生物医学信号的分析处理。小波变换用于e c g 滤波,常采用的算法有:去除噪声干扰所对应的小波多分辨率分解尺度上的细节分量、小波空间的阂值化处理、小波变换模极大值方法。这几种算法都可以有效去除e c g 中的噪声、干扰。e c g 波形检测是检测e c g 信号中各个波形的具体位置,识别各波波界的特征点,提取各项特征参数。所提取的特征参数,包括各波的时限、幅度和各间期时间等,并用于下一步的心电图分类识别及疾病诊断。如e c g 中代表心脏各部位状况的波形p 波、q r s 波、t 波等的检测、识别。特别是对q r s 波的检测,由于q r s 波是e c g 的重要特征波形,是单个心电波形的代表波形,只要确定了它的位置和状态,其它波形可以相继得到较准确地识别和确认,因此q r s 波的检测成为心电波形检测的关键l 巧o ”。第_ 章绪论动态心电图检测是基于信号处理的检测,传统的方法主要有一下几种:( 1 ) 早期研究中,对e c g 进行变换运用较多的方法是求e c g 的一阶或二阶差分,然后采用固定阈值或可变阈值进行判决。采用可变阈值进行判决,可以减少由于干扰或高p 、高t 波的存在而产生的假阳性结果以及由于心律失常或q r s 波幅度变小导致漏检而产生的假阴性结果。所采用的可变阈值有幅度阈值、斜率阈值和时间间隔闽值等。( 2 ) 把e c g 信号采样点与预先存储的心电图波形模版逐点进行比较,当待处理信号与模版耦合时其相关值最大。常用的比较方法有平均平方法、最小二乘法和面积差分法等。所存储的信号可以是正常或非正常的q r s 信号。这种方法不仅可以检测出q r s波,而且可以提取心律失常下的q r s 波,但它对高频噪声和基线漂移很敏感。( 3 ) 基于数学形态学的q r s 波检测方法。该方法每次适用一个导联的信号,通过对心电图信号作形态运算,将q r s 波群检测出来,其具有数学上的严谨性、准确性和鲁棒性,而且计算过程简单,仅需做形态运算( 开、关) ,但是这种方法对噪声比较敏感。近年来,人们又将小波变换( 、t ,w a v e l e tt r a n s f o r m ) 引入到q r s 波检测【1 8 - 2 2 1 。小波变换应用于q r s 波检测,都是基于m a l l a t 等人在信号奇异性检测和信号的小波系数局部极值分析之上的,检测效果不错。小波变换的基本思想是用一族函数去表示或逼近一信号或函数,这一族函数称为小波函数系,它通过一基本小波的平移和伸缩构成。该变换具有以下三个特点:多分辨率;品质因素即相对带宽恒定;适当选择基本小波,可使小波在时、频两域都具有表征信号局部特征的能力。形象的讲,小波变换有“变焦距”的功能,在高频部分,它有“显微”能力,这一特点在处理突变信号时很有用,保证了小波变换应用于q r s 波检测的可行性。该技术利用信号在不同尺度( 频段) 上的不同分布来检测q r s 波。用小波变换方法检测q r s 波具有以下一些特点:( 1 ) 由于小波变换w 7 f ( n ) 能代表信号不同频道上的分量,在s = 2 3 的尺度上,高频噪声有很大衰减,而基漂、高p 波、高t 波等容易造成误判的低频成分在s = 2 3 尺度上较小,检测该尺度上的小波变换大大提高了q r s 波检测率。( 2 ) e c g 信号记录中出现伪迹很容易造成误判,在小波变换检测方法中,通过去掉孤立极值点能很好地解决这个问题。1 4 2e c g 分类方法分类识别是对e c g 进行自动诊断和解释,运用具体的分类算法对送入的心电波形或特征参数进行判别,并由此判断该e c g 信号是否对应某一病症。方法包括利用a r t神经网络分析心电图,获得心电波形的分类结果,采用模糊聚类神经网络对心电图进行分类,还有利用主成分分析法( p c a ) 和自组织映射神经网络( s o m ) 分析、标定心电图的种类,再有利用波形的形态和心跳间期特征对心电图进行自动分类,方法选择的是线性分类和神经网络,其准确度达到8 0 以上。第一章绪论1 5 本章主要研究内容本章主要介绍了本文的研究目的和意义。介绍了国内外动态心电图的研究情况,对动态心电图的检测分类有一个大概的了解。详细介绍了心电波形及其特点和临床意义,并根据动态心电图波形自身的特点及问题所在,提出了基于机器学习的动态心电图波形自动分析系统。1 6 文章主要研究内容及框架本文共五章。第一章主要介绍了心电图的概念及其临床诊断意义,提出了机器学习用于动态心电图分类的框架,并对国内外研究现状进行了研究。第二章主要是对采集的数据的预处理过程的描述,主要包括z 动态心电波形的向量化、小波变换和阈值检测技术用于r 波的定位、心电波形向量化及维度的统一。然后研究了机器学习中可用于心电波形的分类策略,包括:决策树、神经网络、k 近邻等。通过实验比较最终确定了基于实例的k 近邻分类策略,并指出了k 近邻策略的优点和不足。第三章主要介绍了心电波形向量相似性度量问题,这是影响分类j 下确率的重要因素之一。第四章主要是针对动态心电波形筛选要求提出了两个阶段的筛选策略:第一阶段的筛选是对k 近邻分类算法提出的改进,并对不同核函数算法进行了比较。第二阶段介绍了基于s o m 和相似性搜索合并的细分筛选策略,对第一阶段筛选后遗留的未满足最终筛选要求的波形的集合进行了细化分类。目的是尽量将动态心电波形中存在的全部波形筛选出来,即使某些波形数量可能很少,以达到完整分类和用于心脏疾病诊断的目的。第五章是对本文所做工作的总结和展望。第一章动态心电刚波# 筛选分类器的选择第二章动态心电图波形筛选分类器的选择2 1 动态心电围波形的采集及预处理本文所采用的数据是通过便携式心电信号采集器获得的,如图2 - 1 所示,采样率为2 4 0 次秒分辨率为8 b i t 。图2 - 1 便携式动态心电囝披形信号采集器预处理工作包括:独立心电被形获取( 即r 波峰定位) 、心电波形向量化及向量归j 化三方面内容。( 1 ) 进行动态心电图波形筛进的筇步足获得独立的心电波形及向量化。单个心电波形中波形的起伏具有心脏痈的跨断意义,在处理大量心屯波形时,单个心电波形的划分成为重要问题。在心电图波形中存在着很多波峰包括p 波、q r s 波、t 波、u 波等,其中q r s 波群中的r 波的能量鞍高即r 波峰的心电电压值较高,在一般情况下r 波峰的值堆太。 l = 【不同的人会有不同的情况,有的人的菜一位_ 苒:的心电波形的r 波并非最高。( 2 ) 为进一步筛选心电波形,在对波形向量化及确定r 波峰位置后,需要对独立心电波形进行归一化处理。这是由于心电波形间隔的时问不等性,因此心电波形在向量化之后需要进行维度统一。再由于心电波形的个体差异性,每个人的心电波形向量化后的向量维度足不同的。2 1 1 动态心屯波形向最化心咆波形转换的向量由一组电雎值( ,圪) 构成,其叶l “为心电电压值取值第一二章动态心电图波形筛选分类器的选择频率为每秒钟2 4 0 次,记录每秒的数据为2 4 9 个字节。下面给出1 秒的数据格式:前8个字节为记录时间,第9 个字节为预留状态,现在的给定值为0 ,第1 0 到2 4 9 个字节为2 4 0 个采样数据。该数据文件存储的是十六进制的数据,为了应用方便将其转换为十进制的数据,同时将每秒钟记录的前9 个字节的记录去掉。通过该处理,获得每个被检测人的连续时间内的采样点数据。图2 - 2 ( a ) ( b ) 分别为第一秒的数据格式及其对应的十进制数据。每秒的开始时闻fl 预留字节,设簧为o9 4 7 f7 8 68 3b b :! j j 【8 磅i b 38 36 f 7 38 1 8 6 b c7 76 f 7 e 8 1 9 0 9 78 f 8 f 8 9f 07 0e b e 0 0 1 2 8 c 9根据公式( 2 1 )3 鼋l 够5 0i 翳s 8l s 8裙1 2 l6 31 7 s 8l 辅i 81 1 罨“2 i 1 84 41 4 6铀l l锚5 l5 7i 粤蕈35 4l l1 2 3骟6 0锦哇鲁髓1 2强蹬甜1 2 晕嚷嚷基l2 4 0个数据苄秒的2 4 9个字节的部分数据( a )翳l s 2i 辙l 软1 5 31 5 zl 蓦2l 髭i 毂i 耱1 5 01 5 0i瓣1 5 01 5 t1 5 2t 5 2 1 5 2l 铊i 罨1 5 3l 翳i 弱l 韩铬l 弱l 铬l s t1 5 6 1 5 3l 锈t s 3i 瓣l 嚣31 5 0l 莺9;1 2l i 4i i 蓦1 1 9l 孙1 2 9 ;3 鼋1 4 4l i s 蠡1 5 9 巧9f游t 3 38 64 00 002 s6 51 4 4l 冁2 1 8 濑2 1 6 澈瓣1 5 0l 锯l t 7l 砖i 钙l 辱曩t ll l 薜t m1 3 4耱l e l 擘8 髓簖双娩8 l t 9 鞠t gt 8 了霉;1 3 2l 耱l 蝣l ”l “1 4 71 4 71 4 1 $ l 诣l 9t 4 7i娼l 薯s1 艚1 4 rl l l 豹l 诒l s ll s 2i 镗l 铂l 锨鑫lt 6 01 6 l 1 5 1l 眈t $ t 隋lt 6 0l 钌l s it $ 1l 蟾;( b )图2 2 第1 秒的数据格式几期对应的十进制数据( 2 5 5 一x ) 枣0 8 2 5 5( 2 1 )将该十进制的数据转换为心电电压的数据后获得的心电图波形如图2 3 所示:1 2 723 45cec8d788898b867775sds21 2826z3a7798 ,87889s1 3e 哇r04e28c9678778b878s9do722008c249579789799953836c 气bc 嘎0e95898889899507063b6ie759958878 988866d779l3 b6 0959999987876edzb395 28d885989888777670 哇068acs8ec859b88777778627d888r7ba08s877776788850d 哇2i3543eb75777777887887lb 哇eldl 6638767878989c83d99fb02696 嘎886877998842 17
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025遵义机场有限责任公司招聘考试备考题库及答案解析
- 2025乌海市海南区事业单位急需紧缺人才引进49人笔试备考题库及答案解析
- 2025安徽安庆市交通控股集团有限公司选聘6人笔试模拟试题及答案解析
- 2025云南省红河州个旧市教体系统公开遴选教师(16人)笔试模拟试题及答案解析
- 2025鄂尔多斯东胜区诃额伦社区卫生服务中心招聘广告笔试模拟试题及答案解析
- 2025年马鞍山职业技术学院引进博士研究生5人考试参考题库附答案解析
- 2025广东广州市荔湾区人民检察院招聘劳动合同制司法辅助人员2人笔试参考题库附答案解析
- 2025广东广州市天河区体育东路小学兴国学校第二次编外聘用制专任教师招聘2人笔试参考题库附答案解析
- 2025内蒙古锡林郭勒盟二连浩特市民政事业发展中心招聘4人考试模拟试题及答案解析
- (2025年标准)房产分割转让协议书
- GB/T 14153-1993硬质塑料落锤冲击试验方法通则
- (完整版)人教版八年级下册《道德与法治》期末测试卷及答案【新版】
- 并购贷款业务培训
- 北京大学人民医院-医疗知情同意书汇编
- 档案管理员述职报告9篇
- 建设集团有限公司安全生产管理制度汇编
- 牙体牙髓病最全课件
- 交通信号控制系统检验批质量验收记录表
- 疫苗运输温度记录表
- 各国钢材-合金牌号对照表
- 医院定岗定编要点
评论
0/150
提交评论