【《血管造影图像的匹配算法研究》16000字(论文)】_第1页
【《血管造影图像的匹配算法研究》16000字(论文)】_第2页
【《血管造影图像的匹配算法研究》16000字(论文)】_第3页
【《血管造影图像的匹配算法研究》16000字(论文)】_第4页
【《血管造影图像的匹配算法研究》16000字(论文)】_第5页
已阅读5页,还剩35页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页绪论1.1课题来源与背景本课题来源于国家重点研发计划项目“面向复杂病变的多器械协同递送血管介入手术机器人关键技术及应用研究”。世界卫生组织(WorldHealthOrganization,WHO)最新报告指出,心血管疾病是全球第一大致死疾病,占全球死亡人口构成的31%左右ADDINEN.CITE<EndNote><Cite><RecNum>59</RecNum><DisplayText><styleface="superscript">[1]</style></DisplayText><record><rec-number>59</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1613961459">59</key></foreign-keys><ref-typename="WebPage">12</ref-type><contributors></contributors><titles></titles><volume>2021</volume><number>02.22</number><dates></dates><urls><related-urls><url>/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds)</url></related-urls></urls></record></Cite></EndNote>[1]。同时,我国现在约有3.3亿心血管疾病患者,心血管疾病的死亡率高居我国居民死亡原因之首,高于肿瘤、呼吸系统疾病等其他类疾病,且仍处于持续上升状态,如图1.1所示ADDINEN.CITE<EndNote><Cite><Year>2019</Year><RecNum>60</RecNum><DisplayText><styleface="superscript">[2]</style></DisplayText><record><rec-number>60</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1613961829">60</key></foreign-keys><ref-typename="Book">6</ref-type><contributors></contributors><titles><title><styleface="normal"font="default"charset="134"size="100%">中国心血管健康与疾病报告</style><styleface="normal"font="default"size="100%">2018</style></title><secondary-title><styleface="normal"font="default"charset="134"size="100%">国家心血管病中心</style></secondary-title></titles><dates><year>2019</year></dates><pub-location><styleface="normal"font="default"charset="134"size="100%">北京</style></pub-location><publisher><styleface="normal"font="default"charset="134"size="100%">中国大百科全书出版社</style></publisher><urls></urls></record></Cite></EndNote>[2]。其中,冠心病患者数高达1100万人。1990-2017年中国农村居民主要疾病死亡率(b)1990-2017年中国城市居民主要疾病死亡率图STYLEREF1\s1.SEQ图\*ARABIC\s11我国居民死亡率主要疾病死亡率统计图ADDINEN.CITE<EndNote><Cite><Year>2019</Year><RecNum>60</RecNum><DisplayText><styleface="superscript">[2]</style></DisplayText><record><rec-number>60</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1613961829">60</key></foreign-keys><ref-typename="Book">6</ref-type><contributors></contributors><titles><title><styleface="normal"font="default"charset="134"size="100%">中国心血管健康与疾病报告</style><styleface="normal"font="default"size="100%">2018</style></title><secondary-title><styleface="normal"font="default"charset="134"size="100%">国家心血管病中心</style></secondary-title></titles><dates><year>2019</year></dates><pub-location><styleface="normal"font="default"charset="134"size="100%">北京</style></pub-location><publisher><styleface="normal"font="default"charset="134"size="100%">中国大百科全书出版社</style></publisher><urls></urls></record></Cite></EndNote>[2]血管内介入手术是指在相关辅助器械的引导下,医生通过体表穿刺点操作导管在人体血管内运动,通过导管注射造影剂,使得血管在X射线下显示形状,再依据血管影像操作其他介入器械(如支架、球囊等)到达病灶位置、实施相应治疗手段的方法,例如最常见的经皮冠状动脉介入手术(PercutaneousCoronaryIntervention,PCI)和主动脉腔内修复术(EndovascularAorticRepair,EVAR)ADDINEN.CITE<EndNote><Cite><Author>Lanzer</Author><Year>2007</Year><RecNum>61</RecNum><DisplayText><styleface="superscript">[3]</style></DisplayText><record><rec-number>61</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1613961995">61</key></foreign-keys><ref-typename="Book">6</ref-type><contributors><authors><author>Lanzer,</author><author>Peter</author></authors></contributors><titles><title>Masteringendovasculartechniques:aguidetoexcellence</title></titles><dates><year>2007</year></dates><publisher>LippincottWilliams&Wilkins</publisher><isbn>1582559678</isbn><urls></urls></record></Cite></EndNote>[3]。由于血管内介入手术可以使得患者创口更小、痊愈更快、并且具有更良好的术后预后结果和更高的安全性,目前这类手术是最常用的心血管疾病的治疗方法ADDINEN.CITE<EndNote><Cite><Author>Langer</Author><Year>2016</Year><RecNum>51</RecNum><DisplayText><styleface="superscript">[4]</style></DisplayText><record><rec-number>51</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1608967617">51</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>N.B.Langer,</author><author>M.Argenziano,</author></authors></contributors><titles><title>Minimallyinvasivecardiovascularsurgery:incisionsandapproaches</title><secondary-title>MethodistDeBakeycardiovascularjournal</secondary-title></titles><periodical><full-title>MethodistDeBakeycardiovascularjournal</full-title></periodical><pages>4</pages><volume>12</volume><number>1</number><dates><year>2016</year></dates><urls></urls></record></Cite></EndNote>[4]。在血管内介入手术中,由于人体血管组织会被X射线穿透,从而在X射线造影图像中不可见,为确定导管或其他介入器械与血管的相对位姿,医生需要向血管内注射密度较大的造影剂来显示血管形状。注射造影剂前后的血管图像如图1.2所示。然而,由于部分血管(例如冠状动脉)血流速度快、压力强,造影剂通常在几秒内就会充盈至整个血管然后褪色,每次显影时间非常短暂。目前临床上的解决方式是医生在每次造影后选择一帧X射线造影血管图像固定作为术中参考图像,并每隔一段时间就重新注入造影剂来更新参考图像,所以术中大部分时间医生都近似处于“盲操作”状态。(a)无造影血管图(b)X射线血管造影图像图STYLEREF1\s1.SEQ图\*ARABIC\s12注入造影剂前后的冠脉血管图像同时,注入过量的造影剂会给患者的肾脏造成额外的排泄负担,对于肾脏功能较弱的患者甚至可能造成一定的身体损害。另一方面,长时间的X射线辐射对医生的身体健康同样具有危害性。长期暴露在辐射中的医生癌症患病率会上升,尤其是皮肤癌、甲状腺癌等ADDINEN.CITE<EndNote><Cite><Author>Ambrosini</Author><Year>2017</Year><RecNum>48</RecNum><DisplayText><styleface="superscript">[5,6]</style></DisplayText><record><rec-number>48</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1608877984">48</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>P.Ambrosini,</author><author>D.Ruijters,</author><author>W.J.Niessen,</author><author>A.Moelker,</author><author>T.V.Walsum,</author></authors></contributors><titles><title>Fullyautomaticandreal-timecathetersegmentationinX-rayfluoroscopy</title><secondary-title>InternationalConferenceonMedicalImageComputingandComputer-AssistedIntervention</secondary-title></titles><pages>577-585</pages><dates><year>2017</year></dates><publisher>Springer</publisher><urls></urls></record></Cite><Cite><Author>Lee</Author><Year>2021</Year><RecNum>74</RecNum><record><rec-number>74</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614086665">74</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>W.J.Lee,</author><author>Y.J.Bang,</author><author>E.S.Cha,</author><author>Y.M.Kim,</author><author>Cho,SungBum,</author></authors></contributors><titles><title>Lifetimecancerrisksfromoccupationalradiationexposureamongworkersatinterventionalradiologydepartments</title><secondary-title>InternationalArchivesofOccupationalEnvironmentalHealth</secondary-title></titles><periodical><full-title>InternationalArchivesofOccupationalEnvironmentalHealth</full-title></periodical><pages>139-145</pages><volume>94</volume><number>1</number><dates><year>2021</year></dates><isbn>1432-1246</isbn><urls></urls></record></Cite></EndNote>[5,6]。为了防止X射线辐射带来的伤害,医生需要穿着沉重的铅皮防护服进行手术,而最重的会对医生产生高达300磅/平方英寸的椎间盘间隙压力ADDINEN.CITE<EndNote><Cite><Author>Sachteleben</Author><Year>2020</Year><RecNum>73</RecNum><DisplayText><styleface="superscript">[7]</style></DisplayText><record><rec-number>73</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614084063">73</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Sachteleben,</author><author>M.Jan,</author></authors></contributors><titles><title>OccupationalHazardsinInterventionalCardiologyandModernInnovationsoftheirPreventativeMeasures</title></titles><dates><year>2020</year></dates><urls></urls></record></Cite></EndNote>[7]。这种长时间的负重站立不仅会对医生的脊柱造成损害,而且可能导致腰椎间盘突出或者其他骨科疾病。此外,由于介入手术中皮肤可穿刺的部位面积较小、穿刺角度刁钻、以及介入器械直径很小等因素,手术对医生的手部技术准确度要求较高,因此即使医生注意力高度集中,长时间的手术也容易导致医生手部出现抖动、位移等人类难以克服的生理反应,从而影响手术质量,严重时甚至可能对患者造成血管内大出血等伤害ADDINEN.CITE<EndNote><Cite><Author>Kettenbach</Author><Year>2015</Year><RecNum>62</RecNum><DisplayText><styleface="superscript">[8]</style></DisplayText><record><rec-number>62</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1613962045">62</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>J.Kettenbach,</author><author>G.Kronreif,</author></authors></contributors><titles><title>Roboticsystemsforpercutaneousneedle-guidedinterventions</title><secondary-title>MinimallyInvasiveTherapyAlliedTechnologies</secondary-title></titles><periodical><full-title>MinimallyInvasiveTherapyAlliedTechnologies</full-title></periodical><pages>45-53</pages><volume>24</volume><number>1</number><dates><year>2015</year></dates><isbn>1365-2931</isbn><urls></urls></record></Cite></EndNote>[8]。综上所述,解决医生的“盲操作”困难,可以提高手术效率,缩短手术时间,进而减少医生和患者双方受到的健康损害,具有重要的临床意义。1.2选题意义人的血管会受呼吸和心跳影响从而发生周期性的弹性形变。其中,冠状动脉环于心脏表面一周(如图1.3所示),因此受到心脏收缩和舒张运动的影响最大,发生的弹性形变相比于人体其他位置的血管也最大,又因冠状动脉血压大,血流速度极快,注入的造影剂会被迅速冲刷掉,因此在涉及到冠状动脉的血管内介入手术中,为了保证及时获知当前时刻的血管位姿和介入器械与血管的相对位置,医生必须频繁向患者血管内注入造影剂,从而保证能够安全顺利地将器械送达至病灶处。图STYLEREF1\s1.SEQ图\*ARABIC\s13冠状动脉血管示意图如果能从少量几次造影视频序列中捕获并分类出在心跳影响下的X射线血管造影图像和无造影图像,分别提取有造影和无造影图像中的显著特征,并能从这些特征中寻找相似信息,从而训练一个可以匹配发生相同形变的X射线造影图像和无造影图像的模型,就能在手术中使用该模型将预先提取的X射线造影图像与术中实时的无造影图像进行匹配。相比于重复注射造影剂获取当前血管造影图像,再固定某一帧图像作为参考图像的传统方法,该模型使医生在整个手术过程中都可以参考动态的血管图像,相比于某一帧静态图像会更准确、更方便,有效解决了医生的“盲操作”困难,提高手术效率,进而减少医生受到的辐射伤害和防护服造成的脊柱损害。同时,对患者来说,该方法由于能够减少介入手术中造影剂的使用次数和用量,所以将会减少患者术后产生的副作用,对患者的身体健康也有更多保障。因此,本项目在临床应用上认可度很高,具有重要的临床实用意义。目前针对血管匹配的相关研究极少,且其中大多是研究眼部巩膜血管ADDINEN.CITE<EndNote><Cite><Author>Xu</Author><Year>2020</Year><RecNum>69</RecNum><DisplayText><styleface="superscript">[9]</style></DisplayText><record><rec-number>69</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614047688">69</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>D.Xu,</author><author>D.Wei,</author><author>Z.Han,</author></authors></contributors><titles><title>ScleraRecognitionBasedonEfficientScleraSegmentationandSignificantVesselMatching</title><secondary-title>TheComputerJournal</secondary-title></titles><periodical><full-title>TheComputerJournal</full-title></periodical><dates><year>2020</year></dates><isbn>0010-4620 1460-2067</isbn><urls></urls><electronic-resource-num>10.1093/comjnl/bxaa051</electronic-resource-num></record></Cite></EndNote>[9]和腹主动脉ADDINEN.CITE<EndNote><Cite><Author>Lv</Author><Year>2018</Year><RecNum>72</RecNum><DisplayText><styleface="superscript">[10,11]</style></DisplayText><record><rec-number>72</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614048554">72</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>J.Lv,</author><author>M.Yang,</author><author>J.Zhang,</author><author>X.Y.Wang,</author></authors></contributors><titles><title>Respiratorymotioncorrectionforfree-breathing3DabdominalMRIusingCNN-basedimageregistration:afeasibilitystudy</title><secondary-title>TheBritishjournalofradiology</secondary-title></titles><periodical><full-title>TheBritishjournalofradiology</full-title></periodical><volume>91</volume><dates><year>2018</year></dates><isbn>0007-1285</isbn><urls></urls></record></Cite><Cite><Author>Schulz</Author><Year>2016</Year><RecNum>65</RecNum><record><rec-number>65</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614045328">65</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>C.J.Schulz,</author><author>M.Schmitt,</author><author>D.Böckler,</author><author>P.Geisbüsch,</author></authors></contributors><titles><title>Fusionimagingtosupportendovascularaneurysmrepairusing3D-3Dregistration</title><secondary-title>JournalofEndovascularTherapy</secondary-title></titles><periodical><full-title>JournalofEndovascularTherapy</full-title></periodical><pages>791-799</pages><volume>23</volume><number>5</number><dates><year>2016</year></dates><isbn>1526-6028</isbn><urls></urls></record></Cite></EndNote>[10,11]的匹配问题。眼部巩膜毛细血管呈红色,无需造影剂也可以清晰地看到血管结构,如图1.4所示;腹主动脉距离心脏较远,发生的位移和形变都非常微小,且其血管相比于冠状动脉直径更粗,因此发生的形变相较于血管直径几乎可以忽略不计,连续三帧腹主动脉血管造影图像如图1.5所示。因此,本文提出的针对冠状动脉的血管造影图像匹配研究更加复杂困难,且属于开创性研究,具有很强的创新性。图STYLEREF1\s1.SEQ图\*ARABIC\s14巩膜毛细血管示意图ADDINEN.CITE<EndNote><Cite><Author>Xu</Author><Year>2020</Year><RecNum>69</RecNum><DisplayText><styleface="superscript">[9]</style></DisplayText><record><rec-number>69</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614047688">69</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>D.Xu,</author><author>D.Wei,</author><author>Z.Han,</author></authors></contributors><titles><title>ScleraRecognitionBasedonEfficientScleraSegmentationandSignificantVesselMatching</title><secondary-title>TheComputerJournal</secondary-title></titles><periodical><full-title>TheComputerJournal</full-title></periodical><dates><year>2020</year></dates><isbn>0010-4620 1460-2067</isbn><urls></urls><electronic-resource-num>10.1093/comjnl/bxaa051</electronic-resource-num></record></Cite></EndNote>[9]图STYLEREF1\s1.SEQ图\*ARABIC\s15腹主动脉连续三帧造影图1.3本文研究工作1.3.1研究目标本设计的研究目标为,设计一个两阶段CNN实现造影图像的分类和匹配任务。对于原始的完整造影视频序列,首先通过一个分类网络从原始造影视频序列中捕获并识别出在心跳作用下的X射线造影和无造影的冠脉血管图像,随后将有造影血管图像提取保存为造影图像库,最后通过一个匹配网络分别提取有造影和无造影图像中的显著特征,利用这些特征中的相似信息在造影图像库中对每一张无造影图像寻找最佳匹配造影图像,实现有造影图像与无造影图像的匹配功能。1.3.2研究内容具体地,本设计的研究内容为:(1)设计并训练一个深度学习分类算法模型,对于X射线造影图像和无造影图像进行分类,使得每次进行冠状动脉血管内介入手术时,医生只需要向模型输入该患者少量几次冠状动脉造影显影过程的视频序列,模型就能自动将输入的每一帧图像进行有无造影显影的图像分类,分类完成后将至少一个心跳周期长度的连续造影图像保存为造影图像库;(2)设计并训练一个深度学习匹配算法模型,使得对于术中实时的无造影显影的冠脉血管图像,模型能够从造影图像库中寻找到与其位于心跳周期内同一时刻的造影图像,完成冠脉血管造影图像的动态匹配过程。整体两阶段CNN网络的结构示意图如图1.6所示。图STYLEREF1\s1.SEQ图\*ARABIC\s16两阶段CNN匹配网络结构图1.4论文章节安排本论文组织结构如下:第一章绪论本章主要介绍了该论文课题的来源和背景、研究意义、以及具体的研究内容与目标。第二章相关技术研究现状本章主要介绍了该论文中涉及的相关技术的当前研究现状,包括图像预处理方法、分类神经网络模型、孪生网络结构和注意力机制四部分。第三章基于轻量化网络Xception的血管造影图像分类算法本章重点介绍了分类任务部分对图像数据的标注和预处理方法,轻量化Xception的结构,不同网络和图像预处理方法的对比实验得到的分类结果及其分析结论。第四章基于孪生网络和注意力机制的血管造影图像匹配算法本章重点介绍了匹配任务部分对数据对的标注方法,所涉及的匹配CNN模型中各部分的具体结构,任务中所采用的评价指标,以及不同网络结构的对比实验结果及其分析结论,提出了能实现较好匹配结果的网络模型。相关技术研究现状2.1图像预处理方法图像的预处理可以提升图像的品质,能使得算法更容易地提取图像特征,且也使得提取的特征更准确、更具代表性ADDINEN.CITE<EndNote><Cite><Author>Kotadiya</Author><Year>2019</Year><RecNum>80</RecNum><DisplayText><styleface="superscript">[12]</style></DisplayText><record><rec-number>80</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614175275">80</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>H.Kotadiya,</author><author>D.Patel,</author></authors></contributors><titles><title>Reviewofmedicalimageclassificationtechniques</title><secondary-title>ThirdInternationalCongressonInformationandCommunicationTechnology</secondary-title></titles><pages>361-369</pages><dates><year>2019</year></dates><publisher>Springer</publisher><urls></urls></record></Cite></EndNote>[12]。基本的图像预处理方法有图像尺寸的裁剪、缩放,以及对图像整体的旋转、翻转,对图像像素值的归一化等。除上述方法外,由于医学图像噪声较大,信噪比较低,因此还需要采用一些滤波器来减弱图像的噪声。常用的图像去噪方法主要分为基于空间域的方法和基于频域的方法两大类。其中,基于空间域的方法主要有均值滤波、高斯滤波、中值滤波等方法。均值滤波和高斯滤波都是线性方法,通过对整个窗口范围内的像素值进行平均或加权平均来平滑信号,适用于去除高斯噪声,但不适用于去除尖峰噪声,还会模糊图像边缘,丢失重要信息;中值滤波是基于排序统计理论的非线性方法,将每一像素点的灰度值设置为该点邻域窗口内的所有像素点灰度值的中值,可以很好的去除孤立的噪声点,同时保护图像的边缘不被模糊,但不适用于去除高斯噪声。基于频域的方法主要是通过傅立叶变换或小波变换将图像转换到频域上,再根据噪声特点利用低通滤波、高通滤波、带通滤波和带阻滤波来设计合适的滤波器,从而在频域上去除图像噪声ADDINEN.CITE<EndNote><Cite><Author>郭相凤</Author><Year>2012</Year><RecNum>90</RecNum><DisplayText><styleface="superscript">[13]</style></DisplayText><record><rec-number>90</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614428704">90</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author><styleface="normal"font="default"charset="134"size="100%">郭相凤</style></author><author><styleface="normal"font="default"charset="134"size="100%">贾建芳</style></author><author><styleface="normal"font="default"charset="134"size="100%">葛中峰</style></author></authors></contributors><titles><title><styleface="normal"font="default"charset="134"size="100%">图像序列的预处理与目标检测技术综述</style></title><secondary-title><styleface="normal"font="default"charset="134"size="100%">传感器世界</style></secondary-title></titles><periodical><full-title>传感器世界</full-title></periodical><pages>6-8,20</pages><volume>18</volume><dates><year>2012</year></dates><urls></urls></record></Cite></EndNote>[13]。图像增强可以突出图像中的某些信息,并抑制或去除其他不需要的信息,因此也可以在本实验中采用相关方法,突出有用的血管信息,抑制杂乱的背景信息。例如,可以采用直方图均衡化的方法来把原始图像的灰度直方图变换为均匀分布的形式,从而增加像素灰度值的动态范围,增强图像整体对比度。此外,Frangi滤波器是基于Hessian矩阵构造出来的一种边缘检测增强滤波算法,也是常用的血管增强方法之一ADDINEN.CITE<EndNote><Cite><Author>Frangi</Author><Year>2000</Year><RecNum>91</RecNum><DisplayText><styleface="superscript">[14]</style></DisplayText><record><rec-number>91</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614430307">91</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>A.F.Frangi,</author><author>W.J.Niessen,</author><author>K.L.Vincken,</author><author>M.A.Viergever,</author></authors></contributors><titles><title>Multiscalevesselenhancementfiltering</title></titles><dates><year>2000</year></dates><urls></urls></record></Cite></EndNote>[14]。2.2图像分类卷积神经网络模型图像分类问题一直是机器学习主流的研究方向之一。在分类任务中,经典的方法有基于信息熵原理的决策树算法、基于统计学贝叶斯原理的朴素贝叶斯算法、以及基于核函数的支持向量机(SupportVectorMachine,SVM)等。然而,传统方法需要花费大量时间人为手动选择和提取图像的特征,且近年来研究进展较为缓慢,到达了瓶颈期。自2012年Krizhevsky等人提出的AlexNet在ILSVRC图像分类比赛上取得当年冠军以来,深度学习开始迅速发展,且其中卷积神经网络(ConvolutionalNeuralNetwork,CNN)在图像分类任务中展现出了出色的结果。CNN是一种端到端的方法,它会自己学习输入图像的特征并据此分类ADDINEN.CITE<EndNote><Cite><Author>Yadav</Author><Year>2019</Year><RecNum>79</RecNum><DisplayText><styleface="superscript">[15]</style></DisplayText><record><rec-number>79</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614175151">79</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>S.S.Yadav,</author><author>S.M.Jadhav,</author></authors></contributors><titles><title>Deepconvolutionalneuralnetworkbasedmedicalimageclassificationfordiseasediagnosis</title><secondary-title>JournalofBigData</secondary-title></titles><pages>1-18</pages><volume>6</volume><number>1</number><dates><year>2019</year></dates><isbn>2196-1115</isbn><urls></urls></record></Cite></EndNote>[15]。2014年,VGGNet和GoogLeNet相继问世,分别获得了当年ILSVRC比赛的亚军和冠军,如今仍是非常经典的CNN结构。相比于Alexnet,VGGNet将所有卷积都替换为3*3大小,比起较大的卷积核能够捕获更有效的信息ADDINEN.CITE<EndNote><Cite><Author>K.Simonyan</Author><Year>2015</Year><RecNum>86</RecNum><DisplayText><styleface="superscript">[16]</style></DisplayText><record><rec-number>86</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614247332">86</key></foreign-keys><ref-typename="ConferencePaper">47</ref-type><contributors><authors><author><styleface="normal"font="default"size="100%">K.</style><styleface="normal"font="default"charset="134"size="100%"></style><styleface="normal"font="default"size="100%">Simonyan,</style></author><author><styleface="normal"font="default"size="100%">A.</style><styleface="normal"font="default"charset="134"size="100%"></style><styleface="normal"font="default"size="100%">Zisserman,</style></author></authors></contributors><titles><title>VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition</title><secondary-title><styleface="normal"font="default"size="100%">The3rdInternationalConferenceonLearningRepresentations(ICLR</style><styleface="normal"font="default"charset="134"size="100%">)</style></secondary-title></titles><dates><year>2015</year></dates><urls></urls></record></Cite></EndNote>[16]。GoogLeNet中提出了Inception模块,该模块采用多个大小不同的卷积核来提取不同尺度的特征再聚合,扩展了网络的宽度,可以获取丰富的特征信息ADDINEN.CITE<EndNote><Cite><Author>Szegedy</Author><Year>2015</Year><RecNum>85</RecNum><DisplayText><styleface="superscript">[17]</style></DisplayText><record><rec-number>85</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614247281">85</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>C.Szegedy,</author><author>W.Liu,</author><author>Y.Q.Jia,</author><author>P.Sermanet,</author><author>S.Reed,</author><author>D.Anguelov,</author><author>D.Erhan,</author><author>V.Vanhoucke,</author><author>A.Rabinovich,</author></authors></contributors><titles><title>Goingdeeperwithconvolutions</title><secondary-title>ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition</secondary-title></titles><pages>1-9</pages><dates><year>2015</year></dates><urls></urls></record></Cite></EndNote>[17]。同时,Inception模块首次采用1*1卷积来进行降维,大大减少了网络的计算量,目前Inception模块已拓展有四种不同模型。随着网络的加深,2016年何凯明团队提出了ResNet,设计了一种类似“短路连接”的残差模块,解决了梯度退化的问题,也获得了当年的ILSVRC比赛冠军ADDINEN.CITE<EndNote><Cite><Author>He</Author><Year>2016</Year><RecNum>87</RecNum><DisplayText><styleface="superscript">[18]</style></DisplayText><record><rec-number>87</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614247484">87</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>K.M.He,</author><author>X.Y.Zhang,</author><author>S.Q.Ren,</author><author>J.Sun,</author></authors></contributors><titles><title>Deepresiduallearningforimagerecognition</title><secondary-title>ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition</secondary-title></titles><pages>770-778</pages><dates><year>2016</year></dates><urls></urls></record></Cite></EndNote>[18]。为了追求分类准确度,很多网络发展得越来越深,模型也变得越来越大。然而,复杂而庞大的模型一方面可能面临内存不足的困境,无法灵活部署硬件,另一方面在某些任务或场景中难以满足实时性的要求,因此小而高效的CNN成为了一个新的热点研究方向,轻量化模型应运而生。2016年美国加州大学伯克利分校和斯坦福大学的研究人员提出了SqueezeNet,在模型表现不输Alexnet的情况下将模型大小压缩了510倍ADDINEN.CITE<EndNote><Cite><Author>Iandola</Author><Year>2016</Year><RecNum>88</RecNum><DisplayText><styleface="superscript">[19]</style></DisplayText><record><rec-number>88</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614260128">88</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>F.N.Iandola,</author><author>S.Han,</author><author>M.W.Moskewicz,</author><author>K.Ashraf,</author><author>W.J.Dally</author><author>K.Keutzer,</author></authors></contributors><titles><title>SqueezeNet:AlexNet-levelaccuracywith50xfewerparametersand<0.5MBmodelsize</title><secondary-title>arXivpreprintarXiv:.07360</secondary-title></titles><periodical><full-title>arXivpreprintarXiv:.07360</full-title></periodical><dates><year>2016</year></dates><urls></urls></record></Cite></EndNote>[19]。随后在2017年,Google的Andrew等人提出了另一种轻量化网络MobileNetADDINEN.CITE<EndNote><Cite><Author>Howard</Author><Year>2017</Year><RecNum>89</RecNum><DisplayText><styleface="superscript">[20]</style></DisplayText><record><rec-number>89</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614260811">89</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>A.G.Howard,</author><author>M.L.Zhu,</author><author>B.Chen,</author><author>D.Kalenichenko,</author><author>W.J.Wang,</author><author>T.Weyand,</author><author>M.Andreetto,</author><author>H.Adam,</author></authors></contributors><titles><title>Mobilenets:Efficientconvolutionalneuralnetworksformobilevisionapplications</title><secondary-title>arXivpreprintarXiv:.04861</secondary-title></titles><periodical><full-title>arXivpreprintarXiv:.04861</full-title></periodical><dates><year>2017</year></dates><urls></urls></record></Cite></EndNote>[20]。MobileNet的主要组成单元是深度可分卷积,这是将普通的卷积操作拆解成先分别对每一输入通道内部进行卷积、再用1*1卷积进行跨通道卷积的操作,由此在整体效果不变的基础上,可以大大减少计算量和模型参数量。MobileNet的模型表现可以比肩VGGNet和GoogLeNet,是到目前为止仍然最常用的轻量化网络结构之一。此外,常用的轻量化网络还有XceptionADDINEN.CITE<EndNote><Cite><Author>Chollet</Author><Year>2017</Year><RecNum>92</RecNum><DisplayText><styleface="superscript">[21]</style></DisplayText><record><rec-number>92</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614433217">92</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>Chollet,François</author></authors></contributors><titles><title>Xception:Deeplearningwithdepthwiseseparableconvolutions</title><secondary-title>ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition</secondary-title></titles><pages>1251-1258</pages><dates><year>2017</year></dates><urls></urls></record></Cite></EndNote>[21]和ResNeXtADDINEN.CITE<EndNote><Cite><Author>Xie</Author><Year>2016</Year><RecNum>102</RecNum><DisplayText><styleface="superscript">[22]</style></DisplayText><record><rec-number>102</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1620958911">102</key></foreign-keys><ref-typename="ConferenceProceedings">10</ref-type><contributors><authors><author>S.Xie,</author><author>R.Girshick,</author><author>P.Dollár,</author><author>Z.Tu,</author><author>K.He,</author></authors></contributors><titles><title>AggregatedResidualTransformationsforDeepNeuralNetworks</title><secondary-title>IEEE</secondary-title></titles><dates><year>2016</year></dates><urls></urls></record></Cite></EndNote>[22]等。由于医学图像需要专业医生对数据进行标注,因此数据集通常规模较小、且很难获得,给模型的训练造成了一定困难。由此,迁移学习被广泛用于医学图像的分类任务中。广州医科大学妇女儿童医疗中心的Kermany等人使用在ImageNet数据集上训练过的InceptionV3模型进行迁移学习,基于眼底光学相干断层成像(OpticalCoherenceTomography,OCT)图像来区分脉络膜新生血管和糖尿病性黄斑水肿,并框选出病变区域,最后达到了96.6%的准确率,甚至超越了两名人类专业医生的分辨准确率ADDINEN.CITE<EndNote><Cite><Author>Kermany</Author><Year>2018</Year><RecNum>81</RecNum><DisplayText><styleface="superscript">[23]</style></DisplayText><record><rec-number>81</rec-number><foreign-keys><keyapp="EN"db-id="t0vxtp2e825zpwerp2axvwz02p9rza5wdz99"timestamp="1614219642">81</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>D.S.Kermany,</author><author>M.Goldbaum,</author><author>W.J.Cai,</author><author>C.C.SValentim,</author><author>H.Y.Liang,</author><author>S.L.Baxter,</author><author>A.McKeown,</author><author>G.Yang,</author><author>X.K.Wu,</author><author>F.B.Yan,</author></authors></contributors><titles><title>Identifyingmedicaldiagnosesandtreatablediseasesbyimage-baseddeeplearning</title><secondary-title>Cell</secondary-title></titles><periodical><full-title>Cell</full-title></periodical><pages>1122-1131.e9</pages><volume>172</volume><number>5</number><dates><year>2018</year></dates><isbn>0092-8674</isbn><urls></urls></record></Cite></EndNote>[23]。印度可爱国际大学的Chouhan等人也利用迁移学习的思想,将AlexNet、DenseNet121、Inc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论