




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分类号 R737.9 单位代码 10006 学 号 10101035 毕业设计(论文)磁共振图像造影剂动力学曲线的定量描述在恶性乳腺癌鉴别诊断的应用 学院名称生物与医学工程学院 专业名称生物医学工程 学生姓名陈 宇 指导教师万 涛2014年 5 月25日磁共振图像造影剂动力学曲线的定量描述在恶性乳腺癌鉴别诊断的应用 陈宇 北京航空航天大学 北京航空航天大学本科毕业设计(论文)任务书、毕业设计(论文)题目:磁共振图像造影剂动力学曲线的定量描述在恶性乳腺癌鉴别诊断的应用 、毕业设计(论文)使用的原始资料(数据)及设计技术要求:原始资料: 我们的原始资料(数据)可以从癌症影像存档网站上下载。癌症影像存档(TCIA)是癌症医学图像的可下载用于研究目的的一个庞大且不断增长的归档。图像被归纳在一个集合里,主要是一些典型患者的研究焦点,例如常见的疾病(如肺癌),图像模态(MRI,CT等)。 TCIA每年都会收集大量的临床和影像研究,以保证记载的即时图像利于研究的各种用途。 技术要求: 第一,利用Matlab编程生成造影剂动力学曲线 第二,掌握曲线拟合数学模型,包括线性模型和非线性模型 第三,掌握图像分类基本方法,例如支持向量机分类法(Support Vector Machine Classifier) 、毕业设计(论文)工作内容:通过生成造影剂动力学曲线,对比良性和恶性乳腺癌动力学曲线,用曲线拟合模型描述曲线特征,能够有效的区分良恶性乳腺癌,从而提高诊断的准确度。 一、文献阅读 二、数据下载和整理 三、生成造影剂动力学曲线 四、曲线拟合模型描述曲线特征 五、区分良性和恶性乳腺癌动力学曲线 六、分类结果评判 七、撰写论文 、主要参考资料:1 El Khouli R H, Macura K J, Jacobs M A, et al. Dynamic contrast-enhanced MRI of the breast: quantitative method for kinetic curve type assessmentJ. AJR. American journal of roentgenology, 2009, 193(4): W295. 2 Macura K J O R, Jacobs M A B D A. Patterns of enhancement on breast MR images: interpretation and imaging pitfallsJ. Radiographics, 2006, 26(6): 1719-1734. 3 Moate P J, Dougherty L, Schnall M D, et al. A modified logistic model to describe gadolinium kinetics in breast tumorsJ. Magnetic resonance imaging, 2004, 22(4): 467-473. 4 Zheng Y, Englander S, Baloch S, et al. STEP: spatiotemporal enhancement pattern for MR-based breast tumor diagnosisJ. Medical physics, 2009, 36(7): 3192-3204. 5 Agner S C, Soman S, Libfeld E, et al. Textural kinetics: a novel dynamic contrast-enhanced (DCE)-MRI feature for breast lesion classificationJ. Journal of Digital Imaging, 2011, 24(3): 446-463. 生物与医学工程院(系)生物医学工程 专业类 101012 班学生 陈宇 毕业设计(论文)时间: 自 年 月 日至 年 月 日答辩时间: 年 月 日 成绩 指导教师: 兼职教师或答疑教师(并指出所负责部分): 教研室主任 注:任务书应该附在已完成的毕业设计(论文)的首页。 北京航空航天大学毕业设计(论文) 第 页本人声明我声明,本论文及其研究工作是由本人在导师指导下独立完成的,在完成论文时所利用的一切资料均已在参考文献中列出。作者:陈宇签字:日期:2014年5月25日 北京航空航天大学毕业设计(论文) 第 24 页磁共振图像造影剂动力学曲线的定量描述在恶性乳腺癌鉴别诊断的应用学 生:陈 宇指导教师:万 涛摘要我国乳腺癌发病率已跃居女性恶性肿瘤的首位,且发病年龄趋于年轻化,30岁后患病女性增多。早期发现、早期诊断、早期治疗是降低乳腺癌病死率的关键。针对这一问题,本文通过研究乳腺癌磁共振图像造影剂动力学曲线,采用动力学曲线特征描述良性和恶性乳腺癌在增强模式的差异,为有效的区分良性和恶性乳腺癌提供一种新的描述手段。首先,本文利用Matlab工具,采用多项式拟合模型对初始数据进行曲线拟合,尝试从低阶到高阶的多项式拟合,并比较拟合结果,生成造影剂动力学曲线。在生成造影剂动力学曲线的基础上,提取动力学曲线特征参数,为下一步图像分类做准备。接下来使用支持向量机(Support Vector Machines ,SVM)分类器,选取核函数并训练,把特征选择得到的造影剂动力学曲线参数组成向量输入到训练好的SVM分类器进行分类识别,从而区分良性和恶性乳腺癌。最后得到了分类结果的预测值,利用Matlab编程实现分类结果与真是结果的对比,查看分类准确度。分类准确度最低为0.5123,最高为0.7699。结果显示,6阶拟合后的数据分类准确度最高,效果最好。本研究通过生成造影剂动力学曲线,对比良性和恶性乳腺癌动力学曲线,使用曲线拟合模型描述曲线特征,利用支持向量机分类器分类,能够有效的区分良恶性乳腺癌,从而提高了诊断的准确度关键词:动力学曲线,多项式拟合,支持向量机The application of Quantitative description in the kinetic curves of contrast agent of Magnetic Resonance Image in the differential diagnosis of malignant breast cancerAuthor:Chen YuTutor:Wan TaoAbstractIncidence rate of breast cancer ranks first in women , and the age of onset tends to be younger, and female prevalence increased after the age of 30 . Early detection, early diagnosis ,and early treatment are the key to reducing breast cancer mortality. To solve this problem , this paper studies of contrast agent kinetics of breast MRI,and using kinetic curves describes the difference between benign and malignant breast enhancement mode in order to effectively distinguish the difference between benign and malignant breast cancer to provide a new description means .The Matlab tool and polynomial fitting model for the initial data curve fitting are used to try to fit from low to high order polynomial fitting and compare the results to generate a contrast agent kinetics . On the basis of the contrast agent kinetic curves , we generated on the extraction kinetics characteristic parameters to prepare for the next image classification. Next, using support vector machines (SVM) classifier select the kernel function and train ,and input the kinetics parameters to the trained SVM classifier for classification , which distinguish between benign and malignant breast cancer. Finally we got the predictive value of the classification results , and using Matlab programming for classification and comparison of the results we can see the classification accuracy. 0.5123 is the lowest classification accuracy , and the maximum is 0.7699 . The results show that the accuracy of data classification usingr six-order fits the best results .By generating a contrast agent kinetics curves, the study contrasts benign and malignant breast kinetic curves . Using curve fitting model to describe curves and using support vector machine classifiers , we can effectively distinguish the difference between benign and malignant breast cancer. Thus we improved the diagnosis accuracy.Key words:The kinetic curves, Polynomial fitting, Support vector machines目 录1.绪论11.1研究意义11.2研究现状分析32.研究方案72.1研究目标72.2研究内容72.3研究方案92.4研究创新点102.5研究可行性分析102.6预期研究结果103.研究过程113.1 数据整理113.2对比剂动力学曲线的生成123.3曲线拟合133.4曲线特征参数提取143.5良性和恶性肿瘤的区分153.6分类结果评判164.结论174.1 结论174.2 存在的问题174.3 展望18致谢19参考文献20附录221.绪论1.1研究意义乳腺癌是发生在乳腺腺上皮组织的恶性肿瘤。乳腺癌中99%发生在女性里,男性仅占1%。从全球范围来说乳腺癌的发病率在上升。但是,死亡率却在逐渐下降。到2010年,年新发病例数达到140万人左右。这是全球的乳腺癌发病的情况。在欧美国家,八到九个女性中,就会有一个是乳腺癌患者。乳腺癌的发病率非常高。乳腺癌死亡率的下降,主要是因为乳腺癌的普查。在健康人群当中进行普查,通过钼靶照相、MRI等手段发现早期乳腺癌是乳腺癌生存率提高的重要原因1。另外,乳腺癌诊治水平的提高,也使得乳腺癌死亡率逐步的下降。乳腺癌是疗效最佳的实体瘤之一。近年来,通过广大医务人员的努力,使乳腺癌的生存率不断的提高,早期乳腺癌十年生存率接近百分之八十。我国还是乳腺癌的低发国家。但是,我国乳腺癌的发病的增长速度比高发国家高1.2个百分点。所以总体状况也不容乐观。2002年,全国肿瘤防治办公室公布了,从1993年到97年,包括12个市、县乳腺癌发病的登记情况。从中发现,北京市和天津市乳腺癌的发病率都是十万分之33.7,上海市最高,是十万分之41.92。(公布乳腺癌发病的统计数据要等死亡登记出来以后,不断的调整数据,才能得到准确的数据。因此,需要的年限长。)另外,乳腺癌的发病率增长速度比较快。当然,乳腺癌的发病率的增长速度,与一个国家的发达程度等有关系,我国发达的大城市发病率比较高。另外,乳腺癌的发病还与遗传、环境、饮食结构等有关系3。乳腺癌的治疗以手术治疗为主。现在,乳腺癌的手术范围在逐渐缩小。原来切除整个的乳房,包括胸大肌、胸小肌,腋窝淋巴结的乳腺癌根治手术,逐渐向保乳手术衍变。腋窝淋巴结的解剖,也逐渐被腋窝淋巴结的取样所替代,当然这都是在有适应症的前提之下4。现在,在欧美国家,早期乳腺癌绝大多数都实施的是保乳手术的治疗。保乳治疗的效果和切除乳房是一样的。另外,乳腺癌的前哨淋巴结活检,也是近年来乳腺外科的研究热点。现在,可以通过前哨淋巴结活检来预测是否存在肿瘤转移,使前哨淋巴结阴性的乳腺癌患者免行腋窝淋巴结的清扫。前哨淋巴结有两种定位的方法,一种是以放射性核素作为示踪迹的前哨淋巴结活检5。示踪迹可以注射在肿瘤的周围,在手术当中用计数器探测放射核素,来找到前哨淋巴结,予以摘除。还有一种,是用蓝色染料作为示踪迹的前哨淋巴结活检。 另外,摸不到的乳腺癌,但是通过照像可以发现一些微小钙化,我们通过外科活检取出微小钙化,通过病理报告来确诊乳腺癌。我国乳腺癌发病率已跃居女性恶性肿瘤的首位,且发病年龄趋于年轻化,30岁后患病女性增多Error! Reference source not found.。早期发现、早期诊断、早期治疗是降低乳腺癌病死率的关键。晚期乳腺癌的治疗收效甚微,早期乳腺癌的预后通常是令人满意的。虽然乳腺并不是维持人体生命活动的重要器官,原位乳腺癌也并不致命,但由于乳腺癌细胞丧失了正常细胞的特性,细胞之间连接松散,易脱落。脱落后,游离的癌细胞会随血液或淋巴液播散全身,形成转移,危及生命。目前乳腺癌已成为威胁女性身心健康的常见肿瘤。由于患者对生活质量的重视,国人保乳手术逐年增加,术前对乳腺癌的准确分期、肿瘤多灶性或多中心性的明确、对侧乳腺的评估等,对患者治疗方案制定和预后评估至关重要。全球乳腺癌发病率自20世纪70年代末开始一直呈上升趋势。美国8名妇女一生中就会有1人患乳腺癌。中国不是乳腺癌的高发国家,但不宜乐观,近年我国乳腺癌发病率的增长速度却高出高发国家12个百分点。据国际癌症研究中心(International Agency for Research on Cancer,IARC)报告,2008年全球女性新发乳腺癌138万例,占女性恶性肿瘤发病的229;死亡46万例,占女性恶性肿瘤死亡的13.71。据国家癌症中心和卫生部疾病预防控制局2012年公布的2009年乳腺癌发病数据显示:全国肿瘤登记地区乳腺癌发病率位居女性恶性肿瘤的第1位,女性乳腺癌发病率(粗率)全国合计为42.55/10万,城市为51.91/10万,农村为23.12/10万8。乳腺癌已成为当前社会的重大公共卫生问题。自20世纪90年代全球乳腺癌死亡率呈现出下降趋势;究其原因,一是乳腺癌筛查工作的开展,使早期病例的比例增加;二是乳腺癌综合治疗的开展,提高了疗效。乳腺癌已成为疗效最佳的实体肿瘤之一。多数乳腺癌早期无明显临床症状,当临床发现时已多属中晚期。影像学检查能够发现临床无症状或隐匿的乳腺病灶,在乳腺癌的早期检出与诊断方面具有重要的作用。磁共振成像(MRI)具有良好的软组织分辨率及空问分辨率,而且无放射线损伤,对发现乳腺癌具有很高的敏感性,大大提高了乳腺癌的早期检出率和诊断符合率。目前,在乳腺磁共振中应用最多的方法是动态增强。动态增强磁共振甚至能发现几个毫米大小的乳腺病灶,其诊断乳腺癌的敏感性很高,在95100之间,但其特异性较低,各家报道不一致,范围在3797之间3。提高动态对比增强磁共振成像的特异性,是目前乳腺磁共振临床应用面临的重要问题之一。1.2研究现状分析乳腺癌是女性最常见的恶性肿瘤之一,我国原为乳腺癌低发病率国家,近年来随着生活水平的提高,发病率迅速上升,尤以大城市为著。2008年我国最新统计数据表明,乳腺癌发病率已经跃居为女性恶性肿瘤首位,其中又以高学历、迟生育、绝经晚的女性发病最多,且发病年龄越来越年轻化,严重危害女性健康和生命。早期发现、早期诊断、早期治疗是降低死亡率、改善预后的关键10。物理查体是最基本的肿瘤大小的测量方法,但是在实际工作中,这种方法的测量结果仍然与病理学的测量有较大差距。 这是因为在检查者的两指之间还存在着肿瘤表面的皮肤及其周围皮下组织。 在伴随着乳腺癌的同时也常存在结缔组织增生和乳腺结构的紊乱。 原发肿瘤的大小、外形、质地、部位等肿瘤本身的因素也是影响其准确性的重要因素。 因此高估了实际肿物大小。 另外肿瘤对四周组织的浸润程度是物理查体中产生差别的一个重要因素,与这方面相关的因素主要包括肿瘤的病理类型和肿瘤的大小。 如浸润性导管癌的蟹足样浸润最为明显,四周组织的水肿也越重,肿瘤越大,越是如此;而对于髓样癌而言,对四周组织的浸润作用很小。 反应在物理查体上,浸润性导管癌物理查体所得到的大小与病理学的差距最大,而以髓样癌的差距最小。影像学检查在乳腺癌的早期诊断中具有至关重要的地位,包括乳腺钼靶X线摄影、乳腺超声、乳腺PET扫描和其它乳腺成像技术11。现今在我国,最常用的方法就是钼靶X线射线及干板照相。钼靶X线射线的射线剂量小,致癌危险率接近自然发病率。干板照相得优点是对钙化点的分辨率高,但X线剂量较大。在乳腺内的一些细沙样钙化,对乳腺癌的早期诊断非常有突出的意义。乳腺的X线检查作为乳腺癌筛查的主要方法,发现很多零期乳腺癌(触摸不到肿块时的乳腺癌),零发现零期乳腺癌,及时的治疗还可以保留乳房,对乳腺癌的预后都有非常大的好处。通过X线照相,发现钙化点是确定早期乳腺癌的一个主要的方法12。我在前几年,分析研究了四百多例乳腺癌的钙化,通过手术前的X照相,术后标本的显微镜的检查,再结合病理诊断发现,四百余例乳腺细沙样钙化中有百分之三十是乳腺癌,百分之七十是乳腺增生,尤其是乳腺导管的非典型性增生。所以,乳腺的钙化不一定是乳腺癌。通过乳腺的X线检查发现乳腺的细沙样钙化,进而诊断出早期乳腺癌对临床非常有意义的,有非常大的特异性。另外,可以通过照片上肿块的密度、肿块的边缘、肿块和周围组织的界限等信息,判断肿块是良性的还是恶性的。乳腺癌的乳腺肿块,界限是不清楚的,质地是不均匀的。而乳腺的良性肿瘤,像乳腺纤维腺瘤的界限是非常清楚的,密度质地是非常均匀的。 同时,在X线照相发现细沙样钙化和肿块时,可以在X射线定位的情况下,立即用细针穿刺肿块吸引细胞,作细胞学检查,立即作出病理诊断,就可以对下一步的治疗方案提供依据。但是,乳腺的X射线照相对人体是有害,不能反复的进行13。乳腺钼靶X线摄影已经有90多年历史,其对发现临床早期乳腺癌和隐匿性乳腺癌的独特作用,引起国际上对乳腺钼靶影像技术和乳腺普查的极大关注,美国放射学会制定的乳腺影像报告和数据系统(BIRADS)统一了钼靶X线异常影像的评价体系和临床干预标准,为放射科医师和临床医师搭建了沟通的桥梁。但乳腺钼靶X线摄影在腺体非常致密的乳房中敏感性下降40以上,而且,对边缘清晰、光滑或显像模糊的恶性结节,诊断准确率偏低,需要其它影像检查方法来弥补它的缺陷14。超声检查是一种无损伤性检查,而且费用低廉,清晰显示肿块的大小、形态、边界及内部回声,并清晰显示内部血流情况,可以作为乳腺肿瘤的常规检查方法,甚至乳腺癌的普查。 其对于较明确的肿块大小界定准确,误差小。 同时其在乳房肿瘤大小测量中也具有一定的限制性。 通过本研究的结果来看,虽然在测量肿物的相等程度上超声高于 MRI,但是在低估和高估的病例中测量值与术后真实值之间差距较大。 尤其,肿物直径多在 2cm 以上15。 肿瘤的直径越大,超声波的测量结果与实际病理学的差距越大,这可能是因为肿瘤的直径超过了探头的视野因而无法测量。 另外,超声波难以穿透大肿瘤,肿瘤衰减明显,因而肿瘤的边缘不能清楚地显示,影响了肿物测量。早在上世纪50年代,A型超声就用于检查3mm大小的乳腺恶性肿瘤。现在,实时、高分辨率的B型灰阶超声,结合彩色多普勒(CDFI)、能量多普勒(PDI),能多切面观察致密型腺体内的囊实性肿块内部及边缘、血流供应、腋窝淋巴结情况,且无放射性损伤,尤其适用于年青女性的乳腺普查16。但超声对操作医师的经验、水平依赖性极大,对散在和成簇钙化灶的重现率差,导致对早期不典型乳腺恶性肿瘤检出率不高。上述两种检查方法成像技术手段优势互补,但对部分隐匿性及表现不典型的乳腺癌,仍有不同程度的检出缺陷,使得人们去改善和寻求新的成像技术。早些年间,常规影像学检查(主要为X线和B超)在乳腺癌的诊断中发挥了重要作用。但是由于它们的诊断原理不同,以及不同年龄的乳腺组织其结构特征不同(例如中青年女性乳腺腺体比较致密,而老年女性乳腺中脂肪成分较多),因此这些常规影像检查都有一定的缺陷。乳腺钼靶摄影是1990年到2000年左右在钨靶、钼靶、干板的基础上发展起来的一种新技术,具有x线球管小、操作简便、价格低廉、安全可靠、图像清晰、可显示出乳腺中微小肿块及钙化点,且对比度适宜等优点。在美国,应用乳腺X线摄影所检出的肿瘤中,75以上为小的和触诊阴性的病灶,使病人能够得到早期治疗,从而降低了乳腺癌的死亡率网17。虽然乳腺x线摄影对乳腺癌的检测非常有效,但它的敏感性和特异性较低,约515的乳腺癌不能由乳腺X线摄影检出18。对于恶性肿瘤而言,各种不同的测量方法中以 MRI 与病理学检查之间的相关性最好,两者之间的差距最小。 MRI 作为可手术乳腺癌术前评价肿物的 TNM 分期及不可手术乳腺癌辅助全身治疗后疗效评价的作用比较准确。但 MRI 检查费用昂贵,检查时间较长,同时有一定的限制性,如对于存在心脏疾病、体内有金属支架、心脏瓣膜及金属吻合器、金属植入物的患者等不能行 MR 检查。 在测量肿块大小时也存在一些可能导致结果不准确因素,如:乳房的形态对肿物的影响,体积较大的乳房由于俯卧位下垂明显,可导致其肿块大小的测量与其他体位的测量方式比有一定的误差。 同时应避免在检查时乳腺受压迫, 应处于自然形态下进行检查并行肿块测量。 同时肿物的测量应在动态增强的曲线峰值期相应图像上进行,这样才更准确。 对于增强形态为非肿块型的肿瘤,如斑点状强化、条索样强化、不规则强化,肿块的边界不好确定,这时所测得的肿物的大小误差较大。磁共振成像作为乳腺检查方法之一,在过去20年里,乳腺专用表面线圈和多种扫描成像序列都取得了巨大进步,国外很多文献报道了磁共振发现乳腺X线摄影、超声和临床检查阴性的隐匿性乳腺癌。尽管MRI检查乳腺恶性肿瘤的敏感性非常高,但特异性受到很多限制,因为良恶性病变很多表现乃至客观数据存在一定重叠。MRI对无明显肿块的早期乳腺癌和细小恶性钙化灶检出率亦不如乳腺X线摄影。如何综合应用多种影像诊断方法,充分发挥各种检查手段的优势,克服其缺点,优势互补,是乳腺影像诊断领域中一大热点。虽然乳腺MRI在诊断某些病变面敏感性及特异性也不高,而且对微小钙化很难发现,但是乳腺MRI具有良好的空间分辨率及软组织分辨率,其敏感性明显优于乳腺钼靶及B超,能对乳腺癌特别是小病灶,多发的、多中心病灶,以及乳腺深部病灶进行良好的评估,并且能准确估计病灶的大小、范围、淋巴结转移、及胸壁肌肉受累的情况5。乳腺MRI是目前诊断乳腺癌的较好的方法,多种磁共振技术联合使用可以提高乳腺癌诊断的准确率及特异性,实现乳腺癌的超早期诊断。动态对比增强磁共振成像(dynamic contrast enhanced magnetic resonance imaging, DCE-MRI)通过观察对比剂在病灶内随时间的动态变化以反应其血流动力学特征。DCE-MRI不仅在显示肿瘤形态学方面有优势,还可通过病变强化模式、血流动力学参数了解肿瘤微血管分布情况,判断肿瘤良恶性。对于乳腺癌的诊断,DCE-MRI具有非常高的灵敏度,但特异性适中。动态对比增强MRI已被广泛地用来改善乳腺病变特征中MRI的特异性。DCE-MRI分析的最广泛使用的形式是时间-信号强度曲线(即,动力学曲线)的评估,该曲线是由分类钆造影剂洗脱图案得到的Error! Reference source not found.。虽然近年来对造影剂动力学曲线在乳腺癌诊断的应用研究中取得了一定的进步,但由于造影剂的摄入过程非常复杂,如何能够定量准确的描述造影剂动力学曲线仍然是目前研究的热点问题之一。因此,本研究通过生成造影剂动力学曲线,对比良性和恶性乳腺癌动力学曲线,使用曲线拟合模型描述曲线特征,能够有效的区分良恶性乳腺癌,从而提高诊断的准确度。2.研究方案2.1研究目标通过研究乳腺癌磁共振图像造影剂动力学曲线,采用动力学曲线特征描述良性和恶性乳腺癌在增强模式的差异,为有效的区分良性和恶性乳腺癌提供一种新的描述手段。2.2研究内容本课题研究内容主要包括:1.曲线拟合数学模型,包括线性模型和非线性模型。所谓拟合是指寻找一条平滑的曲线,最不失真地去表现测量数据,用连续曲线近似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系的一种数据处理方法。在科学实验或社会活动中,通过实验或观测得到量x与y的一组数据对(xi,yi)(i=1,2,m),其中各xi是彼此不同的。人们希望用一类与数据的背景材料规律相适应的解析表达式,y=f(x,c)来反映量x与y之间的依赖关系,即在一定意义下“最佳”地逼近或拟合已知数据。f(x,c)常称作拟合模型 ,式中c=(c1,c2,,cn)是一些待定参数。当c在f中线性出现时,称为线性模型,否则称为非线性模型。我们将利用Matlab工具,采用多项式拟合模型,对初始数据进行曲线拟合,生成造影剂动力学曲线。2.采用特征选择方法发现重要动力学曲线特征。特征选择也叫特征子集选择 ( FSS , Feature Subset Selection ),是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化。特征选择是模式识别的关键问题之一,特征选择结果的好坏直接影响着分类器的分类精度和泛化性能。线性判别式分析(Linear Discriminant Analysis, LDA),是模式识别的经典算法,它是在1996年由Belhumeur引入模式识别和人工智能领域的。线性判别分析的基本思想是将高维的模式样本投影到最佳判别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。因此,它是一种有效的特征抽取方法。使用这种方法能够使投影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵最小。就是说,它能够保证投影后模式样本在新的空间中有最小的类内距离和最大的类间距离,即模式在该空间中有最佳的可分离性。在前面生成的造影剂动力学曲线的基础上,我们将用LDA算法进行模式识别,从而得到需要的动力学曲线特征。3.利用造影剂动力学曲线参数区分良性和恶性乳腺癌。支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(或称泛化能力)。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。简单地说,就是升维和线性化。升维,就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,甚至会引起“维数灾难”,因而人们很少问津。但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本集,在高维特征空间中却可以通过一个线性超平面实现线性划分(或回归)。一般的升维都会带来计算的复杂化,SVM方法巧妙地解决了这个难题:应用核函数的展开定理,就不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾难”。这一切要归功于核函数(Kernel Function)的展开和计算理论。核函数为了解决完美分离的问题,使SVM将原始数据映射到高维空间中去,直觉上可以感觉高维空间中的数据变的稀疏,有利于“分清敌我”。如果这种核函数选择得当,高维空间中的数据就变得容易线性分离了。而且可以证明,总是存在一种核函数能将数据集映射成可分离的高维数据20。应用特征选择得到的造影剂动力学曲线参数组成向量作为SVM分类器的输入向量进行分类识别,从而区分良性和恶性乳腺癌。2.3研究方案1.生成造影剂动力学曲线将在癌症影像存档(TCIA)网站上下载的原始数据作图处理,利用Matlab工具,采用多项式拟合模型对初始数据进行曲线拟合,尝试从低阶到高阶的多项式拟合,并比较拟合结果,生成造影剂动力学曲线。Matlab中的多项式曲线拟合函数:polyfit()调用格式:p=polyfit(x,y,n) ; p,s= polyfit(x,y,n)说明:x,y为数据点,n为多项式阶数,返回p为幂次从高到低的多项式系数向量p。矩阵s用于生成预测值的误差估计。2.曲线拟合模型描述曲线特征在生成造影剂动力学曲线的基础上,用LDA算法进行模式识别,从而得到需要的动力学曲线特征参数,为下一步图像分类做准备。3.区分良性和恶性乳腺癌动力学曲线使用SVM分类器,选取核函数并训练,把特征选择得到的造影剂动力学曲线参数组成向量输入到训练好的SVM分类器进行分类识别,从而区分良性和恶性乳腺癌。4分类结果评判分类精度评估(Accuracy Assessment):是将专题分类图像中的特定像元与已知分类的参考像元进行比较,实际工作中经常是将分类数据与真值、先前的试验舆图或其它数据进行对比的途径之一。通过对分类的评价,假如对分类精度满足,保存结果。假如不满足,可以进一步做有关的修改,或应用其它功能进行调整。把数据分类结果与该图像主人的真实情况对比,查看分类准确度。如果分类准确度过低,仔细分析实验原理和实验过程是否有误,并分析错误原因。2.4研究创新点造影剂动力学曲线是近年来新兴的能比较准确区分良性和恶性肿瘤的方法,为恶性肿瘤的判定提供了新的手段。造影剂动力学曲线,如时间-信号强度曲线,是由分类钆造影剂冲刷图案得到的。这些模式被分类为:I型,持续提高(逐行扫描),这是良性的暗示;II型,高原型,其具有恶性肿瘤为中级概率;III型,冲刷型,这表明是恶性肿瘤。2.5研究可行性分析本项目的研究方法和技术路线是可行的,其依据是:1.在假期阅读了大量相关中英文文献,选题是在充分阅读相关研究最新进展的基础上进一步确立的,选题依据充分。2.原始资料(数据)可以从癌症影像存档网站上下载。癌症影像存档(TCIA)是癌症医学图像的可下载用于研究目的的一个庞大且不断增长的归档。图像被归纳在一个集合里,主要是一些典型患者的研究焦点,例如常见的疾病(如肺癌),图像模态(MRI,CT等)。 TCIA每年都会收集大量的临床和影像研究,以保证记载的即时图像利于研究的各种用途。因此数据采集能保证,前期已经完成部分数据采集工作。3.曲线拟合部分已有文献报道,低阶到高阶具有一定差异,但是都可以得到预期的拟合结果。SVM分类器也已经有文献使用到乳腺的诊断中,如乳腺钙化点的检测,乳腺肿瘤的检测和识别Error! Reference source not found.,并获得了良好的效果,因此是可行的。4.硬件方面,实验室配有所需实验仪器,具备实验所需各种软件如Matlab等,并已经熟练掌握了其使用。5.时间安排上可以保证论文的完成。2.6预期研究结果达到正确分类良性和恶性肿瘤的目的(或正确认识到研究失败的主管和客观因素)。3.研究过程3.1 数据整理在进行具体实验之前,我们有必要把需要用到的数据进行整理,这样有利于我们后续试验的进行。原始数据图片示例如图1。图1 原始数据图片示例我按照良性与恶性病例的不同,将图片数量,每张图片包含的兴趣区像素数做了一个比较详细的统计,方便后面编程使用。所选数据包含良性和恶性病例各3例,总图片数为47张,兴趣区总像素数共计2935个。其中,良性病例图片共计24张,恶性病例图片共计23张;良性图片的兴趣区总像素数共计1368个,恶性病例的兴趣区总像素数共计1567个。在后面的支持向量机(svm)分类器构成时,保证了原始数据的对等。详细数据已在表1列出。表1 良性和恶性各3病例良性恶性图片数像素数图片数像素数第1例7272第1例7738第2例10674第2例7517第3例7422第3例93123.2对比剂动力学曲线的生成1.手动选择乳腺癌区域本研究所用乳腺癌图片如图2(左)所示。图一中红色小圈内包含的区域便是我们研究中用到的部分,该红色小圈为医生所标注,无需本研究人员自行寻找,首先应将该区域提取出来。为了提取该兴趣区,我们将采用matlab编程实现。图2(右)所示为兴趣区提取模板,我们利用matlab中的自带函数find进行对兴趣区的提取。调用格式为:r, c = find(f = 255); r代表行坐标;c代表列坐标。这样一来。我们便得到了原始数据的兴趣区坐标位置,方便以后的使用。图2 乳腺癌图片示例(左)与兴趣区提取模板(右)2.绘制对比剂动力学曲线上一步骤得到了兴趣区的坐标位置,我们将该坐标位置下的图片像素值提取出来,按照对比剂注射的时间顺序进行对比剂动力学曲线的绘制。绘制结果如图3所示。图3良性(左)与恶性(右)对比剂动力学曲线的绘制在图3中,横坐标代表对比剂注射的时间顺序,纵坐标代表该时间点所对应的图像的兴趣区像素值。为了与原始数据图像作比较,我们把部分原始数据的图像兴趣区位置的图片附到了对比剂动力学曲线上。由对比剂动力学曲线的走势可以得出,左图的走势显示为持续上升型(1型)曲线,对应了该良性病例。右图显示了该曲线为衰退型(3型)曲线,对应了该恶性病例。由此可见,图3显示出来的曲线类型正好对应了正确的病例,一定程度上说明了我们研究方向的正确性。3.3曲线拟合前文已述,polyfit函数的数学基础是最小二乘法曲线拟合原理,所得到的函数值在基点处的值与原来点的坐标偏差最小。调用格式:p=polyfit(x,y,n),x,y为数据点,n为多项式阶数,p为幂次从高到低的多项式系数向量。我们利用matlab工具中的polyfit函数将上一步骤得到的对比剂动力学曲线进行了3到6阶的拟合,拟合的阶数确定为3到6阶是因为低阶的拟合结果偏差太大,而过于高阶的拟合也会导致一定的偏差,且计算量也会增大,因此都被我们舍弃。拟合曲线的横纵坐标与图3中未拟合曲线的横纵坐标一致,在此不再赘述。拟合结果图像如图4所示。图4 良性(左)和恶性(右)3阶polyfit拟合结果拟合后图像比较拟合前更加圆滑,趋势也更加明显,由拟合曲线的走势可以得出,左图的走势显示为持续上升型(1型)曲线,显示为良性病例。右图显示了该曲线为衰退型(3型)曲线,显示为恶性病例。可见,图4显示出来的曲线类型也是对应了正确的病例,也从一定程度上说明了我们研究方向的正确性。4到6阶图像走势均与3阶图像类似,故在此不再赘述。3.4曲线特征参数提取利用polyfit函数拟合曲线后得到的拟合图像只能从走势上定性的得出良性与恶性肿瘤的判定,无法给出定量的结果,因此,我们还需要进行定量方法的步骤来确保研究结果的准确度和可信度。定量方法首先要确定乳腺癌的的特征参数。鉴于前面已经得到了利用polyfit拟合的曲线,我们决定以该曲线的特征参数来代表乳腺癌的特征参数。为了提取特征参数,我们采取matlab编程的方法,将拟合曲线的系数值进行提取。提取方法是,在上一步骤的基础上,定义一个总像素数为行数,拟合曲线系数为列数的零矩阵,用于存放拟合曲线的系数。然后将polyfit的n阶拟合结果系数赋给该零矩阵的特定位置,利用循环语句,直到把所有的曲线特征参数赋给零矩阵。循环结束,我们只需将得到的结果矩阵导出到Excel表格中,便完成了曲线的特征参数提取。曲线特征参数示例见表2。表2 良性与恶性3阶曲线特征参数示例3阶拟合特征参数(良性)序号3次项系数2次项系数1次项系数常数项1-1.3888915.67857-30.004712-1.0833311.27381-12.428657.285713-0.756.9880953.66666746.714294-110.11905-7.5238161.71429均值0.553717-11.733579.50322-5.569853阶拟合特征参数(恶性)序号3次2次1次常10.944444-15.071474.34127-5.142862-0.16667-2.3571443.309527.57142930.944444-16.428689.26984-15.714341.416667-20.964397.2619-14.8571均值0.817036-1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 4948-2025铝合金牺牲阳极
- GB/T 2941-2025橡胶物理试验方法试样制备和调节通用程序
- 2025年模具维修技师知识技能资格知识考试题与答案
- 装修市场专员培训
- 生产管理知识培训
- 资产采购管理培训课件
- 红旗车驾驶员培训:从盛夏酷热到金秋丰收的旅程
- 售后服务顾问培训体系构建
- 制定个人税务筹划的发展目标计划
- 运输合同终止协议范本
- 玉盘二部合唱简谱
- 【MOOC】救护与救援-福建农林大学 中国大学慕课MOOC答案
- 砂浆配合比标识牌
- 初生雏鸡的性别鉴定课件
- 钢筋笼加工检验流程图
- 全套电子课件:机械制造工艺基础(第六版)
- T∕CAME 1-2019 家庭式产房建设标准
- 善意的谎言辩论赛正反方观点
- QC新老7种工具表格
- 中科院《钢铁生产工艺流程和节能减排》
- 项目四:旅游电子商务支付与安全(教案)
评论
0/150
提交评论