_陈瑶_近红外光谱无创检测血糖浓度的初步研究_第1页
_陈瑶_近红外光谱无创检测血糖浓度的初步研究_第2页
_陈瑶_近红外光谱无创检测血糖浓度的初步研究_第3页
_陈瑶_近红外光谱无创检测血糖浓度的初步研究_第4页
_陈瑶_近红外光谱无创检测血糖浓度的初步研究_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、河 北 工 业 大 学毕业设计说明书作 者: 陈瑶 学 号: 080888 学 院: 电气工程学院 系(专业: 生物医学工程 题 目:近红外光谱无创检测血糖浓度的初步研究 指导者: 陈韵 讲师 评阅者: (姓 名 (专业技术职务2012年5月25日毕业设计(论文)中文摘要题 目 近红外光谱无创检测血糖浓度的初步研究摘要:血糖含量是评价糖尿病的重要指标,应用近红外光谱法有可能实现对人体血糖水平的无创伤检测。本文以葡萄糖水溶液作为样本,对无创血糖浓度检测的方法进行了初步试验研究。首先分析了葡萄糖水溶液近红外光谱检测的最佳波段范围,然后研究了光谱数据的预处理方法,最后对建立校正模型采用的化学计量学方

2、法进行了研究。选择了含有较多葡萄糖光谱信息的13001800nm作为全谱分析区域,采用多元散射校正(MSC的方法对光谱数据进行了预处理,并利用偏最小二乘的方法建立葡萄糖浓度预测模型。实验结果表明:相对于MSC处理前,PLS模型的实际预测偏差(RMSEP明显改善,RMSEP值由13.9982 mg/dl降为2.3391 mg/dl。这对于血糖浓度测量的研究具有一定的现实意义。关键词:血糖浓度;无创伤检测;近红外光谱法;多元散射校正;偏最小二乘法毕业设计(论文)外文摘要Title Study on Non-invasive Blood Glucose Measurement by Near-inf

3、rared SpectroscopyAbstractBlood glucose concentration is a key parameter to estimate diabetes. Non-invasive measurement of human blood glucose concentration may be realized by using Near-infrared (NIR Spectroscopy. In this paper, the preliminary experiment study by using the samples of glucose aqueo

4、us solution is tried. The best spectroscopy range for measurement is analyzed firstly. Then the pretreatment method of spectra is studied. And the chemomtrics method for establishing calibration model is discussed in detail at last. The spectra within 13001800nm, which containing more glucose absorp

5、tion information, are selected for analysis. Multiplicative Scatter Correction (MSC is chosen as the pretreatment method and Partial Least Squares (PLS method is used to establish the calibration model. The results show that the Root Mean Square Error of Prediction (RMSEP of the PLS model is reduced

6、 significantly after MSC pretreatment. The RMSEP merely reduced from 13.9982 mg/dl to 2.3391 mg/dl. It is instructive for the study of blood glucose measurement with NIR spectroscopy.Keywords:Blood glucose concentration;Non-invasive measurement;Near-infrared Spectroscopy;Multiplicative scatter corre

7、ction;Partial least squares method目 次1 绪论 11.1 无创检测人体血糖浓度的研究背景和意义 11.2 血糖检测方法的发展现状 21.3 近红外光谱法无创测量人体血糖浓度的特点 61.4 本论文主要研究内容和结构安排 72 近红外光谱检测技术的原理 82.1 朗伯-比尔定律 92.2 近红外光谱数据预处理方法 102.3 近红外光谱分析方法 123 近红外光谱血糖检测的初步实验研究 173.1 光谱分析波段的选择 173.2 多元散射校正(MSC对光谱数据的预处理 183.3 葡萄糖浓度预测结果及其分析 21结论 25参考文献 27致谢 291 绪论11

8、无创检测人体血糖浓度的研究背景和意义糖尿病是一种常见的内分泌疾病。它是由于遗传因素、免疫功能失调、精神因素和微生物感染等其它致病因子作用于患者机体,导致患者体内胰岛素含量绝对或者相对不足,进而引起体内糖、水、脂肪、蛋白质和电解质等多种物质产生代谢紊乱。在临床上糖尿病以高血糖为主要特征,大多数糖尿病人会表现出“三多一少”的症状,即多食、多饮、多尿、消瘦等。如果糖尿病病情一旦控制不好,会使人体免疫力下降,容易患上感冒、肺炎及肺结核等各种感染性疾病,并且有选择性地侵害、吞噬人体细胞,减弱体内抗癌细胞的防御机能,至使癌细胞活跃、聚集。同时糖尿病也会引发一系列并发症,主要表现为患者全身微循环出现障碍,包

9、括心脑血管疾病、微血管病变、视网膜病变、神经病变及慢性肾衰竭等,且都无法治愈。如果糖尿病患者的病情得到了很好的控制,就能够有效的降低罹患上述并发症的危险。目前,糖尿病患者的数量逐年递增,据世界卫生组织2011年的报告统计,全球糖尿病患者已超过3.66亿,估计仅2004一年就有340万人死于高血糖引起的疾病,而在低收入和中等收入的国家中,糖尿病患者的死亡率超过80%。中国的糖尿病发病率高达9.7 %,患者数量已超过五千万,居世界第二。从以上调查数据中可以看出,中国的糖尿病现状已十分严峻。由于大多数糖尿病患者的血糖浓度未达到理想的控制目标,容易引起相应的并发症,使糖尿病相关的医疗费用支出庞大。仅2

10、008年全球的血糖检测市场就高达68亿美元,可见糖尿病目前已成为一个严重的公共卫生问题1。鉴于糖尿病患者在临床表现中无明显症状,如果不对其进行血糖测量将很难分辨并确诊为糖尿病患者,等到患者出现相应症状时也已经引起了各种糖尿病并发症。因此在对糖尿病的诊断、控制和治疗中,患者血糖水平的高低起着十分重要的作用。医学界普遍认同通过对病人血糖值的控制,将其维持在一个安全的水平范围内,可以防止患者糖尿病病情的恶化,减少相应的并发症。世界卫生组织(World Health Organization也推荐对患有糖尿病的患者,采取血糖浓度的自我监测,随时的、连续的掌握体内血糖变化情况,实现精确管理血糖浓度值,调

11、整现行用药方案,这样才能较好的控制血糖浓度,对糖尿病的治疗及并发症的预防具有重要意义。目前,对糖尿病患者血糖浓度的监测一般是采取有创或微创法进行检测。这两种方法都需要采集患者血样,不仅容易对患者造成各种体液传染性疾病的传播,给患者带来痛苦和不便,而且较高的检测费用也限制了血糖检测的频率。由于无法随时、连续的掌握患者体内血糖浓度的变化情况,医生难以对患者实现理想的治疗和管理。因此,研究一种无创伤血糖浓度检测的方法,具有十分重要的社会和经济意义:(1)无痛、无感染,减少患者采血时的痛苦和不便;(2)可以提高患者检测血糖的频率,从而精确控制血糖浓度值;(3)可以取代有创检测技术,不仅减少对材料的耗费

12、,降低患者测量血糖的费用,而且能降低对环境的污染;(4)有助于对糖尿病患者的治疗及并发症的预防,加强患者的日常健康管理,提高生活质量;(5)它由多学科交叉发展,结果将带动光谱技术、化学计量学分析技术、数据处理技术的发展,其各种研究成果也可推广运用于人体内其他化学成分的无创检测。12 血糖检测方法的发展现状现行血糖浓度测量仪器分很多种,按照检测时患者受创伤的程度可以分为有创伤的检测仪,微创伤的检测仪和无创伤的检测仪2。其中,有创检测方式是血糖浓度检测的传统方法。该方法是从被测者体内抽取血液,然后应用一次性试药通过生化的方法来实现。有创检测虽然测量结果非常精准,但是它采血量多,通常需要300050

13、00微升;化验时间慢,一般第二天才能得到结果;程序操作复杂,只有受过专业培训的人才能进行操作;机器价格昂贵,测试费用高。这些缺点使得有创检测不仅容易造成各种体液传染性疾病的传播,给病人带来痛苦和不便,而且也限制了检测血糖的频率,无法满足对患者血糖浓度的实时、长期、连续性监测。采用微创检测方式如图1.1所示,是先用装有采血针的采血笔对病人手指进行采血,将血液滴于血糖试纸上,然后将试纸插入血糖检测仪,血糖仪会在几秒至几分钟的时间内显示出患者的血糖值。与有创检测方法相比,微创检测方法可以实现微量的、快速的采血过程。目前,已取得各国政府管理机构认证的商品化的血糖监测仪绝大多数都是微创伤的检测方式。其中

14、,强生、罗氏、拜耳、雅培利舒坦等医疗器械企业生产的血糖仪销量较好。2007年,仅拜耳一家企业在大中华地区的血糖仪销售额就为18亿欧元。尽管微创检测方法具有稳定可靠、采血量少、经济方便等优点,尤其对那些需要连续多次血糖监测的病人,可减轻多次采集静脉血造成的痛苦,能够比较准确的测得血糖值,但是采血造成的微痛感和创伤点仍然不利于患者进行频繁的自我监测,难以对患者实现理想的治疗和管理。图1.1 微创血糖检测仪由此可见,实现人体血糖的无创伤快速检测具有非常重要的意义。无创检测血糖的方式如图1.2所示,该方法不需要对患者进行采血,只需将具有一定波长的光照射在患者手掌或其他身体部位的表面,再根据返回光束的细

15、微变化进行相应计算,来得出患者的即时血糖值、血氧量、脂肪比等信息。相对于有创和微创检测技术,无创检测不仅具有无痛、无感染,测量快速、测量简单等优点,还可以降低血糖测试费用、改善现行用药方法、精确监控血糖3-4,也为闭环式胰岛素泵人工胰腺提供重要保证,是血糖检测技术发展的方向5。然而到目前为止,还没有出现与有创检测方法精度相当的无创检测方法的报道及专利6。图1.2 无创血糖仪系统示意图由于无创血糖浓度测量的重要科研价值和广泛的社会意义以及潜在的经济效益,近几十年来一直是国际学术界的热点研究之一。多家科研机构及公司,针对无创血糖浓度检测技术进行了持续而深入的研究,并不断取得阶段性成果。上世纪70年

16、代,美国的Jobsis7和德国的Kaiser8开始尝试用光学方法对人体成分进行测量。这个时期对无创血糖浓度检测技术的研究主要聚集在尝试各种检测方法及申请专利上,如光的折射及偏振、眼底吸收等等,其中眼底吸收测量由于实现难度较大,研究人员较少,实验设施有限等原因,研究进展的报道很少。而最有希望的方法是由Dähne于1987年首次提出的运用近红外分光原理进行人体血糖无创伤检测的方法,并申请了专利。随着化学计量方法和计算机技术的飞速发展,无创血糖研究在19901998年迎来了高峰期,主要以近红外散射和透射检测为主。而近十年来无创血糖检测的研究主要以近红外漫反射为主,并不断产生了一些新的方法,

17、如OCT技术等。无创检测血糖浓度的发展动态大致可以分为如下三个阶段:第一阶段主要在19841995年,为较封闭的独立研究阶段。由于血糖无创检测的巨大市场前景和潜在经济效益,出现了多家热衷于仪器开发和专利申请的高科技公司。如Futrex公司在1992年的Oak-Ridge会议上,首次展出了第一台利用光吸收原理制成的血糖无创测量产品样机。Biocontrol公司的样机Diasensor 1000型无创血糖仪在1996年获得了CE认证(欧洲市场安全认证标志)9。但由于开发的仪器对被测对象复杂、测量环境不稳定等所带来的基本问题重视不足、研究不够,不能满足临床精度的要求,使得仪器均未通过美国食品及药物管

18、理局(FDA的认证,很多课题组基本上已停止了对本项目的研发。第二阶段主要在19962005年,为合作研究阶段。九十年代中后期,发达国家逐渐认识到血糖无创检测课题的难度,开始以国家项目基金的形式支持相关科研研究。如2000年日本在经济产业省的支持下,成立了包含松下电工、东京工业大学、北海道大学等多家研究单位构成的项目组,投资六亿四千万日圆10。德国多特蒙德光谱化学研究所,在Heise教授的领导下,运用中红外光谱的原理,进行反射式测量,从人体口腔粘膜处获取血糖信息11。桑迪亚国立实验室与新墨西哥医科大学Haland研究组,采用透射式方法进行近红外光谱无创检测血糖浓度的研究。美国Iowa大学由M.

19、A. Arnold领导的无创血糖研究组和Ohio大学Small研究组从1992年开始得到NIDDK(美国糖尿病、消化和肾脏疾病国家研究所)和NIH(美国国家卫生研究所)的连续资助,旨在研发一种基于近红外光谱原理的连续血糖浓度测量系统,来对糖尿病患者进行治疗和管理。在2007年,该研究组又获得 96.7万美元的联邦基金资助,该小组已经在血糖无创检测领域坚持研究达30年之久12-13,具有雄厚的研究基础和经验。但由于没有攻克近红外血糖无创检测技术面临的一些关键难题,研究基本上在可预见的时间内难以实现突破,目前还不能达到可以临床应用的目标。随着研究的不断深入,人们也逐渐淘汰了一些光学方法,如穿透能力

20、浅的中红外法、测量能量不易被接受的拉曼法、信号异常微弱的光声法等,并将血糖无创检测的希望重点寄托在能深入传播到组织内部的近红外反射光谱方法上。第三阶段主要在2006至今,为方法创新阶段。比如以色列的OrSense公司生产的仪器,是对被测对象施以外界压力以阻断血流,在动态过程中实现精确测量,该仪器已于2007年得到欧洲的CE认证。新加坡的Health stat公司,运用新型长波激光器,尝试对指尖进行透射的测量。在NIH的资助下,美国的InLight Solution公司,研究出能够从皮肤上识别出与血糖浓度变化密切相关的特定解剖区域。澳大利亚的AiMedics公司14、韩国的Samsung公司15

21、等也已经在这方面进行了大量的基础性研究。我国在这方面的研究虽然起步较晚,主要以大学的科研为主,资金来源于国家或省部级基金资助,但目前也已经有数个研究小组运用近红外光谱对人体内无创血糖检测技术进行了深入的展开。如中国医科大学的沙宪政、清华大学的丁海曙在近红外无创血糖浓度检测技术方面进行了大量基础性研究。西安交通大学的王炜设计出近红外多波长传感器阵列,可以在全血中进行血糖检测。北京大学的吴瑾光研究小组运用中红外检测方法对人体血糖的无创测量进行了研究。华中科技大学的骆清铭设计出近红外三波长的血糖浓度检测系统。中科院长春光机所的张洪艳运用近红外光谱系统对手腕进行了血糖检测。天津大学精密测试技术及仪器国

22、家重点实验室的徐可欣,把在国外八年的无创血糖测量研究经验带回国。该团队在多项国家自然科学基金和科技攻关等项目的资助下,利用近红外光谱技术在血糖无创检测方面进行了大量的、系统的研究。从2000年至今,已研制出四套无创伤血糖浓度测量系统和具有自主知识产权的样机,通过多例临床研究取得的经验,在AOTF分光系统设计、背景影响的消除、测量条件的把握等多个方面获得了诸多研究结果,并申请了国家发明专利及国际专利16-18。目前,针对血糖无创检测的研究主要有两个趋势:一个是以微创伤的血糖检测逐渐替代有创伤的方法。随着微机电系统(MEMS技术的不断发展,传感器有可能做得更为精小,但它仍需要消耗材料,对患者成一定

23、程度的创伤。目前,已经有仪器通过了美国FDA的许可认证,但仍有很多限制。如美国Cygnus公司研发的微创血糖仪只针对年龄在18岁以上的成年人,并且血糖仪在使用者出汗、低血糖或手臂过于劳累时无法正常工作。因此,用微创检测方法代替有创检测只能作为一个过渡方案,是无创血糖检测技术成功之前的一个有益补充。而另一个趋势就是坚持无创伤血糖测量方法的研究,它需要在测量方法上进行创新。也正是因为无创血糖测量包含十分重要的科学意义、社会价值和经济利益,各国政府从未放弃对该项技术的支持,在不断积累测量经验的基础上研究人员正在对新的测量原理和方法进行研究。13 近红外光谱法无创测量人体血糖浓度的特点近红外光谱技术之

24、所以能够在短短的十多年内有着如此迅速的发展,主要是因为它对有机化合物的分析测定方面有着以下独特的优越性。(1)近红外谱区内光散射效应大,穿透深度强。因此可以用漫反射技术对样品进行直接测定。(2)近红外区域的倍频及合频吸收系数很小,因此无需用溶剂稀释样品就可以直接测定,使分析过程简化,分析成本降低,便于实现生产过程的实时测定。(3)可以得到精度很高的定量结果,也可以对样品进行定性分析。(4)不破坏样品,不污染环境。近红外光谱分析只需取得样品的光谱信号,不会破坏或消耗样品本身。因此在对活体生物组织的测量中,利用近红外光谱技术可以实现真正意义上的无创伤测量。(5)测定速度快,分析效率高。一般一个样品

25、取得近红外光谱数据后,通过建立好的校正模型可快速对样品的化学成分作出定量或定性的分析,整个过程可以在12分钟内完成。正是由于近红外光谱的这些优点,使得它在无创血糖检测技术中具有无创无痛、检测速度快、分析效率高、分析成本低、测试重现性好等特点,被认为是最有应用前景、能较好实现的无创血糖检测技术之一,已成为当前国内外研究的热点课题,也是目前各种无创光谱检测中投入研究最多的技术之一19-20。目前,虽然采用近红外光谱法进行血糖无创测量是血糖浓度检测技术最好的发展方向,但就当前研究现状而言仍存在一定的技术难点,这其中包括如何提高检测器件的灵敏度、消除各种噪声造成的干扰、减小被测个体差异和测量条件的影响

26、措施、从各种相互重叠的光谱中获取微弱的血糖浓度信息(包括多波长测量和数据分析方法等。只有解决这些问题,近红外光谱无创血糖检测技术的研究才能取得突破性的进展,实现真正的临床应用。14 本论文主要研究内容和结构安排本论文的具体内容及结构安排如下: 1. 第一章为绪论介绍了无创血糖检测的一些相关基础知识,包括糖尿病基本常识及其现状、血糖基础知识;阐明了无创检测人体血糖浓度研究的背景和现实意义;综述了现行血糖浓度检测方法,包括有创、微创、无创三种方法;重点表述了运用近红外光谱法进行血糖浓度无创检测的研究现状和特点;概括了本论文的主要研究内容及结构安排。2. 第二章为近红外光谱检测技术的原理介绍了近红外

27、光谱的产生及光谱特点,本课题的研究思路;介绍了近红外光谱测定物质浓度的理论依据:朗伯-比耳吸收定律;综述了多种近红外光谱数据预处理方法,本课题将采用多元散射(MSC方法对光谱数据进行预处理;阐明了近红外光谱分析中用到的化学计量学方法,重点介绍了本课题用到的偏最小二乘(PLS法及建模评价方法和评价参数;概括了近红外光谱无创血糖检测的步骤。3. 第三章为近红外光谱血糖检测的初步实验研究通过对比纯水及葡萄糖在13002500nm谱区的吸收带,明确各自吸收峰的位置,分析水的吸收对建模精度的影响。选取不同的光谱波段进行建模,比较各模型预测能力,对近红外光谱波段进行合理选择;分别对校正集中样品进行异常值剔

28、除和多元散射(MSC预处理,然后进行建模,并比较RMSEP和Corr值的变化,分析讨论两种方法优劣;对验证集中样品葡萄糖浓度的预测结果进行分析讨论。2 近红外光谱检测技术的原理近红外(Near-infrared,NIR谱区是指介于可见光区(VIS和中红外区(MIR之间的电磁波,是人们最早发现的非可见光区域。根据美国试验和材料协会(ASTM规定,近红外光谱的波长范围为700nm至2500nm(波数即12800cm-14000cm-1,其中近红外短波为7801100nm,近红外长波为11002500nm。近红外光谱主要是由含有C-H、N-H、O-H等键基团的化合物在中红外光谱区基频吸收的倍频、合频

29、和差频吸收带相叠加而形成的。该光谱吸收频率特征性强、频带宽和吸收较弱、受分子内外环境的影响小。由于不同或同一基团,处在不同的化学环境中,对近红外光的吸收波长与强度会有明显差别。因此近红外光谱中含有丰富的结构和组成信息,可反映分子中所含氢的振动信息,其信息量远大于其它谱区21,已经成功应用于石油、化工、医药、烟草等行业的分析中22-23。众多相关研究结果表明,由于葡萄糖的分子结构中包含有多个均能够在近红外光谱区产生吸收的主要含氢官能团,如C-H、N-H、O-H基团,这些含氢基团在近红外谱区的样品光谱特性稳定。并且体液和软组织在近红外区域相对透明,因此光对其穿透力强,而该波段的光对葡萄糖的穿透能力

30、较弱,所以采用近红外光谱无创测量血糖浓度在原理上是可行的,并且多种模拟样品的实验结果都证明了该方法的有效性。但是,近红外光谱无创测量人体血糖要达到稳定可靠的临床运用仍需对某些关键的基础问题进行深入的研究。在近红外光谱无创血糖浓度检测技术中,对血糖进行定量分析的关键是建立光谱数据和血糖浓度之间的精确对应关系。本课题将基于现代化学计量学理论,对光谱仪采集到的样品的近红外光谱和成分浓度进行关联建模。其中近红外光谱仪、化学计量学软件和应用模型缺一不可,只有将三者进行有机的结合,才能够满足快速分析的技术要求。选取一组具有代表性的、已知葡萄糖浓度的样品作为校准集,测量其近红外光谱,建立近红外光谱与葡萄糖浓

31、度之间定量的数学校正模型,并利用该校正模型对预测集样品的近红外光谱进行计算,从而得到该样品的葡萄糖浓度,从而为实现近红外光谱对葡萄糖浓度的无创检测进行前期的实验研究。在该方法中,正确建立校正模型是准确分析未知浓度的预测集样品的前提,对样品采集波段的选择直接影响校正模型建立的效果,对光谱数据进行相应的预处理和所采用的化学计量学方法是提高信噪比,获得好的分析结果的关键。21 朗伯-比尔定律近红外光谱技术是根据样品对某一谱区光的吸收强度与吸光粒子(低能态的分子或原子)之间的关系,并结合样品中的吸光粒子数与样品粒子总数的关系来定量的。测定样品物质浓度的理论依据是朗伯-比耳(Lambert-Beer吸收

32、定律24: (2.1式(2.1中A为被测样品对特定波长光的吸光度,I0与I分别为入射光强度和出射光强度,ai为第i种吸收物在对相应波长光处的吸光系数(波长的函数,n为溶液中物质的成分数,为波长,Ci为相应吸收物的浓度,L为光在相应吸收物中的光程长。根据朗伯-比耳吸收定律可知,样品的吸光度与样品的成分浓度之间具有较好的线性相关性,所以样品成分浓度的变化会引起相应的光谱特征吸收的变化。近红外光谱数据分析的过程如图2.1所示。图中对校正集的样品光谱A0和成分浓度C0进行关联,通过化学计量学的方法建立校正模型。所建模型的可靠程度用预测值和化学测定值的相关系数和相对标准偏差来衡量,然后用稳定可靠的校正模

33、型和预测集样品(未知浓度的样品)的光谱信息A1即可预测得到预测集样品的成分浓度C125。所以,对近红外光谱的数据分析通常由以下三部分组成:校正集样品(建模样品的光谱波段选择及光谱数据的预处理、校正模型的建立、预测集样品浓度的预测。实际运用中,对近红外光谱的数据分析都是通过化学计量学软件实现的。成分浓度C1图2.1 近红外光谱数据分析过程22 近红外光谱数据预处理方法由于近红外光谱的特征峰差别不明显,检测到的光谱信号除了包含样品的待测成分信息外,还包括各种仪器噪声,如基线漂移、杂散光、高频随机噪声、样品背景等,使得近红外光谱数据分析大致有一半的误差来自于建模数据。因此在运用关联算法建立校正模型前

34、,还需要通过对光谱数据进行合理的预处理。将有用的分析信号与仪器噪声分离,改善分析信号的质量,恢复被扭曲的分析信号,滤除噪声,消除随机误差等各种干扰因素对光谱信号提取的影响,进而提高性噪比,优化建模数据。常用的近红外光谱数据预处理方式包括:光谱平滑(smoothing、光谱求导(derivation、光谱归一化、多元散射校正(MSC、傅里叶变换(FT和小波变换滤波(WT26等。光谱数据的平滑:平滑是一种常用的信号或数据预处理方法。它的基本思想是在平滑点的前后各取若干点来进行“拟合”或“平均”,以此求得平滑点的最佳估计值,然后连接成平滑的曲线,消除随机噪声。对光谱数据进行平滑处理可以消去数据中由随

35、机误差引起的较小的偏离,保留能反映被测对象特征的较大偏离部分,消除仪器或者其他变量所引起的噪声。光谱平滑的本质是对光谱曲线进行低通滤波,平滑高频噪声,提高光谱信噪比。但对光谱数据进行平滑处理不会加入额外的有用信息,并且在某些时候,平滑还会引起某些信号失真。常用的信号平滑方法有Savitsky-Golay法、移动窗口平均法、厢车平均法。光谱求导:导数法可以减弱背景干扰或者消除基线漂移的影响,分辨重叠谱峰,提供比原光谱更高的灵敏度和分辨率。光谱求导可分为一阶导数、二阶导数、高阶导数等。由于随机噪声一般都是高频信号,光谱求导后噪声可能进一步被放大,使光谱信噪比降低。因此在对光谱进行求导前,要求原光谱

36、有很高的信噪比或者应先对光谱进行平滑处理。光谱归一化:设定所有的数据向量长度相同,且每个数据向量中各元素的平方和相似,令向量为单位面积或者单位长度。对光谱数据进行归一化可以很好地消除一组测量中的随机误差,提高建模精度。多元散射校正(Multiplicative Scatter Correction,MSC:是现阶段对多波长光谱数据建模常用的一种处理方法,由Martens27等人首先提出。由于样品的散射程度与所选的测量光谱的波长,样品的颗粒度和折射率等物理性质有关,因此对整个光谱而言,在不同的波长点处散射强度的不同,对光谱的影响也不相同。采用多元散射校正的方法对光谱数据进行预处理,能尽可能消除散

37、射效应对光谱的影响,增强与样品成分含量相关的光谱吸收信息。该方法首先要建立一个待测样品的光谱,该光谱的变化与样品中成分的含量满足直接的线性关系,然后以该光谱为标准,对其它所有样品的近红外光谱进行修正。算法如下:计算所有样品光谱的平均光谱: (2.2将每个样品的光谱与平均光谱进行线性回归,求得回归系数mi、bi: (2.3 多元散射校正: (2.4式(2.2、(2.3、(2.4中为平均光谱,Ai为第i个样品的光谱,i=1,2,.,n,n为样品数目,mi和bi分别表示各样品的近红外光谱Ai与平均光谱进行一元线性回归后得到的斜率和截距。 傅里叶变换(FT:FT变换法可以实现光谱多通道测量的变换,从变

38、换角度来看,傅里叶变换是基于三角函数。其变换的本质是把原光谱分解成为许多不同频率的正弦波的叠加和,实现时域函数与频域函数之间的转换,其中时域函数能给出重叠波谱振幅的信息,频域函数能给出各个波频率方面的信息。然后通过压缩光谱数据使信息的提取更为方便有效,同时进行滤波处理,去掉干扰信号和噪声,提高性噪比。目前,傅里叶变换作为一种强有力的分析数据处理方法,在分析仪器和方法中得到了广泛的运用。小波变换滤波(WT:WT是近年来在国际上掀起热潮的一个前沿领域。小波变换的思想与傅里叶变换相似,只是小波变换中“窗口”的大小可以随着频率而变化。与傅里叶变换相比,小波变换的基函数为分析小波,具有时-频局部化特性,

39、可以按照不同的分辨率将原光谱分解成一系列不同频率的块信号。本课题将采用多元散射校正(MSC的方法对葡萄糖水溶液的近红外光谱数据进行预处理。23 近红外光谱分析方法由于近红外光谱峰较宽,光谱信息中除了血糖以外还包含其他物质的吸收光谱,这使得近红外光谱各组分的谱带严重重叠。如果用单波长光谱数据建立校正曲线将难以提取出足够多的有用信息,所建模型必将产生较大的误差,因此必须利用多波长甚至全谱的光谱数据建立校正模型25。本课题将基于化学计量学中多元统计的方法从光谱数据中提取相关信息,对近红外光谱无创测量血糖浓度进行研究。化学计量学(Chemometrics的发展,经历了日趋成熟的过程。作为一门新兴的多交

40、叉学科,化学计量学在实验设计、数据处理、信号解析、化学分类决策及预报等方面具有很大的优势,能够解决传统研究方法难以解决的复杂问题。它能综合应用数学、统计学、计算机科学等手段和方法,设计和选择出最优测量程序和实验方法,对化学测量数据中提取到的信息进行各种处理和分析,以最大限程度地获得有关物质的成分、结构和其他相关信息。化学计量学处理问题的一般步骤如图2.2所示,问题提出后,制定采样计划同时设计实验内容及步骤,选择其中最优的实验方案进行问题的分析和处理;对实验数据进行处理,提取其中信息,通过不断的模拟进行最大程度的分析、优化信息;对信息进行合理解释,得出结论。信息解释图2.2 化学计量学问题的一般

41、步骤化学计量学研究的内容包括:统计学和统计方法;采样理论;实验设计、选择与优化实验条件;信号处理(包括校正理论)和数据分析;人工智能和专家系统;人工神经元网络与自适应化学模式识别等。其中化学计量学中的多元统计分析(即多元校正,多变量分析)是现代统计学应用中十分活跃的一个分支。它是通过对多个随机变量观测数据进行分析,运用数理统计的方法,来研究多个随机变量之间的相互依赖关系以及内在统计规律性的一门统计学科。在处理实际问题中,很多随机现象涉及到的变量不只是一个,而经常是多个,并且这些变量之间又存在一定的联系。多元统计分析就是讨论多元随机变量的理论及统计方法的总称,其内容既含括对一元统计学中某些方法的

42、直接推广,也包含多元随机变量特有的一些问题,因此多元统计分析是一类包含范围很广的理论和方法。运用多元统计分析可以解决如下问题:简化分析对象的测量数据结构,用简单的方法形象地表示所研究的复杂对象。降低复杂体系测量数据的维数,将相互依赖的变量转换成独立的变量。按测量性质把涉及到分析对象进行分类或对各种变量进行分组并分析变量之间的相互关系。另外,多元统计分析也包含提高性噪比、提高测量精密度、改善分析选择性、拓宽应用范围等内容。 常用的多元统计方法主要有:多元数据图表示法、主成分分析、聚类分析、判别分析、因子分析、对应分析、回归分析、路径分析、典型相关分析、偏最小二乘回归分析等28。基于偏最小二乘法能

43、够用较简单的数学模型找出和描述复杂的数据矩阵之间重要及有效的内在联系,且计算方法简单,不会出现其它方法在计算中的收敛发散问题。所以本课题将采用多元统计分析中的偏最小二乘回归法(PLS,从近红外光谱数据中提取分析样品的浓度信息,建立稳定可靠的校正模型,实现对预测集样品的近红外光谱分析。偏最小二乘法(Partial Least Square,PLS是一种稳健的化学计量学方法。由于PLS是对变量系统中的信息进行筛选,能有效地区分系统的信息和噪声,防止过度拟合,提高系统模型的准确性29。因此PLS特别适合于解释变量数目多且存在着多重共线性,样本观测数目少且干扰噪声大的情况,目前在近红外光谱分析领域中使

44、用较多、效果较好。PLS将因子分析和回归分析相结合,通过因子分析将光谱(多维空间数据,维数相当于波长数目)压缩为较低维的空间数据,其方法是将光谱数据向协方差最大方向进行投影。将原光谱分解为多种主成分光谱,不同近红外光谱的主成分分别对应不同因素和组分对光谱的贡献,通过对主成分的合理选取,即对变量系统中的信息进行新的综合筛选,去掉代表干扰因素和干扰组分主成分,仅选取有用的主成分进行回归建模30,进一步提高了方法的可靠性。具体来说,在使用PLS回归法进行建模分析时,其原理25可分为以下两步,第一步为矩阵分解,其模型为:Xn×p=Tn×fPf×p+EX (2.5Yn

45、15;m=Un×fQf×m+EY (2.6式(2.5、(2.6中Xn×p为光谱矩阵,Yn×m为浓度矩阵,Tn×f和Un×f分别为Xn×p和Yn×m的得分矩阵,Pf×p和Qf×m分别为Xn×p和Yn×m的载荷(即主成分)矩阵,EX和EY分别代表用PLS模型拟合Xn×p和Yn×m时引进的残差矩阵。n为样品数目,m为组分数,p为波长数目,f为最佳主成分数目。 PLS的第二步,将矩阵T和U做线性回归: Un×f=Tn×fBf×f (2

46、.7式(2.7中,Bf×f为回归系数矩阵。 在预测时,通过未知样品的光谱矩阵A和校正后得到的矩阵P校正求出样品光谱的T未知,然后得到:C未知=T未知BQ (2.8偏最小二乘法的具体算法由两部分组成,即校正部分和待测样品组分的确定,计算方法如下:(1)校正部分将浓度矩阵Y和光谱矩阵X标准化,即中心化和方差归一化;令维数k=0,开始迭代交叉回归计算;令k=k+1,将Y中的某些列作为矩阵U的初始向量;求X的权向量Wk:Wk=UX,将Wk 标准化Wk=1;计算t:t=X Wk,计算Y的载荷向量q:q= UY,确定Y的新特征向量U=Yqq;若ttold>10-6U,转;否则执行以下步骤;

47、计算关联矩阵X和矩阵Y的特征向量t和u的系数Bk(第k个元素):Bk=tU/t;计算X的载荷向量P:P= tX;计算X和Y中各自形成的残差,并将其作为下一维新的X和Y:X=Xtp,Y=YBktq由完全交互验证法确定k是否为最佳维数d,若达到最佳维数,迭代停止,否则转向。(2)待测样品中组分的确定由校正模型和待测样品的吸光度向量x确定样品的各组分浓度c。将待测样品的吸光度向量x按校正过程中进行标准化处理;令k=0,c=0;k=k+1,t=x·Wk,c=c+Bktq,x=xtp;若k 转 ,否则停止迭代。 由于是以标准化的形式给出测得的浓度值,故需要进行逆运算求得待测样品的浓度值。由以上

48、叙述可知,PLS法在构造校正模型时更充分地利用了光谱矩阵X和浓度矩阵Y中包含的信息,是比较完善的基于因子分析和回归分析原理的校正方法,使用这种方法可以降低噪声对校正模型的影响。为了评价所得校正模型的实际预测能力,一般采用完全交互验证方法(Full Cross Validation。它是一种以数据内部验证为基础的方法,意味着测量数据中每一个元素将被其余元素所建立的数学模型预报,即使用校正集本身的数据(X矩阵和Y矩阵来对未知样品集的数据进行模拟,从而达到评价模型实际预测能力的目的。其计算过程是:在每次建模过程中从校正集里剔除一个样品,用剩余的样品建立新的校正模型,对该被剔除的样品进行预测,并得到该

49、样品的预测误差。将校正集中各个样品轮流剔除,作一次验证集样品,求取各次均方根预测误差RMSEP,从而得到整个模型的预测精度31。与其它方法相比,完全交互验证法的优点是:它能够比较客观地对该模型的实际预测能力进行估计,因为每次计算时被预测的样品并没有参加模型的建立,因此可以模拟对未知样品的预测情况。此外,完全交互验证有利于检测校正集中的奇异点,提高模型的预测能力。模型质量的评价指标一般包括相关系数Corr、均方根校正误差RMSEC(Root Mean Square Error of Calibration和均方根预测误差RMSEP(Root Mean Square Error of Predic

50、tion,计算公式分别如下:(2.9 (2.10 (2.11式(2.9、(2.10、(2.11中,y为使用标准方法测定得到的结果,yi为通过光谱测量及校正集模型预测得到的结果,为yi的平均值,n为建立校正集模型所使用的样本数,m为校正模型所采用的主成分数。相关系数Corr越接近1,RMSEC值和RMSEP值越小,说明所建模型的预测能力越好25。本课题将采用Camo公司的光谱分析软件Unscramable7.8,对已有的近红外光谱数据进行分析,选择合适的建模波段,进行多元散射(MSC预处理。然后采用偏最小二乘回归法(PLS实现对近红外光谱的分析,建立校正模型。用完全交互验证法来评价模型的预测能力

51、,评价指标为相关系数Corr和均方根预测误差RMSEP,如果Corr值越接近1,RMSEP值越小,则模型的预测能力越好,最后针对预测集样品进行模型预测。3 近红外光谱血糖检测的初步实验研究课题中拟分析的光谱数据采集于相同环境下、包含不同葡萄糖浓度的糖水溶液。具体样品如下:实验中有21个浓度均匀分布的葡萄糖水溶液样品,浓度范围为100500mg/dL,分别测量各浓度下葡萄糖水溶液样品的光谱数据,光谱测量的波长范围为10002500nm。将样本集中的17个样本作为校正集,4个样本作验证集。31 光谱分析波段的选择对于波长连续的近红外光谱,为了保证对样品光谱的分辨,光谱的数据一般有数百到数千个数据点

52、。但谱区中各个数据点包含的信息是不同的,选择过宽的分析波段会增加无效信息,降低有效信息率;过窄的分析波段,则可能丢掉有效信息,降低校正模型分析的准确度。因此可以在全光谱中选择合适的谱区建立校正模型来压缩光谱数据。本实验在13002500nm范围的谱区选取三组不同波长进行建模预测,葡萄糖水溶液在不同波段建模结果见表3.1所示。表3.1 不同波段建模结果谱区范围(nmCorrRMSEP(mg/dlRMSEC (mg/dl1300250013001800130017000.99290.99300.992414.099013.998214.57398.36634.61294.5987从表3.1可以看出

53、,在13001800nm谱区范围建立校正模型,得到模型的误差RMSEP和RMSEC均小于13002500nm谱区范围对应的误差,前者的相关系数值大于后者的相关系数。在13001700nm谱区范围建立校正模型,得到的模型误差RMSEC虽然小于13001800nm谱区范围对应的误差,但13001700nm谱区范围的RMSEP较大,相关系数Corr小,建模的预测效果不如13001800nm谱区。同一组样品,选取不同的波长进行建模,得到的结果不同。这主要是因为被测葡萄糖水溶液中存在大量的水,在13002500nm光谱范围内,水在不同的波长处对应不同的吸收峰。水在吸收峰处的对光的吸收强度干扰了葡萄糖的吸

54、收。纯水及葡萄糖样品的近红外吸收光谱图分别如图3.1所示。吸光度 图3.1 纯水的近红外吸收光谱图从图3.1中水的近红外吸收光谱可以很明显看出,水在近红外谱区1450nm和1930nm处有较强的吸收峰。而葡萄糖的合频吸收峰在2105nm、2272nm、2325nm附近,葡萄糖的一级倍频吸收峰在1612nm、1689nm、1731nm附近25。因此,水的强吸收带覆盖了葡萄糖的大部分吸收光谱,是近红外光谱法测量葡萄糖浓度的主要干扰。实验中选择13001800nm光谱波段进行建模,避开了水在1930nm附近的吸收峰,又保留了葡萄糖的一级倍频吸收峰。该波段光通量较大,光谱的信噪比较高,因此能够较准确地

55、预测葡萄糖浓度,是比较好的建模波段。本课题将在13001800nm光谱波段对葡萄糖水溶液进行建模。32 多元散射校正(MSC对光谱数据的预处理在13001800nm波段将光谱数据采用偏最小二乘法(PLS方法,完全交互验证(Full Cross Validation的方式建立葡萄糖水溶液样品的回归模型,样品浓度预测值和参考值的相关图如图3.2所示。样品葡萄糖浓度值/(mg/dl 图3.2 葡萄糖水溶液样本建模结果示意图(图中直线表示校正集样品浓度的实际值的连线。M1表示的点是不采用完全交互验证方式得到的校正模型,对各个建模样品浓度进行预测的浓度值。M2表示的点是采用完全交互验证方式得到的校正模型

56、,对各个建模样品浓度进行预测的浓度值)在图3.2中,横坐标的1-17个点分别代表17个建模样品,纵坐标为葡萄糖水溶液浓度值。图中直线表示校正集样品浓度的实际值的连线。M1表示的点是不采用完全交互验证方式得到的校正模型,对各个建模样品浓度进行预测的浓度值,其评价参数是均方根校正误差RMSEC。M2表示的点是采用完全交互验证方式得到的校正模型,对各个建模样品浓度进行预测的浓度值,评价参数是均方根预测误差RMSEP。Slope为相应点连线后的斜率,Offset为点与实际值对比后的偏差,Corr为相关系数。斜率Slope越接近1,偏差Offset越小,相关系数Corr越靠近1,说明建模精度越高,预测结

57、果越好。图中结果表明:M1和M2的重合程度较好,且与样品的真实浓度值较为吻合,这表明所建模型对葡糖水溶液有较好的预测精度。但对个别样品浓度的预测,如图中5、8、17点的预测值与样品浓度的参考值有所偏差。因此需要对模型进行一些优化,如剔除建模样本中的异常值,对建模数据进行预处理等,以提高模型的预测精度。分别对校正集样品进行异常样品剔除和表3.2 葡萄糖水溶液建模结果校正集样本预处理方法CorrRMSEP(mg/dlRMSEC (mg/dl全部剔除3、7、11全部无无MSC0.99300.99380.999813.998213.87882.33914.61294.09682.0178建模过程中某些样品加入模型后所建模型的预测精度会有所降低,这些样品的化学值或光谱值称为异常值。在建立校正模型的实际应用中,探查异常点,判断并剔

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论