(作物遗传育种专业论文)花生籽仁蛋白质含量近红外光谱模型的建立及育种应用.pdf_第1页
(作物遗传育种专业论文)花生籽仁蛋白质含量近红外光谱模型的建立及育种应用.pdf_第2页
(作物遗传育种专业论文)花生籽仁蛋白质含量近红外光谱模型的建立及育种应用.pdf_第3页
(作物遗传育种专业论文)花生籽仁蛋白质含量近红外光谱模型的建立及育种应用.pdf_第4页
(作物遗传育种专业论文)花生籽仁蛋白质含量近红外光谱模型的建立及育种应用.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(作物遗传育种专业论文)花生籽仁蛋白质含量近红外光谱模型的建立及育种应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得塑宴垦盛些盘堂或其他教育机构的学 位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 t 学位论文作者签名:宗觯 签字同期: 劢年箩月;1 日 学位论文版权使用授权书 本学位论文作者完全了解塑皇堡盔些盘堂有i 关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借 阅。本人授权塑兰堡盔些盘鲎可以将学位论文的全部或部分内容编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:宗雨铧 导师签名: 签字日期: 加ff 年岁月多1 日 签字日期: 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 弓7 日二幽驯 摘要 花生是我国主要的经济作物之,同时还是重要的食用植物蛋白来源。花生育种 中蛋白质含量的测定常采用凯氏定氮法,但是这种传统的化学分析方法存在费用高、 时间长、易产生污染、具破坏性和重复性差等缺陷,因此探索新的花生中蛋白质含量 快速、无损的分析方法非常必要。本研究采用近红外漫反射法,对7 5 份整粒花生籽 仁进行光谱的扫描,构建了花生籽仁蛋白质含量的近红外光谱模型,并用该模型对花 生育成品种和杂交后代株系进行了蛋白质含量的测定,主要研究结果如下: 1 用凯氏定氮法对7 5 份花生地方品种的蛋白质含量进行了测定,结果表明:参 与建模花生品种蛋白质含量的变幅为1 8 8 2 2 5 2 4 ,平均值为2 1 8 7 。 2 用化学计量学方法对7 5 份花生品种的近红外光谱数据进行了相应的分析。比 较了s n v 、m s c 、微分、归一化、平滑等几种常见的数据预处理方法对近红外光谱 的影响。结果表明,采用采用偏最d 、- - - 乘法,对光谱进行一阶导数处理加标准正态变 量变化处理所建模型效果最佳,并构建了花生籽仁蛋白质含量的近红外光谱模型,该 模型的校正集和验证集决定系数分别为0 9 2 4 5 和0 9 0 1 8 ,校了f 标准误和预测标准误 分别为0 3 6 0 1 和0 4 1 5 3 。 3 利用该模型对9 8 个花生育成品种进行了蛋白质含量的测定,并用化学法测定 这部分样品的蛋白质含量,比较两种方法的差异,结果表明,进行检测的9 8 个花生 样品中,蛋白质含量的变幅为1 8 2 6 2 7 0 8 ,绝对误差最大不超过o 5 ,相对误差 最大为2 4 9 。 4 利用该模型对2 个杂交组合1 0 2 个株系花生籽仁蛋白质含量的测定,结果可 信,能达到快速筛选高蛋白品种的需要。 关键词:花生;近红外光谱技术;偏最d - 乘法;蛋白质含量 ii卜吨 0 e s t a b l i s h m e n to fm o d e lo fs e e d sp r o t e i nc o n t e n ti np e a n u tu s i n gn i r s a n da p p l i c a t i o ni np e a n u tb r e e d i n g a u t h o r :s o n gl i h u a m a j o r :c r o pg e n e t i c sa n db r e e d i n g s u p e r v i s o r :p r o f l i ul i f e n g a b s t r a c t p e a n u ti so n eo ft h em a i ne c o n o m i cc r o p si nc h i n a , a n da l s oi sag o o ds o u r c eo f d i e t a r yv e g e t a b l ep r o t e i n t h ep r o t e i nc o n t e n to fp e a n u tw a ss t u d i e db yk j e l d a h lm e t h o d u s u a l l y b u tt h i st r a d i t i o n a lc h e m i c a lm e t h o do ft h e s ec o n t e n t sh a v ed e f e c t s ,s u c ha sh i g h c o s t ,l o n gt i m ec o n s u m i n g ,e a s yt op r o d u c ep o l l u t i o n ,d e s t r u c t i v ea n dp o o rr e p e a t a b i l i t y t h e r e f o r ei ti sn e c e s s a r yt o e x p l o r ean e w , f a s ta n dn o n d e s t r u c t i v ea n a l y s i sm e t h o do f p r o t e i nc o n t e n ti np e a n u t i nt h i sr e s e a r c h ,d i f f u s er e f l e c t a n c es p e c t r u m so fi n t a c tp e a n u t s e e d sw e r eo b t a i n e db yn e a ri n f r a r e ds p e c t r o m e t e r , a m o n gt h e s es p e c t r a ld a t a ,t h o s eo f7 5 p e a n u t sw e r ea n a l y z e d a n dt h em o d e lf o ra n a l y s i so fp r o t e i nc o n t e n t si n p e a n u tw a s e s t a b l i s h e d t h i sm o d e lw a su s e dt oa n a l y z et h ep r o t e i nc o n t e n to fo t h e rv a r i e t i e sa n dt h e h y b r i d s t h em a i nr e s e a r c hr e s u l t sw e r ea sf o l l o w s : 1 k j e l d a h lm e t h o dw a su s e di nt h i sr e s e a r c hi no r d e rt oo b t a i nt h ep r o t e i nc o n t e n to f t h ep e a n u tl a n d r a c e s ,a n dt h er a n g eo ft h ep r o t e i nc o n t e n ti sf r o m18 8 2 t o2 5 2 4 ,a n d t h ea v e r a g ei s2 1 8 7 2 a m o n gt h e s es p e c t r a ld a t e s ,t h o s eo f7 5p e a n u t sw e r ea n a l y z e da n de v a l u a t e dw i t h m o d e mm e t r o l o g ym e t h o d s t a n d a r dn o r m a lv a r i a t e ( s n v ) ,m u l t i p l i c a t i v es c a t t e r c o r r e c t i o n ( m s c ) ,d e r i v a t i v e ,n o r m a l i z e ,s m o o t h i n gw e r ec o m p a r e d t h er e s u l t ss h o w e d t h a tt h em o d e ld e v e l o p e db ym e a n so fp a r t i a ll e a s t - s q u a r e s ( p l s ) r e g r e s s i o n ,a n dt h e s p e c t r a ld a t ap r e t r e a t m e n to ft h ef i r s td e r i v a t i v e + s t a n d a r dn o r m a l i z e dv a r i e t yw a st h eb e s t o n e t h ed e t e r m i n a t i o nc o e f f i c i e n t s ( r 2 ) o fc a l i b r a t i o na n dv a l i d a t i o ns e t sw e r e0 9 2 4 5a n d o 9 0 18 ,t h es t a n d a r de r r o ro fc a l i b r a t i o na n dp r e d i c t i o nw e r e0 3 6 0 1a n d0 4 1 5 3 , r e s p e c t i v e l y 3 t h i sm o d e lw a su s e dt op r e d i c tt h ep r o t e i nc o n t e n to fo t h e r9 8p e a n u ts a m p l e s w h i c ht h o s es a m p l e sw e r es t u d i e db yt r a d i t i o n a lc h e m i c a lm e t h o d s ,c o m p a r e dt h et w o m e t h o d s i ts h o w e dt h a tt h ep r o t e i nc o n t e n to ft h e9 8p e a n u ts a m p l e sw a s1 8 2 6 t o 2 7 0 8 ,a n dt h ea b s o l u t ee r r o rw a sl o w e r0 5 ,t h er e l a t i v ee r r o rl e s st h a n2 4 9 4 t h i sm o d e lw a su s e dt oa n a l y z et h ep r o t e i nc o n t e n to ft h e10 2h y b r i do f f s p r i n g s ,i t s h o w e dt h a tt h er e s u l ti sf e a s i b l e ,t h eh i 。g hp r o t e i nv a r i e t i e sc o u l db es c r e e n i n ge a s i l y k e y w o r d s :p e a n u t ;n i r s ;p l s ;p r o t e i nc o n t e n t 目录 1 弓i 言1 1 1 近红外光谱分析技术概述1 1 1 1 近红外光谱分析技术简介1 1 1 2 近红外光谱分析技术的发展闸顾1 1 1 3 近红外光谱分析技术的特点2 1 1 4 近红外光谱分析技术的流程4 1 2 近红外光谱分析的理论基础5 1 2 1 近红外光谱分析技术的化学基础5 1 2 2 近红外光谱分析技术的数学基础5 1 2 3 近红外光谱分析技术的物理基础6 1 3 光谱数据的预处理7 1 3 1 平滑处理7 1 3 2 导数法8 1 3 3 多元散射校正8 1 3 4 标准止态变量变换9 1 3 5 小波变换9 1 3 6 正交信号校正9 1 3 7 数据增强算法1 0 1 3 8 基线校正1 0 1 4 建模方法介绍1 0 1 4 1 偏最小二乘法1 1 1 4 2 偏最小二乘法分析原理。1 1 1 4 3 偏最d - - 乘法的特点1 2 1 5 评价近红外准确性的冈素1 3 1 6 近红外光谱分析技术在作物品质分析上的应用1 4 1 6 1 在小麦品质分析上的应i 1 4 1 6 2 在稻米品质分析上的应用1 5 1 6 3 在玉米品质分析上的应用1 6 1 6 4 在油料作物品质分析上的应 j 1 7 1 7 本研究的目的和意义1 8 2 材料与方法。1 9 2 1 实验材料1 9 2 2 仪器1 9 2 3 试齐0 2 0 2 4 实验方法2 0 2 4 1 花生样品蛋白质含量化学值的测定方法2 0 2 4 2 花生样晶光谱数据的采集方法2 1 2 4 3 试剂的配制方法”2 1 3 结果与分析2 2 3 1 建模花生样品蛋白质含量化学值的测定2 2 3 2 异常值的剔除2 2 3 3 建模样品的蛋白质含量的分布2 3 3 4 建模花生样品的原始光谱图2 4 3 5 光谱数据的处理2 4 3 5 1 标准止态变量变换预处理2 4 3 5 2 多元散射校正2 5 3 5 3 微分处理2 6 3 5 4 归一化处理2 7 3 5 5 平滑处理2 7 3 6 采川偏最小二乘法建立模型2 8 3 7 模璎的廊川3 0 3 7 1 在预测朱知样品上的应川3 0 3 7 2 在花生品种杂交后代上的应川3 1 z l 讨论:;4 4 1 随机误著的控制3 4 4 2 操作误著的控制3 6 4 3 对模型的评价3 7 1 ;l ;论:;8 参考文献3 9 在读期间发表论文4 4 作者简历4 5 致谢q 1 6 花生籽f :蛋广1 质近红外模刑的建立及育种虑川 1 1 近红外光谱分析技术概述 1 1 1 近红外光谱分析技术简介 1 引言 近红# - ( n e a ri n f r a r e dn i r ) 光是介于可见光和中红外光之间的电磁波,是人们认识 最早的非可见光区域i lj 。按照美国试验与材料学会( a m e r i c a ns o c i e t yf o rt e s t i n ga n d m a t e r i a l ,a s t m ) 的定义近红外光谱区是指波长在7 8 0 - - 一2 5 2 6 n m ( 波数为1 2 8 2 0 , - - 一 3 9 5 9 c m 。1 范围内的电磁波【2 巧j 。习惯上将近红外光划分为短波( 7 8 01 0 0 0 n m ) 和长波 f 1 1 0 0 - - 2 5 2 6 n m ) 两个区域。近红外光谱分析技术( n e a ri n f r a r e dr e f l e c t a n c es p e c t r o s c o p y , n i r s ) 主要是利用含氢基团( 主要是o h ,c h ,n h ,s h 等) 的有机物分子的倍频 与合频在近红外谱区的吸收。该技术是一种问接分析技术,需通过校j 下模型的建立实 现对未知样本的定性或定量分析。近红外谱区吸收的光谱包含了绝大多数类型有机物 组成和分子结构的丰富信息,不同的基团和同一基团在不同化学环境中的吸收波长有 明显差别,可以作为获取组成或性质信息的有效载体。n i r 光谱不仅能够反映绝大多 数的有机化合物的组成和结构性能信息,而且对某些无机离子化合物也能够通过它对 共存的本体物质影响引起的光谱变化,间接地反映它存在的信息1 6 j 。 1 1 2 近红外光谱分析技术的发展回顾 近红外反射光谱分析技术( n i r s ) 是利用化学物质在近红外光谱区内的光学特性, 快速测定样品中一种或多种化学成分含量和特性的物理测定技术。它是一种不需要对 样品进行前处理,即可得到儿乎全部农产品品质含量的分析技术。虽然我国在上世纪 8 0 年代初才开始关注该项技术,但由于它具有的简便、准确、快速、无污染、不破 坏种子等优点,使n i r s 技术己在农业、药物生产、石油化工等领域得到广泛的应用。 近红外光谱由h e r s h e l 在1 8 0 0 年观察到1 7 】,距今已有2 0 0 多年的历史了,是人们 认识最早的非可见光区域。因此可以说近红外谱区的应用比中红外谱区更早。到1 9 世纪前期,由于有机物质在近红外谱区的倍频和合频吸收信号弱,且近红外谱区信号 强度弱、谱带复杂、谱峰重叠等特点,加上当时的仪器性能比较差,理论和技术水平 不能充分提取、分离和解析近红外谱区的信息,限制了近红外光谱技术的应用。到 1 9 世纪中叶,有机结果分析和研究的重点逐渐转向了中红外谱区,并积累了丰富的 知识。而此期间的光谱学研究已有的传统模式不完全适用于近红外光谱分析,影响了 近红外光谱的分析的应用。以致1 9 6 0 年w h e e l e r 称近红外谱区为“被遗忘的谱区”1 8 j 。 2 0 世纪5 0 中后期,随着商业化近红外光谱仪的出现,以及n o r r i s 研究用可见透射与 反射技术测定鸡蛋、蔬菜和水果品质的大量工作1 9 1 3 1 ,使得近红外光谱分析技术达到 了一个小高潮,近红外光谱分析技术在测定农副产品品质方面得到了广泛的应用。进 1 河北农业大学硕十学位( 毕业) 论文 入6 0 年代中后期,随着各种新的分析测试技术的发展,传统的近红外光谱分析技术 暴露出抗干扰性差、分析灵敏度低的弱点,该技术逐渐被淡漠,从而在将近2 0 年的 时间罩,处于徘徊不前的状态,从此,近红外光谱进入了一个沉默的时期。8 0 年代 中后期,随着计算机技术的发展,分析仪器的数字化以及化学计量学的应用,加上化 学计量学方法在解决光谱信息提取和背景干扰方面取得的良好效果,并由于近红外光 谱在测样技术上所独有的特点,使得近红外光谱分析技术得到迅速推广,成为一门独 立的分析技术,其在各个研究领域应用也迅速展丌。1 9 8 8 年国际近红外光谱协会 ( c n i r s ) 成立i l4 。进入9 0 年代以后,国外先后创立了研究近红外技术的( ( j o u r n a lo f n e a ri n f r a r e ds p e c t r o s c o p y ) ) 和( ( n e a ri n f r a r e dn e w s ) ) 两份专业期刊。国内也掀起了近 红外热潮,在近红外仪器的研制、软件开发、基础研究和应用等方面都取得了可喜的 成果。从而使得近红外光谱分析技术进入了一个快速发展时期,应用领域涉及到石油 化学、烟草、乳品、药品、酒类与农业等行业。 1 1 3 近红外光谱分析技术的特点 近红外光谱分析技术在2 0 世纪8 0 年代以后飞速发展,进而在众多领域得到广泛 且成功的应用,在数据处理及仪器制造方面也有迅速的发展,主要因为它在测定中有 以下的优越性: ( 1 ) 分析速度快。 采用近红外光谱分析技术,扫描速度快,将采集到的光谱输入建立好的数学模型 就可迅速测定出样品的某种成分浓度,分析一个样品可以在1 分钟之内完成。 ( 2 ) 高效率分析,可以进行多组分同时测定。 对样品进行一次全光谱的扫描,可以得到各种化学成分的光谱信息,再由已建立 的相应的数学模型进行计算,就可以得到多种化学成分的含量,提供定量、定性的分 析结果。比较适合于植物种质资源和育种材料的大规模测定和筛选工作。 ( 3 ) 适合多种状态的分析对象。 近红外光谱分析可以采用漫反射、透射、折射等方式,因此,可以用于直接分析 可以是液体、气体、固体、半固体、胶状体等任一形态的样品,不必做形状的改变, 就可以直接分析。例如固体样品可以是任何形状,完整的水果、谷物或药物粉末等, 都可以直接测定,而这些样品,用常规的分析方法是很难直接进行分析的。光谱测量 起来更方便。在育种的某个环节上,利用近红外光谱技术分析中间材料,可以改进育 种流程,提高选择效率。 ( 4 ) 不破坏样品,样品不需进行处理。 由于近红外光具有较强的穿透能力和散射效应,可以对样品进行直接无损分析, 如育种试验的中间材料,且近红外光谱分析只是取得样品的光谱信号,并能保证产品 的质量一致和稳定,样品不需要使用化学试剂或高温、高压、大电流等测试条件进行 预处理,在测定光谱时不破坏或消耗样品,对样品的外观和内在结构都不产生影响, 分析后不产生污染,是一种典型的绿色分析技术,符合分析技术的发展趋势。 2 花生籽f + :蛋白质近红外模型的建它及育种应用 ( 5 ) 测试重现性好。 近红外光谱分析技术无需对样品预处理,光谱测定有很好的重现性,其测试结果 一般不会受到人为因素影响,与常规的化学方法相比,近红外光谱分析技术一般可显 示出更好的重现性。同时,近红外光谱技术所建立的模型是基于丌放性的、可拓展的 样品数据库的模型,其分析准确度将会越来越高。 ( 6 ) 分析成本较低。 由于近红外光的波长短,可以被玻璃或石英吸收。因而可以用玻璃或石英制成所 用的样品池容器,价格较低,使用也方便。同时由于近乡l :p l - 光谱测量在分析过程中不 消耗样品,不消耗化学试剂,样品经过分析后,仍可以保持原样,以及仪器的高度自 动化提高分析效率,与常用的标准获参考方法相比,测试费用可大幅度降低,非常适 合实验室和生产线上大批量样本的分析。 ( 7 ) 由于应用光纤可以进行远距离测定,且易于实现在线分析。 传统的分析技术一般是离线分析,分析耗时较长,且无法实现连续过程的即时分 析及在线控制。由于近红外光在光纤中具有良好的传输特性,这使得近红外光谱测量 更容易。通过光纤完全可以使仪器远离采样现场,将测量的光谱信号实时地传输给仪 器,而且同一台近红外光谱仪上可以接上多个光纤,同时实现多监测点、多指标分析, 调用建立的校正模型计算后可直接显示出样品的组成或性质结果。另外,光导纤维的 引进使传统的近红外光谱技术扩展到了有毒材料或恶劣环境中样品的远程分析,同时 也使光谱仪的设计得以更多用、更加小型化。 ( 8 ) 仪器使用简单。 由于仪器的高度自动化降低了对操作者的技能要求,对操作人员的要求不苛刻, 经过简单的培训就可以胜任工作。 但是近红外光谱分析技术也有其固有的弱点: ( 1 ) 测试灵敏度相对较低。 因为近红外光谱作为分子振动的非谐振吸收,其跃迁几率较低,一般近红外倍频 和合频的谱带强度比其基频吸收低1 3 个数量级。并且吸收峰较弱,谱带重叠,特 别对复杂体系,光谱信息特征性不足,没有定性鉴别优势,灵敏度较差,如果待分析 的样品仅有几毫克,或需要分析的组分在样品中的含量很低( 百万分之一) ,则不适用 近红外光谱技术进行分析。 ( 2 ) 一种问接分析技术。 方法所依赖的模型必须事先用标准方法或参考方法对一定范围内的样品测定出 组成或性质数据,因此模型的建立需要一定的化学计量学知识,必须投入一定的人力、 物力和财力才能得到一个准确的校正模型。另外分析结果的准确性与模型建立的质量 和模型的合理使用有很大的关系。对于经常的质量控制是十分经济且快速的,但对于 偶然做一二次的分析或分散性样品不太适用。 3 河北农业人学硕十学位( 毕业) 论文 1 1 4 近红外光谱分析技术的流程 ( 1 ) 收集定标集样品 在近红外光谱分析中,定标模型的稳定性和准确性由定标集样品决定。这就要求 定标集样品应能涵盖以后要分析样品的范围,且筛选出的样品必须具有代表性,各个 样品必须包括今后待测样品中的全部背景,还应尽量包括待测组分以外所有背景信 息,使建立的数学模型能将这些样品的背景信息扣除,解决近红外光谱分析高背景的 难点。并且样品的基体应该是相同的( 例如p h 值或水份等) ,否则背景的干扰将非常 严重,导致模型适用性变差或根本不能适用。如果样品中各个组分会发生相互反应, 要注意光谱的采集和采集瞬f b j 的组成情况,否则,将不会得到好的校f 模型。此外, 定标样品集的选择应有一定数量要求,但也不宜过多,选择样品时应做到“少儿全、 少而精”,总之,定标集中要具有足够的样品数以能统计确定光谱变量与浓度之间的 数学关系。 ( 2 ) 标准方法测定样品的物化性质 采用国家标准或其他公认的化学方法测定样品的组分或性质数据。对于合成样 品,其中的组分测定容易实现,对于复杂的天然样品,必须选用大家所接受的、权威 的分析方法。即使是采用一些标准方法,由于多方面的原因,仍然会产生一些误差。 尽管测量误差不可能用数学方法消除,但可以用多次分析结果的平均值来使之减小。 模型预测结果的准确性很大程度上取决于标准方法测量结果的准确性,为建立高质量 的校正模型,标准对照方法的测量误差应降至最小。应注意在进行光谱采集的同时进 行化学法检测待测组分的含量。 ( 3 ) 样品光谱数据的测量 在测量光谱数据时,为了克服光谱测定不稳定的因素,必须严格控制如制样、装 样、测试条件、仪器参数等测量参数在内的测量条件。例如仪器的工作状态每天都在 变化,在同一天的不同时刻,光谱数据也可能由于光源温度的变化而变化。因此,不 能把仪器靠近热源或冷风处,温度的变化会明显影响光谱数据的测量,温度的变化导 致空气的相对湿度发生变化,从而光路中的水蒸气会吸收光源中的一部分能量。此外, 对定标集样本或未知样本进行光谱测量时,实验条件应尽量保持一致。测量光谱数据 时,最好不要按浓度顺序进行,以免仪器条件的变化使某个局部浓度区域的光谱数据 发生变化,从而影响模型的建立。如果可能,定标集样本的光谱测定最好不在同一时 间进行,这样,可以将时间不同而造成的光谱数据的变化也概括到模型中。一个好的 模型意味着它必须是对样品的组分变化非常敏感,而对其它因素,如仪器、湿度、温 度的变化不敏感。 ( 4 ) 建立与检验数学模型 运用化学计量学的方法对得到的光谱资料进行合理的预处理,从复杂的背景与各 种组分形成的吸收峰重叠的光谱中提取特定的信息,这称之为建模数据的前处理,光 谱数据预处理方法包括平滑、扣减、微分、多元散射校正等等。具体使用哪种方法进 行处理,要根据具体情况而定。光谱数据处理好以后,可以结合样品的化学数据,然 4 花生籽f f 蛋白质近红外模删的建立及育种应用 后采用最佳的回归算法对光谱数据和化学数据建立联系,集建立样品光谱特征与化学 组分之间关系的数学模型。好的数学模型往往要进行多次建立,模型建好以后,要对 模型进行训练和改进,以确保能得到稳定、准确、可靠的模型。 ( 5 ) 数学模型的修正与维护 一个好的数学模型必须能够满足在不同时问( 如不同的季节) 与空间( 如不同的地 区、不同的样品类型) 都能运用,这就需要定期的对对数学模型进行不断修正与维护。 当样品的测定条件改变时,必须用预测样品集检验数学模型,如果数学模型的预测精 度降低,就需要在定标样品集中增加新类趔的样品,并重新按上述步骤修改数学模型。 稳定的数学模型需要不断的完善,这个过程是没有止境的。 ( 6 ) 模型的j 电用 即对未知样品进行化学组分的预测。采用与建立模型相同的实验条件下测定未知 样本的近红外光谱数据,并对其进行与建模时相同的光谱预处理;其次选择合适的定 标模型,并进行模型的适应性检验,根据所选定的定标模型和未知样品的光谱预测出 未知样品的组分含量。 1 2 近红外光谱分析的理论基础 1 2 1 近红外光谱分析技术的化学基础 分子在近红外谱区的吸收主要都是由分子内部振动状态的变化而产生的,其光谱 信息主要反应含氢基团( 包括o h 、n h 、c h 等) 基团的倍频和合频振动吸收,不 同基团( 如甲基、亚甲基、苯环等) 或同一基团在不同化学环境中的近红外吸收波长 与强度都有明显差别。表1 列出了主要皋团合频与各级倍频吸收带的近似位置【15 1 。 表1 主要基团合频与各级倍频吸收带的近似位置 t a b 1t h em a j o rg r o u p so ft h ej o i n ts p e c t r a la n df r e q u e n c yd o u b l i n go ft h es p e c t r u m 单位 c m jn m 基团c hn ho h h 2 0 c - hn - h0 - h h 2 0 合频4 2 5 0 4 6 5 05 0 0 05 1 5 52 3 5 02 1 5 02 0 0 01 9 4 0 二倍频5 8 0 0 6 6 7 07 0 0 06 9 4 01 7 2 0 1 5 0 0 1 4 3 01 4 4 0 三倍频6 5 0 09 5 2 0 1 0 5 0 0 1 0 4 2 01 1 8 01 0 5 09 5 09 5 0 四倍频1 1 1 0 01 2 5 0 01 3 5 0 01 3 5 0 09 0 08 0 07 4 07 5 0 五倍频 1 3 3 0 07 5 0 1 2 2 近红外光谱分析技术的数学基础 近红外光谱分析需要建立光谱参数与样品化学成分含量问的关系,即我们所说的 定标模型。要想获得某一组分的含量信息或定性信息,必须要借助化学计量学的方法, 如主成分分析法、多元线性回归法、偏最d , - 乘法、人工神经网络法等进行多元回归 5 河北农业人学硕十学位( 毕业) 论文 分析建立物质光谱与待测成分含量问的线性或非线性模型,这个模型是多元回归的一 个大矩阵,其数学模型可表示为: c = b o + b 1 舢+ b 2 x a 2 + b 3 x a 3 + b k x a k b 0 一b k 为回归系数( 也是在第k 个波长点的吸收常数) ; 以k 为在第k 个波长点的吸收强度; c 为由近红外光谱分析的某个化学成分的含量 通过对一批己知其化学成分含量的近红外光谱定标,可获得k 个波长点的回归 系数,再用这个被确定的模型来预测未知样品中该化学成分的含量。在计算机的应用 软件中,这种通过多元回归建立模型形象化的体现为一条类似一元回归方程的曲线, 用其相关数值可以表示模型的优劣。因此通过近红外光谱分析可以直接测定样品中的 这些成分的含量。 1 2 3 近红外光谱分析技术的物理基础 近红外光是一种电磁波,它具有“光”的属性,即同时具有“波”和“粒”的二重性, 近红外光子的能量可以表示为: e p = h v 其中,h 为普郎克常数,v 为光的频率。 近红外的光子能量同样可以使用上述公式定量描述。从光源发出的近红外光照射 到由一种或多种分子组成的物质上,如果分子的振动或转动的状念变化以及分子振动 或转动状态在不同能级问的跃迁,等于近红外光谱区域某波长处光子的能量,则产生 近红外光谱吸收。这些分子能量的跃迁在量子力学理论中进行了详细的阐述【摇1 7 1 。 近红外光谱分析技术分为透射和反射两类。每种方法都有其特定的原理及适用范 围。 ( 1 ) 透射 一般认为透射吸收光谱的定量分析遵循比尔定量,根据样品对某一谱区光吸收强 度和吸光粒子之间的关系来定量。比尔定律的表达式为: 肚一- s 砉谢c 其中:a 为吸光强度,1 0 为波长为九的平行、均匀入射光束强度,l 为透过溶液 后的光束强度,为待测组分的摩尔吸光系数,b 为光程,c 为待测组分的物质浓度。 发生透射时,入射光射到样品,部分光被样品吸收,部分光穿过样片,负载了样 品的结构信息,到达检测器。透射分析一般用于均匀透明的溶液或固体样品,仪器测 量得到的吸光度与光程及样品的浓度之间遵守比尔朗伯定律,若样品是浑浊的,样 品中有对光产生散射的颗粒,由于光散射的原因,光在样品中经过的路程不确定,透 射光的强度与样品浓度间的关系不符合比耳定律,用于测定时称为漫透射分析。 ( 2 ) 漫反射 6 花生籽f _ 蛋白质近红外模础的建立及育种应州 近红外漫反射分析一般用于固体和半固体样品,吸收光谱的定量分析不再遵循比 尔定律,而是依据“k u b e l k a m u n k ”定律。 r 。o 。t o o o o o o o 。_ 一 a = 一l o g 1 + 足s 一( 石s ) 二- i - 2 t c s ) 】= l o g 1 r 。】( 1 2 ) 其中:a 为吸光强度,k 为样品的吸收系数,s 为样品的散射系数,r o o 为样品 层无穷厚的漫反射率。 漫反射时,近红外光射到样品上,样品作为漫反射体,分析光进入样品内部后, 经过多次的反射,折射,吸收后,部分光被样品吸收,部分光返回表面,这样返回的 光就负载了样品的结构,成分等信息,可以用于分析。漫反射主要适用于固体样品, 如粉术、颗粒等样品。 1 3 光谱数据的预处理 近红外光谱由被测样品的近红外特征光谱主导,近红外光谱仪所采集的光谱除了 样品自身的信息外,还包含噪声、各种外界干扰因素,噪声主要来自高频随机噪音、 基线漂移、样品不均匀、光散射等1 1 引。因此,使用近红外光谱仪采集样品的光谱,并 用化学计量学方法建立模型时,消除光谱数据中无关的信息和噪音,对光谱数据进行 预处理十分关键和必要。对光谱进行预处理一方面是消除随机噪声、样品背景干扰以 及器件引起光谱差异等因素对校正结果产生的影响;另一方面是进行谱图信息的优 化,对样品信息突出的光谱区域进行选择,筛选出最有效的光谱区域,提高运算效率 1 1 9 l 。近红外光谱分析过程使用的这些化学计量学方法中,光谱预处理是基础,定性和 定量分析都是在此基础上进行的。光谱预处理方法的选择对建立预测能力强、稳健性 好的分析模型至关重要,有时甚至起决定作用【2 0 j 。常用的光谱预处理方法主要有以下 几种: 1 3 1 平滑处理 平滑处理( s m 0 0 t h i n g ) 的原理是将各数据点的值按一定的权重在自身和临近点进 行平均或拟合,即重新分配,得到较光滑的曲线。用近红外光谱仪扫描得到的光谱数 据不仅含有有用的信息,也包含没用的信息( 随机噪声) ,因此得到往往是一条不光 滑的曲线,平滑可以降低有效高频随机噪声,提高信噪比。常用的平滑方法主要有: 平均窗i ( m o v i n ga v e r a g e s ) 平滑法、中位值平滑法、s a v i t z k y g o l a y 平滑法等1 2 。对 于平均窗口平滑法,平滑窗口宽度是一个重要的参数,若窗口宽度太小,平滑去噪效 果不佳,达不到理想的滤噪效果;若窗口宽度太大,进行简单求均值运算,可以使信 噪比提高,但也会平滑掉一些有用信息,造成光谱信号的失真。因此必须考虑具体的 情况,适当选择平滑窗口的大小。s a v i t z k y g o l a y 平滑法是目前使用最广泛的除噪平 滑方法,采用多项式在最d - - 乘法下拟合原数据,采用h a m m i n g 窗来代替平均窗1 :3 平滑法中的矩形窗口,从而不会使峰形失真,采用不同的h a m m i n g 窗,该方法还可 7 河北农业火学硕十学位( 毕业) 论文 以用于数据的微分【2 引。 1 3 2 导数法 对样品进行光谱扫描时,由于制样条件、仪器性能及环境变化等对光谱的影响, 谱图有可能发生平移、倾斜( 随着波数的变小差谱值规律上升) 以及图谱的其它变形。 导数法( d e r i v a t i v e ) n - 消除基线漂移、平缓背景或组分间相互干扰出现的谱线重叠的影 响,提供比原来光谱更高的分辨率和更清晰的光谱轮廓变化,并降低高次项的幂次, 使高频信号显现出来,但导数法同时会引入噪声,降低信噪比。所以,用导数法处理 光谱时要求光谱有较高的信噪比。但f 只高友1 2 3 j 等提出小波变换与导数法相结合,去除 了基线、背景及噪声的干扰,提高模型的精度。光谱的一阶( 1 s td e r ) 和二阶导数( 2 n d d e r ) 是n i r 光谱分析中常用的基线校证和光谱分辨预处理方法。一阶求导可以消除光 谱中的扁平的基线,二阶求导可以消除光谱中倾斜的基线l2 4 1 。利用漫反射吸光度的一 阶、二阶导数光谱与样品化学值间建立的数学模型可以提高模型的精度。光谱的求导 可以有更高阶,但对光谱进行导数处理扣除背景干扰的同时,会损失一些低频信息, 在消除系统误差的同时会放大随机误差,一般只求一、二阶导数。由于求导在除去低 频基线的同时还会放大高频的噪音,因此在求导之前,通常都进行平滑处理以滤去噪 音。 1 :3 3 多元散射校正 多元散射校i t ( m u l t i p l i c a t i v es c a t t e rc o r r e c t i o n ,m s c ) 1 2 5j 是用来消除由于样品表面 性质差异和颗粒尺寸大小不同带来的光谱漂移常用的一种方法。该方法通过校正每个 光谱的散射以获得较理想的光谱,随后在n i r 固体漫反射和浆状物透( 反) 射光谱分析 时得到了广泛应用。它的目的是消除颗粒分布不均匀及颗粒大小不同产生的散射影 响,其特点是在使用多元校正方法建立近红外光谱模型时,将光谱的变动与待测性质 或组成的变动进行关联。并在建立n i r 定量或定性分析模型前,采用数据增强算法 来消除多余信息,增加样品之间的差异,从而提高模型的预测能力和稳健性。m s c 法认为每一条光谱都应该与理想光谱成线性关系,而真正的理想光谱无法得到,可以 用校正集的平均光谱来近似。具体实现是首先计算所有样品的近红外光谱的平均光 谱,然后将平均光谱作为标准光谱,将每个样品的近红外光谱与标准光谱进行一元线 性回归运算,求得各光谱相对于标准光谱的线性平移量( 回归常数) 和倾斜偏移量( 回归 系数) ,在每个样品原始光谱中减去线性平移量的同时除以回归系数修正光谱的基线 相对倾斜,这样每个光谱的基线平移和偏移都在标准光谱的参考下予以修正,而和样 品成分含量所对应的光谱吸收信息在进行数据处理的全过程中没有任何影响,所以提 高了光谱的信噪比陋j 。 8 花生籽f :蛋自质近红外模型的建立及育种戍用 1 3 4 标准正态变量变换 标准正态变量变换( s t a n d a r dn o r m a lv a r i a t e ,s n v ) ,又称为变量标准化,主要是 将原始数据各元素减去该元素所在列的元素的均值再除以该列的标准差1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论