




已阅读5页,还剩57页未读, 继续免费阅读
甜叶菊糖甙含量近红外光谱定量预测模型的创建及应用-硕士论文.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
7 一 铷- 交 分类号: 密级: 单位代码:一1 0 3 3 5 学 号:2 Q 8 1 6 0 3 8 甜叶菊糖甙含量近红外光谱定量预测 模型的创建及应用 论文答辩日期 答辩委员会主席 ( 姓名、职称、单位) 论文评阅人 ( 姓名、职称、单位) 鸭 N I RM o d e lC o n s t r u c t i o na n d A p p l i c a t i o nf o rD i t e r p e n e G I y c o s i d e sC o m p o s i t i o ni n 踵匆v 缸R P 6 口跖舭刀口 B y Z h e n g q i nR o n g S u p e r V i s o r :J i a n g u oW u 一+ 一一一 AD i s s e r t a t i o nS u b m i t t e d I nP a r t i a IF u l f i l m e n to ft h e R e q u i r e m e n t s I 0 rt h eD e g r e eo fM a s t e r ( P I a n tG e n e t i c sa n dB r e e d i n g ) Z h e j i a n gU n i V e r s i t y H a n g z h o u ,C h i n a J a n ,2 0 1 l 哪83咖635帅8 i_哪Y 一 一 本研究受以下项目资助 国际合作项目( I10 8 0 3 ) 浙江省科技厅科技攻关项目( 2 0 0 9 C 3 2 0 3 0 ) 浙江省1 5 1 人才基金 T h e p r e s e n ts t u d yw a s s u p p o r t e db y I n t e r 眦t i o n a lC o o p e r a t i o nP r o j e c t ( N o 1 10 8 0 3 ) P r o j e c to fS c i e n c ea n dT e c h n o l o g yO m c eo fz h e j i a n gP r o v i n c e , C h i 舳( N o 2 0 0 9 C 3 2 0 3 0 ) 1 5 lF o u n d a t i o nf o rt h eT a l e n t so f Z h e j i a n gP r o v i n c e ,C h i n a 、,一,、 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成 果除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的 研究成果,也不包含为获得逝姿盘堂或其他教育机构的学位或证书而使用过的材 料与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示 谢意。 一一一一一一一一_一一,。_ 一_ 学位论文作者签名: 签字日期:年 月日 学位论文版权使用授权书 本学位论文作者完全了解逝姿态堂有权保留并向国家有关部门或机构送交 本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿盘堂可以将学位论 文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复 制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 、 l 学位论文作者签名: 孚但佑义作有佥名。 导师签名: 日 签字日期:年月日 致谢 本研究是在浙江大学农学系吴建国副教授的悉心指导下完成的昊老师从论 文的选题、技术路线的设计、实验操作方法、数据处理与分析等方面对我进行了 全面,详细和耐心地指导吴老师严谨求治学的科学态度,渊博的知识、务实的 工作作风、兢兢业业的工作精神和对学生在科研上的指导和启发都令我受益匪 浅 同时衷心感谢石春海教授在实验方面给予的指导和帮助! 石老师言传身教、 严格要求,对我的学习和个人生活给予了很多理解和关照,在此我向石老师表示 深深的谢意! 感谢陈国林、张玉江、郭万里、洪彩霞等老师在我学习和生活上给予的关心 和指导感谢张斌一:石云、李文强、张大鹏、阿弗雷德( A n r e d ) :张莉、王克敏j 朱琼琼、李冠、俞倩茹、单卓、徐伟东、杨韵龙、尚珂、赵赞、王瑞果等同门师 兄弟( 姐妹) 在学习生活上提供的帮助 特别要感谢实习生王松、李江、黄如标等同学在实验工作上的帮助 感谢农业与生物技术学院领导和老师给予的关心和鼓励。同时实验工作还得到了 叶敏、胡清香、陈美珍、赵美武等师傅的帮助,在此也表示感谢。 最后,特别要感谢我的父母,在我的学习和生活上的理解和支持几十年来他 们起早贪黑,辛勤劳作,无怨无悔,是他们用汗水浇筑了我的成长之路! 在此论文顺利完成之际,对以上所有的老师、同学、朋友和亲人表示诚挚的 谢意! 在今后的人生道路中,我将会牢记你们的教诲和帮助,努力学习、踏实工 作,用实际行动和成果来回报你们同时,也真诚的祝愿我们课题组能有一个更 加辉煌灿烂的明天! 荣正勤 2 0 1O 年1 1 月于华家池 浙江大学硕士学位论文目录 目录 摘要I A b s t r a c t l 前言i 。l 2 文献综述3 2 1 近红外分析技术的理论基础3 2 2 近红外光谱技术中的化学计量学方法4 2 2 1 近红外光谱预处理方法的研究5 2 2 1 1 小波变换法( w a v e l e t n 彻s f 0 咖,w T ) 5 2 2 1 2 正交信号校正( O r t l l o g o n a ls i g n a lc o r r c c t i o n ,O S C ) 5 2 2 2 变量选择方法7 2 2 2 1 基于蒙特卡罗的无信息变量消除( M o n t ec 州ou n i n f 0 珊a t i v ev 耐a b l e e l i m i n a t i o n ,M C U V E ) 。7 2 2 2 2 连续投影算法( S u c c e s s i V ep r o j e c t i o n sa l g o r i t h m ,S P A ) 7 2 2 2 3 其他变量选择方法。8 2 2 3 近红外光谱定量回归校正方法。8 2 2 3 1 支持向量机( S u p p o r tv e c t o rm a c h i n e ,S V M ) 8 2 2 3 2 核偏最小二乘法( K e m e lp a n i a ll e a S ts q u a r e s ,K P L S ) 1 3 2 2 3 3 集成( 共识) 建模策略1 4 2 2 3 4P L S 稳健性建模方法16 2 2 3 5 稳健的支持向量机回归算法17 2 2 4 模型传递19 2 2 5 近红外模型评价指标1 9 2 3 近红外光谱技术的特点2 0 2 4 近红外光谱技术在农产品品质分析及育种中的应用2 0 3 材料与方法2 1 3 1 试验材料与样品选择2 1 浙江大学硕士学位论文目录 3 2 样品近红外光谱采集及预处理2 l 3 3 训练集和预测集样本划分:2 l 3 4 甜叶菊叶片糖甙含量测定2 2 3 5 近红外光谱回归模型与预测集验证2 2 4 结果与分析2 3 4 1 甜叶菊中二萜糖甙含量的测定2 3 4 1 1 训练集和预测集选择2 3 4 1 2 甜叶菊二萜糖甙含量的测定2 4 4 2 目标性状近红外光谱变量选择2 6 4 2 1 近红外光谱与目标性状相关性分析2 6 4 2 2 光谱变量选择2 7 4 3 线性与非线性方法建模。j i 二:i :。:= i o i :_ :。:。:- :二= i 二3 0 一 4 3 1P L S 回归方法3 0 4 3 2 混合的支持向量机回归算法3 l 4 3 3 不同建模方法比较。3 7 4 4 单一二萜糖甙组分建模3 8 4 5 甜叶菊二萜糖甙近红外光谱回归模型的应用研究。3 9 5 讨论i 4 2 5 。1 近红外光谱变量优选4 2 5 2 支持向量机回归算法的优化4 3 5 3 近红外光谱预测模型的评价与应用4 4 5 4 近红外光谱技术展望4 4 参考文献4 5 作者简历5 2 浙江大学硕士学位论文 摘要 摘要 近红外光谱技术是上世纪8 0 年代后期迅速发展起来的新型物理测试技术,其具有 速度快、无污染、低消耗,非破坏性、多组分同时测定等优点,已被列为多种国际或行 业标准,在许多领域得到广泛应用甜菊二萜糖甙是一类高甜度、无能量、天然甜味剂, 在食品、医药、化妆品等领域有广阔的前景本研究旨在建立甜叶菊叶片中重要二萜糖 甙组分的近红外光谱预测模型,并通过改进的算法,优化模型的稳健性,提高模型的适 用性和预测能力,为甜叶菊味质检测和育种选择提供快速、简捷、有效地方法 甜叶菊二萜糖甙含量近红外光谱预测模型的创建及应用研究中,利用多年份的单株 选择材料,随机选出5 0 8 份甜叶菊叶粉样品,取样品量约3g 扫描其近红外光谱参考 分析方法采用改良的液相色谱法测定甜菊糖甙、瑞鲍迪甙A 及两者的总百分含量采用 一一标准正态变换、二阶微分和S a v i 乜坶G o l a y 卷积平滑处理原始光谱联用基于蒙特卡罗一 的无信息变量消除法和连续性投影法筛选光谱变量,剔除了大量无信息变量和冗余变 量,同时降低光谱变量的共线性,提高了模型预测的准确性和稳健性,并在一定程度上 克服了过拟合现象 建模过程中采用迭代的加权最小二乘支持向量机剔除异常值,并对剔除了异常值的 训练集采用支持向量机回归算法,仿真数据和二萜糖甙总含量数据均表明,此混合方法 的预测性能优于其他方法,对二萜糖甙总含量的预测均方根误差,决定系数,剩余预测 偏差分别为0 8 4 3 、0 9 0 7 和3 2 5 6 同时,通过P L s 方法对筛选后的变量空间进行特 征提取,提高了计算的效率,其预测均方根误差,决定系数和剩余预测偏差分别达到 0 8 4 5 、O 9 0 6 和3 2 4 9 对单个组分的甜菊糖甙和瑞鲍迪甙A ,采用相同的建模方法, 并对第一个偏最小二乘成分进行正交信号校正以提高预测的准确性预测结果表明,应 用所构建的近红外光谱预测模型进行大规模育种材料的筛选是可行的。 应用此模型共筛选出7 0 个瑞鲍迪甙A 绝对含量较高和6 3 个瑞鲍迪甙A 相对含量 较高的单株材料其杂交F l 子代5 0 个品系的瑞鲍迪甙A 绝对含量和相对含量均显著提 高,甜叶菊味质得到显著改良 本研究所发展的近红外光谱技术还可为甜叶菊遗传研究,数量性状定位,种质资源 评价以及甜叶菊叶片现场收购提供有利的检测工具 关键词:甜叶菊;甜菊糖甙;瑞鲍迪甙A ;近红外光谱;变量筛选;支持向量机 A b s t r a c t N e a ri n f 打e dr c f l e c t 锄c eS p e c 仃D s c o p y( M R S ) h a sb e e nr 印i d l yd e V e l o p e d 觞an 0 V e l p h y s i c a la 眦l y s i st c c h n i q u ei n t 1 1 el a t co fl9 8 0 si nl a s tc e n t u r y B e c 叭t h eN 瓜Si s n o n d e s t r u c t i V e ,f a 巩c o s te 位c t i v e ,e n v i r o n m e n t a l l y s a f e , 锄da l l o w sm es i m u l 切n e o u s e s t i m a t i o no fs e v e r a lt 随i t Si nau n i q u em e a s u r e m e n t m i st e c l l n i q u ew a su s e dw i d e l yi nm 锄y a r c a s 锄dc o n s i d e r e d 嬲i n t e m a t i o n a ls t a r d a r d s T h ed i t e 巾e n eg l y c o s i d e si n 龇V 缸陀6 删批刀口 l e a v e sa r ec o n s i d e r e d 嬲ap o t e n t i a ls o u r c eo fn a n 腿In o n c a l o r i cs w e e t e n e r sa n du s e dw i d e l y i nt I l ef o o d m e d i c i n e ,c o s m e t i c ,e t c T h ep r e s e n ts n J d ya i m e df o ra s s e s s i n gm ep m e n t i a lO f N 峪t e c h n i q u et 0e s t i m a t em es 钯v i o s i d e ,r c b a u d i o S i d eA 锄dt h e i r t o t a l n t e n t Si n 龇,插 陀6 口“d 勉刀口l e a v e s 锄dt oo p t i m i 髓也eS u i t a b l er c g r c s s i o nm e t h o d 舳dV 撕a b l e ss p a c et o 一d e v e l 叩ar o b u S ta n d a c c u r a t er e g r e s s i o nm o d e l 一一一一一一一 At o t a lo f5 0 8s 锄p l e ss e l e c t e dr a n d o m l y 舶mt h ei n d i V i d u a lp l a n t s w i t l lg o o d a g r o n o m i c 舰bf r o m2 0 0 8t o2 0 0 9 1 1 1 ep e r c e n t a g ec o n t e n so f S t e V i o s i d e 锄dr e b a u d i o s i d eA o fm e1 fs 锄p l e sw e r ed e t e 册i n e db yt I l er e f e r e n c em e l o do fH P L C A b o u t3 9l e a fp o w d e r o fe a c hs 锄p l ew a ss c a 彻e d 舶m4 0 0 姗t o2 4 9 8 n ma t t 1 1 ei n t e n ,a lo f0 5 砌n ee n t i r c s p c c 饥朋w 觞p r e 订e a t e dw i t h t h es t a n d a r dn o 肿a l i z e dV 撕a t e ,s e c o n dd e r i V a t i V e da n d S a v i t 2 姆G o l a yc o n v o l u t i o ns m 0 0 t h i n g F o r 也ep r e t r e a t c ds p e c t m mi n3 5 0s 锄p l e si n 舰i n s 比M o n t e C a r l ou n i n f o 咖a t i v ev 耐a b l e se l i m i n a t i o n 锄ds u c c e s s i V ep r o j e c t i o n sa l g o r i t h m 、 浙江大学硕士学位论文摘要 B yu s i n gt I l ed e V e l o p e dm o d e l st os c r e e nt h ei n d i V i d u a lp l a n t s ,13 3p a r e n t a lm a t e r i a l s a n d5 0F ll i n e sw i ma b s o l u t e l yo rr e l a t i V e l yh i g hr e b a u d i o s i d eAc o n t e n tw e r ep r i m a r i l y i d e n t i f i e d 柚dt e s t e ds u b s e q u e n t l yb yH P L C B r i e f l y t h ed e V e l o p e dm o d e lc o u l db ed i r e c t l yt 0 p f e d i c tt l l ed i 白e 印e n eg l y c o s i d e si n ;抛V 妇l e a V e sa n dh a dg o o dp e 响n n a n c ei nb r e e d i n g p r o j e c t K e yw o r d s :龇 ,切膨6 口猢铴M ;s t e v i o s i d e ;r e b a u d i o s i d eA ;N e a r - j n 丘撒dR e f l e c t 柚c e S p e c 仃0 s c o p y ( N I R S ) ;V 矾a b l e ss e l e c t i o n ;S u p p o r tV e c t o rm a c h i n e n I 浙江大学硕士学位论文前言 1 前言 。 甜叶菊( 舭1 ,砌旭6 口“妣加,B e r t o n i ) 又名甜菊,属菊料甜菊属的一种多年生草 本植物起源于巴拉圭东北的阿曼拜地区及巴西和阿根廷两国交界处( S o c j a r t o ,2 0 0 2 ) 其次生代谢产物二萜糖甙类物质是天然、低热量、高甜度的甜味剂,具有共同的甜菊 醇甙元结构因甙元上第1 3 、1 9 位的取代糖基不同,构成了至少9 种不同的二萜糖甙 。 类物质( 图1 ) ( G e u n s ,2 0 0 3 ) 其中,含量最高的两个组分为甜菊糖甙和瑞鲍迪甙A , 甜度分别为蔗糖的3 0 0 倍和4 0 0 倍( T a n a I ( a ,1 9 8 2 ;K o l b ,1 9 8 6 ;H 锄s o n 和O l i v e h , 1 9 9 3 ) 瑞鲍迪甙A 的味质要优于带后苦味的甜菊糖甙( D u b o i s 和S t e p h e n s o n ,1 9 8 5 ) 甜叶菊原产地南美巴拉圭巴西等地的居民食用甜叶菊已有四百多年历史2 0 0 9 年, 基于大量的毒理学研究( C u r 巧和R o b e r t s ,2 0 0 8 ;C 缸a k o s t a s 等,2 0 0 8 ;B r u s i c k ,2 0 0 8 ) , 美国食品和药物管理局( F o o d 锄dD m gA d m i n i s 仃a t i o n ,F D A ) 批准认证瑞鲍迪甙A 为 一一G R A S ( G e n e r a l l yr e c o 弘i z e d 於S a f e ) 产品一中国、美国、日本、韩国、加拿大! ,墨西一一 哥、瑞士、法国等国也先后批准其作为甜味剂使用,欧盟委员会正处于考虑是否批准 阶段目前,二萜糖甙类物质已在在食品、医药、化妆品等领域得到广泛应用因此, 味质较好的高瑞鲍迪甙A 的甜叶菊育种工作具有广阔的前景,快速、有效、大规模的 筛选高品质育种材料的分析方法变得非常必要 近红外光谱( N e a ri 1 1 胁e ds p e c 们s c o p y ,N I R ) 技术作为一种新崛起的新颖物理测 试技术,具有无损,测定速度快,可同时分析多项指标,成本较低等特点,在农业、 食品、石油、化工、医疗等领域得到了广泛的应用( 严衍禄,2 0 0 5 ) 随着化学计量学 的飞速发展,近红外光谱分析模型的预测可靠性得到加强,建立稳健、可靠的预测模 型成为现实 本研究旨在创建甜叶菊二萜糖甙含量的近红外光谱预测模型,用于育种中间材料 的快速筛选,提高育种效率,使N I R 技术能够更好的为育种和生产实践服务 。 本研究主要内容包括应用高效液相色谱法( H P L c ) 测定甜叶菊叶片中的甜菊糖甙 和瑞鲍迪甙A 含量;根据H P L C 化学分析结果和叶片粉样近红外光谱数据,对自变量 空间进行优化:剔除无信息变量和冗余数据;并用偏最小二乘法对处理后的变量空间 进行特征提取,选择算法,确定模型的参数提高稳健性;建立、检验与评价预测模型; 探讨不同化学计量学定量校正方法的优缺点和适用性,探索样品训练集样本构建模型 时各参数的优化设置;应用近红外光谱预测模型对大规模单株选择材料进行预测筛选, 浙江大学硕士学位论文前言 选择出一批绝对含量高或相对含量高的瑞鲍迪甙A 亲本和育种中间材料,并用于育种 实践,杂交获得高品质的F l 杂交组合 璃鲍过甙A 蟪箢逆戎8 璃童戡电戎C 璃鲐楚戎D 璃燕迫戎 境空惫适甙F 转尔胃砍A 甜蒴蒋甙 镩蒴鼯教耱戎 声G l 。 H 声G l 。 舳参G 酸I ) 触移a 瓯1 ) 爹娩 G I c 钕 H 声G l o 泸G 斌3 - I ) 声G 蚁2 功 声G l o ( 声G 斌3 - I ) 声G 斌2 - D ) 声G l o 涉q 蚊孓I ) 够l 毪蕾1 ) 声啡G 联3 1 ) 声G 斌2 功 触翻瓯2 1 声G 洼。涉吣孓I ) 蝴1 ) 爹馘蛾2 - l 触_ G | c ( 2 1 ) 。参G l c 图l 甜叶菊二萜糖甙主要组分及其结构( G e 坞。2 0 0 3 ) F i g 1T h ec h e m i c a ls 细J c t u 他o fs t e V i o lg l y c o s i d e sw i 吐lac o m m m n c t i o n a Jg r o u po fa g l y c o n e s t e v i o l 姐dd i 彘r 锄ts u b s t h e n to fg l y c o s y l ( G l c ,g l u c o s y l ;R h a r I l 嬲m o s y l ;X y l ,碍l o s y l ) 一一一一。一一一一一一 2 浙江大学硕士学位论文 文献综述 2 文献综述 近红外光谱( N e a ri n 行a r e ds p e c t r o s c o p y ,N I R ) 是是介于可见光( s ) 和中红外 ( M 瓜) 之间的电磁辐射波,美国材料检测协会( A S 刑) 将近红外光谱区定义为 7 8 0 2 5 2 6 m n 的区域,由英国天文学家w i l l i a mH e r S c h e l 于1 8 0 0 年在天文观察中发现 ( O s R o m e 等,1 9 8 6 ) ,是人们在吸收光谱中发现的第一个非可见光区N I R 分析是将 近红外谱区的光谱测量技术、化学计量学技术与计算机技术交叉结合的现代分析技术, 主要用于复杂样品的直接快速无损分析,基于有机物在近红外光谱区具有特征性吸收 以及不同波段的吸收强度与该物质的分子结构和浓度存在对应关系的原理( M u l l r a y 等, 1 9 8 7 ) 但N I R 分析存在许多技术难点,主要是:光谱吸收弱、信噪比低;测定易受样 品状态、测量条件的影响而导致光谱的波动性;以及由于样品可以不经前处理,因此 样品状态,测量条件、成分的组成等造成光谱复杂、谱峰重叠等许多困难所以,对 复杂样品进行M R 分析是从复杂、重叠、变动的光谱中提取弱信患,其困难犹如“沙里一 淘金”,必须依靠有效的算法和计算机软硬件技术的支撑,因此,该分析方法是一种现 代高技术分析方法( 严衍禄,2 0 0 5 ) 2 0 世纪5 0 年代,N m 技术首先由美国农业部( U s D A ) 的N o r r i s 等人做了大量的 开发工作,然而由于其暴露出的灵敏度低、抗干扰性差的劣势,使人们逐渐淡漠了该 技术在分析测试中的应用,以致1 9 6 0 年w h e e l e r 称近红外谱区为“被遗忘的谱区”随 着计算机技术的迅速发展和化学计量学的发展,通过有效的化学计量学方法在解决光 谱信息提取和背景干扰方面取得的良好效果,加之N I R 在测试技术上所独有的特点, 使人们重新认识了它的价值上世纪9 0 年代以来,N l R 技术迅速发展,在农业、医药、 食品、石油、化工等领域中的应用全面开展 2 1 近红外分析技术的理论基础 近红外光照射到由一种或多种分子组成的物质上,如果分子的振动或转动的状态 变化以及分子振动或转动状态在不同能级间跃迁所需能量,等于近红外光谱某波长处 的光子的能量,则产生近红外光谱吸收其中包含了大多数类型有机化合物的组成和 分子结构的信息 近红外光谱包括基团的基频、倍频和合频吸收产生基频振动的主要是含氢官能 团,如C H 、N H 、S H 、O H 等,是N I R 分析的主要信息来源其他官能团,如C = o 、 C - N 、C C 等基团在N I R 区大多产生多级倍频吸收,强度较弱,实际分析时应用难度 浙江大学硕士学位论文文献综述 较大N I R 谱带是若干个不同基频、倍频或合频谱带的组合,大量的是重叠峰和肩峰, 没有能和基线分离的锐峰( 陆婉珍等,2 0 0 0 ) 因此,精确分析近红外光特定频段谱带 由何种基团产生较为困难( 吴建国,2 0 0 4 ) N I R 数据包含了样品丰富而杂乱的信息,从如此大量的数据信息中剔除无效信患 的干扰,获取目标特征信息,就要依赖有效的化学计量学方法2 0 世纪8 0 年代以来, 化学计量学取得重大突破,推动了近红外光谱技术的快速发展 2 2 近红外光谱技术中的化学计量学方法 化学计量学是一门关于计算机、数学及统计学技术在化学领域中的应用科学它 主要用于光谱信号的预处理,模型变量的筛选,奇异样品的检测,以及定性,定量模 型的建立和模型的传递将稳定、可靠的近红外光谱分析仪器与强大的化学计量学算 法相结合正是现代近红外光谱技术的一个明显的标志因此,深入开展光谱化学计量 一学方法研究,开发出新的更具实用性和适用性的化学计量学软件,对现代N I R 技术的一 发展将起到极为重要的作用 化学计量学方法的研究主要涉及四个方面的内容:一是光谱预处理方法的研究 主要目的是减弱以至于消除各种非目标因素对光谱的影响,尽可能地去除无关信息交 量,提高信噪比、分辨率和灵敏度二是变量选择方法,主要目的是选取目标性状特 征谱峰,提高预测的可靠性和准确度三是近红外光谱定性、定量校正方法的研究 在模式识别定性方法研究方面,采用线性学习机、支持向量机、基于核函数技术的F i s h e r 判别和K 】州最近邻法等有监督的模式识别,以及聚类分析法等无监督模式识别,通过 N 取数据对不同样本按某些共同的特征进行分类识别,从而发现被量测样本之间的内 在联系,获得决策函数( R o g g o 等,2 0 0 7 ) 在定量校正方面,主要通过多元回归技术, 如主成分回归( P r i n c i p a lc o m p o n e n t sr e g r e s s i o n ,P C R ) 、偏最小二乘( P a n i a ll e a s ts q u a r e s 一 P L s ) 、人工神经网络( A r t i f i c i a ln e u r a ln e t w o r k ,A N N ) 、核主成分回归( K e m e IP C R , K P C R ) 、核偏最小二乘法( K e m e lP L S ,K P L S ) 和支持向量机回归( S u p p o r tV e c t o r r e g r e s s i o n ,s V R ) 等;集成( 或共识) 的建模策略,如B o o s t i n g ,B a g g i n g 和s t a c k i n g 等;基于局部样本的建模策略,如c A R N A C ( C o m p a r i s o na n a l y s i su s i n gr e s t r u c t u r c dn e a r i n f - m r e da n dc o n s t i t u e n td a t a ) 、L W R ( L o c a l l yw e i 曲t e dr e g r e s s i o n ) 和L O C A L 等从而 建立稳定、可靠的定性或定量分析模型,用于预测未知样品性质或组分( 褚小立等, 2 0 0 8 ) 同时,稳健性建模方法的研究在近年来取得了较大的发展,提出较为实用的 4 浙江大学硕士学位论文文献综述 R P M ( P a r t i a lr o b u s tM - r e g r e s s i o n ) 、R S I M P L S ( R 0 b u s tS I M P L S ) 、K R P M ( K e m e l p a n i a l r o b u S t M r e g r e s s i o n ) 等方法四是校正模型的传递和共享,尤其是大型数据库的共享 解决此问题需要首先解决光谱标准化问题,它不仅要求同一样本在相同型号仪器上采 集的光谱一致,而且要求在不同厂家的仪器上也尽可能的保持一致,这需要在仪器硬 件和化学计量学方法( 如光谱信号预处理和模型传递算法等) 两个方面加以解决在 此基础上,基于数据库的局部建模策略结合网络化技术,有望实现模型的共享 2 2 1 近红外光谱预处理方法的研究 近红外分析仪所采集的原始光谱除与样品组成有关的信患外,也包含由环境温度、 化学成分和含量的波动以及电阻的热噪声等因素所产生的无关信息和噪音这些信息 的存在会直接影响到近红外分析的可靠性和准确性( 吴建国等,2 0 0 6 ) 因此,针对复 杂样品体系,通过对光谱的适当处理或变换,尽可能去除无效信息和背景信号,提高 分辨率和灵敏度,为建立预测能力强、稳健性好的分析模型奠定基础常用的光谱预 处理方法有平滑、微分、标准正态变量变换等近几年来,小波交换和正交信号校正 等一些新方法正在得到发展和应用 2 2 1 1 小波变换法( w a v e l e tt r a n s f o r m ,w r ) 光谱的微分处理可以去除部分线性或接近线性的背景和噪声光谱对目标光谱的影 响,但该处理后光谱的随机误差会被放大。小波变换是近年来新出现并不断获得应用 的一种高效信号处理方法,兼有时域及频域分析的特点,对分析信号的滤波处理有其 独特的优点( 诸小立,2 0 0 4 ) 其主要在以下几个方面得到应用:( 1 ) 改善分析信号 质量;( 2 ) 光谱数据压缩,以最小的信息损失获得最大的压缩比;( 3 ) 用于光谱的特 征提取,以小波系数代表分析信号的主要特征 小波变换的时、频域的局部化性质可以很好地获得信号的局部特征,对突变信号 和非平稳信号的检测较为有效( 郝勇,2 0 0 6 ) 小波阈值法利用近红外光谱信号与噪声 之间的频率差异,通过在不同尺度设定阈值去除噪声,是一种理想的分频滤波手段 但在利用小波交换对光谱进行预处理时压缩中的阈值,小波基函数、截断尺度以及 分解层次等参数的设置目前尚未有客观的标准,需要靠经验和不断尝试来确定,是采 用该方法滤除光谱噪声的一个难点 2 2 1 2 正交信号校正( O n h o g o n a l 奎i g n a Ic o r r e c t i o n ,o S C ) 正交信号校正首先是S w 6 r d 等人于1 9 9 8 年最先提出,其主要思想是通过光谱矩 阵z 中与因变量浓度矩阵】,正交,滤除X 矩阵中与Y 矩阵不相关的变异信息,并减少 浙江大学硕士学位论文文献综述 模型中的潜变量个数,提高模型的预测准确性多种O S c 校正算法被提出,包括w b r d O S C( w b r d 等,1 9 9 8 ) ,s j 6 b l o mO s C ( s j 6 b l o m 等,1 9 9 8 ) ,F e a mO S c( F e a m 等, 2 0 0 0 ) 和D o s c ( w e s t e r h u i s 等,2 0 0 1 ) 但上述方法每次迭代计算均需要计算一遍P L S , 不仅耗时,且内置的P L s 算法的成分数也难于确定在改进的算法中,研g g 和w b r d ( 2 0 0 2 ) 提出的O P L s 方法效果较好,与其他O S C 算法相比,这种方法无需迭代,正 交性也得到了充分的保证该算法流程如下: ( 1 ) 初始化站o = 】, ( 2 ) w = o 石( F 即 ( 3 ) w = w l I 卅| ( 4 ) f = 斯( w w ) 一( 5 ) 矿= f t 】r “f f ) ( 6 ) 甜= 毙( c c ) ( 7 ) 判断是否收敛:肛一l I l I “0 l O 浙江大学硕士学位论文 文献综述 O C ,= l , o Z c ,f = l , , ( 一口j ) = o ,l l 求解未知量口,口,则 , w = ( 一西) 伊( 一) , 得回归函数: , ( 力= ( 口,一口? ) K ,力+ 6 其中,口? 不为。的部分样本即为支持向量 目前研究较多的核函数主要有三类j 一 一 一 ( 1 ) 多项式核函数 K ( t ,) = 【 ,) + l 】9 ( 2 ) 径向基核函数( R B F ) 地圳一e X p - 钭 ( 3 ) S i g m o i d 函数 K ( 一,z J ) = t a 咀h ( ,( 一x ,) + c ) 另一种基本的S 之算法:最小二乘支持向量机回归( L e a S ts q u a r e s - S t ,L S s 乇) 是标准S V R 在二次损失函数形式下的一种扩展,它用等式约束替代不等式约束,这样 只需求解一个等式方程组,避免了耗时的求解二次规划问题( S u y k e n s 和V a n d e w a I 】e , 1 9 9 9 ;B o r i n 等,2 0 0 6 ) ,其本质是将优化问题转变为求解线性问题L S S 之的问题表 述为: 眺帅2 + 圭7 缸 约束条件: 浙江大学硕士学位论文 文献综述 y f = w 9 ( z ,) + 6 + P ,f = l , 其中,y 为惩罚参数得拉格朗日函数 = 洲2 + 厂车P ? 一妻口加讹) + ,叫) 根据优化条件: 凳:o w :圭州 弧”一 罢:o 口,:7q 等= 。j 喜铲。 罢:o j w 伊( x ,) + 6 + P ,一y ,:o 由此得一一 故而 , y ,= 口,K ( 而,_ ) + 6 ) 转变为求解线性问题: 其中 坍豳 f K + !1 1 M :I 7 I 卜。J 仁1 卜 1 2 、, X ,L缈 P y ,。 = 、, 而 ,L伊 口 ,。 = 缈 浙江大学硕士学位论文文献综述 s u y k e n s 等( 2 0 0 2 ) 通过修剪技术实现L S S v M 对稀疏矩阵的逼近 无论是S t 还是L s S v R ,其训练的核心是参数优化问题,即惩罚参数,不敏感 损失函数中的占,和核函数参数U S t e n 等( 2 0 0 5 ) 采用遗传算法和单纯形法对上述参 数进行优化其他启发式算法如蚁群算法( A n tc o l o n y0 p t i m i z a t i o n ,A c O ) 和粒子群 优化算法( P a n i c I es 、a 硼o p t i m i z a t i o n ,P S O ) 在优化s V R 和L s - s v R 参数上也得到了 很好的应用( 秦军立等,2 0 0 9 ;刘瑞兰等,2 0 0 6 ) 一般来说,采用启发式算法进行参 数寻优无论在计算效率和最终预测结果上往往要比网格搜索法要好 2 2 3 2 核偏最小二乘法( K e r n e Ip a r t i a l l e a s ts q u a r 豁,K P L S ) 核偏最小二乘法是由R 0 s i p a l 和州o ( 2 0 0 1 ) 将核函数技术引入P L S 中,实现对 线性回归方法的非线性改造K i m 等( 2 0 0 5 ) 将) L S 与O s C 校正相结合,显示了其 优于O S C P L S 的预测性能N i C 0 l a :j f 等( 2 0 0 7 ) 成功应用此方法预测苹果中的糖含量, 并分析了三种核函数的性能,显示了其优于线性方法的预测性能考虑到算法的稳定 性,K P L S 算法采用类似M P A L S P L s 算法的形式,步骤如下: ( 1 ) 初始化= 】, ( 2 ) ,= = 砌 f = ,删 ( 3 ) c = 】, ( 4 ) = “ ( 5 ) 判断是否收敛:肛一“。l l M 0 ,起到对误差超出占的样本惩罚程度 juD告。Jejbs口8吕苗。匣 苦矗娶寒g苗星 荆嗤警代霹 | 椭蓍!警恹羁 浙江大学硕士学位论文 结果与分析 控制的作用在R B F 核中,盯是影响核宽度的参数核参数的改变实际上是隐含的改 变低维向高维的映射函数,从而改变样本数据子空间分布的复杂程度但当异常值存 在时,算法会将其自动确定为支持向量,从而导致与真实模型存在较大的偏差 C h 啪g 和L ( 2 0 1 1 ) 采用H S t ( H y b r i dS ) 的仿真测试结果表明,采用 C h e r k 邪s k y 和M a ( 2 0 0 4 ) 设置S t 参数的原则,通过训练集数据估算噪音水平,确 定合理的占,进而剔除异常值此方法成功解决了对存在大量异常值的一维真实数据 ( 来自h t t p :朋i b 删锄u e d 删粕e t 怕a l l o o n ) 的预测问题,在剔除训练集异常值的同 时保证了模型的稳健性然而,在多维光谱数据中,变量间存在较大的共线性,采用 C h e 妇s 时和M a ( 2 0 0 4 ) 的原则难以确定盯,使样本数据子空间分布的复杂程度不 可控,易导致过拟合现象本文受上述启发,采用迭代的、礼S S t ( R W L S S 乇) 剔除异常值,并采用S 乇方法重新建模,使其具有稀疏性因为若采用修剪技术实现 稀疏性,其模型参数的更新及迭代次数设置等仍存在一定的问题 一 一。一十 一一。采用本文改进算法州L s S v R 测试下述模拟数据( 如图9 ,x 已被缩放至啦l 之间) :y = 5 。5 + 1 3 s i n ( x 2 ) x 2 + S ,x 【_ l o ,l o 】,等间距
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年水利水电工程安全生产基础知识试题及答案
- 20万千瓦风电工程社会稳定风险评估报告
- 2025财会类专技岗考试真题及答案
- 2025病理学考试真题及答案
- 2025殡仪协会考试真题及答案
- 游泳教练基本考试题
- 初中美术考试试题及答案
- DB14T35182025幸福河湖评价导则
- 军医医学基础题库及答案
- 2025年煤炭财务知识题库及答案
- 导管相关并发症的预防及处理
- 铁路信号基础继电器详解
- 外墙真石漆工程安全文明施工保证措施及环境保护体系和保证措施
- 等离子点火系统及暖风器系统培训
- 2024年金华市中心医院医疗集团(医学中心)招聘笔试真题
- 新课标体育与健康教案集(水平四)
- 混凝土结构设计原理(第五版)课后习题答案
- 中国非遗文化鱼灯介绍介绍2
- 金华市金东区合同制教师管理办法
- 5.申恒梅-环境空气自动监测数据审核、评价及异常数据判定
- 智能安防系统维护与保养手册
评论
0/150
提交评论