基于主成分分析和小波神经网络的近红外多组分建模研究_第1页
基于主成分分析和小波神经网络的近红外多组分建模研究_第2页
基于主成分分析和小波神经网络的近红外多组分建模研究_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于主成分分析和小波神经网络的近红外多组分建模研究         11-04-22 16:18:00     编辑:studa20                作者:汤守鹏 姚鑫锋 姚 霞 田永超 曹卫星 朱艳【摘要】【关键词】  小波神经网络, 主成分分析, 近红外光谱, 小麦叶片, 全氮, 可溶性总糖 

2、;          本文系教育部新世纪优秀人才支持计划(No.NCET080797)、国家自然科学基金(No.30871448)、国家科技支撑计划(No.2008BADA4B02)、江苏省创新学者攀登计划(No.BK20081479)和江苏省自然科学基金(No.BK2008330)资助1 引 言近红外光谱(NIR)分析技术以其快速、环保、可多组分同时检测等优点1,在各个领域得到了广泛应用2。NIR属于弱信号,信息提取必须依靠化学计量学才能实现,传统的定量校正方法,如偏最小二乘法(PLS),仅适用于线性模

3、型,而实际应用中却存在很多非线性关系3。人工神经网络可解决连续非线性函数的逼近,在多组分分析中优势明显,其中反向传播(BP)算法是采用最多也是最成熟的神经网络训练算法之一4,但是BP网络(BPNN)存在着易陷于局部最小和收敛速度慢等弱点5,6。小波神经网络(Wavelet neural network, WNN)已经在化学领域得到了广泛应用7,8。小波神经网络综合了小波多尺度分析和神经网络自学习的优点,因而具有比传统神经网络更快的收敛速度和更强的逼近性能。已有的多组分预测模型大都采用PLS方法9和传统BP网络10,11,而将小波神经网络用于近红外光谱定量分析的报道较少。小波神经网络用于函数优化

4、时,其输入层的维数和小波基函数都不能太多,否则会大大增加模型参数12。主成分分析(Principal component analysis, PCA)是对光谱数据压缩和信息提取的有效方法13,通过提取少数几个主成分(即原始变量的线性组合),并把它们作为小波神经网络的输入,既可以保证输入数据的精度,又可以大大加快神经网络的收敛速度14,15。本研究首先运用主成分分析方法(PCA)从预处理后的小麦叶片近红外光谱中提取主成分,以达到降维目的;然后将降维后得到的主成分作为小波神经网络的输入,建立基于主成分分析和小波神经网络的近红外多组分预测模型,以用于同时预测小麦叶片全氮和可溶性总糖含量;最后通过与P

5、LS方法和传统神经网络的比较分析,检验小波神经网络模型的收敛速度和预测精度。2 理论部分2.1 主成分分析主成分分析(PCA)是一种数据压缩的常用方法,通过少数几个主成分(即原始变量的线性组合)解释多变量的方差, 即导出少数几个主成分,使它们尽可能完整地保留原始变量的信息,且彼此间不相关,以达到简化数据的目的。将该方法结合神经网络用于近红外光谱定量分析,既能保证输入数据的精度、减少训练时间,又能简化网络结构13。2.2 小波神经网络理论小波神经网络(WNN)是将小波理论与人工神经网络的思想相结合而形成的一种新的神经网络7。它将传统神经网络中的隐层节点激励函数(如Sigmoid函数)用小波函数来

6、代替, 图1 小波神经网络结构Fig.1 Structure of wavelet neural network相应的输入层到隐层的权值及隐层阈值分别由小波函数的伸缩参数a与平移参数b所代替,而输出层通常为线性神经元,它将隐层的小波伸缩系进行线性叠加形成输出结果。对于一个单隐层的神经网络,假设有p个输入节点,h个隐层节点,q个输出节点,则小波神经网络的结构如图1所示,其输出表达式见公式(1):fk(x)=hj=1wjk(pi=1xi-bjaj)(1)其中,xi(i=1, 2, , p)为输入层第i个输入变量,k =1, 2, , q,h为隐层节点数,为隐层的小波基函数,wjk是隐层第j个节点到

7、输出层第k个节点的连接权值,bj和aj分别是小波函数的平移参数(隐层节点的阈值)和伸缩参数(输入层到隐层节点的权值)。由此可见,小波网络可调整的参数包括wjk、bj和aj,共有3×h个,它们通过最小均方误差函数得到优化。本研究选择常用的Morlet小波函数16作为小波神经网络的隐层激励函数,该小波是余弦调制的高斯波,时频域分辩率较高。3 实验部分3.1 样品和仪器Fig.2 Near infrared absorbance spectra of leaf samples所有光谱数据都转化为波长形式,范围为10002500 nm,数据点间隔取为1 nm,因而所有的样品光谱就组成了一个144行1501列的矩阵。图2为144份样品的近红外原始光谱图。样品全氮含量(TNC)采用凯氏微量定氮法测定,可溶性总糖含量(TSSC)采用蒽酮比色法测定17。每份样品每个指标重复测定3次,取平均值作为该样品化学值(各组分含量单位均为%),样品集的全氮和可溶性总糖含量变化范围分别为0.60%4.32%和0.50%4.78%。3.2 数据处理与分析运用马氏距离法18剔除奇异样品后,对NIR光谱进行多元散射校正和Norris一阶导数滤波处理,然后采用PCA方法将光谱压缩成若干主成分,最后将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论