版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、算法:一、移动窗口最小二乘多项式平滑(Savitzky-Golay Smoothing)假设数据(光谱或者是色谱等)为X,选定的平滑窗口大小为m(其必须为奇数,这里以7为例),多项式次数为n,这里以3为例,当前平滑的点为X0,前3个点分别记为:X-3,x_2,X-1 ,以及后三个点记为:Xi,X2,X30移动窗口最小二乘多项式平滑就是利用中心点以及其前3个点和后3个点进行最小二乘拟和。每一个点可以表示为不同的多项式的结果,从而7个点可以表示成为含有n+1(下面的例子是4个)个未知数,m(例子中为7)个方程的方程组:X =bb(-3)b2*( -3)2b3*(-3)3= b-3bi9b2-27b
2、Xu =bb(-2)b2*( -2)2炳*(-2)3= b0-2tv4b2-8b3X- =bo+b!*( 1) + b2*( T)2+b3*(1)3=加bi+b2 b3X= b。bi*( -0) b2*(-0)2b3*(-0)3= bXi=bbi*(1)b2*(1)2b3*(1)3= bb2b3(1)X2 =b0bi*(2)b2*(2)2b32)3= b2tv 4b28b3X3= bbi*(3)b2*(3)2b3*(3)3= b3bi9b227b3对于上述方程的求解,采用最小二乘法。利用线性代数中的矩阵知识, 为下面矩阵形式:即:A * b=x. . 一 .,_. 、 - . .一 、 -*因
3、而米用取小二乘法您算,碍到一个b b的解析解b :b*=( A危A )-1* At*x从而得到这个方程组的最小二乘解为:线性方程可以表示成1111111-3-2-1012941014x_iX。43 9 27X2X3Jlx3将求出来的b b*代入方程或者就可以求出平滑之后的数据点。实际上,如果将方程5求得的b b*代入方程1或者2之后得到如下7个方程:1 .Xw =一 *(39x-3+8x-2-4x-i-4x0+Xi+4x2-2x3)421 5x = *(8x-3+ 19X-2+ 16x-1+6x0-4xi-7x2+4x3)421.、Xj = 一*(-4x-3+ 16X-2+ 19X-1+12X
4、0+2X1-4X2+X3) 42X0 =*(-4x-3+6x-2+ 12x-1+ 14x0+ 12x1+6x2-4x3) 42x =*(x-3-4x-2+2x-1+12x0+19x1+ 16x2-4x3) 421 5X2 =*(4x-3-7x-2-4X-1+6X0+16X1+19x2+8x3) 421 X3 =一*(-2x-3+4x-2+X-1-4X0-4x1+8x2+39x3)42从这个里面我们可以发现,它们其实都是这个窗口内部各个点的线性组合,即7个点由不同的权值进行加权而得,对于我们需要的点X。也是由7个点加权而得。因此从本质上说,移动窗口多项式平滑其实就是利用窗口内部各个点之间的加权来
5、计算平滑后的新值。计算过程中,中间局部我们只需要X0这个点的值即可,即从第四个点开始仅需要计算X0这个点的值。而对于开始的三个点和最后的三个点,没有很好的处理方法,因此我们还是利用式子6来计算:开始的三个点用6式中的X-3 ,X-2,X-1计算式计算,最后的三个点用 式中的X1,X2,X3计算式计算。详细解释也可见分析化学手册第十分册。(-691821189-6 )15.5-16.75-14.5014.516.75-5.5一633.750-2.25-3-2.2503.751-1.751.751.750-1.75-1.751.75X0XiX2(5)(6)文二、粗糙惩罚(Roughness Pen
6、alty Smoothing)粗糙惩罚其实为了克服最小二乘法不稳健而引入的一个方法。设平滑后的各个点为y*(i),最小二乘法的目标函数是想让最后的结果与原始数据之间的差异最小:2然而在实际情况中,如果有很多异常点的话, 这个标准并不能代表我们模型的准确性,有时候反而会产生非常大的误差,比方说色谱中如果噪声水平很高的话,平滑效果并不好。因此,Silverman在1994出版的一本书中提出了粗糙惩罚算法,其就是在最小二乘目标函数后面加上一个惩罚项:n2min (y(i) - y*(i)(;:2f (x)2d(x)i日式中,7、是惩罚系数,其越大,那么说明对这个数据点的惩罚越严重。后面的积分项是对函
7、数在x处的求二次导(这里的x并不是我们的数据点x(i),这个也就是高等数学里面的曲线的 曲率。现在的问题是如何优化这个目标函数?目标函数中前一个式子就是最小二乘拟和,可以通过回归得到(同SG平滑),而后面的积分式,由于f(x)很难得到。实际上,这个目标函数是一个优化问题,可将其转化为线 性代数进行求解。已经证明了,如果函数f(x)可以通过立方样条表示,那么可以通过一系列的变换得到如下的算式:(2f (x)2d(x) = yKy*(9)其中K通过下面的表达式求得:K = QRH(10)对于色谱或者光谱来讲,由于是等间距采样的,故可以得到Q和R的表达式如下:一2102-2(11)-2n*min (
8、y(i) - y(i)i =1(8)12/31/60000、1/62/31/600001/62/31/600R =00a1/6a2/39+ .0a09(12)00002/31/600001/62/3 j其中Q是一个n*(n-2)的一个矩阵,R是一个(n-2)*(n-2)的一个方形矩阵。利用上面两个式子(11)和(12)代入方程(10)可以求出K,再代入方程(8)经过变换之后,目 标函数变为:n2 (y(i)-y*(i)(2f(x)2d(x)i V+ *+ *+ *=yt*y-2yt*y y*( I K)* y(13)求S的最小值。经过变换可以发现,当:*_1y = (I K)1* y(14)的
9、时候,S可以取最小,这样就求得了平滑函数的表达式。但是其中丸应该如何判断呢?在分析化学手册第十分册中提到了采用去一法交互检验来选择参数人,即:nCV = n、i=1*2(y(i) - y (%1-A()(15)其中A(舄)是矩阵A=(I+舄K)的第i个对角元素。通过代入不同的 人值可以得到不同 的CV值,在兀变化范围之内选择CV值最小时对应的值作为参数代入(14)式,就得到了平 滑后的函数。上面的两个式子中,kern(x)就是kernel函数,是kernel平滑的核心,其有三种表达式, 分别代表不同的加权函数:10.5 x1均匀函数:kern(x)= 0 otherwise10. 7 5(1x
10、2) x苴1三、kernel平滑方法Kernel平滑方法在各种数据方法处理书中介绍得非常多,其本质上和SG平滑一样,采用加权函数,利用窗口内部各个点的信息,来拟和当前点,从而取得平滑效果。因此,kernel平滑方法的变化主要是变化在加权函数上面,而加权函数在kernel平滑以及书上介绍都是采用术语估计器(estimator)来表示。同样假设平滑后的数据表示为y*(i),带宽为h,加权函数用S(t)表示,那么对于在某一时刻t (比方某个色谱的保存时间)的拟和值其计算式为:n* _ _y(t Sj(t)y(j)j =1(16)在1964年Nadaraya, Watson提出了加权函数 月(i)的计
11、算式:Sj(t)kern(L - t)/h)n、 kern(L - t)/h)j(17)后Gasser和Muller对其进行了改良,下面提供的算法是改良后的算法,而Nadaraya-Watson加权函数可以直接代入式(16)进行计算,因此不于详细介绍。Gasser和Muller提供的加权函数表达式为:1Sj(t)=h,* t(j)t(j 1),U-tker n( ) h(18)二次函数:ken X =) S0otherwise高斯函数:ken x i(21/)2exup2(/ 2)利用不同的kernel函数会得到不同的平滑效果。在式子(17)中,t*=(tj+tj)/2 ,1j vn,t0=t
12、1,t;=tn。经过变换后得到一个Gasser-Muller二次kernel加权函数为:1 33、1i3rj(t) - rj(t) -3rj(t) - rj(t)/ Sj(t) = 40otherwise式中,式(18)是通过式(17)和二次kernel用。可见,加权函数实质上就是利用在带宽加权,而对于在h范围之外的点,不考虑其影响,即其权值为0,S是一个n*n,带宽为h/2的带状矩阵,每一行代表一个点的加权信息。带宽h的选择一直以来都是数据处理学家们一个研究的课题,已经提出非常多的方法来对其进行自动选择,但是到现在还没有一个可以解决所有问题的解决方案,因此对其算法也不予介绍。而且本人比拟信奉
13、的一句话是J.O. Ramsay和B.W. Silverman在他们的书functional data analysis中提到的h的选择,任何一种算法其实还比不上人眼的判断,如果我 们试了几个h值,觉得其中一个已经到达了我们的要求了,那我们就无需花费大量的心思在算法上面,把其变成完美(Our own view is that trying out a variety of values of h and inspectingthe consequences graphically remains a suitable means of resolving the bandwidth select
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机台班组安全活动制度培训课件
- 起重机械安全管理人员职责培训
- 卫生院安全隐患排查制度培训课件
- 任务4.3活动数据分析工作页
- 起重机械卷筒安全检查培训课件
- 2026安国市法院面试题及答案
- 2026阿里java校招面试题及答案
- 景区安全检查制度培训课件
- 配电室安全防护制度培训
- 配电室安全工作职责培训课件
- (五调)武汉市2026届高三年级五月调研考试数学试卷(含答案及解析)
- 2026年广西专业技术人员继续教育公需科目试题及答案
- 2026年家庭保姆协议书
- 2026届河北省石家庄市新乐市重点名校中考英语仿真试卷含答案
- 2026广东深圳市九洲电器有限公司招聘android 应用工程师1人笔试参考试题及答案详解
- 2026江西省江投海油新能源有限公司招聘4人笔试参考题库及答案解析
- 2025年2026春季新人教版物理八年级下册全册教案新版
- 2025-2030中国生核桃行业市场现状分析及竞争格局与投资发展研究报告
- 云仓工作加工制度概述
- 蒙大《中国哲学史》课件05宋明哲学
- 04.028金属零件涂层标准盐雾试验
评论
0/150
提交评论