自适应信号处理第五章_第1页
自适应信号处理第五章_第2页
自适应信号处理第五章_第3页
自适应信号处理第五章_第4页
自适应信号处理第五章_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第第5章章 梯度估值及其对梯度估值及其对自适应过程的影响自适应过程的影响Chap.5 Gradient Estimation andIts Effects on Adaptation2 111kkkkkk wwRww实际中,梯度向量实际中,梯度向量k的精确值是无法知道的,必须进行估计。的精确值是无法知道的,必须进行估计。如何估计,如何估计,用有限个统计样本对它进行估计。用有限个统计样本对它进行估计。效果,效果, 观察估值代替真值对自适应过程的影响。观察估值代替真值对自适应过程的影响。为什么需要估计梯度为什么需要估计梯度均用到了梯度均用到了梯度3先考虑单变量的情况:先考虑单变量的情况:2min

2、v2222dvdvddv微商的精确值:微商的精确值:用用“中心差中心差”法估计这两个值(数值估计)法估计这两个值(数值估计)用微商法估计梯度用微商法估计梯度4 用用 处的一阶微商:处的一阶微商: ()()2dvvdv/2v222()(0)(0)()()2 (0)()vvddvvv0中心差估计中心差估计当当 时,这种近似逼近其真实值时,这种近似逼近其真实值5一阶微商一阶微商22minmin()()()()22422vvvvvdvdv 二阶微商二阶微商222()2 (0)()2vvddv在二次型性能函数中,当在二次型性能函数中,当 有限(而非有限(而非 0)时,)时,“中心差中心差”方法给的估计也

3、是精确的。方法给的估计也是精确的。二次型的特殊之处二次型的特殊之处6定义:定义:由于权系数不停留在由于权系数不停留在v点上而引起的均方误差的点上而引起的均方误差的 平均增量称作性能损失平均增量称作性能损失 (performance penalty)1 ()()( )2vvv? 可否取负值。可否取负值。性能损失性能损失v点梯度的估计给出了真值,但点梯度的估计给出了真值,但该点上的函数值却发生了变化该点上的函数值却发生了变化7对于二次型性能函数对于二次型性能函数222minminmin21()() 2vvv1. 对于给定的性能函数对于给定的性能函数, 是一个常数,是一个常数,而不随而不随 v 变化

4、。变化。2. 0总是有性能损失存在总是有性能损失存在v8定义:定义:用均方误差归一化的均方误差的平均增量称作扰动用均方误差归一化的均方误差的平均增量称作扰动2minminpp 是衡量自适应算法性能的一个量(性能损失很少用)。是衡量自适应算法性能的一个量(性能损失很少用)。扰动(扰动(Perturbation)9多权情况多权情况 双权双权?如何估计梯度?如何估计梯度 ?性能损失如何表示?性能损失如何表示min00001min011011122min00011101012TRvrrv vrrvrvrvrvvvv沿每个坐标轴分别测量性能函数的微商沿每个坐标轴分别测量性能函数的微商对每个坐标分量的对每

5、个坐标分量的102000min2111minrprp2110001min1()22rrppp平均扰动:平均扰动:各个坐标轴上:各个坐标轴上:11定义:定义:总的扰动量定义为每一个梯度分量测量所带来的扰总的扰动量定义为每一个梯度分量测量所带来的扰 动量的平均值。动量的平均值。多权情况多权情况 (L+1)个权个权220minmin20min2avmintr( )111LnnnLnnrpLLLR这是扰动量的一个这是扰动量的一个方便的估计式。方便的估计式。12方差,与均值一起,描述随机变量统计特性的一个量方差,与均值一起,描述随机变量统计特性的一个量对于二次型,如果得到对于二次型,如果得到()v的精确

6、值,就可以得出的精确值,就可以得出 vddv的精确值。的精确值。测量得到的测量得到的 值都不是精确的,或说是含噪的(值都不是精确的,或说是含噪的(noisy)梯度估计的方差梯度估计的方差?这些噪声成分对梯度估值会有多大的影响。?这些噪声成分对梯度估值会有多大的影响。!多次测量,分析其统计特性。!多次测量,分析其统计特性。13在估计梯度时,假定在每一个测量点有在估计梯度时,假定在每一个测量点有 N 个采样个采样(sample)211NkkN这里这里 k 是采样次数,而非迭代次数。是采样次数,而非迭代次数。可以证明:可以证明: limk的这种估计是无偏的。的这种估计是无偏的。2kEE 2kE真值:

7、真值:估计值:估计值:14由于在梯度估计中用到了由于在梯度估计中用到了,所以先考虑所以先考虑的方差的方差。 可以证明:可以证明:当当k是零均值的正态分布时,有方差是零均值的正态分布时,有方差的方差的方差22VarN 的方差正比于的方差正比于2,反比于,反比于N。15微商法中包含了求微商法中包含了求 的差。各点的的差。各点的 只用到该点上的只用到该点上的 k的测量值。的测量值。假定样本假定样本 是独立的,则是独立的,则 的值是独立的。的值是独立的。在独立性假设条件下有:在独立性假设条件下有:12122VarVar VarVarVar xxxxcxcx梯度估计的方差梯度估计的方差k16()()2v

8、vv将(将(*)式代入:)式代入:2222211VarVar()Var()441()()2vvvvvN当自适应过程收敛到最佳权向量解附近时,有:当自适应过程收敛到最佳权向量解附近时,有:min()()vv考虑梯度估值的一个分量考虑梯度估值的一个分量22VarN 17所以,梯度估值分量的方差可以表示为:所以,梯度估值分量的方差可以表示为:2min2VarvN1. 仅与仅与 有关有关min,N2. 对任意一个分量都成立对任意一个分量都成立18在梯度估计中,对所有的分量取相同的在梯度估计中,对所有的分量取相同的N 和和,且由于,且由于在所有的估值中,在所有的估值中,k的样本对所有分量都是独立的。的样

9、本对所有分量都是独立的。估值的方差对所有分量也是独立的,且有相同的方差估值的方差对所有分量也是独立的,且有相同的方差min2CovHkkkkkEN 第第 k 次迭代上,梯度估值的协方差矩阵次迭代上,梯度估值的协方差矩阵所以:所以:19研究研究 对权向量的影响对权向量的影响 噪声传递问题噪声传递问题。对权向量解的影响对权向量解的影响? “含噪的含噪的”梯度估值对权向量有何影响。梯度估值对权向量有何影响。!将在权向量解中引起噪声,带来性能上的损失。!将在权向量解中引起噪声,带来性能上的损失。?影响方式?影响方式!取决于所用的方法(牛顿法或最速下降法)。!取决于所用的方法(牛顿法或最速下降法)。分析

10、:分析: 当当kww时,记时,记kNL+1维的梯度估值噪声向量维的梯度估值噪声向量kkk N2011kkkwwR梯度含噪时:梯度含噪时:111kkkk wwRRN1111(1 2 )kkkkkk vvRRNvRN平移坐标系:平移坐标系:可以看出:由于可以看出:由于 的存在,梯度估值噪声的各分量在传递的存在,梯度估值噪声的各分量在传递1R过程中出现了互耦。过程中出现了互耦。牛顿法牛顿法21将问题变换到旋转坐标系中!将问题变换到旋转坐标系中!11(12 )kkk vvN其中:其中:1Hkkk NQNQN表示投影到主轴坐标系中的梯度估值噪声向量。表示投影到主轴坐标系中的梯度估值噪声向量。解决方法解决

11、方法用归纳法可得主轴坐标系中的权向量解。用归纳法可得主轴坐标系中的权向量解。11010(12)(12)kknkknnvvN22110(12 )nkk nn vN牛顿权向量的稳态解牛顿权向量的稳态解1/2时,牛顿法一步收敛时,牛顿法一步收敛1010102 vN0lim1xxx受受0N的影响的影响稳态解稳态解适当地选取适当地选取 使权值收敛使权值收敛11/223Cov()TkkkEvvv对牛顿法:对牛顿法:22111111111111(1 2 )() (1 2 )()TTTTkkkkkkTTkkkk v vvvNNvNNv权向量的协方差权向量的协方差kkvN与假设假设彼此独立,且有零均值,并且彼此

12、独立,且有零均值,并且221 2Cov(12 ) Cov() CovkkkvvN11()T 241 2()CovCov4(1)kkvNCovk v与与CovkN之间的关系之间的关系11121min22min2Cov()()CovTTkkkkkTkkkkkEENN NNNQ NN QQQQQQQ对牛顿法:对牛顿法:1 22min2()Cov4(1)kN v推导:推导:251kkk ww1(2)(1 2)kkkkkkvvRvNR vN变换到旋转坐标系中变换到旋转坐标系中 去耦:去耦:11010(2)(2)kknkk nn vIvIN最速下降法最速下降法平移坐标系,含噪平移坐标系,含噪26稳态解:稳

13、态解:协方差:协方差:212min2()Cov4kN v无估计误差时:无估计误差时:, 0, Cov0kkk vv最速下降法最速下降法110(1 2)knkk nn vN27平移坐标系中权向量的协方差平移坐标系中权向量的协方差 (稳态时)(稳态时)牛顿法:牛顿法: 最速下降法:最速下降法:1 22min2()Cov4(1)kN Rv212min2()Cov4kNRRv式中:式中:步长:步长min:最小均方误差:最小均方误差 :输入协方差矩阵:输入协方差矩阵N :每个扰动权上独立测量的次数每个扰动权上独立测量的次数:估计梯度时权的偏移估计梯度时权的偏移R28超量均方误差与时间常数超量均方误差与时

14、间常数衡量自适应系统性能的两个主要参数衡量自适应系统性能的两个主要参数超量均方误差超量均方误差定义:定义:min excess MSE=E-=E=EkHkkHkk vR vvv仅考虑迭代次数仅考虑迭代次数 k 够够大时的情况大时的情况291. excess MSE仅包含由仅包含由 产生的产生的 相对于相对于 的增量,的增量, 不包含性能损失不包含性能损失 。kNmin2. 如果在自适应过程中没有噪声,如果在自适应过程中没有噪声,*min(,) w噪声的存在噪声的存在稳态解在稳态解在*min(,)w附近变化附近变化超量均方误差超量均方误差30k v的稳态解:的稳态解:110(12)knkk nn

15、 vN令令12r 2111100211100excess MSEnmk nk mnmn mHk nk mmnErrrE NNNN无交叉项存在无交叉项存在牛顿法牛顿法31假定:梯度估计噪声假定:梯度估计噪声N在每次迭代之间是独立的在每次迭代之间是独立的221110excess MSEnHk nk nnr E NN假设:梯度噪声是平稳过程,即均值与假设:梯度噪声是平稳过程,即均值与n无关无关221021221220excess MSE11nHkknHkkLmmkmr EEE nNNNN322mkE n是kN的协方差矩阵的一个对角线元素,且kkk N由定义:由定义:所以:所以:22min2201ex

16、cess MSE=1LmmN212min2()Cov4kNRRv为了更方便地表示和解释该结果,引入一个新的量为了更方便地表示和解释该结果,引入一个新的量 时间常数时间常数比较比较min2CovHkkkkkEN 33时间常数时间常数 权值的时间常数权值的时间常数 权值:权值:*0*0(12 ) ()(12 ) ()kkkkwwwwwwww 牛顿法牛顿法*0()()kkwwrww用用*0()tww e近似表示该曲线近似表示该曲线在在 t=k 的离散点上,的离散点上,两者相等两者相等34000011101022211220203300exp11exp2 exp 3tvvtkvvtvrvtkevevt

17、vr vtkeevevvr vtk*kkvww平移坐标系中平移坐标系中35权系数的收敛过程构造出一个指数包络权系数的收敛过程构造出一个指数包络 ,用,用exp()t表示表示时间常数时间常数这里时间取离散值时,每次采样对应一次迭代这里时间取离散值时,每次采样对应一次迭代令令1re在各迭代点上,在各迭代点上,100kkkkvrveve36Taylor级数展开级数展开231111.2!3!r 在通常的应用场合在通常的应用场合,较大较大(10),r 较小较小(1)所以:所以:11r 对牛顿法:对牛顿法:12r 1237引入两个新的时间常数引入两个新的时间常数1)mse 学习曲线时间常数(以迭代次数为单

18、位)学习曲线时间常数(以迭代次数为单位)2)mse 自适应时间常数(以数据样本为单位)自适应时间常数(以数据样本为单位)2mserr21122msemsereree2mse学习曲线时常数小,收敛快(较学习曲线时常数小,收敛快(较 w)38如果估计梯度时,每一个分量需要如果估计梯度时,每一个分量需要2N个样本,个样本,(L+1)个分量个分量共需要共需要 2 (L+1) N 个样本个样本2(1)(1)msemseLNLN已知采样率,就可以将该时间常数与真实时间常数联系起来已知采样率,就可以将该时间常数与真实时间常数联系起来自适应过程的快慢与迭代次数有关,也与每次迭代所需要自适应过程的快慢与迭代次数

19、有关,也与每次迭代所需要的时间有关。的时间有关。39 超量均方差与时间常数的关系超量均方差与时间常数的关系min202minav2minavavminavav1excess MSE81(1)81(1)81(1)8LmmmseNLNLNpLp牛顿法牛顿法 :minavp 40最速下降法最速下降法学习曲线受学习曲线受(L+1)个模态控制,相应地分别有个模态控制,相应地分别有( L+1 )个时间常数个时间常数,, () , ()nmsenmsen11121, 22()(1)2(1)()nnnnnnmsenmsennmsenrN LN L minav02minav1excess MSE41(1)18L

20、mmmseNpLp41失调(失调(Misadjustment)定义:定义:minexcess MSEM仅由估计噪声引起的仅由估计噪声引起的表征了由于梯度估值噪声引起的自适应系统性能与最佳维表征了由于梯度估值噪声引起的自适应系统性能与最佳维纳解性能纳解性能即,使用自适应所付出的代价的归一化量度。即,使用自适应所付出的代价的归一化量度。注意:注意:M中不包含为估计梯度而人为地偏置权向量所引起的扰动中不包含为估计梯度而人为地偏置权向量所引起的扰动p42牛顿法牛顿法 : 最速下降法:最速下降法:2avav1(1)8mseLMp2av(1)18mseLMp1. ,msepM 2.(1)LM自由度更大,要

21、付出更多的代价自由度更大,要付出更多的代价3.22(1),22mseNNLNNN, 不变不变,M 不变不变梯度估计更精确梯度估计更精确小步长小步长+少数据量等价于大步长少数据量等价于大步长+大数据量大数据量/步步43性能比较性能比较主要参数:主要参数:, M比较方式:比较方式:速度相同时,两种算法的失调量;速度相同时,两种算法的失调量; (固定失调量,比较速度)(固定失调量,比较速度)。 准备:准备:将最速度下降法将最速度下降法 M 的表达式简化的表达式简化。av1?mseTmaxmin11, 222msenn44maxmaxmin(1)()2(1)()2msemseL NLN(1)()2msennLNavav(1)12mseLNTavavavminmaxminmaxav221(1)2()()msemsemseLN最大自适应时间常数最大自适应时间常数第第 n 个自适应时间常数个自适应时间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论