3第三章线性判别函数

上传人：j*** IP属地：河南上传时间：2020-04-16 格式：PPT 页数：50 大小：613KB 积分：15 举报 版权申诉

已阅读5页，还剩45页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三章线性判别函数郝红卫 1 第三章线性判别函数 3 1引言3 2线性判别函数和决策面3 3广义线性判别函数3 4两类线性可分情况3 5梯度下降算法3 6感知准则函数最小化3 7松弛算法3 8最小平方误差方法第三章线性判别函数郝红卫 2 引言贝叶斯公式中需要知道类条件概率密度函数和先验概率在实际中我们通常只能得到有限数目的样本因此分类器的设计过程可以分为两步利用样本集估计先验概率和类条件概率密度函数将估计值代入贝叶斯公式完成分类器设计第三章线性判别函数郝红卫 3 引言先验概率的估计比较容易比如癌细胞识别中可以根据细胞病理检查的统计结果得到正常与异常的大致比例密度函数的估计非常困难只能根据样本进行估计第三章线性判别函数郝红卫 4 引言解决的思路迎难而上参数估计假定密度函数是种分布即分布形式已知但参数未知通过训练样本估计分布的参数比如假定分布为正态可以利用样本估计其均值和方差非参数方法分布的形式未知直接通过样本估计密度函数的形式和参数另辟蹊径第三章线性判别函数郝红卫 5 引言在对正态分布下贝叶斯决策理论的讨论中我们看到在正态假设下可以得到一些简单方便的判别函数如最小距离线性判别函数我们可以绕过对密度的估计直接得到判别函数在所有的判别函数中最简单的是线性判别函数第三章线性判别函数郝红卫 6 引言线性判别函数的优点特定条件下为最优正态独立等方差可以通过对特征的选择来达到相对简单容易实现牺牲精度享受简便性能和代价的折中是复杂方法的基础线性判别函数中的基本方法可以推广到非线性判别函数中第三章线性判别函数郝红卫 7 引言思路假定判别函数的形式已知线性判别函数未知的是判别函数的参数参数由样本约束合适的参数将使错误率最小通过训练样本确定其参数找出使训练样本错误率最小的参数最优化方法第三章线性判别函数郝红卫 8 引言设计线性分类器的主要步骤根据需求确定准则函数使准则函数的值反映分类器的性能如错误率其极值解对应最优决策用最优化技术求出准则函数的极值解将该极值解代入线性判别函数的表达式中完成分类器的设计第三章线性判别函数郝红卫 9 线性判别函数和决策面线性判别函数是x各分量的线性组合 g x wtx w0其中x x1 x2 xd t是d维特征向量w w1 w2 wd t是d维权向量 weightvector w0为常数称为偏置 bias 或阈值权 thresholdweight 第三章线性判别函数郝红卫 10 线性判别函数和决策面通常我们需要设计c个判别函数分别与c个类别相对应先来看两类的情况 Decide 1ifg x 0and 2ifg x w0and 2otherwise 第三章线性判别函数郝红卫 11 线性判别函数和决策面第三章线性判别函数郝红卫 12 线性判别函数和决策面方程g x 0定义了一个决策面它将分属两类的样本分开假设x1和x2都在决策面H上则有 wtx1 w0 wtx2 w0wt x1 x2 0这表明 w和超平面H上任一向量正交即w是H的法向量超平面H将特征空间分成两部分即对 1类的决策域R1和对 2类的决策域R2 由于当x在R1中时 g x 为正所以法向量是指向R1的故称R1中的x在H的正侧称R2中的x在H的负侧第三章线性判别函数郝红卫 13 线性判别函数和决策面判别函数g x 是特征空间中某点到超平面距离的一种代数度量如图所示第三章线性判别函数郝红卫 14 线性判别函数和决策面可以将x表示成其中xp 是x在H上的投影向量r 是x到H的垂直距离w w 是w方向上的单位向量第三章线性判别函数郝红卫 15 线性判别函数和决策面代入g x 或写作第三章线性判别函数郝红卫 16 线性判别函数和决策面若x为原点则g x w0因此原点到超平面H的距离为r0 w0 w 总之利用线性判别函数进行分类就是用一个超平面把特征空间分割成两个决策区域超平面的方向由权向量w确定超平面的位置由阈值权w0确定判别函数正比于x到超平面的代数距离带正负号当x在超平面正侧时 g x 0 在负侧时 g x 0 第三章线性判别函数郝红卫 17 线性判别函数和决策面多类情况可以把c类问题看做c个两类问题其中第i个问题是用线性判别函数把属于 1类的点与不属于 1类的点分开可以用c c 1 2个线性判别函数把样本分成c个类别每个线性判别函数只对其中的两个类别分类两种方法都会产生无法确定其类别的区域如图所示第三章线性判别函数郝红卫 18 线性判别函数和决策面第三章线性判别函数郝红卫 19 线性判别函数和决策面我们可以定义c个判别函数如果对于所有的j i有gi x gj x 则把x归为 i类如果gi x gj x 则拒识这样得到的分类器称为线性机器 linearmachine 线性机器把特征空间分成c个决策区域当x在Ri中时 gi x 具有最大值如果Ri和Ri是相邻的则它们的分界就是超平面H的一部分其定义为gi x gj x 第三章线性判别函数郝红卫 20 线性判别函数和决策面共有c个决策区域实际中超平面的个数往往会少于c c 1 2个如图所示第三章线性判别函数郝红卫 21 广义线性判别函数线性判别函数可以写成通过增加高次项可以得到二次判别函数 quadraticdiscriminantfunction 第三章线性判别函数郝红卫 22 广义线性判别函数继续增加更高次的项得到多项式判别函数 polynomialdiscriminantfunction 这可以看作对某一判别函数做级数展开然后取其截尾逼近由此得到广义线性判别函数 generalizedlineardiscriminantfunction 或第三章线性判别函数郝红卫 23 广义线性判别函数在中 yi x 可以是x的任意函数通过选择合适的y 就可以逼近任意复杂的判别函数得到的判别函数并不是x的线性函数但却是y的线性函数虽然理论上我们可以通过这种方式来解决非线性问题但这种变换却使得维数大大增加陷入维数灾难第三章线性判别函数郝红卫 24 广义线性判别函数其中一个特例却是有用的我们可以把线性判别函数写成如下的形式式中y称为增广样本向量 a称为增广权向量这样做带来的好处是将两个参数w和w0合并成一个参数a 第三章线性判别函数郝红卫 25 两类线性可分情况线性可分设有一个包含n个样本的集合 y1 y2 yn 其中某些样本为 1类某些为 2类如果有一个线性机器能把每个样本正确分类即如果存在一个权向量a 使得对于任何y 1都有aty 0 而对于任何y 2都有aty 0 则称这组样本集是线性可分的否则称为线性不可分的反之如果样本集线性可分则必存在一个权向量a 能将每个样本正确分类第三章线性判别函数郝红卫 26 两类线性可分情况样本的规范化样本线性可分则必存在某个权向量a 使得如果在来自 2类的样本前面加上一个负号即对yj 2 令yj yj 则也有atyj 0 因此如果我们令则就可以不管样本原来的类别标志只要找一个对全部样本yn 都满足atyn 0的权向量a即可上述过程称为样本的规范化 yn 叫规范化增广样本向量在后面仍用yn来表示它第三章线性判别函数郝红卫 27 两类线性可分情况解向量和解区在线性可分的情况下满足atyn 0的权向量称为解向量记为a 解向量往往不止一个而是由无穷多个解向量组成一个区域这样的区域称为解区第三章线性判别函数郝红卫 28 两类线性可分情况对解区的限制对解区加以限制的目的在于使得解向量更可靠通常认为越靠近解区中间的解向量似乎越能对新的样本正确分类因此我们可以引入余量b 0 并寻找满足atyn b的解向量a 实际上我们主要关心的是求解权向量的算法不至于收敛到解区域的边界上显然余量的引入可以很好地避免这个问题第三章线性判别函数郝红卫 29 两类线性可分情况引入余量的解区第三章线性判别函数郝红卫 30 梯度下降算法求解线性不等式组atyi 0的方法定义一个准则函数J a 使得当a是解向量时 J a 为最小这样就将问题简化为一个标量函数的极小化问题通常可以用梯度下降法来解决梯度下降法的基本步骤首先任意选择一个初始的权向量a 1 计算梯度向量 J a 1 然后自a 1 沿梯度负方向移动一段距离得到下一个值a 2 反复迭代最终收敛到一个使J a 极小化的解上第三章线性判别函数郝红卫 31 梯度下降算法取初值a 1 迭代其中是正的比例因子是用于设定步长的学习率 learningrate 第三章线性判别函数郝红卫 32 梯度下降算法第三章线性判别函数郝红卫 33 感知准则函数最小化定义感知准则函数其中是被a错分的样本集合如果没有样本被错分我们定义Jp a 为0 由于当atyi 0时即样本被a错分时Jp a 是非负的只有当a是解向量时才为0 故a 对应着Jp a 的极值解第三章线性判别函数郝红卫 34 感知准则函数最小化梯度迭代公式第三章线性判别函数郝红卫 35 感知准则函数最小化批处理感知机算法第三章线性判别函数郝红卫 36 感知准则函数最小化固定增量单样本感知机算法第三章线性判别函数郝红卫 37 感知准则函数最小化感知机算法收敛定理如果训练样本线性可分则由固定增量单样本感知机算法给出的权向量序列必定收敛于某个解向量第三章线性判别函数郝红卫 38 感知准则函数最小化固定增量单样本感知机算法详细步骤样本增广样本规范化取初值迭代得到最终解第三章线性判别函数郝红卫 39 感知准则函数最小化例31固定增量单样本感知机算法示例 pdf32固定增量单样本感知机算法示例 doc 第三章线性判别函数郝红卫 40 感知准则函数最小化算法推广带余量的变增量感知机算法Begininitializea marginb k 0dok k 1 modnifatyk bthena a k ykuntilatyk bforallkreturnaEnd 第三章线性判别函数郝红卫 41 感知准则函数最小化批处理变增量感知机算法第三章线性判别函数郝红卫 42 松弛算法为了使搜索表面更为平滑我们可以采用二次的准则函数其梯度是连续的但存在两个问题有可能得到无意义的解a 0模值大的样本对其影响太大第三章线性判别函数郝红卫 43 松弛算法改进后得梯度迭代公式第三章线性判别函数郝红卫 44 松弛算法批处理余量松弛算法第三章线性判别函数郝红卫 45 松弛算法单样本余量松弛算法第三章线性判别函数郝红卫 46 最小平方误差方法前面的准则函数依然存在两个问题只能利用被错分的样本实际上是在解线性不等式组不如解线性方程组方便为此我们可以引入余量bi bi是任意取定的正常数这样就可以将一个求解线性不等式组atyi 0的问题转化为求解线性方程组atyi bi 同时利用平方误差来定义准则函数无论是否错分只要有误差就进行调整

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

3第三章线性判别函数

文档简介

温馨提示

最新文档

评论

3第三章线性判别函数

文档简介

温馨提示

最新文档

评论

相关文档