


已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.1. 什么是模式及模式识别?模式识别的应用领域主要有哪些?模式:存在于时间,空间中可观察的事物,具有时间或空间分布的信息;模式识别:用计算机实现人对各种事物或现象的分析,描述 ,判断 ,识别。模式识别的应用领域: ( 1)字符识别; ( 2) 医疗诊断; (3)遥感; (4)指纹识别脸形识别;( 5)检测污染分析,大气,水源,环境监测;( 6)自动检测; ( 7 )语声识别,机器翻译,电话号码自动查询,侦听,机器故障判断;( 8)军事应用。2. 模式识别系统的基本组成是什么?(1) 信息的获取:是通过传感器,将光或声音等信息转化为电信息;(2) 预处理:包括ad, 二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理;( 3)特征抽取和选择: 在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征;( 4) 分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。把这些判决规则建成标准库;( 5)分类决策:在特征空间中对被识别对象进行分类。3. 模式识别的基本问题有哪些?( 1)模式 (样本 )表示方法:( a)向量表示; ( b)矩阵表示; ( c)几何表示; ( 4)基元 (链码)表示;( 2)模式类的紧致性:模式识别的要求:满足紧致集,才能很好地分类;如果不满足紧致集,就要采取变换的方法,满足紧致集( 3)相似与分类;(a)两个样本xi , xj 之间的相似度量满足以下要求: 应为非负值 样本本身相似性度量应最大 度量应满足对称性 在满足紧致性的条件下,相似性应该是点间距离的单调函数(b)用各种距离表示相似性( 4)特征的生成 :特征包括: (a)低层特征 ;(b) 中层特征 ;(c)高层特征( 5) 数据的标准化 :(a)极差标准化;(b) 方差标准化4. 线性判别方法( 1)两类:二维及多维判别函数,判别边界,判别规则;.二维情况:( a)判别函数:g (x)w1 x1w2 x2w3 (w为参数,x1, x2为坐标向量)( b)判别边界:g(x)=0;( c)判别规则:gi ( x)0, x10, x2n 维情况:( a)判别函数:g (x)w1 x1w2 x2.wn xnwn 1也可表示为:g (x)wt xw( w1 , w2,., wn, wn)t 为增值权向量,1x(x , x ,., x ,x1) t 为增值模式向量。12nn( b)判别边界:g1(x) =wtx=0( c)判别规则:gi ( x)twix0, xi0,其它,i1,2,.,m。(2) 多类: 3 种判别方法(函数、边界、规则)(a) 第一种情况:(a)判别函数: m 类可有 m 个判别函数t1gi ( x)wix式中wi 权向量。(wi1, wi 2,., win, win, )t 为第i个判别函数的(b) 判别边界: i (i=1,2,n)类与其它类之间的边界由g i(x)=0 确定(c) 判别规则:gi ( x)twix0, xi0, 其它, i(b) 第二种情况: (a)判别函数:有m(m _ 1)/2 个判别平面1,2,., m。tgij ( x)wijx(b) 判别边界:(c) 判别规则:g ij ( x)gij( x)00当xiij0当xj(c) 第三种情况:(a)判别函数:(b) 判别边界:gk ( x)wk xgi(x) =gj(x) 或 gi(x) -gj(x) =0(c) 判别规则:gi ( x)w t x最大,当 xik小,其它5. 什么是模式空间及加权空间,解向量及解区?(1) 模式空间:由x(x1, x2, x3,.xn)t构成的 n 维欧氏空间;(2) 加权空间:以w1 , w2 ,., wn1 为变量构成的欧氏空间;(3) 解向量:分界面为h, w 与 h 正交, w 称为解向量;(4) 解区:解向量的变动范围称为解区。6. 超平面的四个基本性质是什么? 性质: w 与 h 正交;性质:rg (x) w其中,r为 x 矢量到 h 的正交投影;性质:q性质:wn 1 ,原点到wh的距离与wn 1成正比若wn 10, 则h在原点正侧,若wn 10, 则h在原点负侧。若wn 10, 则g(x)w t x,说明超平面h通过原点。7. 二分法能力如何表示?n 个样品线性可分数目(条件:样本分布良好) :2 n ,若nn1d( n ,n)nk2cnk 01 ,若nn1n1其中 c k( n k! ( n1)!k1)! , n为样本数, n为特征数线性可分概率:p(n, n)d(n,n)1,若nn1cn 1n2n21 nk 0k,若nn1(a) : 当n由1时,曲线急剧下降,在2处出现明显的门限效应 。(b) : 对于任意n值,2时,即 n2(n1) 时,线性可分概率为p(n, n)1 。2(c) : 在2范围,即 n2(n1), p( n, n)1,说明样本少时二分能力 强。(d ) : 在2范围,即 n2(n1), 线性可分概率急剧下降,说明样品越多线性可分能力越差。(e) : 对n个样本的线性可分性(二分能力)的估计:n 02(n1), 即2是最好情况 .8. 广义线性判别方法( 1)非线性线性一个非线性判别函数通过映射,变换成线性判别函数:g( x)k 1wi fii 1( x)x空间变换y空间w t yg(y)其中: ww1 w2., (广义权向量)。yf1( x)f 2( x).,(增广模式向量 )(2)线性判别判别平面:twkw t y00, x1f k ( x)w yg(y)0, x29. 分段线性判别方法1) 基于距离 :( 1)子类,类判别函数( 2)判别规则,)( 1)子类:把 i 类可以分成li 个子类 :1i(i2 ,.,l分成 l 个子类。ii子类判别函数:gi(x)iminxl l 1, 2,., l在同类的子类中找最近的均值( 2)判别规则:g j (x)mingi (x), i1,2,., m这是在 m 类中找最近均值。则把x 归于 j 类完成分类2) 基于函数: ( 1)子类,类判别函数( 2)判别规则( 1)子类类判别函数:对每个子类定义一个线性判别函数为:g l (x)wl x, 其中wl 为l 子类的权向量。iiii( 2)判别规则:在各子类中找最大的判别函数作为此类的代表,则对于m 类,可定义m 个判别函数gi(x),i=1,2,.m因,此,决策规则g j (x)maxi 1, 2,., mgi ( x), 则xj3) 基于凹函数的并: ( 1)析取范式,合取范式,凹函数( 2)判别规则( 1)析取范式: p=(l11 l12 l1m) (lq1 lq 2lqm )合取范式: q= (l11 l12 l1m) (lq1 lq2 lqm)凹函数: pi=li 1 li2 lim( 2)判别规则: 设第一类有q 个峰,则有 q 个凹函数。即 p=p1 p2 pqlijwij x0, x0, x1,i2 , j1,2,.,q子类。1,2,., m每个子类的判别函数数 。p判别规则:p0,则x10,则x210. 非线性判别方法( 1)1 集中,2 分散定义1判别函数 :g(x)k2( xt1 ( x1 ), k的大小,决定超平面的大小。)11其中:1为1均值,1为1协方差( 2)1 ,2 均集中如果1,2都比较集中,那么定义两个判别函数:gi ( x)2( xt1 ( xi ), i1,2ki)ii其中:i为1,2均值,i 为 1,2 协方差判别平面方程:g( x)g1 ( x)g 2 ( x)1x2 (12(t11 ) x2t12(1t)(k 21t12k 2 )01 ) x11122212判别规则:g( x)0, x10, x2k1, k2可用来调整二类错误率。11. 分类器的设计( 1)梯度下降法(迭代法):准则函数,学习规则( a)准则函数: j(w)j(wk)+ jt(w- wk)+(w- wk)td(w- wk)t/2其中 d 为当 w = wk 时 j(w)的二阶偏导数矩阵( b)学习规则:从起始值w1 开始,算出w 1 处目标函数的梯度矢量j(w1),则下一步的 w 值为: w2 = w1- 1 j(w1)其中 w1 为起始权向量,1 为迭代步长, j(w1) 为目标函数,j(w1)为 w1 处的目标函数的梯度矢量在第 k 步的时候wk+1 = wk- k j(wk)最佳步长为k=| j| 2/ jtdj这就是梯度下降法的迭代公式。( 2)感知器法:准则、学习规则(批量,样本)( a)准则函数:( b)学习规则:j(w)wxtxx 0其中 x0 为错分样本t1. 错误分类修正wk如tw如 wk x0并且 x1w k+1= wk+kxtk x0并且 x2wk+1= wk-kx 2.正确分类 , wk 不修正t如 w k x 0 并且 x 1 如 w k x 0 并且 x 2 wk+1= wk( 3)最小平方误差准则法(mse 法)(非迭代法) :准则、权向量解(a) 准则函数:(b) 权向量解:j (w )2| e | xw12b |n2iwt xbii1wx t xx t bxb其中 xx t x1t 称为 x的伪逆(规范矩阵)x( 4)韦霍氏法(lms 法)(迭代法) :准则,学习规则(a) 准则函数:j (w )2| e | xw2b |n2twx ibii t1 kk1(b) 学习规则:w1 任意, wk+1=wk+k(bk-wkx ) x取 kkk 随迭代次数k 而减少,以保证算法收敛于满意的w 值( 5)何卡氏法(h-k 法)(迭代法) :准则, b , w 的学习规则(a) 准则:j (w )2| e | xw12b |n2x iwtbii1它的解为: wx t xx t bxb( b) b, w 的学习规则:对b前后两次迭代后,bk1bkbk其中bk为b的增量bkcek| ek |其中c 为矫正系数, ek 为误差矢量, ek=xwk -bkw k 1xbk 1xbkbk xb kxbkw kc xek| ek |初始条件w1=x+b 1 并且 b10迭代时检测k如果 e 0时, xw b ,系统线性可分,迭代收敛如果 ek 0 时, xw 0 时rk+1= 0xk+1 1 并且 kk(xk+1)时0rk+1= 1xk+1 2 并且 kk(xk+1)0 时rk+1= 0xk+1 2 并且 kk(xk+1)时0rk+1= -112. 1)二类问题的贝叶斯判别( 1)判别函数的四种形式( 2)决策规则( 3)决策面方程( 4)决策系统的结构( a)g(x)p(1x)p(2x), (后验概率 )( 1)判别函数的四种形式:( b)g(x)p( x1 )p(1 )p(x2 ) p(2 ), (类条件概率密度 )(c) g(x)p(x1 )p( x2 )p(2 ) , (似然比形式 ) p(1 )( 2)判别规则:( d)g(x)ln p(x1 )ln p(2 ) ,(取对数方法 )( a) p(1x)1p(2x)x2p(x2 )p(1 )(b) ) p( x(c ) p( x1 ) p(1 )p( x21 )p(2 ) p(2 )x122 )x1( d ) g ( x)p( x2 )p( x1 )lnp( x2 )p(1 )p(2 )1lnxp(1 )2( 3)决策面方程:g(x) =0( 4)决策系统的结构( a)向量特征( b)判别计算( c)阈值单元( d)决策2)多类问题的贝叶斯判别( 1)判别函数的四种形式( 2)决策规则( 3)决策面方程( 4)决策系统的结构( 1)判别函数的四种形式:m 类有 m 个判别函数g1 (x), g2(x),mg(x).( a)g(x)p(1x)p(2x) , (后验概率 )( b)g(x)p(x1 )p(1 )p(x2 )p(2 ), (类条件概率密度 )(c) g( x)p(x1 )p(x2 )p(2 ) ,(似然比形式 ) p(1 )( d)g( x)( 2)决策规则:ln p( x1 )p( x2 )ln p(p(2 ) , (取对数方法 )1 )gi ( x)p( xmaxi ) p(p(xi )j )p(j )xi , (i1,2,., m )1 j m另一种形式:gi ( x)ln p( xi )ln p(i )maxln p( xj )ln p(i )xi1 j m( 3)决策面方程:gi ( x)g j ( x), 即gi ( x)g j ( x)0( 4)决策系统的结构:(a) 特征向量; (b)判别计算; (c)最大选择器; (d)决策13. 三种最小错误率贝叶斯分类器(正态分布):判别函数,判别规则,决策面方程( 1)第一种情况:各个特征统计独立,且同方差情况。(最简单情况 )(a) 判别函数:gi ( x)wt xwi 0, (线性判别函数 )i其中: wi12, w2ii01t22iiln p(i )ij(b) 判别规则:gi ( x)wt xwi 0maxwt xwj 0xi(c) 决策面方程:gi ( x)g j ( x)1 w m0w( xx0 )0其中wij20ijx1 () 2ijln p(i )ijp(j )i(2) 第二种情况:i 相等,即各类协方差相等。(a) 判别函数:gi ( x)其中 wiw t xwi0(,1i线性函数)wi 01t1ii2ln p(i )(b) 判别规则:g ( x)w t xwmax w t xwxiii 01j mjj 0i(c) 决策面方程:若i 与j 相邻g i ( x)g j ( x)0wt (xx0 )0, 其中w(ij )。x(10ij )2ln p(p()t(iji ) (ij )1 (1j )ij )(3) 第三种情况(一般情况 ):?为任意,各类协方差矩阵不等,二次项xt ? x 与 i 有关。所以判别函数为二次型函数。i(a) 判别函数:gi ( x)xtw i xw t xwi 0,其中w i11, (ni2n矩阵)1wiii (n维列向量 ),wi 01t12iii1 ln2iln p(i )(b) 判别规则:(c) 决策面方程:gi ( x)xt wi xitwt xwi 0 tmax xw j xwj xwj 0xi1 j m14. 最小风险贝叶斯分类器:判别函数,判别规则(1) 判别函数: 条件风险:rixeijmij pj 1jx , i1, 2,., a.(am )i:表示把模式x 判决为 i 类的一次动作rrxx p xdx, (平均风险 )期望风险:(2) 判别规则:若rkxminri 1, 2,., mix ,则xk:15. 聂曼皮尔逊判决: (二类):准则,判别规则,阈值的确定(1) 准则: 在取2为常数时 ,20 ,使1最小,(2) 判别规则:p(xp(x1 )tx2 )1皮尔逊规则归结为找阈2值t.(3) 阈值的确定:当 p( x1 )p( x2 )tt时,t作12的分界线 .2p( x这时2 一定2 ) dx,1最小t为2的函数在取2为常数时,t可确定,16. 最小最大损失准则判决(二类):准则,判别规则,(1) 准则:讨论在p(i)变化时如何使最大可能风险最小;p* (1 ) 的确定(2) 判别规则:风险rabp1其中: a221222p x2 dx2b11222111p x1 dx21222p x2 dx1通过最小风险与先验概率的关系曲线,确定最大风险,使最大风险最小。*(3) p (1 ) 的确定:如果选择1,2使b0, r与p1 无关.即11222111p x1 dx21222p x2 dx01这时候最大风险为最小17. 什么是序贯分类?, ra221222p x2 dx2序贯:随着时间的推移可以得到越来越多的信息。序贯分类决策规则pi ( x pi ( x1)a2 )1p1 (e) 时x p2 (e)1pi ( x1)bp1 (e)时xpi ( x2 )1p2(e)2bpi ( x1)pi ( x2 )a时,继续观察18. 什么是参数估计,非参数估计,监督学习,无监督学习?参数估计: 先假定研究的问题具有某种数学模型,如正态分布,二项分布,再用已知类别的学习样本估计里面的参数;非参数估计:不假定数学模型,直接用已知类别的学习样本的先验知识直接估计数学模型; 监督学习:在已知类别样本指导下的学习和训练,参数估计和非参数估计都属于监督学习。无监督学习:不知道样本类别,只知道样本的某些信息去估计,如:聚类分析。19( 1)最大似然估计算法思想:准则,求解过程(1) 准则:第i 类样本的类条件概率密度:ip(xi/ i)= p(xi/ i i ) = p(xi/ )原属于 i 类的学习样本为xi=(x1 , x2 ,t nx,)i=1,2,m求 i 的最大似然估计就是把p(xi/ii 的函数,求出使它最大时的i 值)看成 (2) 求解过程:学习样本独立从总体样本集中抽取的p( x i |i .i )np( x i |ni )p( x k |i)nk1n 个学习样本出现概率的乘积取对数:logp( x k |)ik 1log p( x k |)ik 1对 i 求导,并令它为0:1n.logp( x k |i )0k 1nk 11plogp ( x k |i)0.nlog p( x k |i )0k 1p利用上式求出i 的估值,即为i (2)正态分布情况下:,的计算已知 , 未知,估计 1nk1nx k, 均未知a 一维情况: n=1 对于每个学习样本只有一个特征的简单情况:1n11x k即学习样本的算术平均n k 1nx k21221n k 1样本方差b 多维情况: n 个特征估计值:1n1 x kn k 11ntn2x kx kk 1x/ 转)化为20( 1)贝叶斯估计算法思想:准则,求解过程(a) 准则:通过对第i 类学习样本i 的观察,使概率密度分布p(xi后验概率p(/xi) ,再求贝叶斯估计;(b) 求解过程: 确定 的先验分布p( 待), 估参数为随机变量。i 用第 i 类样本1, x2,.nx)t 求出样本的联合概率密度分布p(xi,)它是的函数。x =(xip( x i |).p() 利用贝叶斯公式,求 的后验概率p(| x )p( x i |) p() d 求贝叶斯估计p(| x i)d(2)正态分布情况下:的计算对 的估计为20nnn0 2若令 p( )=n( 0,2n2 xkk 120n0 220)=n(0,1)nn1xkn1 k 121( 1)贝叶斯学习概念求出 的后验概率之后,直接去推导总体分布即p( x| xi )p( x |)p(| xi )dp( x |)p(| x i )dn当 n,n 就反映了观察到n 个样本后对 的最好推测, 而 2 反映了这种推测的不确定性,n ,n2 ,n2 随观察样本增加而单调减小,且当n , 2 0n当 n , p( |x i)越来越尖峰突起;n , p(|x i) 函数,这个过程成为贝叶斯学习。(2)正态分布情况下(a) 一维正态:已知p( x x i ) 的计算2, 未知xp( x |i)p( x |)p(|i) dp( x |)p(| xi)dx1exp1x 2211x22n1exp1 d2n2n2n22nx22n222n2221nexp222n2nexp2ndx1122expn2222nn22n (n ,n)为正态函数(b) 多维正态(已知 ,估计 ):111 n111n00n(xk)(0)0n k 1nn将 n代入p( x | xi )p(x |) p(| xi)d就可以设计bayes分类器22非参数估计的条件密度计算公式(1) parzen 窗口估计的三种形式,条件密度的计算( a)窗口的选择: ( a)方窗函数; ( b)正态窗函数; ( c)指数窗函数(u)1,| u|120.其他(u)1exp 21 u 22(u)exp| u |( b)条件密度的计算:pn ( x)k nn1n1(| xxi |)v nni 1 v nh n(2) k-近邻估计的基本思想及用k-近邻法作后验概率估计的方法(a) 基本思想:以x 为中心建立空胞,使v,直到捕捉到kn 个样本为止。(b) 用 k-近邻法作后验概率估计的方法:由kn 近邻估计知n 个已知类别样本落入 vn 内为 kn 个样本的概率密度估计为k npn ( x)n v nn 个样本落入vn 内有 kn 个, kn 个样本内有ki 个样本属于i 类,则联合概率密度:kipn (x,i)根据 bayes公式可求出后验概率:np( x | vni)p(i)pn (i | x)p( x |ni )p(i )pn (x,i )mp(x |i 1k ii )p(i )pn (x,i )j 1后验概率的估计:pn (i | x)k n23 分类与聚类的区别是什么?分类:用已知类别的样本训练集来设计分类器(监督学习);聚类(集群):用事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学习) 。24( 1)聚合聚类(系统聚类)的算法思想:先把每个样本作为一类,然后根据它们间的相似性和相邻性聚合。若有 n 个样本:( a)设全部样本分为n 类;( b)作距离矩阵d(0);( c)求最小元素;( d)将距离平方最小的元素归为一类;( e)以新类从新分类,作距离矩阵d(1);( f)若合并的类数没有达到要求,转(c),否则停止。(2) 分解聚类的算法思想:把全部样本作为一类,然后根据相似性、相邻性分解。目标函数:两类均值方差en1 n2n(x1tx2)( x1x2)n:总样本数,n1 : 1类样本数n 2 : 2类样本数,x1, x2 : 两类均值( 3)动态聚类的算法(k-均值算法)先选定某种距离作为样本间的相似性的度量;确定评价聚类结果的准则函数;给出某种初始分类,用迭代法找出使准则函数取极值的最好的聚类结果。25( 1)什么是模糊集,-水平截集?(a) 模糊集: 假设论域e=x(讨论的区间) ,模糊集 a 是由隶属函数a(x)描述。其中, a(x)是定义在e 上在闭区间 0, 1中取值的一个函数,反映x 对模糊集的隶属程度。(b) -水平截集: 设 a 为 e=( x)中的模糊集, 则 a=x|a(x) 称为模糊集a 的 水平集, 为阈值在( 0, 1)间取值。( 2)什么是模糊集的并,交,补运算? 设: a,b 为 e=( x)上的两个模糊集并集: a b(x) max( a(x) ,交集:a b(x)min( a(x) ,b(x)b(x)补集:a ( x)=1- a(x) ,a(x) ,b(x) 分别为 a、b 的隶属函数(3) 什么是模糊关系及其变换运算?(a) 模糊关系: 设 u,v 为两个模糊集 ,则 u ,v 的笛卡儿乘积集记为:u v=u(,v)| u u,v
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北省唐山市玉田县2023-2024学年五年级下学期期末数学试题
- 西南财经大学-公司治理与战略管理
- 学校后勤工作经验交流分享会上校长讲话:全网疯传!最废的校长却带出了最强的后勤
- 幽默课件教学课件
- 巡视病房的观察要点
- 崖壁攀登概述课件
- 岩石书课件教学课件
- 尾矿工安全生产教育培训课件
- 河南省生态园区民宿租赁合同含环保设施租赁说明
- 环保技术研发工人计件合同
- GB/T 6003.2-2024试验筛技术要求和检验第2部分:金属穿孔板试验筛
- 甘肃省工程勘察设计收费指导标准2022版(全过程工程咨询)
- 供电所开展保命教育培训(3篇模板)
- 人教版音乐九年级上册第1单元选唱《中国军魂》教案
- 中医糖尿病治疗:特效中成药集
- 肺癌诊疗路径解读2024课件
- 心脏起搏器植入指南解读
- 学生会文体部部门招新
- 胃肠镜院感培训课件
- 应急管理学院成立可行性方案
- 矿山后勤与基础设施
评论
0/150
提交评论