版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、模式识别与MATLAB,-信息0603康叶,1,主讲内容,Fisher算法及MATLAB实现,Svm(supportvectormachine)与优化,通过MATLAB编程进一步熟悉一下模式识别中的一些典型算法,2,典型算法,聚类算法:1、层次聚类2、划分聚类,3,分类器算法3、线性判别函数4、Bayes算法,W2,W1,W3,L1,L3,L2,4,1、层次聚类,单连接算法第一步:将n个样本分配到n个簇中,计算距离矩阵;第二步:计算最新距离矩阵,将拥有最小簇间距离的两个簇合并,得到新簇集合;第三步:若簇数大于1,重复第二步;若为1,则结束。,5,Matlab代码,样本:x数据标准化:xn=zs
2、core(x)计算样本间距离:Y=pdist(xn,distance)距离矩阵:squareform(y)调用z=linkage(y,method)dendrogram(z)生成层次图调用T=cluster(z,c)对样本进行分类,Distance:Euclid:欧拉距离Hamming:汉明距离Function:DISTFUN,Y=(1:6)X=0123104524063560,squareform(Y)=X,squareform(X)=Y.,MethodSingle:最小距离Complete:最大距离Average、weighted:平均距离Centroid、median:重心法,6,Exa
3、mple:,clearX=5.8090.597.4467.148.1165.4810.2158.889.5159.249.8160.47;Xn=zscore(X);Y=pdist(Xn,euclid)squareform(Y)figureZ=linkage(Y,centroid);dendrogram(Z);T=cluster(Z,3),Clusterdata,7,8,k-均值(k-means)算法给定k,算法的处理流程如下:第一步:随机的把所有对象分配到k个非空的簇中;第二步:计算每个簇的平均值,并用该平均值代表相应的簇中心;第三步:将每个对象根据其与各个簇中心的距离,重新分配到与它距离最近
4、的簇中;第四步:重复2,3直到k个簇的中心点不再发生变化或准则函数Je收敛。,2、划分聚类,9,Matlab代码,直接调用库函数kmeans()IDX,C,SUMD,D=KMEANS(X,K,PARAM1,val1,PARAM2,val2,.)DistanceStartReplicatesDisplay,10,Example:X=randn(20,2)+ones(20,2);randn(20,2)-ones(20,2);cidx,ctrs=kmeans(X,2,dist,city,rep,5,disp,final);plot(X(cidx=1,1),X(cidx=1,2),r.,.X(cidx
5、=2,1),X(cidx=2,2),b.,ctrs(:,1),ctrs(:,2),kx);,11,12,3、线性判别函数,现抽取n个特征为:判别函数:判别条件:,g1(x)g2(x)和g1(x)g3(x),13,实现步骤第一步:初始化各权值矢量W=0;第二步:将所有样本x(k)进行计算,求的g(x(k);第三步:若x(k)判断gi(k)是不是最大值,若是,权值不用修改;否则权值需修正;W+x(k),Wj-x(k)第四步:重复2,3直到权值不再修正。第五步:求的gij=gi-gj,14,Matlab代码,g=sample(i,:)*w;length(find(d=max(d)=1|find(d=
6、max(d)=y(i);%判断是否是最大值w=w+sample(i,:)*2*(y(i)=1)-1,2*(y(i)=2)-1,2*(y(i)=3)-1;%修正权值flag=1;%设标志位w=w(:,1)-w(:,2),w(:,2)-w(:,3),w(:,3)-w(:,1);%求的gij,15,16,例:对一批人进行癌症普查,患癌症者定为属1类,正常者定为属2类。统计资料表明人们患癌的概率,从而。设有一种诊断此病的试验,其结果有阳性反应和阴性反应之分,依其作诊断。化验结果是一维离散模式特征。统计资料表明:癌症者有阳性反映的概率为0.95即,从而可知,正常人阳性反映的概率为0.01即,可知。,4、
7、Bayes算法,17,对于两类1,2问题,直观地,可以根据后验概率做判决:,随机模式分类识别,通常称为Bayes(贝叶斯)判决。,主要依据类的概率、概密,按照某种准则使分类结果从统计上讲是最佳的。准则函数不同,所导出的判决规则就不同,分类结果也不同。,18,将P(i|x)代入判别式,判别规则可表示为,根据Bayes公式,后验概率可由类i的先验概率P(i)和条件概率密度来表示,即,19,最小误判概率准则下的判决规则:,如果则判,另一个等价形式是:如果则判,由贝叶斯定理,20,对于多类问题,最小误判概率准则有如下几种等价的判决规则:,21,实现步骤,1、先验概率:2、类概率:3、后验概率:4、判别
8、:,22,23,24,Fisher算法,25,二维模式向一维空间投影示意图,o,x,y,o,y,x,26,映射Y空间Y=WTX-W00X1Y=WTX-W00X2把X空间各点投影到Y空间得一直线上,维数由2维降为一维。若适当选择W的方向,可以使二类分开。下面我们从数学上寻找最好的投影方向,即寻找最好的变换向量W的问题。,w(y),w,y1,y2,x2,x1,1,2,27,投影样本之间的分离性用投影样本之差表示投影样本类内离散度:,i=1,2,i=1,2,28,类间散布矩阵,29,上式就是n维x空间向一维y空间的最好投影方向,它实际是多维空间向一维空间的一种映射。,其中Sw为类内散布矩阵,Sb为类
9、间散布矩阵,30,现在我们已把一个n维的问题转化为一维的问题。现在一维空间设计Fisher分类器:W0的选择,31,Yki表示第i类中第k个样本的投影值N1为1样本数N2为2样本数当W0选定后,对任一样本X,只要判断Y=WTXW0则X1;Y=WTXW0则X2。分类问题就解决了,32,实现步骤第一步:把来自两类1/2的训练样本集X分成与1对应的子集X1和与X2对应的子集;第二步:由计算xi;第三步:由计算各类的类内离差阵S1,S2第四步:计算类内总离差阵Sw=S1+S2第五步:计算的逆矩阵第六步:按求解W,33,第七步:第八步:第九步:对未知模式x判定模式类,34,35,Svm(supportvectormachine)与优化,首先看一下它处理分类问题的情况:,36,判别函数,判别准则,37,核函数,解决线性不可分问题:,低维空间的线性不可分,非线性转换,高维空间的线性可分,由于维数是升高,很大程度上增大了计算量,所以引进多项式内积核函数。,38,线性核函数(linear),高斯径向基核函数(rbf),D阶(非)齐次多项式核函数(poly),指数型径向基核函数(erfb),39,example:,线性判别:,二阶多项式判别:,clearloadlineardatac=100;ker=linear;nsv,alph
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 持续交付发布流水线安全规范
- 合同变更审查报告编制指导方案
- 装配线首件确认制度管理规范
- 公务车辆调度使用管理制度
- 院前急救质量评价
- 输送系统振动监测保养方案
- 技术标施工组织编制规范
- 高架道路钢筋配送卸料流程
- 磨削线职业健康风险防控制度
- 仓储车间托盘周转计划管理办法
- 2026届初中中考数学模拟试卷
- 2026哈尔滨兰兴资产运营管理有限公司公开招聘备考题库参考答案详解
- 2025湖北武汉市汉江集团公司面向集团内部招聘2人笔试历年难易错考点试卷带答案解析
- 星创天地创业辅导制度
- 框架结构住宅楼施工计划
- 2026江苏事业单位统考泰州市靖江市招聘42人考试参考题库及答案解析
- (一模)太原市2026年高三年级模拟考试(一)历史试卷(含官方答案)
- 江苏南京紫金投资集团有限责任公司招聘笔试题库2026
- 游泳馆安全生产制度
- 副流感病毒感染诊疗指南(2025版)
- (2026年)中医护理操作并发症预防及处理课件
评论
0/150
提交评论