Fisher准则线性分类器设计_第1页
Fisher准则线性分类器设计_第2页
Fisher准则线性分类器设计_第3页
Fisher准则线性分类器设计_第4页
免费预览已结束,剩余7页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一 、 基 于F i s h e r准 则 线 性 分 类 器 设 计1、实验内容:已知有两类数据1 和2 二者的概率已知 p( )1 =, p( )2 =。1 中数据点的坐标对应一一如下:数据:x=2 数据点的对应的三维坐标为x2=数据的样本点分布如下图:1) 请把数据作为样本,根据 Fisher 选择投影方向 W 的原则,使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,求出评价投影方向 W 的函数,并在图形表示出来。并在实验报告中表示出来,并求使 JF ( w) 取极大值的 w* 。用 matlab 完成 Fisher 线性分类器的设计,程序的语句要求有

2、注释。2) 根据上述的结果并判断( 1,),(,),属于哪个类别,并画出数据分类相应的结果图,要求画出其在 W 上的投影。3) 回答如下问题,分析一下 W 的比例因子对于 Fisher 判别函数没有影响的原因。2、实验代码x1=将 x1、x2、x3 变为行向量x1=x1(:);x2=x2(:);x3=x3(:);%计算第一类的样本均值向量m1m1(1)=mean(x1);m1(2)=mean(x2);m1(3)=mean(x3);%计算第一类样本类内离散度矩阵S1S1=zeros(3,3);fori=1:36S1=S1+-m1(1)+x1(i)-m1(2)+x2(i)-m1(3)+x3(i)&

3、#39;*-m1(1)+x1(i)-m1(2)+x2(i)-m1(3)+x3(i); end%w2 的数据点坐标x4=计算第二类的样本均值向量m2m2(1)=mean(x4);m2(2)=mean(x5);m2(3)=mean(x6);%计算第二类样本类内离散度矩阵S2S2=zeros(3,3);fori=1:36S2=S2+-m2(1)+x4(i)-m2(2)+x5(i)-m2(3)+x6(i)'*-m2(1)+x4(i)-m2(2)+x5(i)-m2(3)+x6(i); end%总类内离散度矩阵SwSw=zeros(3,3);Sw=S1+S2;%样本类间离散度矩阵SbSb=zero

4、s(3,3);Sb=(m1-m2)'*(m1-m2);%最优解 WW=Sw-1*(m1-m2)'%将 W 变为单位向量以方便计算投影W=W/sqrt(sum(W.2);%计算一维 Y 空间中的各类样本均值M1 及 M2fori=1:36y(i)=W'*x1(i)x2(i)x3(i)'endM1=mean(y);fori=1:36y(i)=W'*x4(i)x5(i)x6(i)'endM2=mean(y);%利用当 P(w1)与 P(w2)已知时的公式计算W0p1=;p2=;W0=-(M1+M2)/2+(log(p2/p1)/(36+36-2);%计

5、算将样本投影到最佳方向上以后的新坐标X1=x1*W(1)+x2*W(2)+x3*W(3)'X2=x4*W(1)+x5*W(2)+x6*W(3)'%得到投影长度XX1=W(1)*X1;W(2)*X1;W(3)*X1;XX2=W(1)*X2;W(2)*X2;W(3)*X2;%得到新坐标%绘制样本点figure(1);plot3(x1,x2,x3,'r*');% 第一类holdonplot3(x4,x5,x6,'gp');%第二类legend('第一类点 ','第二类点 ');title('Fisher 线性判别

6、曲线 ');W1=5*W;%画出最佳方向line(-W1(1),W1(1),-W1(2),W1(2),-W1(3),W1(3),'color','g');%判别已给点的分类a1=1,'a2=,'a3=,'a4=,'a5=,'A=a1a2a3a4a5;n=size(A,2);%下面代码在改变样本时可不修改%绘制待测数据投影到最佳方向上的点fork=1:nA1=A(:,k)'*W;A11=W*A1;% 得到待测数据投影y=W'*A(:,k)+W0;% 计算后与 0 相比以判断类别,大于 0 为第一类,小

7、于 0 为第二类 ify>0plot3(A(1,k),A(2,k),A(3,k),'ro');% 点为 "rp" 对应第一类 plot3(A11(1),A11(2),A11(3),'ro');% 投影为 "r+" 对应 ro 类 elseplot3(A(1,k),A(2,k),A(3,k),'ch');% 点为 "bh" 对应 ch 类 plot3(A11(1),A11(2),A11(3),'ch');% 投影为 "b*" 对应 ch 类 end

8、end%画出最佳方向line(-W1(1),W1(1),-W1(2),W1(2),-W1(3),W1(3),'color','m'); view(,30);axis(-2,3,-1,3,);gridonholdoff3、实验结果根据求出最佳投影方向,然后按照此方向,将待测数据进行投影。为直观起见,我们将两步画在一张图上,如下:其中,红色的 * 是给出的第一类样本点,蓝色的五角星是第二类样本点。下方的实直线是最佳投影方向。待测数据投影在其上,圆圈是被分为第一类的样本点,十字是被分为第二类的样本点。使JF (w) 取极大值的W=(,)4、实验分析W 的比例因子对于F

9、isher 判别函数没有影响的原因:在本实验中,最需要的是W 的方向,或者说是在此方向上数据的投影,那么W 的比例因子,即它是单位向量的多少倍长就无关紧要了,不管比例因子有多大,在最后求投影时都会被消掉而起不到实际作用。二、 Bayes 分类器设计1、实验内容假定某个局部区域细胞识别中正常(1 )和非正常(2 )两类先验概率分别为正常状态: P( 1 ) =;异常状态: P( 2)=。现有一系列待观察的细胞,其观察值为x :已知先验概率是的曲线如下图:p( x | 1 ) p( x | 2 ) 类条件概率分布正态分布分别为( - 2,)( 2, 4)试对观察的结果进行分类。1) 用 matla

10、b 完成分类器的设计,要求程序相应语句有说明文字,要求有子程序的调用过程。2) 根据例子画出后验概率的分布曲线以及分类的结果示意图。3) 如果是最小风险贝叶斯决策,决策表如下:最小风险贝叶斯决策表:状态决策 106 210请重新设计程序,画出相应的后验概率的分布曲线和分类结果, 并比较两个结果 。2、实验代码最小错误率贝叶斯决策x=%得到待测细胞个数pw1_x=zeros(1,m);%存放对 w1 的后验概率矩阵pw2_x=zeros(1,m);%存放对 w2 的后验概率矩阵results=zeros(1,m);%存放比较结果矩阵fori=1:m%计算在 w1 下的后验概率pw1_x(i)=(

11、pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2);%计算在 w2 下的后验概率pw2_x(i)=(pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2);endfori=1:mifpw1_x(i)>pw2_x(i)% 比较两类后验概率result(i)=0;%正常细胞elseresult(i)=1;%异常细胞endenda=-5:5;%取样本点以画图n=numel(a);pw1_plot=zeros(1,

12、n);pw2_plot=zeros(1,n);forj=1:npw1_plot(j)=(pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2 );%计算每个样本点对w1 的后验概率以画图pw2_plot(j)=(pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2 );endfigure(1);holdonplot(a,pw1_plot,'co',a,pw2_plot,'r-.');f

13、ork=1:mifresult(k)=0plot(x(k),'cp');% 正常细胞用五角星表示elseplot(x(k),'r*');% 异常细胞用 * 表示end;end;legend('正常细胞后验概率曲线 ','异常细胞后验概率曲线 ','正常细胞 ','异常细胞 ');xlabel('样本细胞的观察值 ');ylabel('后验概率 ');title('后验概率分布曲线 ');gridonreturn%实验内容仿真:x=,disp(x);pw

14、1=;pw2=;result=bayes(x,pw1,pw2);最小风险贝叶斯决策x=%得到待测细胞个数R1_x=zeros(1,m);%存放把样本 X 判为正常细胞所造成的整体损失R2_x=zeros(1,m);%存放把样本 X 判为异常细胞所造成的整体损失result=zeros(1,m);%存放比较结果e1=-2;a1=;e2=2;a2=2;%类条件概率分布 px_w1: (-2,) px_w2 (2,4)r11=0;r12=2;r21=4;r22=0;%风险决策表fori=1:m%计算两类风险值R1_x(i)=r11*pw1*normpdf(x(i),e1,a1)/(pw1*normp

15、df(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2) )+r21*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2);R2_x(i)=r12*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2) )+r22*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2);endfori=1:mifR2_x(

16、i)>R1_x(i)%第二类比第一类风险大result(i)=0;%判为正常细胞(损失较小),用0 表示elseresult(i)=1;%判为异常细胞,用1 表示endenda=-5:5;%取样本点以画图n=numel(a);R1_plot=zeros(1,n);R2_plot=zeros(1,n);forj=1:nR1_plot(j)=r11*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2)+r21*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a

17、1)+pw2*normpdf(a(j),e2,a2)R2_plot(j)=r12*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2)+r22*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2)%计算各样本点的风险以画图endfigure(1);holdonplot(a,R1_plot,'co',a,R2_plot,'r-.');fork=1:mifresult(k)=0plot

18、(x(k),'cp');% 正常细胞用五角星表示elseplot(x(k),'r*');% 异常细胞用 * 表示end;end;legend('正常细胞 ','异常细胞 ','Location','Best');xlabel('细胞分类结果 ');ylabel('条件风险 ');title('风险判决曲线 ');gridonreturn%实验内容仿真:x=,disp(x);pw1=;pw2=;result=bayes(x,pw1,pw2);3、实验结果

19、最小错误率贝叶斯决策后验概率曲线:带红色虚线曲线是判决为异常细胞的后验概率曲线青色实线曲线是为判为正常细胞的后验概率曲线根据最小错误概率准则,判决结果显示在曲线下方:五角星代表判决为正常细胞,* 号代表异常细胞各细胞分类结果( 0 为判成正常细胞, 1 为判成异常细胞):0000000000000最小风险贝叶斯决策带红色虚线曲线是异常细胞的条件风险曲线;青色圆圈曲线是正常细胞的条件风险曲线。根据贝叶斯最小风险判决准则,判决结果显示在曲线下方:五角星代表判决为正常细胞, * 号代表异常细胞。各细胞分类结果( 0 为判成正常细胞, 1 为判成异常细胞):4、实验分析由最小错误率的贝叶斯判决和基于最

20、小风险的贝叶斯判决得出的图形中的分类结果可以看出,样本在前者中被分为“正常细胞”,在后者中被分为“异常细胞”,分类结果不同。因为在给予最小风险的贝叶斯判决中,影响决策结果的因素多“损失”,这个损失是人为给出的,要想获得最小风险的效果,就要认真分析其问题的内在特点与专家的共同设计给出适当的损失。可以看出,在图1 中,这两个样本点下两类决策的后验概率相差很小,当结合最小风险贝叶斯决策表进行计算时,“损失因素”就起了主导作用,导致出现了相反的结果。另外,最小错误率贝叶斯决策就是在0-1损失函数条件下的最小风险贝叶斯决策,最小错误率贝叶斯决策是最小风险贝叶斯决策的一种特列。三、感知函数准则线性分类器1

21、、实验内容:已知有两个样本空间w1 和 w2,这些点对应的横纵坐标的分布情况是:x1= 1, 2, 4, 1, 5; y1= 2, 1,- 1,- 3,- 3;x2=,-4,- 5,- 3; y2= 1,- 1, 5, 1,- 4, 0;在二维空间样本分布图形如下所示:(plot( x1, y1, x2, y2) )1、用matlab 完成感知准则函数确定程序的设计。2、请确定 sample=( 0,- 3),( 1, 3),(- 1, 5),(- 1, 1), 6),(- 3,- 1),( 2,- 1),( 0, 1), ( 1, 1),; 属于哪个样本空间 , 根据数据画出分类的结果。3、

22、请分析一下k 和 a (1) 对于感知函数准则确定的影响,并确定当的 k 的值,以及 a (1) 不同时, k 值得变化情况。k =1/ 2/ 3 时,相应4、根据实验结果请说明感知准则函数是否是唯一的,为什么?2、实验代码%a 为解向量,b 为分界面clearalla(1,:)=2,4;y=zeros(11,2)%第一类样本点x1=1,2,4,1,5;y1=2,1,-1,-3,-3;%规范化处理第一类样本点xb1=-x1;yb1=-y1;%第二类样本点x2=,-4,-5,-3;y2=1,-1,5,1,-4,0;%需进行分类的样本sample=0,-3;1,3;-1,5;-1,1;,6;-3,

23、-1;2,-1;0,1;1,1;,;,%执行算法fori=1:5y(i,:)=xb1(i),yb1(i);endfori=1:6y(i+5,:)=x2(i),y2(i);endk=1;while(1)flag=1;yk=0,0;forj=1:11;temp=y(j,:)*a(k,:)'%求两个向量内积iftemp<=0yk=yk+y(j,:);flag=0;endendifflag=1break;elsea(k+1,:)=a(k,:)+yk;k=k+1;endend%确定分界面(! 指令用来调用操作系统命令echo 指令用来控制m 文件在执行过程中是否显示)!echo 迭代次数k

24、-1% 经过 k-1 次迭代!echo 解向量a(k,:)% 解向量b(1,1)=a(k,2);b(1,2)=-a(k,1);% 此为分界面!echo 分界面b(1,:)%绘制图形subplot(2,1,1),% 图 1:原始样本点,确定分界面plot(x1,y1,'rs',x2,y2,'b*');holdonline(0,a(k,1),0,a(k,2),'color','b');%绘制解向量c=b(1,2)/b(1,1);bplot(1)=-6/c;bplot(2)=6/c;line(bplot(1),bplot(2),-6,6

25、,'color','g','LineWidth',2);%绘制分界面gridonaxis(-6,6,-6,6)xlabel('x'),ylabel('y'),title('由分类样本确定分界面')legend(' 类别 1',' 类别 2','解向量 ','分界面 ')subplot(2,1,2),% 图 2:测试样本点,确定分类fori=1:length(sample)ifsample(i,:)*a(k,:)'>0plot(sample(i,1),sample(i,2),'b*');holdonelseplot(sample(i,1),sample(i,2),'rs');holdonendendline(0,a(k,1),0,a(k,2),'color','b');%绘制解向量line(bplot(1),bplot(2),-6,6,'color','g','LineWidth',2);% 绘制分界面 gridonaxis(-6,6,-6,6)xlabel('x'),ylabel

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论