Fisher分类器算法及程序_第1页
Fisher分类器算法及程序_第2页
Fisher分类器算法及程序_第3页
Fisher分类器算法及程序_第4页
Fisher分类器算法及程序_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、3.5 Fisher分类器(Fisher Linear Discriminant)w1类w2类q判为w1判为w20xp1xp2图3.4, Fisher判别法几何原理示意图Fisher判别法是历史上最早提出的判别方法之一,其基本思想是将n类m维数据集尽可能地投影到一个方向(一条直线),使得类与类之间尽可能分开。从形式上看,该方法就是所谓的一种降维处理方法。为简单起见,我们以两类问题w1和w2的分类来说明Fisher判别法的原理,如图3.4所示。设数据阵为XÎRN´m,w1共有N1个样本,w2共有N2个样本,N= N1+N2。两个类别在输入空间的均值向量为设有一个投影方向,这两

2、个均值向量在该方向的投影为在方向,两均值之差为类似地,样本总均值向量在该方向的投影为定义类间散度(Between-class scatter)平方和SSB为其中定义类wj的类内散度(Within-class scatter)平方和为两个类的总的类内散度误差平方和为其中,我们的目的是使类间散度平方和SSB与类内散度平方和SSw的比值为最大,即图3.5a, Fisher判别法类间散度平方和(分子)的几何意义w1类w2类q0xp1xp2图3.5b, Fisher判别法类内散度平方和(分母)的几何意义w1类w2类q0xp1xp2图3.5给出了类间散度平方和SB与类内散度平方和SE的几何意义。根据图3.

3、5a,类间散度平方和SB的另一种表示方式为这里可以证明,(3.48)与(3.42)只相差一个系数。简单证明如下:由于由(3.42)得这说明,(3.48)与(3.42)只相差一个与样本数有关的常数。根据图3.5b,类内散度平方和SSE的另一种表示方式为这正是(3.44)。下面分析怎样确定最佳投影方向。显然, SB、SW均为对称阵,于是,=,且SW= 。令,则,代入(3.46),得使(3.52)为最大,等价于求最大特征值 对应的特征向量。即我们知道,于是,(3.53)可写成这说明,得方向与的方向一致,即因此,在应用过程中,我们往往不必求出类间散度阵。与输入空间维数相等,或者说,投影方向过原点。设分

4、类阈值为q,则判别公式为确定q的一些经验公式为(1) 取两个类别均值在方向投影的简单平均(2) 考虑样本数的两个类别均值在方向投影的平均或(3) 考虑类方差的两个类别均值在方向投影的平均或这里,、分别为两个类别在方向投影的均方差。当然,当类内散度阵不可逆时,Fisher判别法失效。例5 在研究地震预报中,遇到沙基液化问题,选择了下列7个有关的因素:x1:震级,x2:震中距(公里),x3:水深(米),x4:土深(米)x5:贯入值,x6:最大地面加速度(10-2N/m2),x7:地震持续时间(秒)。具体数据如表1所示。x1x2x3x4x5x6x7类别序号6.6391.06.06.00.1220I1

5、6.6391.06.0120.1220I26.1471.06.06.00.0812I36.1471.06.0120.0812I48.4322.07.5190.3575I57.26.01.07.0280.3030I68.41133.56.0180.1575I77.5521.06.0120.1640I87.5523.57.56.00.1640I98.31130.07.5350.12180I107.81721.03.5140.2145I117.81721.53.0150.2145II128.4321.05.04.00.3575II138.4322.09.0100.3575II148.4322.54.

6、0100.3575II156.3114.57.53.00.2015II167.08.04.54.59.00.2530II177.08.06.07.54.00.2530II187.08.01.56.01.00.2530II198.31611.54.04.00.0870II208.31610.52.51.00.0870II217.26.03.54.0120.3030II227.26.01.03.03.00.3030II237.26.01.06.05.00.3030II245.56.02.53.07.00.1818II258.41133.54.56.00.1575II268.41133.54.58.

7、00.1575II277.5521.06.06.00.1640II287.5521.07.58.00.1640II298.3970.06.05.00.15180II308.3972.56.05.00.15180II318.3890.06.0100.16180II328.3561.56.0130.25180II337.81721.03.56.00.2145II347.82831.04.56.00.1845II35解,设数据文件名为d:a.txt,用Matlab实现的源程序如下load d:ss.txt;a=ss;m=mean(a(1:12,:);m(2:2,:)=mean(a(13:35,:);

8、ssb=(m(1:1,:)-m(2:2,:)'*(m(1:1,:)-m(2:2,:);ssw=zeros(7,7);for i=1:12,ssw=ssw+(a(i:i,:)-m(1:1,:)'*(a(i:i,:)-m(1:1,:);endfor i=13:35,ssw=ssw+(a(i:i,:)-m(2:2,:)'*(a(i:i,:)-m(2:2,:);endw=inv(ssw)*(m(1:1,:)-m(2:2,:)'result=a*w;theta=w'*(m(1:1,:)+m(2:2,:)'/2;for i=1:35,result(i:i,2

9、:2)=theta;result(i:i,3:3)=i;end投影方向向量为=(0.0202, -0.0001, -0.0175, 0.0156, 0.0160, -0.7333, -0.0016)T,分类阈值为q=0.1358。决策面方程为p: l(x)=0.0202x1-0.0001x2-0.0175x3+0.0156x4+0.0160x5-0.7333x6-0.0016 x7-0.1358=0.分类结果为序号wTxq=0.1358 (3.58)q=0.1007 (3.59)q=0.1709 (3.60)q=0.1567 (3.61)q=0.1149 (3.62)10.181220.277230.212540.308550.174960.416370.247580.232590.1160*100.4551110.1745120.173913-0.0866140.054215-0.0325160.0414170.044218-0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论