整理了现有的手势识别的重点,以及几个重要方法的特点,对每种方法都分析了优缺点_第1页
整理了现有的手势识别的重点,以及几个重要方法的特点,对每种方法都分析了优缺点_第2页
整理了现有的手势识别的重点,以及几个重要方法的特点,对每种方法都分析了优缺点_第3页
整理了现有的手势识别的重点,以及几个重要方法的特点,对每种方法都分析了优缺点_第4页
整理了现有的手势识别的重点,以及几个重要方法的特点,对每种方法都分析了优缺点_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一个基于视觉手势识别系统的构成应包括:图像的采集,预处理,特征提取和选择,分类器的设计,以及手势识别。其流程大致如下:其中有三个步骤是识别系统的关键, 分别是预处理时手势的分割,特 征提取和选择,以及手势识别采用的算法。(1)手势分割一般来讲,分割方法大致分为以下三类:一是基于直方图的分割,即阈值法,通常取灰度直方图的波谷作 为阈值。hausdorff在距离在手势识别中的运用采用了阈值法。)二是基于局部区域信息的分割,如基于边缘和基于区域的方法;(基于几何特征的手势识别算法研究采用了边缘检测方法。)三是基于颜色等一些物理特征的分割方法。(复杂背景下基于单 目视觉的静态手势识别采用了基于颜色空间

2、的肤色聚类法, 基于 视觉的手势识别及其在人机交互中的应用采用了肤色滤波法。)。每种方法都有自己的优点,但也存在一定的问题,对于简单背景 的图像,采用阈值法能达到不错的效果,对于复杂的图像,单一的阈 值不能得到良好的分割效果。采用边缘提取方法时,若目标物和背景 灰度差别不大时,则得不到较明显的边缘。可以采用多种方法相结合 的图像处理方法,例如对采集的图像先进行差影处理, 然后进行灰度 阈值分割,或者对图像按区域分成小块,对每一块进行设置阈值。 手势分割是手势识别系统中的关键技术之一, 它直接影响系统的识别 率,目前的分割技术大都需要对背景,用户以及视频采集加以约束。 其受背景复杂度和光照变化的

3、影响最大,可以在这些方面进行改进。(2)特征提取和选择手势本身具有丰富的形变, 运动以及纹理特征, 选取合理的特征 对于手势的识别至关重要。目前 常用的手势特征有 : 轮廓、边缘、图 像矩、图像特征向量以及区域直方图特征等等。基于计算机视觉的手势识别研究 中提到了多尺度模型, 它就 是采用此模型提取手势的指尖的数量和位置, 将指尖和掌心连线, 采 用距离公式计算各指尖到掌心的距离, 再采用反余弦公式计算各指尖 与掌心连线间的夹角, 将距离和夹角作为选择的特征。 对于静态手势 识别而言,边缘信息是比较常用的特征。基于几何特征的手势识别算法研究中采用的 HD提取关键点的识别算法, 基于用八方向邻域

4、搜索法提取出手势图像的边缘, 把图 像的边缘看成一条曲线,然后对曲线进行处理。基于视觉的手势识别及其在人机交互中的应用 利用方向直方 图作为手势识别的特征向量。 虽然方向直方图具有平移不变性, 但它 不具有旋转不变性。同一手势图像,经过旋转后,直方图会不同。而 且方向直方图不具有唯一性, 即不同的手势图像可能会有相似的方向 直方图。在进行特征选取时我们可以考虑结合多种特征, 在基于计算机视觉的手势识别研究中提出了多尺度模型与矩描绘子相结合的算 法,将指尖和重心连线,采用距离公式计算各指尖到重心的距离,再 采用反余弦公式计算各指尖与重心连线间的夹角, 将距离和夹角作为 选择的特征,从而提高了识别

5、正确率,并减少了识别时间。 基于几 何特征的手势识别算法研究 采用几何矩和边缘检测的识别算法, 手 势图像经过二值化处理后, 提取手势图像的几何矩特征, 取出几何矩 特征七个特征分量中的四个分量, 形成手势的几何矩特征向量。 在灰 度图基础上直接检测图像的边缘, 利用直方图表示图像的边界方向特 征。最后,通过设定两个特征的权重来计算图像间的距离,再对手势 进行识别。可以看出适当的采用多种特征结合的算法, 可以在计算的复杂度 以及精确度上有所提高。(3)手势识别 目前基于单目视觉的静态手势识别技术主要有三大类: 第一类为 模板匹配技术 ,这是一种最简单的识别技术。 它将待识 别手势的特征参数与预

6、先存储的模板特征参数进行匹配, 通过测量两 者之间的相似度来完成识别任务。 Hausdorff 距离在手势识别中的 运用中利用 Hausdorff 距离模板匹配思想来实现手势的识别。将待 识别手势和模板手势的边缘图像变换到欧式距离空间,求出它们的 Hausdorff 距离或修正 Hausdorff 距离。用该距离值代表待识别手势和 模板手势的相似度。识别结果取与最小距离值对应的模板手势。第二类为 统计分析技术 ,这是一种通过统计样本特征向量来确定分类器的基于概率统计理论的分类方法。 这种技术要求人们从原始数 据中提取特定的特征向量, 对这些特征向量进行分类, 而不是直接对 原始数据进行识别。在

7、基于计算机视觉的手势识别研究中虽然也 采用了 Hausdorff 距离算法,但并未提出模板手势,而是对于每幅图 像提取出指尖和重心特征,然后计算出距离和夹角,对于不同手势 分别进行距离和夹角的统计,得到其分布的数字特征,根据基于 最小错误率的贝页斯决策得到用于分割不同手势的距离和夹角的值。 得到分类器以后, 对于采集的手势图像进行分类识别。 文中的多尺度 模型和矩描绘子相结合的算法也是运用了统计分析技术。第三类为 神经网络技术 ,这种技术具有自组织和自学习能力, 具 有分布性特点,能有效的抗噪声和处理不完整模式以及具有模式推广 能力。采用这种技术,在识别前都需要一对神经网络的训练( 学习)阶段

8、。其中比较常用的是 BF神经网络。BP ( Error Back PropagationNeural Network 误差反向传播神经网络 ) 由它是一种能向着满足给 定的输入输出关系方向进行自组织的神经网络, 当输出层上的实际输 出与给定的输入不一致时, 用下降法修正各层之间旧的结合强度, 直 到最终满足给定的输入输出关系为止, 出于误差传播的方向与信号传 播的方向正好相反称为误差反向传播神经网络。BP神经网络的理论认为: 只要不断给出输入和输出之间的关系,则在神经网络的学习过程 中,其内部就一定会形成表示这种关系的内部构造, 并且只要使关系 形成的速度达到实用值,那么BP的应用就不存在任何的困难.基于视觉的手势识别及其在人机交互中的应用 采用了基于方向直方图的BP (误差反向传播)神经网络方法。可以看出若是基于几何分类法算法简单, 与神经网络的方法相比, 显示出了可靠性, 其允许定义一个不同手势类别特点的特征集, 估计 一个局部最优的线性分辨器, 根据手势图像中提取的大量特征

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论