已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模式识别综述与展望摘要:模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。文章介绍了模式识别和知识引导的模式识别系统的区别和联系、模式识别的应用及其发展潜力。关键词:模式识别;信息科学;人工智能;知识引导(一) 引言模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着2 0世纪4 0年代计算机的出现以及5 0年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在2 0世纪6 0年代初迅速发展并成为一门新学科。模式识别研究主要集中在两方面:一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴;二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。本文将介绍传统的模式识别和知识引导的模式识别系统的区别和联系、模式识别的应用及其近乎无限的发展潜力。(二) 传统的模式识别方法统计方法与句法方法把图像或图像系列分割为线条、边缘,结点,区域等并提供相应的特征,诸如灰度值、颜色、形状、纹理,深度等。目的是要利用这些信息对模式进行分类或者对模式进行分析(描述)。分类是实现一个模式与一个类别号的对应。分析(描述,解释)则是实现一个模式与一个符号描述的对应。模式分析一般包括:解释模式的组成部份,说明各个组成部份的时间和空间关系,甚至给出作出特定解释的理由。(1) 用统计方法发展起来的模式识别系统如图1所示:图1 统计模式识别系统在用统计方法研究模式识别问题时,大体上侧重于特征抽取与选择以及模式分类与学习两个方面。1、特征选择与特征抽取特征选择与特征抽取的一般方法主要分为两种:特征空间变换以及信息和距离的测度。特征空间变换这个方法目的是将原始特征空间变换为较低维数的特征空间,以便于模式的表示与模式的分类。当着眼于模式表示时,常用最小均方误差与嫡准则作为确定最优变换的最佳准则。当着眼于分类判别时,往往以最大类间距离和最小类内距离为最佳准则。至于变换方法本身可以是线性的也可以是非线性的。可利用的变换有:Courier变换,Welsh-Hallmark变换,Mar变换。为了压缩特征空间的维数常利用Karhunen-love展开式和主分量分析法。衡量变换结果好坏的标准之一是要看是否增加模式类的可分性。就增加模式类的可分性而言,一般非线性变换比线性变换好。然而就计算复杂性而言,。线性变换要比非线性变换简单得多。 信息和距离的测度与识别率的上界和下界有关。为了比较各种信息和距离的测度,Cant以误识率的上界为准则,把各种信息和距离测度的定义按其重要性以递增顺序排列起来。对于两个模式类的识别问题,这个顺序是:就计算的困难性而言,计算Bhattacharyya距离比计算其他距离测度要容易些。2、分类和学习对模式进行分类和描述是模式识别系统的根本目标。对于每类模式,当已经知道或者虽不确切知道但能精确估计出其特征向量的条件概率密度函数时(亦称类密度函数),就可以导出贝叶斯分类规则,它使平均风险或误识率最小。实际上,当可以得到大量模式样本时,可以比较精确的估计出类密度函数,或者从样本学习到类密度函数。比较实用的非参数分类方案有:最近邻分类规则(NN规则)和K最近邻分类规则(K-NN规则,以及其他种种变态的NN规则。非参数分类方案一般是从样本中直接学习分类规则。学习类密度函数或判决边界线的方法可以用Lesbian估值法、随机逼近法、势函数法等。Littler研究了一种将判函数归入模式特征空间的一个子空间的方法,它可以在缺少任意数目的分量的情况下使模式分类仍为最佳(平均方差最小)。对于无人管理的学习,特别是模式的类射数不确切知道时,这时的分类就是集群分析。各种相似性和距离测度都可用作集群划分的准则。集群划分准则和集群参数的选择往往需要探索性地或交互式地进行。(2) 运用句法(或结构)方法的模式识别系统的框图如图2所示:图2 句法模式识别系统图中的“基元”类似于统计方法中的特征。在句法方法中。用一个“句子”表示一个模式。句子构成语言语言具有特定的文法。文法就是用基元构成模式的规则。文法推断是一个总结由基元构成模式的规律性。从而得到规则即文法的过程,类似于学习。句法分析则是分析输入模式是否符合某种文法规则的过程。也就是分析能否用该文法生成输入模式。分析结果为肯定则对输入模式完成了分类。分析结果为否定,则拒绝输入模式。也可以用关系图来表示模式结构信息。1、基元选择和基元抽取通常需在基元抽取的复杂性和文法复杂性两者之间折衷,也可以用曲线线段的长度和曲率等表示曲线线段的特征。对于区域范围的模式,一个区域内存在两个特征互异的子区域时称这个区域为边缘,存在着小于一定距离的两个边缘时称这个区域为线,边缘闭合时称为区。常用的特征可以取灰度特征。也可以用形状和纹理测度来描述区域。其他还有一些方法亦可用来描述图像基元,例如灰度矩阵、灰度共生矩阵、梯度共生矩阵、点测度等。 2、文法已经有了各种专门的语言来描述特定的模式。例如描述中外文字字符、染色体图像、火花室图像、二维数学化学结构、颈动脉脉冲波形、二维飞机外形、口语单词、指纹图像等。对于多维模式,用多维文法来描述。其他如网状文法(web)、图文法、树文法、形状文法等都已有了应用。有两个因素决定了文法的选择,一个是所选基元的情况,另一个是要权衡文法的描述能力与文法分析的效率。在实际应用中,往往存在某些不确定性。例如测量中的噪声和抖动会引起分割误差和基元抽取误差,从而使描述模式的语言产生二义性。在二义性存在的情况下,可以用随机语言来描述模式,产生随机语言的文法称作随机文法。在随机文法中引进了概串方法,即用具有概率分布的语句来描述模式。3、句法分析在选择文法时需考虑文法的描述能力与句法分析复杂性之间的矛盾。同样,在研究句法分析问题时,也应考虑如何从句法分析的角度处理这种矛盾。进行分析的识别器就要采用由扩充的或变换的模式文法组成的识别器,这时分析器的效率显然会降低很多。事实上,要在提高纠错能力和降低分析效率之间进行权衡,实际困难较大。在句法分析中,还可以采用距离或加权距离的方法。利用两个语句之间的距离或加权距离作为两个模式之间相似性的测度,只要有了相似性测度就可以应用现有的任一种搜索集群的方法作集群分析。这也是一种无人管理的方法。完成集群分析以后,就可以应用文法推断技术来推断每一个群的文法,并构造出相应的句法分析器。(三) 知识引导的模式识别模式识别过程可以看成是下面的规则:描述:识别类在统计决策理论方法中,描述通常是一些解析表达式。表达式中包含先验地选取的变量集合,这些变量分布于整个决策空间中。当被研究模式的特征不是数值特征,而变量之间存在互相强烈依赖的各种关系时。决策理论方法就显得不太适用。在这样的情况下,可以用结构方法。决策理论方法和句法方法两着几乎没有利用被研究问题的语义信息。所以它们能表现和识别的模式类别是有限制的。在设计模式识别系统时,不但要充分利用模式的数值特征和结构特征。还需要利用和问题有关的知识来描述和分析模式,这种理论系统和方法适宜于处理各种类型的描述,它能充分地利用问题的语义,并且能较好地满足人们在易于接受方面的要求。这种系统能表现被研究问题的知识,具有演绎、归纳能力。所以它能产生不包含在原始特征中的新描述,并能给出演绎推理的过程。这种新型的模式识别系统称为知识(或规则)引导的模式识别系统,其系统结构如图3所示:图3 知识引导的模式识别系统由知识引导的模式识别系统应由下面几个部份组成:特征抽取部份、数据库、知识库、演绎机构以及控制机构。特征抽取部分负责抽取模式的数值特征与关系特征。数据库有定义、加载、修改、检索等模块。由于数据库具有完备的数据结构,对每个关键属性设有索引。知识库中包含有事实和规则。事实用来描述被研究的模式,规则是关于被研究的模式和模式之间关系的一般性描述这些事实与规则和具体问题紧密相关。演绎和控制机构是知识引导的模式识别系统的重要部份。根据问题所处的当前状态,控制机构选择合适的规则进行演绎和推理。随着研究的发展,被研究的对象变得复杂起来。就出现了以模型为基础的视觉识别技术。例如,Mockworth提出的方案,认为识别过程是个感知循环。在这个方案中,识别是个叠代过程:精细地描述模型、发现提示、引用模型、验证模型。根据各种拓扑图像,提炼出提示。(四) 模式识别的应用1、文字识别汉字已有数千年的历史,也是世界上使用人数最多的文字,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。2、语音识别语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术。3、遥感遥感图像识别已广泛用于农作物估产、资源勘察、气象预报和军事侦察等。4、医学诊断在癌细胞检测、X射线照片分析、血液化验、染色体分析、心电图诊断和脑电图诊断等方面,模式识别已取得了成效。(五) 模式识别技术的近乎无限的发展潜力模式识别技术是人工智能的基础技术,2 1世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。1、语音识别技术语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过4 0 0亿人民币的市场容量,然后每年以超过3 0%的速度增长。2、生物认证技术生物认证技术是本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。国际数据集团(I D C)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来1 0年的时间里将达到1 0 0美元的市场规模。3、数字水印技术9 0年代以来才在国际上开始发展起来的数字水印技术是最具发展潜力与优势的数字媒体版权保护技术。I D C预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。(六) 结语模式识别从2 0世纪2 0年代发展至今,并不是要对所有模式识别问题都适用的单一模型和解决识别问题,而是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。参考文献:1 熊承义.李玉海统计模式识别及其发展现状综述期刊论文-科技进步与对策2003(8).2 FU,K.S.Syntactic Pattern Recognition,Academic Press. New Youd. 3 程勇.傅德胜基于图像区域特征的细胞识别方法及实现 2003 .4 Dandelion C,Capital K K.Fast feature extraction method for robust face verificationJ.Electronic Letters,2003,38(25)5 Chen Li,Yap Mon-Tue.A fuzzy K-nearest-neighbour algorithm to blind image deconvolutionA.IEEE International Conference on Systems,Man and Cybernetics,2003.6 苏芳,洪文.贝叶斯融合在SAR图像分类中的应用J.电子学报,2003,31(7)7 范昕炜.支持向量机算法的研究及其应用D.浙江大学,2003.8 吴艳冬.复杂背景的人脸检测与定位D.大连理工大学,2004.9 Hes Labour,Wei Backup.Image an
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中国计量泵齿轮行业市场前景预测及投资价值评估分析报告
- 2026年中国梅森密封罐行业市场规模及投资前景预测分析报告
- 2025下半年四川雅安市石棉县雅州英才工程赴外招才引智引进高层次人才和急需紧缺专业人员9人考试笔试参考题库附答案解析
- 2026贵州安顺普定县面向“优师计划”毕业生招聘教师10人考试笔试备考试题及答案解析
- 2025湖南永泰运化工物流有限公司专业人才招聘1人考试笔试备考题库及答案解析
- 2025浙江绍兴市科技产业投资有限公司下属合资企业浙江城华新能源发展有限公司招聘3人考试笔试备考试题及答案解析
- 安徽A10联盟2026届高三上学期11月期中质量检测 地理试卷(含答案详解)
- 婚姻家庭中的法律智慧课件
- 乙肝病毒HBsAg检测解读规范
- 鼻炎急性发作处理流程
- 学校体育发展五年规划(2025.9-2030.9)
- 2025年陇南市人民检察院司法警察辅助人员招聘考试笔试试题
- 2025北京市顺义区卫生健康委员会所属事业单位招聘额度人员14人笔试考试参考题库及答案解析
- 2025年全国共青团“新团员入团”应知应会知识考试试卷及完整答案详解【必刷】
- 2025年高等数学第一学期期中考试试题
- 单位大门施工合同5篇
- 人工智能行业现状与未来展望
- Unit3+Sports+and+fitness+一轮词汇复习+课件+-2026届高三英语人教版必修第一册
- 中国远洋海运2025校园招聘笔试历年参考题库附带答案详解
- 九年级语文基础通关每日一练【空白】
- 2025年工会社会工作者招聘笔试模拟试题库及答案
评论
0/150
提交评论