(应用心理学专业论文)汉字模糊信息的线索搜寻与模式识别的眼动研究.pdf_第1页
(应用心理学专业论文)汉字模糊信息的线索搜寻与模式识别的眼动研究.pdf_第2页
(应用心理学专业论文)汉字模糊信息的线索搜寻与模式识别的眼动研究.pdf_第3页
(应用心理学专业论文)汉字模糊信息的线索搜寻与模式识别的眼动研究.pdf_第4页
(应用心理学专业论文)汉字模糊信息的线索搜寻与模式识别的眼动研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(应用心理学专业论文)汉字模糊信息的线索搜寻与模式识别的眼动研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 汉字的模式识别和视觉信息获取,涉及数学、计算机科学、电子信息、人工智能、心 理学、语言学和文字学等多个学科。汉字识别研究不仅在语言的基础研究中有着重要的理 论意义,而且在计算机汉化操作平台设计、汉字输入法系统开发、汉字光学字符识别技术 汉语语言教学与法庭文字证据的笔迹鉴定等众多领域都有直接的应用价值。 本研究在汉字单字识别的框架内,以汉字单字为视觉材料,利用眼动仪实时测量被试 在注视汉字时的眼动情况,以模板理论、原型理论和特征理论为理论支持,探讨了汉字识 别的构形学视觉识别特征和认知加工过程,主要包括完整印刷体汉字识别、残缺印刷体汉 字识别和手写体汉字识别三个方面。其中,在完整印刷体汉字识别中,主要探讨了汉字识 别的一些基础性问题,如汉字的结构效应、笔画效应和字频效应,以及注视位置偏好和扫 描模式等。在残缺印刷体汉字识别中,主要探讨了残缺汉字被识别的程度和可识别性特征, 以及成功恢复汉字原形的一致性眼动模式。在手写体汉字识别中,对手写体汉字变形进行 了分类模型预设,对手写体汉字识别指标和视觉模式进行了分析。 通过对三个实验的综合分析,得出以下结论:第一,汉字的识别绩效与复杂性无关, 汉字视觉构形特征不会直接影响我们的识别过程,汉字的熟悉程度和使用程度决定着我们 的识别成绩与眼动模式,熟悉性验证是汉字模式识别的前提。第二,小面积的规则残缺不 会影响我们对汉字的正确识别,识别率在9 5 以上。对残缺汉字进行计算机的数字化图像处 理,须经过“寻找对称点连接点成线偏旁相似性选择整字相似性选择汉 字确认”五个阶段,逐步增强相似度,降低识别难度,以实现准确识别。第三,人类识别 手写体汉字不需要经过图形的预处理,可直接进入汉字特征提取。手写体汉字识别应该增 强多线索性、多向激活性,提高后处理阶段的语言情境判断能力。 本研究从人类识别汉字的视觉特点出发,来探讨人类是如何搜索、评价和选择汉字相 关识别线索和信息的,并试图通过寻找汉字识别的视觉模式和规律,为汉字的机器自动识 别提供可借鉴的经验与心理学依据,以提高机器识别的识另玎率和亲和性。 关键词:汉字;线索搜寻;特征分析:模式识别;眼动研究 a b s t r a c t t h ec h i n e s ec h a r a c t e r sr e c o g n i t i o na n do b t a i n i n gt h eo p t i ci n f o r m a t i o nf r o mt h ec h i n e s e c h a r a c t e r si n v o l v e st h a t m a t h e m a t i c s ,c o m p u t e rs c i e n c e ,e l e c t r o n i c si n f o r m a t i o n ,a r t i f i c i a l i n t e l l i g e n c e ,p s y c h o l o g y , l i n g u i s t i c s ,w r i t i n g sa n ds e v e r a lc o u r s e so fe t c t h er e s e a r c ho ft h e c h i n e s ec h a r a c t e r sr e c o g n i t i o nh a v en o to n l yt h ev e r yi m p o r t a n tt h e o r i e sm e a n i n gi nt h eb a s i c r e s e a r c ho ft h el i n g u i s t i c s ,a n db u ta l s oh a v et h ed i r e c t l ya p p l i e dv a l u ei nt h ed e s i g no ft h e c o m p u t e r sc h i n e s ec h a r a c t e r so p e r a t i n gp l a t f o r m ,t h ec h i n e s ec h a r a c t e r si n p u tm e t h o d ss y s t e m d e v e l o p m e n t , t h eo p t i c a lc h a r a c t e rr e c o g n i t i o n , t h ec h i n e s el a n g u a g et e a c h i n ga n dt h el a wc o u r t w r i t i n gp r c o f i nt h e 缸m eo ft h es i n g l ec h i n e s ec h a r a c t e r sr e c o g n i t i o n , t h er e s e a r c hh a st a k e nt h es i n g l e c h i n e s ec h a r a c t e r sa st h ee x p e r i m e n t a lm a t e r i a l s ,a n dw eu s e dt h ee y em o v e m e n ti n s t r u m e n tt o r e a lt i m em e s u r es u b j e c t s e y em o v e m e n tc o n d i t i o nw h i l et h c yg a z e da tt h e e x p e r i m e n t a l m a t e r i a l s m e a n w h i l e ,t h ea u t h o rh a st a k e nt h et e m p l a t et h e o r y , t h ep r o t o t y p et h e o r ya n dt h e c h a r a c t e r i s t i ct h e o r ya st h et h e o r i e st os u p p o r t , s i m p l yi n q u i r i e di n t ot h ec h i n e s ec h a r a c t e r s s o p t i cr e c o g n i t i o ng r a p h i c sc h a r a c t e r sa n dt h ep r o c e s so ft h ec o g n i t i o np r o c e s s i n g i tm a i n l y i n c l u d e st h ec o m p l e t ep r i n t e dc h i n e s ec h a r a c t e rr e c o g n i t i o n ,t h ei n c o m p l e t ep r i n t e dc h i n e s e c h a r a c t e rr e c o g n i t i o na n dt h eh a n d - w r i t t e nc h i n e s ec h a r a c t e rr e c o g n i t i o n a n d j nt h e c o m p l e t ep r i n t e dc h i n e s ec h a r a c t e rr e c o g n i t i o n ,t h ea u t h o rm a i n l yi n q u i r i e di n t os o m eb a s i c p r o b l e m sa b o u tt h ec h i n e s ec h a r a c t e r sr e c o g n i t i o n ,s u c ha st h es t r u c t u r ee f f e c t s ,t h es t r o k e e f f e c t sa n dt h ef r e q u e n c ye f f e c t so ft h ec h i n e s ec h a r a c t e r s ,a n dt h ep r e f e r e n c et ot h eg a z i n g p o s i t i o na n dt h es c a n n i n gm o d ee t c i nt h ei n c o m p l e t ep r i n t e dc h i n e s ec h a r a c t e rr e c o g n i t i o n ,t h e a u t h o rm a i n l ya n a l y z e dt h o s es u b j e c t s r e c o g n i t i o nr e s u l t sa n dd i s c r i m i n a t i n gc h a r a c t e r so ft h e i n c o m p l e t ep r i n t e dc h i n e s ec h a r a c t e f ,a n d t h ee y em o v e m e n tm o d er e c o v e r i n gc h i n e s e c h a r a c t e r s o r i g i n a ls h a p e i nt h eh a n d - w r i t t e nc h i n e s ec h a r a c t e rr e c o g n i t i o n , t h ea u t h o rt o o k t h eh a n d - w r i t t e nc h i n e s ec h a r a c t e r sc l a s s i f i e di n t of o u rt y p e si na d v a n c e , t h e n , a n a l y z e dt h ee y e m o v e m e n tm e t r i c a lv a r i a b l e sa n ds u b j e c t s o p t i cm o d e d r a w i n gac o n c l u s i o nf r o mt h ec o m p r e h e n s i v ea n a l y s i s :t h ef i r s t , t h er e c o g n i t i o nr e s u l t sa r e n oc o r r e l a t i v ew j t ht h ec o m p l e x i t yo ft h ec h i n e s ec h a r a c t e r s t h es h a p ec h a r a c t e ro fc h i n e s e c h a r a c t e r sc a n t d i r e c t l ya f f e c to u rr e c o g n i t i o np r o c e s s i n g i ti s ac a a s eo fd e c i d i n gt h ee y e m o v e m e n tm o d ea n dr e c o g n i t i o nr e s u l t st h a tt h ed e g r e eo f u s i n ga n da c q u a i n t i n gw i t ht h ec 址n e s e c h a r a c t e r s t h ea c q u a i n t a n c ev e r i f i c a t i o ni st h ep r e m i s eo ft h ec h i n e s ec h a r a c t e r sr e c o g n i t i o n t h e i i s e c o n d ,t h es m a l li n c o m p l e t ea r e a sw i l ln o ta f f e c tt h ec h i n e s ec h a r a c t e r sr e c o g n i t i o n , a n dt h e r e c o g n i t i o nr a t ei sa b o v e9 5 t h ed i g i t a li m a g ep r o c e s s i n gi st h r o u g hf i v es t a g e so fl o o k i n gf o r al i t t l eb i ts y m m e t r y , t h ec o n j u n c t i o no r d e rl i n e ,a n dt h er i g h tp a r tc h o i c e ,t h ew h o l ec h i n e s e c h a r a c t e r sc h o i c e ,f i n a l l y ,t h ec r i u e s ec h a r a c t e r sc o n f i r l 1 t h et h i r d , t h em a nc a nd i r e c t l ya n a l y s e t h ec h i n e s ec h a r a c t e r sb u tn e e dt op r o c e s st h es h a p eo ft h ec h i n e s ec h a r a c t e r s t h eh a n d - w r i t t e n c h i n e s ec h a r a c t e r sr e c o g n i t i o ns h o u l db es t r e n g t h e n e d m a n yc l u e sc h a r a c t e r i s t i ca n dm a n y a s p e c t sa c t i v a t i v ec h a r a c t e r i s t i c b e s i d e s ,i ts h o u l di m p r o v et h ea b m t yo ft h ep r o c e s s i n gt h e l a n g u a g es c e n a r i o t h es t u d ya n a l y z e dt h em a nh o wt os e a r c h ,t oe v a l u a t ea n dt oc h o o s et h ei m p o r t a n tc l u e sa n d i n f o r m a t i o nf r o mt h em a n k i n d s o p t i cc h a r a c t e r s i tt r i e s t of o n do u tt h ei m p o r t a n to p t i c r e c o g n i t i o nm o d ea n dr e g u l a t i o n si no r d e rt oi m p r o v et h er e c o g n i t i o nr a t e ,t h ea p p e t e n c ya n d p r o v i d ea n ye x p e r i e n c et ot h ea u t o m a t i c a lr e c o g n i t i o no ft h ec h i n e s ec h a r a c t e r s k e y w o r d :t h ec h i n e s ec h a r a c t e r s ;t h ec l u e ss e a r c h ;t h ec h a r a c t e r i s t i ca n a l y s i s ;t h em o d e r e c o g n i t i o n ;t h ee y em o v e m e n ts t u d y 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的 研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包括 其他人已经发表或撰写过的研究成果,也不包含为获得西北师范大学或其他教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 关于论文使用授权的说明 本人完全了解西北师范大学有关保留、使用学位论文的规定,即:学校有 权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部 或部分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名:杰趔导师签名:牲日期:型递五互丛 李鹏程 汉字模糊信息的线索搜寻与模式识别的眼动研究 1 引言 1 1 研究背景 语言作为人类文明最核心的特征和标志,是进行知识传递、情感沟通和意愿表达的重 要交流工具与信息载体,也是人类进行思维的工具 。语言是一种承载复杂信息的抽象符号 系统,主要包括声音语言符号系统和视觉语言符号系统圆。声音语言,是指人们通过发音器 官发出同一语言群体共同约定的确定可识别的表义声音( 语音) 来传递信息的方式,声音 语言信息的接收主要是借助听觉来实现的。而视觉语言则包含了更广泛的表达形式,如文 字、数字、图形图像、表情和身体动作( 手语、身体姿势语言等) ,视觉语言是通过视觉的 感知和识别来实现的。语言的分类因参照标准的不同可以有很多种分类方法,这里只是根 据语言获得的感觉来源而进行的划分。从语言的产生历史来看,声音语言先于视觉化的语 言而存在,而且可以表达更为丰富的信息和人类情感,但是由于声音语言无法持久保存和 广泛流传,便产生了视觉语言( 主要是文字) o 。而人类视觉先天的优势决定了视觉语言是 我们获得信息和传播信息最为有效的方式。生理心理学的研究显示。:人类8 3 的信息是通 过视觉获取的,而听觉只获取1 1 的信息,其他感觉器官加起来只获取6 的信息。因此, 语言的视觉研究是一个非常重要和有价值的研究领域。 在语言的视觉研究中,文字的阅读和加工过程一直以来是一个非常重要的研究方面,包 括对字、词汇、句子、语段和篇章的视知觉研究。国内外对文字的阅读心理进行了长期而 广泛地研究,也取得了很多非常有价值的研究成果 。主要包括基础研究和应用研究两个方 面。在基础研究中,研究者对阅读的知觉广度、阅读的影响因素、阅读的认知加工过程、 阅读的眼动模式等语言的心理结构进行了考察,同时对语言的内部结构( 如字词的构形、 句法、语义以及篇章的信息整合等) 也进行了深入地探索;在应用研究中,视觉语言的研 究也有着非常广阔的应用空间和应用价值,如对阅读障碍患者的阅读训练、阅读学习机器 的发明、新的阅读教学方法的提出、印刷排版和广告文案的设计,以及人工智能的开发( 如 仿人识字的机器学习和文字识别) 等。 但是,大多数的研究都是在句子水平以上进行分析和探讨的,而对单字的研究相对比较 少。这可能是因为在我们日常的语言交流和学习中,句子( 非正式语言中能够完整表义的 字词往往是省略句) 、语段和篇章往往是最主要的信息载体,所以对单字识别的研究相对不 西黄希庭心理学导论人民教育出舨牡1 9 9 1 年版。4 7 0 o 游顺钊著,徐志民译视觉语言学论集语文出版社,1 9 9 4 年版 。刘伟,张必隐汉字的心理储存和认知历程北京师范大学学报( 人文社会科学版) 2 0 0 5 年。1 6 1 ( 5 ) :9 1 - 9 5 。凌文辁,方俐洛汉字认知学术研究2 0 0 4 年,1 :1 4 1 1 4 6 。阎国利眼动分析法在心理学研究中的应用天津教育出版社2 0 0 4 年版 1 李鹏程汉字模糊信息的线索搜寻与模式识别的眼动研究 是很重视。然而,单字( 在汉语中为单个汉字,在英语中为单词) 是构成语言的最基本单 位,也是我们学习语言所必须掌握的最基本形式,而且单字识别在儿童初学语言和人工智 能的文字识别系统开发中有着非常重要的应用价值。特别值得指出的是,机器学习语言与 人类学习语言存在着显著的不同。主要体现在:在人类成熟的阅读中,视觉往往接触最多 的是句子、语段和篇章,如报纸、杂志、书籍中的文章和电视、电影中的字幕,以及我们 日常生活中随处可见的文字信息等,而不是对单字的识别国。这一点在阅读的眼动研究中也 得到了证实,如b e c k e r j u r g e n s ( 1 9 7 9 ) 在一项阅读的眼动研究中发现。:人类能够对一些短 词、高频词和可以根据上下文推断出来的字词进行跳读( w o r d s k i p p i n g ) 。即人类能够对文 字信息进行灵活地处理,可以忽略一些字词,而不需要对所有的字词进行识别和加工。但 是,在机器识别文字中,文字的输入和识别都是以单字的形式进行的。因此,对单字的认 知特点和加工过程的研究在人工智能的开发方面有着极其重要的意义。 1 2 研究的问题及核心概念界定 本研究在汉字单字识别的框架内,以汉字单字为视觉材料,通过眼动仪实时测量被试在 注视汉字时的眼动数据,探讨了汉字识别的构形学视觉识别特征和认知加工过程,主要包括 完整印刷体汉字识别( c o m p l e t ep r i n t e dc h i n e c h a r a c t e rr e c o g n i t i o n ) 、残缺印刷体汉字识别 ( i n c o m p l e t ep r i n t e dc h i n e s ec h a r a c t e rr e c o g n i t i o n ) 和手写体汉字识别( h a n d - w r i t t e nc h i n e s e c h a r a c t e rr e c o g n i t i o n ) 三个方面。其中,在完整印刷体汉字识别中,主要就目前汉字识别研究 中存在争论的笔画效应、字频效应和结构效应进行验证,并进一步讨论完整印刷体汉字单 字识别时的眼动模式。如实验汉字的笔画数、字频、结构类型与识别时间、识别率( 正确 命名次数) 和瞳孔直径、注视频率之间的关系,并考察注视停留位置( 注视轨迹) 和扫描 模式,看是否存在一致性的注视位置偏好和扫描模式。在残缺印刷体汉字识别中,主要探 讨不同频率和不同结构的残缺汉字被识别的程度和一致性的可识别性特征,以及成功恢复 汉字原形的一致性眼动模式。如将汉字进行规范化残缺设置,即划分为相等的四个部分: 左上、左下、右上、右下,以探讨不同残缺位置、字频、结构类型配对后对识别时间、识 别率和瞳孔直径、注视频率的影响,以及通过注视点位置的分布情况和扫描模式来验证被 试在注视残缺汉字时,是通过视觉的“完形”之后与字典存储器中的汉字模板相匹配而实 现正确识别的,还是通过提取关键特征之后再在字典存储器中进行线索搜寻或检索而实现 正确识别的。在手写体汉字识别中,对自由书写的汉字风格进行概括,以探讨不同风格的 。丁晓青汉字识别研究的回顾电子学报2 0 0 2 年,9 :1 3 6 4 - 1 3 6 8 。b e c k e t , w & j u r g e n s , r ( 1 9 7 9 ) a na n a l y s bo f t h es a c c a d i cs y s t e mb ym e a n so f d o u b l e - s t e ps t i m u l i , v i s i o n r e s e a r c h , 1 9 ,9 6 7 9 8 3 2 李鹏程 汉字模糊信息的线索搜寻与模式识别的眼动研究 手写体汉字的可识别性问题,以及通过实验方法来验证我们在识别手写体汉字时,是通过 输入信号与手写体汉字模板的全面匹配来实现识别的,还是通过输入信号与标准化印刷体 汉字模板的相似性而实现识别的。如果是第二种情况,则有两种可能性:第一,我们可能 是将待识别的手写体汉字进行了视觉上的预处理( 如拉伸、弥合、分割等) ,而转换成近似 标准化的汉字再与模板进行匹配而实现识别的;第二,我们没有对待识别汉字进行视觉上 的预处理,而只是对待识别汉字的某些关键特征线索( 如笔画、部件的运动趋势或空间分 布特点) 进行了注视,并以这些关键线索来激活字典存储器中相对应的模板而实现手写体 汉字的识别。 以上三个方面的研究都是围绕着汉字识别“认知经济化”的原则而确立研究假设和制 定研究设计的,即人类在识别汉字时不可能会利用汉字所有的视觉信息与模板信息相比照 来实现识别,而是通过某些关键特征线索来进行线索搜寻才实现汉字识别的。因为这样符 合人类高级、高效的认知和思维活动,具有更大的便捷性和经济性。正如我们在使用汉语 字典查找某个汉字时,我们绝对不会将整个字典翻遍才能找到这个汉字,而是通过笔画或 部首或拼音等相关线索先找到这个汉字所对应的页码,再来查找这个汉字及其语义等其它 信息的。当然,汉字的识别可以有很多关键搜寻线索,如语音、语义相关、语言情境和构 形特征等。但是,在本研究中所考虑的只是汉字视觉构形上的相关线索,如汉字笔画、频 率、结构和图形特征等。 下面对本研究中所涉及到的一些核心概念进行简单的说明和界定。 汉字的模糊信息( n o n s t a n d a r dc h i n e s cc h a r a c t e r ) ,主要是指待识别汉字仅包含非常少量 的可识别性视觉信息,因此无法进行准确的模式识别,如劣化字、残缺字、自由手写字等 非标准化的汉字回。而本研究仅初步地探讨一些残缺印刷体汉字和手写体汉字的识别问题。 如由于人为或自然的原因所造成的古籍善本、合同、档案等重要文字材料的部分汉字残缺; 以及在一些重要的手写体文字材料中,由于书写者个人书写风格等原因所造成的文字连笔、 任意变形、笔画省略等难以辨认,以及无法进行机器自动识别和转换等问题。 线索搜寻( c l u es e a r c h ) ,也叫信息检索,是指利用汉字的部分线索来激活待识别汉字 的模板信息,再利用其它外部信息最终确定待识别汉字的过程o 。汉字的部分线索包括笔画、 部件或笔画的组合及部件的部分信息,以及整字的运动趋势、空间分布特点和轮廓等。这 样就不再局限于从笔画到部件再到整字的单一知觉过程,而是更强调汉字识别的多线索性、 灵活变通性和有效性。 模式识别( p a a e mr e c o g n i t i o n ) ,是人类的一种基本认知能力和知觉过程,是感觉信息 。史绍强等基于整形特征和模糊识别的手写体汉字识别微机发展。2 0 0 4 年,1 ( 1 4 ) :1 1 4 - 1 1 6 。张学民等视觉搜索中多目标追踪的研究应用心理学,2 0 0 2 年,4 ( 8 ) :7 1 2 李鹏程汉字模糊信息的线索搜寻与模式识别的眼动研究 与长时记忆中的有关信息进行比较,再决定输入的刺激信息与长时记忆中的项目有最佳匹 配的过程回。在本研究中主要指视觉的模式识别,如被试看见某个汉字或汉字的部分线索以 后能够准确地命名该汉字。 1 3 研究的意义与价值 对汉字模糊信息的研究,不仅在语言的基础研究中有着重要的理论意义,而且在计算 机汉化操作平台设计、汉字输入法系统开发、汉字光学字符识别技术 ( o p t i c a lc h a r a c t e r r e c o g n i t i o n , o c r ) 与法庭文字证据的笔迹鉴定。等众多领域都有直接的应用价值。比如,我 们可以通过人类视知觉的完形特点对残缺汉字进行再构和恢复,以实现对残缺汉字原形的 再现与识别。而相应的图形图像处理与识别技术可以模仿人脑的这一功能,对由于手工排 版印刷时用墨不均、排版铅字凸凹不平或因部分墨迹退色等原因所造成的重要历史文献的 文字残缺进行复原固。而手写体汉字识别的研究则应用更广。比如联机手写汉字识别 ( o n 1 i n eh a n d w r i t t e nc h i n c s cc h a r a c t e rr e c o g n i t i o n ,o l c c r ) 与脱机手写汉字识别 ( o f f 1 i n e h a n d w r i t t e nc h i n e s ec h a r a c t e rr e c o g n i t i o n ,o l c c r ) 在信函分拣、银行支票识别、手写文稿的 自动输入和个人数字化助手( p e r s o n a ld i g i t a la s s i s t a n t ,p d a 如掌上电脑、手写式手机) 等 方面的应用。而且大多数的研究者也一致认为,汉字识别的心理学研究对机器汉字识别技 术的开发有着非常重要的启发意义,尤其是认知心理学o 。我们完全可以将人类识别汉字的 视觉识别模式和认知加工过程移植到人工智能的开发中去。 o 汪安圣等认知心理学北京大学出版社。1 9 9 2 年版,4 6 - 4 7 o 张世辉,孔令富汉字识别及现状分析燕山大学学报2 0 0 3 年,2 7 ( 4 ) :3 6 7 - 3 6 9 艾小伟等从手写汉字识别系统的技术方法中探讨计算机笔迹鉴别的一些途径河北公安警察职业学院学报2 0 0 5 年,5 ( 3 ) :2 2 - 2 6 ”陆发春,李晓辉残损文献的文字图像处理及识别技术国家图书馆学刊2 0 0 3 年,4 :6 9 - 7 3 o 俞庆英,吴建国对联机手写汉字识别技术的研究微机发展2 0 0 4 年,1 4 ( 1 0 ) :6 8 7 0 o 高彦宇。杨扬脱机手写体汉字识别研究综述计算机工程与应用2 0 0 4 年,7 :7 4 - 7 7 o 张德喜手写体汉字机器识别技术的现状分析浒昌师专学报1 9 9 9 年,1 8 ( 3 ) :9 1 9 5 4 李鹏程汉字模糊信息的线索搜寻与模式识别的眼动研究 2 研究综述 2 1 汉字识别的理论与模型 世界上的文字大致可以分为两种,一种是拼音文字,如英文、法文等;另一种是意音文 字,如汉字。汉字是世界上最古老的文字之一,也是使用人数最多的一种文字。汉字作为 一种由音符、意符和记号三类符号组成的语素文字,与拼音文字有着显著的区别回。比如在 字形结构方面,汉字是方块字( 正形字) ,它是由不同的笔画和部件按照一定的顺序和相 对位置在二维空间上构成的线段图形,而拼音文字则是按照发音的先后顺序,在一维空间 上建立的线性序o 。此外,构成汉字的一些笔画和部件也可以作为一个独立表义的汉字,如 “一”、“乙”、“口”等,而且每个汉字都有确定且唯一的意义。但是在拼音文字中, 构成文字结构的拼音字母却没有任何意义,如单独呈现的字母“a 、b 、c 、d ”等只是一种 语音记号而已,没有任何的表义功能。而且由若干字母组成的单词也有着不确定的多种意 义囝。汉字的优点显而易见,但是同时也存在字形结构复杂性的问题,即笔画多、部件繁、 结构杂,使得汉字难写、难查、难用。正是因为如此,曾经一度人们认为要开发汉化的计 算机操作系统和汉字输入法简直是不可能的事情。这一阻碍我国信息产业发展的难题虽然 在印刷体汉字识别领域已经成功地解决,但是在目前手写体汉字识别( h a n d - w r i t t e nc h h l e s e c h a r a c t e rr e c o g n i t i o n ,h c c r ) 方面仍是一个无法逾越的障碍,所以对汉字识别的研究从过 去到现在,甚至在未来很长一段时间内仍然将是一个研究的热点问题。 对于汉字识别的研究,学者从不同的角度进行了探讨,而其中汉字识别理论与模型的建 构无疑是最重要的方面之一。现将国内外有关汉字识别理论与模型的研究进行简单地介绍。 2 1 1 经成分识别模型( r e c o g n i t i o n b y c o m p o p n e n tm o d e l ,r b c ) r b c 模型是b i e d e r m a n 提出的物体识别模型固该模型假定,一个物体的二维视像都由 一些几何离子( g e o n ) 组成,各种不同的几何离子按照不同的关系组合起来形成不同的物 体。h u a n gf t t t w a n g ( 1 9 9 2 ) 将b i c d e 咖强的这一理论模型转借到汉字识别中来,他们认为汉 字识别的基本过程应该和物体识别的基本过程相似,相应地也有特征抽取、对非偶然性特性 的搜索和分析字符的范畴、字成分及其关系的激活、字符模式的激活和汉字的确认五个阶 段。但是这个模型对汉字识别的几何离子并没有讲清楚。 o 马国荣现代汉语,北京师范大学出版社1 9 9 0 年版,8 9 9 2 母陈洁汉字认知研究评述应用心理学1 9 8 8 年,2 ( 3 ) ;5 0 - 5 5 删陈良育等汉字构形分析与识别上海电力学院学报2 0 0 5 年,2 1 ( 1 ) :6 3 - 6 6 :b i e d e r m a n , lr e c o g n i t i o n - b y - c o m p o n e n t s :at h e o r yo f h u m a ni m a g eu n d e r s t a n d i n g p s y c h o l o g i c a lr e v i e w , 1 9 8 7 , 9 4 。h u a n g , j t w a n g , m 丫f r o mu n l lt og e s t a l t :p e r c e p t u a ld y n a m i c si nr e c o g n i z i n g 蛐c c h a r a c t e r s i nh cc h c aa n d0 j lt z e n g ( e d s ) ,l a n g u a g ep r o c e s s i n gi nc h i n e s e a m s t e r d a m :t h en e t h e r l a n d s , 1 9 9 2 5 李鹏程汉字模糊信息的线索搜寻与模式识别的眼动研究 2 1 2 汉字识别与命名的联结主义模型 陈鹰、彭聃龄( 1 9 9 4 ) 。在s e i d e n b e r g 和m c a e l l 缸d 的单词识别与命名的分布发展模型的 基础上,提出了汉字识别与命名的联结主义模型。该模型由三层单元组成:第一层为4 2 0 个字 形单元,第二层为2 0 0 个隐单元,第三层为4 2 个语音单元。各层信息都是分布表征的,知识通 过学习获得。模型采用了前传型的结构,即信息从字形单元层传到隐单元层,再传到字音单 元层,不包含任何反馈、隔层连结及层内单元间的相互作用。该模型通过计算机模拟检验了 模型的有效性,尽管还存在一些缺陷和不足,但是给探索汉字识别的过程仍提供了一条非常 有效的途径。 2 1 3 多层次激活模型( m i a ) m i a 模型认为巴词形模块的分析层次可能包括:笔画、偏旁部首( 部件) 、词素( 字) 和复 合词素( 词) 。笔画层次所需要的信息包括笔画和笔画间相对位置的信息,部件层单元的表征 也包含了部件的位置信息。已有研究结果也的确支持笔画分析层和部件分析层存在。而对 单个汉字,t a f t 和z h u 为“在汉字信息加工系统中不存在与字对应的词汇表征单元,相反, 只有与词素对应的表征单元。”汉字的m i a 模型解释了汉字识别中笔画、部件和字的关系。 但是在汉字的6 4 8 个末级部件中,约有3 2 7 个部件既是部件也是字和词,所以m 酞的层次划分 就不容易严格区分。此外,这种汉字识别的多层次激活方向虽然是双向的,但这种交互激活 的具体作用,尤其是对向下传播的激活作用没有解释清楚,在本质上依然是以特征分析加工 为主导的。 2 1 4 中文词汇识别的表征与加工模型 该模型假设 ,每个词在心理词典中至少有字形、语音和语义三种表征,表征之间相互联 结。在词汇加工初期,感觉输入被分析为不同尺度的字形单元,这些单元被并行地用来通达 心理词典中对应的词汇表征o 。但是对字形单元的具体尺度,该模型没有多加阐述。不过,该 模型也提出“对于复杂汉字、整字字形和声旁对被用来通达与它们相对应的字形表征以及 与之联结的语音及语义表征”o ,即认为部件和整字也是字形单元之一。 。陈鹰,彭聃龄汉字识别和命名的联结主义模型i nh w c h a n g , j th u a n g , c w h u ca n d0 j lt z c a g , 但出 a d v a n o 瞄 i n t h es t u d y o f c h i n e s e l a n g u a g c p r o c e s s i n g , v o i 1 ,d e p a r t m e n t o f p s y c h o l o g y ,t a i w a n u n i v c r s i t y , 1 9 9 4 9s c i d c n b c r g , m s ,m c c l c l a n d , 工la d i s m i b u t c d ,d e v e l o p m e n t a lm o d e lo f w o z dr e c o g n i t i o na n dn a m j n 吕p s y c h o l o g i c a l r e v i e w , 1 9 8 9 o 彭聃龄汉语认知研究山东教育出版社1 9 9 7 年版 z h u ,x ,& t a f t ,m c o m p l e x i t ye f f e c te f f e c t si nc h i n e s ec h a r a c t e rp r o c e s s i n g p a p e rp r e s e n t e d 幻t h ea s i a n a u s t r a l i a n w o r k s h o p o i l c o g n i t i v e p r o c e s s l n g o f a s i a n l a n g u a g e s 。t h e u n i v e r s i t y o f n e w s o u t h w a l c s , a n d t h e 2 1 s t a a f i u a l e x p e r i m e n t a lp s y c h o l o g yc o n f e r e n c eo f a u s t r a l i a , t h eu n i v e r s i t vo f s y d n e y , 1 9 9 4 9p e n g d l ,l 。y p o r l h o g r s p h l c i n f o r m a t i o n i n i d t i 丘c a t i o n o f c h i n e s e c h a r a c t c r s p a p e r p r e s e n t e d t o t h c 7 t h i n t e r n a t i o n a l c o n f e r e n c e o n c o g n i t i v e a s p e c t so f c h i n e s e l a n g u a g e ,u n i v c r s 时o f h o n g k a n g , 1 9 9 5 。周晓林语义激活中语音的有跟作用山东教育出版社,1 9 9 7 年版 :s e i d e n b e r g , m s n ct i m ec o u l s eo fp h o n o l o g i c a lc o d ea c t i v a t i o ni nt w ow r i t i n gs y s t e m c o g n i t i o n , 1 9 8 5 ,( 1 ) z h o u 。x ,& m a r s l e n w i l s o n ,w d i r e c tv i s u a la c c e s si st h eo n l yw a yt oa c c c s st h ec h i n e s em e n t a ll e x i c o n i np r o c e e d i n go f t h e l 8 t h a n n u a l c o n f e r e n c e o f c o g n i t i v e s c i e n c e s o e i e t y , 1 9 9 6 6 李鹏程 汉字模糊信息的线索搜寻与模式识别的眼动研究 2 1 5 汉字识别的成分和整字平行加工假说 该假说认为西,被试识别每个单字经历着两类平行加工的过程:一类是识别整字的加工; 另一类是笔画及其组合的加工。两类加工发生分享有限注意( 或知觉) 资源的竞争。对于高 频字或整体字形熟悉度高或知觉整体性较强的,以整字识别为知觉任务或认知目标的字,整 字占有相对多的注意资源,故整字加工击败成分加工,识别的反应时就快。而低频字要经过 特征识别。因而笔画数效应只存在于低频字当中。汉字字形的知觉整合性是该假说的关键 概念,它是通过长期的学习和使用而形成的,制约着汉字识别时的加工单元是以整字为主还 是以成分加工为主。这种假说可以很好地解释字形属性效应与字频效应的交互作用,更具有 灵活性,但是知觉整合性只是一个定性的概念,无法加以具体量化。 通过以上的汉字识别模型,我们可以看出,争论的焦点在于汉字识别中的字形加工究 竟是关键特征线索提取还是整字加工。这些理论模型都有各自的合理之处

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论