(计算机应用技术专业论文)书法碑帖文字的笔划提取技术及其实现.pdf_第1页
(计算机应用技术专业论文)书法碑帖文字的笔划提取技术及其实现.pdf_第2页
(计算机应用技术专业论文)书法碑帖文字的笔划提取技术及其实现.pdf_第3页
(计算机应用技术专业论文)书法碑帖文字的笔划提取技术及其实现.pdf_第4页
(计算机应用技术专业论文)书法碑帖文字的笔划提取技术及其实现.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机应用技术专业论文)书法碑帖文字的笔划提取技术及其实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

s t u d e n tn u m b e r :5 1 0 7 1 5 0 0 0 1 4 e a s tc h i n an o r m a l u n i v e r s i t y t h e t e c h n o l o g ya n d i t si m p l e m e n t a t i o no f s t r o k e e x t r a c t i o no fc h i n e s e c a l l i g r a p h yc h a r a c t e r s d e p a r t m e n t : s o f t w a r ee n g i n e e r i n gi n s t i t u t e m a j o r :c o m p u t e ra p p l i c a t i o nt e c h n o l o g y r e s e a r c hd i r e c t i o n :i n t e l l i g e n c es i m u l a t i o n t u t o r : m a s t e rg r a d u a t e :z h a o q i m a y , 2 0 1 0 郑重声明:本人呈交的学位论文书法碑帖文字的笔划提取技术及其实 现,是在华东师范大学攻读硕出博士( 请勾选) 学位期间,在导师的指导下 进行的研究工作及取得的研究成果。除文中已经注明引用的内容外,本论文不 包含其他个人已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个 人和集体,均已在文中作了明确说明并表示谢意。 作者签名: 亟竣日期:f o 年月l 日 华东师范大学学位论文著作权使用声明 书法碑帖文字的笔划提取技术及其实现系本人在华东师范大学攻读学位 期间在导师指导下完成的硕彰博士( 请勾选) 学位论文,本论文的研究成果归 华东师范大学所有。本人同意华东师范大学根据相关规定保留和使用此学位论 文,并向主管部门和相关机构如国家图书馆、中信所和“知网 送交学位论文 的印刷版和电子版;允许学位论文进入华东师范大学图书馆及数据库被查阅、 借阅;同意学校将学位论文加入全国博士、硕士学位论文共建单位数据库进行 检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式合理 复制学位论文。 本学位论文属于( 请勾选) ( ) 1 经华东师范大学相关部门审查核定的“内部”或“涉密”学位论文 ,于 年月同解密,解密后适用上述授权。 本人签名塾型、 弘b 年月、,日 “涉密”学位论文应是已经华东师范大学学位评定委员会办公室或保密委员会审定 过的学位论文( 需附获批的华东师范大学研究生申请学位论文“涉密”审批表方 为有效) ,未经上述部门审定的学位论文均为公开学位论文。此声明栏不填写的,默 认为公开学位论文,均适用上述授权) 。 赵堪硕士学位论文答辩委员会成员名单 姓名职称单位备注 朱明华教授华东师范大学主席 曹桂涛副教授华东师范大学 刘献忠副教授华东师范大学 对中国书法创作进行计算机模拟的研究,不仅对于继承和发展中国传统文 化有非常重要的意义,而且有利于书法艺术的推广和计算机艺术的发展。本文 就计算机书法模拟和创作中,关于碑帖书法汉字笔划提取的几个关键问题:预处 理、单字图像分割、笔划提取,轮廓恢复等作了介绍,并提出了相应的解决办 法。 为了获取清晰完整的碑帖书法图像,本文首先介绍了图像预处理的方法, 主要包括:图像去噪,单字图像分割、图像平滑、骨架和轮廓提取等。经过处 理,碑帖图像中书法文字信息被以骨架和轮廓图像的方式表达出来。 其次,通过分析书法汉字轮廓的特点,给出了一种基于书法笔划特征的, 书法碑帖汉字笔划提取技术。然后,针对笔划提取过程中遇到的轮廓缺失问 题,提出了一种通过学习相似笔划轮廓、对笔划轮廓的缺失部分进行合理估计的 笔划轮廓恢复方法。 实验表明,本方法可以有效的获取书法文字笔划信息。但由于笔划提取算 法较为简单,在某些复杂情况下笔划提取过程仍然需要人工干预。 最后,集成对书法碑帖图像进行笔划提取处理的相关软件工具,设计和实 现了一个书法笔划提取系统。本文的工作是初步的,需要在友好的人际交互环境 下获得更丰富的实例,为后续研究提供支撑。 关键词:书法,计算机模拟,笔划提取,轮廓恢复 t h er e s e a r c ho fs i m u l a t i n gc h i n e s ec a l l i g r a p h yi sn o to n l ys i g n i f i c a n tf o rt h e i n h e r i t a n c ea n dd e v e l o p m e n to ft h ec h i n e s et r a d i t i o n a lc u l t u r e ,b u ta l s oh e l p f u lf o r p r o g r e s so fc o m p u t e ra r ta n dp o p u l a r i z a t i o no fc a l l i g r a p h ya r t i nt h i sp a p e ls e v e r a l k e yi s s u e s o fs t r o k ee x t r a c t i o no fc a l l i g r a p h yt a b l e tc h a r a c t e r sa r e a n a l y z e d : p r e p r o c e s s i n g ,s e g m e n t a t i o n ,s t r o k ee x t r a c t i o n ,s t r o k ec o n t o u rr e c o v e r y a n dt h e nw e s h a l lp r e s e n tt h ec o r r e s p o n d i n gs o l u t i o n s f i r s to fa l l ,w ei n t r o d u c es o m ei m a g ep r e p r o c e s s i n gm e t h o d s ,i n c l u d i n g :n o i s e r e m o v a l ,w o r ds e g m e n t a t i o n ,i m a g es m o o t h i n g ,c o n t o u ra n ds t r o k ee x t r a c t i o n ,i n o r d e rt oo b t a i ne x p l i c i tc h a r a c t e r si m a g e sf r o mt a b l e tp i c t u r e a f t e rp r o c e s s i n g ,w ec a n o b t a i nt h ei m a g e so fc h a r a c t e r s c o n t o u ra n ds k e l e t o nw h i c hc o n t a i ni n f o r m a t i o no f t a b l e tc h a r a c t e r si n f o r m a t i o nc a nb eo b t a i n e d s e c o n d l y , t e c h n o l o g yo f s t r o k ee x t r a c t i o no fc h i n e s ec a l l i g r a p h yt a b l e t c h a r a c t e r sb a s e do nc a l l i g r a p h i cf o n tc h a r a c t e r i s t i c si sf o c u s e d t h e n ,ar e c o v e r y m e t h o dt or e s t o r em i s s i n gp a n so ft h es t r o k ec o n t o u ro fc a l l i g r a p h i cc h a r a c t e r si s p r e s e n t e d ,k e e p i n gi nm i n dt h a tt h ec o n t o u rl a c u n ap r o b l e mc o m e su pd u r i n gt h e p r o c e s so fs t r o k ee x t r a c t i o n e x p e r i m e n ts h o w st h a ts t r o k ei n f o r m a t i o nc o u l db e e f f i c i e n t l yg o t h o w e v e r , i ns o m ec o m p l e xc a s e s ,s t r o k ee x t r a c t i o np r o c e s ss t i l l r e q u i r e si n t e r v e n t i o nf o rs t r o k ee x t r a c t i o na l g o r i t h mi se l e m e n t a r y f i n a l l y , s o m ep r o c e s s i n gt o o l sf o rs t r o k ee x t r a c t i o no fc a l l i g r a p h yt a b l e ti m a g e s a r ei n t e g r a t e d ,a n dac a l l i g r a p h ys t r o k ee x t r a c t i o ns y s t e mi si m p l e m e n t e d m o r e e x a m p l e s a l et ob e r e a d y w i t h w e l l - - d e s i g n e dh u m a n c o m p u t e r i n t e r a c t i o n e n v i r o n m e n tt os u p p o r tf u r t h e ri n v e s t i g a t i o n k e yw o r d :c a l l i g r a p h y , c o m p u t e rs i m u l a t i o n ,s t r o k ee x t r a c t i o n ,s t r o k e c o n t o u rr e c o v e r y 第一章绪论。1 1 1 中国书法艺术及其仿真意义1 1 2 计算机书法2 1 3 书法笔划提取的意义3 1 4 本文的主要工作和组织结构4 第二章书法笔划提取的相关工作6 2 1 书法图像预处理6 2 1 1 常见去除图像噪声的方法6 2 1 2 书法碑帖图像的预处理方法7 2 2 骨架提取1 3 2 2 1 图像细化算法分析1 3 2 2 2 适合于中国碑帖书法图像的细化算法。1 3 2 3 边缘检测和轮廓提取1 4 2 4 单字切分1 6 2 4 1 汉字切分方法分类1 7 2 4 2 书法作品单字图像分割1 8 2 5 本章小结2 2 第三章基于书法字体结构知识的笔划提取方法2 3 3 1 相关的研究2 3 3 1 1 基于字体细化的笔划提取方法2 3 3 1 2 基于轮廓的笔划提取方法2 4 3 1 3 基于笔划段分割和组合的笔划提取方法2 4 3 2 笔划提取2 5 3 2 1 特征的获取和提取方法定制2 5 3 2 2 算法的设计和实现2 8 3 3 本章小结3 2 第四章书法笔划轮廓恢复。3 3 4 1相关研究。3 3 4 2定义3 4 4 3笔划建模3 4 4 4统计模型的建立3 5 4 5统计模型的求解3 6 4 6 实验结果3 7 4 7本章小结4 1 第五章中国碑帖书法文字笔划提取系统4 2 5o l系统的功能及结构4 2 5 2系统的实现:4 3 5 3本章小结4 7 第六章总结与展望4 8 6 0 l 本文工作总结4 8 6 2 进一步工作展望4 8 附勇乏5 0 参考文献5 8 致谢。6 0 1 1 中国书法艺术及其仿真意义 中国书法作为汉字的书写艺术,是一种古老和具有丰富内涵的艺术形式。 它随着中华文明的发展而发展,以其独特的艺术形式和艺术语言释读了中国传 统文化的内涵,在中国传统文化史上占有重要的地位。汉字一经产生,便呈现 出了书法艺术的萌芽。从甲骨文、金文演变而为大篆、小篆、隶书,至定型于 东汉、魏、晋的草书、楷书、行书诸体,书法一直散发着艺术的魅力。中国的 书法艺术历史悠久,源远流长,影响深远。今天,在几乎所有的名胜古迹,我 们都能看到从古至今无数文人墨客留下的书法作品。这些书法作品或是写于纸 上、或是制成匾额、或是雕于石碑、或是刻于山崖,都是中华传统艺术文化的 瑰宝。 历史上出现了许多著名的书法家,他们留下了许多对后世影响巨大的书法 作品。目前这些书法作品主要以“碑刻拓片 和“帖”的形式被保存下来。碑 刻一般是指刻在石头上的文字。现在,我们能见到的最早碑刻是创作于战国时 代的石鼓文,它距今己经有二千多年的历史。为了传播、学习和交流,历史上 出现了多种拓碑的方法将碑刻文字拓下,印制成纸质的拓本,例如宋代的 “毡蜡 ,明代的“煤拓”等。帖,最早是指书写在帛或纸上的墨迹原作。后来 写得优秀的墨迹难以流传,于是把它f j j n 在木头、石头上,可以多次拓制,这 样就把刻于木石上的这些原来的墨迹作品及其拓本统称为帖。依据辞海“碑 帖”条注:“碑谓碑刻,帖谓法帖,俗亦通称碑帖 ,因此,我们将历史上的书 法作品,无论其依存条件如何,一经印制成册页( 包括碑刻的拓本和帖的印本) 供学习、研究书法之用的文档资料统称为“碑帖 【1 1 。如图卜l 所示是唐代书法 家颜真卿的祭侄文稿。碑帖除了书法艺术价值外,还记录了它所在年代的社 会经济、政治、文化、风俗等方面的内容,这些内容给研究者提供了大量详 实、丰富的文化资料。伴随着汉字的使用和发展,历经千百年流传至今的碑帖 都是中华民族珍贵的遗产。 随着现代科技的进步,计算机的普及和相关技术的飞速发展,人们拥有了 新的书法创作方式。传统的笔、墨、纸、砚,也已不再是书写文字的必要工 具。在多数情况下,人们是借助键盘和鼠标进行文字输入工作。因此,在汲取 传统书法艺术的基础上,为了继承、弘扬和发展书法艺术,对其进行科学的仿 华东师范人学硕上学位论文书法碑帖文字的笔划提取技术及j e 实现 真就成为当前艺术及科技领域最具挑战的课题之一。 同时,书法创作是典型的以经验为基础、体现创造性思维的认知过程,其 心理过程十分复杂但有着内在的规律。对人的书法创作过程进行计算机模拟可 进一步拓展人工智能的研究深度和广度,同时增加对智能本质的理解,还可能 催生一些新的应用【2 1 。书法初学者要对很多优秀的书法作品进行大量的临摹训 练以学习书法的用笔、结构、章法和意境等知识和技巧。书法临摹与创作是一 个典型的学习与创作过程,对书法临摹与创作过程进行计算机模拟有利于探索 机器学习与创作的应用方法。 1 2 计算机书法 图卜1 唐代书法家颜真卿的祭侄文稿 从2 0 世纪8 0 年代开始,我国就开始了应用计算机技术对国画绘画和毛笔书 法模拟的研究这些都是以现代的技术手段发展古老国画和书法艺术的新尝试。 早在1 9 8 3 年,吉林大学的王易工就开始了中国书法艺术计算机虚拟绘制的研究 工作,并成功的将用计算机生成郭沫若先生字体的书法用于吉林大学研究生院 的牌匾上【3 j 。1 9 8 9 年,庞云阶等设计实现了计算机毛笔绘画系统c c b p s1 4 1 。之 后,随着计算机书法被广泛研究,出现了很多计算机模拟、创作的方法和实现 系统。这些研究中有一些是着重于毛笔特性及其在纸上表现的模拟几何参 2 唯承挝芏夙豫协德客店谢 华东师范大学硕 学位论文书法碑帖文的笔划提取技术及其实现 数、笔墨特性、宣纸效果、虚拟毛笔、甚至草书的“飞白效果等。例如,文 献 5 6 7 提出了基于实体造型技术的虚拟毛笔模型,并展示了其在计算机书 法系统中的应用。文献 8 实现了一套辅助用户“写 出毛笔字的计算机系统。 还有一些研究则是对书法创作过程进行模拟。例如,徐颂华等的研究工作【9 】【1 0 l 展示了基于笔划组合的计算机书法字学习及生成方法,并且构建了一个智能书 法辅导系统。董军等在书法创作的计算机模拟方面己做了一些基础性工作,涉 及到书法的笔划变形【矧、书法图像的预处理、轮廓平滑和字的合成【2 9 l 等,取得 了一些有价值的结果。但对于结构复杂的中国书法还不能完全实现自动化,必 要的人机交互仍是不可缺少的。中国书画的计算机虚拟绘制在经历了多年的研 究后,已经取得了长足的发展,但是和实际的中国书画在表现风格和效果方面 还存在着较大的差距。 对书法艺术的计算机模拟,即计算机书法,给书法艺术创作提供了一个新 的平台,给书法艺术的创作带来了新的工具和方法,扩展了书法艺术的表现形 式,推进了书法艺术的传播,并且丰富了书法艺术创作的手段,改变了传统书 法艺术创作的流程【n 】。这些都给传统书法艺术注入了新的活力。 现代社会,尤其随着计算机的普及,文字处理往往在计算机的辅助下完 成,书法已远离人们日常的使用【2 1 。对书法进行计算机模拟的研究,有利于构 建人机结合的书法学习环境【1 2 】,为书法的传播、学习和创作创造便利的环境, 这也有利于继承和发扬这门传统艺术。结合先进的计算机技术,对书法艺术进 行计算机模拟,必将赋予书法这门古老而又灿烂的艺术以新的生命力,也必将 为这颗艺术的明珠增添新的魅力。 1 3 书法笔划提取的意义 计算机的书法模拟和创作也需要以对书法汉字笔划的模拟和创作为基础。 中国书法讲究笔法,核心是“一画”,是线条,一波三折【引。书法笔划表现了 汉字结构,也体现了书法风格,是构成书法字最重要的元素。因此,无论是进 行书法字体的表示、存储和输出处理,或是手写( 包括书法) 汉字的识别和分 析,还是计算机书法的模拟和创作,都需要以笔划为基本单位来进行。这就需 要将单个笔划从字体本身分离出来,从而能够获取笔划信息,并得以提取其主 要特征。在实现单个笔划的模拟和创作之后,依据笔划间关系进行笔划的重构 3 华东师范大学硕上学位论文书法碑帖文字的笔划提取技术及其实现 和重组,从而创造出新的书法汉字。对书法汉字笔划信息进行提取是进行其形 状分析、特征提取,进而模拟书法学习和创作的重要步骤。碑帖书法文字的笔 划信息的获取不仅可以给计算机书法模拟和创作提供大量的原始素材。同时, 信息提取过程本身就是对人脑分析、理解书法作品的一种模拟。从这个意义上 讲,笔划提取同样有利于探索机器学习与机器理解的应用方法。 1 4 本文的主要工作和组织结构 针对使用计算机对书法汉字进行学习和模拟创作过程中遇到的,笔划提取 相关的几个关键问题:预处理、单字切分、笔划提取,轮廓恢复等作了认真分 析,并提出了相应的解决办法。 首先,针对书法碑帖的自然腐蚀和人为损坏的现象,介绍了些图像预处 理的方法,主要包括:图像去噪,单字图像分割、图像平滑、骨架和轮廓提取 世 守0 其次,提出了一种基于书法字体笔划信息特征的、书法碑帖汉字笔划提取技 术。然后,针对笔划提取过程中遇到的轮廓缺失问题,介绍了一种通过学习相 似的笔划轮廓,对书法汉字笔划轮廓的缺失部分进行恢复的笔划轮廓恢复方 法。 第三,集成对书法碑帖图像进行笔划提取处理的相关工具,设计和实现了 一个书法笔划提取系统。 本论文组织结构如下: 第一章:绪论。阐述了本文课题的背景,研究的意义,国内外相关研究的 情况以及主要的工作以及内容的组织结构。 第二章:书法笔划提取的相关工作。介绍了一些图像预处理的方法,主要 包括:图像去噪,单字图像分割、图像平滑、骨架和轮廓提取等。 第三章:基于书法字体结构知识的笔划提取方法。结合相关的笔划提取的 研究经验,主要从轮廓方面总结和归纳书法汉字结构特征。基于这些结构特征 制定适用于笔划提取的判定规则。依据规则进行笔划提取,并实验分析。 第四章:书法笔划轮廓恢复。针对书法笔划提取中遇到的轮廓缺失的问 题,介绍了一种新的笔划轮廓恢复方法。该方法结合一种带参数的统计模型, 4 华东师范大学硕十学位论文 书法碑帖文! # 的笔划提取技术及其实现 通过学习相似的笔划轮廓,对提取得到的有缺失的书法汉字笔划轮廓进行恢 复。 第五章:中国碑帖书法文字笔划提取系统。设计和集成实现笔划提取系 统。系统包括碑帖图像去噪、单字切分、书法图像二值化、字体平滑、书法笔 划提取和缺失轮廓恢复等功能,以及通过交互辅助笔划提取的人机接口。 第六章:总结与展望 5 华东师范大学硕士学位论文书法碑帖文字的笔划提取技术及其实现 第二章书法笔划提取的相关工作 在对书法汉字进行计算机学习,模拟和创作之前,首先要将其有用的信息 从书法作品中提取出来。通常这些信息包括:字体的轮廓、骨架、纹理等。但 由于自然腐蚀和人为损坏,较早历史时期留下来的书法作品大多有所破损。这 使得获取的碑帖图像一般带有背景噪声,严重的甚至模糊不清。并且在各类图 像系统中图像的传送和转换( 如成像、复制、扫描、传输以及显示等) 总要造成 图像的某些降质。因此,在不损坏碑帖图像中汉字书法特征的前提下,去除碑 帖图像中的噪声,对于人们学习研究和数字化处理这些碑帖图像十分重要。通 常进行书法仿真、计算机学习和模拟以及风格化生成等研究是以单个汉字为单 位。因此,在进一步处理之前也需要将单个汉字从书法作品中分离出来。 2 1 书法图像预处理 噪声是图像干扰的重要原因。常见的书法碑刻图像中就有很多噪声,如图 2 1 所示。这些噪声可能在传输中产生,也可能在量化等处理中产生。根据噪 声和信号的关系可将其分为三种形式:( 1 ) 加性噪声,此类噪声与输入图像信 号无关;( 2 ) 乘性噪声,此类噪声与图像信号有关;( 3 ) 量化噪声,此类噪声与 输入图像信号无关,是量化过程存在量化误差,再反映到接收端而产生。 图2 1 伴有噪声的碑刻书法图像 2 1 1 常见去除图像噪声的方法 2 1 1 1 自适应维纳滤波器 6 华东师范大学硕上学位论文书法碑帖文字的笔划提取技术及其实现 它能根据图像的局部方差来调整滤波器的输出,局部方差越大,滤波器的 平滑作用越强。它的最终目标是使恢复图像厂 ,y ) 与原始图像f ( x ,y ) 的均方误 差研( 厂 ,y ) 一,o ,y ) ) 2 】最小。该方法的滤波效果比均值滤波器效果要好,对 保留图像的边缘和其他高频部分很有用,不过计算量较大。维纳滤波器对具有 白噪声的图像滤波效果最佳。 2 1 1 2 中值滤波器 它是一种常用的非线性平滑滤波器,其基本原理是把数字图像或数字序列 中一点的值用该点的一个领域中各点值的中值代换其主要功能是让周围象素灰 度值的差比较大的像素改取与周围的像素值接近的值,从而可以消除孤立的噪 声点,所以中值滤波对于滤除图像的椒盐噪声非常有效。中值滤波器可以做到 既去除噪声又能保护图像的边缘,从而获得较满意的复原效果,而且,在实际 运算过程中不需要图像的统计特性,这也带来不少方便,但对一些细节多,特 别是点、线、尖顶细节较多的图像不宜采用中值滤波的方法。 2 1 1 3 形态学噪声滤除器 将开启和闭合结合起来可用来滤除噪声,首先对有噪声图像进行开启操 作,可选择结构要素矩阵比噪声的尺寸大,因而丌启的结果是将背景上的噪声 去除。最后是对前一步得到的图像进行闭合操作,将图像上的噪声去掉。根据 此方法的特点可以知道,此方法适用于图像中的对象尺寸都比较大、且没有细小 的细节的一类图像。 2 1 1 4 小波去噪 小波分析进行图像去噪主要有3 个步骤: ( 1 ) 对图像信号进行小波分解; ( 2 ) 对经过层次分解后的高频系数进行阈值量化; ( 3 ) 利用二维小波重构图像信号。 这种方法保留了大部分包含信号的小波系数,可以较好地保持图像细节。 2 1 2 书法碑帖图像的预处理方法 综合以上各种图像去噪声的处理方法的不同特点,经过反复试验,我们选 择了一些比较适合于书法碑帖图像的噪声去除方法。在不同的情况下,通过合 7 华东师范人学硕上学位论文书法碑帖文字的笔划提取技术及其实现 理组合和搭配使用这些图像处理和去噪声的手段,可以得到良好效果。 首先对书法图像进行中值滤波和平滑处理,去除大部分噪声;然后进行二 值化操作,从平滑后的图像中提取出文字;再用形态学里的腐蚀和膨胀方法去 掉文字上的小孔;然后通过轮廓提取得到文字的字形,最后对受到破坏的轮廓 用基于傅立叶描述子的复原方法对字形进行修复。 2 1 2 1 中值滤波和图像平滑 由于碑帖书法作品载体大都为岩石,纸张,绢布等,所以书法碑帖图像中 多伴有颗粒状的,黑白相间的亮暗点的椒盐噪声。本文首先采用了常用的中值滤 波方法,并且该方法能很好的保护图像的边缘,减少笔划信息的损失。中值滤 波就是用一个奇数点的移动窗口,将每一象素点的灰度值设置为该窗口内的所 有象素点灰度值的中值。实现方法: ( 1 ) 通过从图像中的某个采样窗口取出奇数个数据进行排序; ( 2 ) 用排序后的中值取代要处理的数据。 然后再使用维纳滤波方法对低频噪声进一步的消除。 图2 - 1 中碑刻书法“春 字,在采用3 3 的窗口中值滤波方法以及维纳滤 波方法处理之后,效果如图2 - 2 所示。背景和字体图像都平滑了。但是,字体轮 廓却并未“模糊”。可以看出,这种方法较好的保护了碑帖书法图像的字体轮 廓信息;同时,平滑了图像的其他部分,使得字体与背景“黑白分明”。这使 得字体信息可以被更好的提取出来。 图2 2 滤波后的“春 字图像 之后,采用图像二值化方法对图2 2 进行处理。阈值的选取对于图像二值化 8 所示。当阈值选取过小( t = 9 0 ) 时,则深色背景没有被完全过滤掉,不能将字体图 像和背景区分开来。当阈值选取过大( t = 2 1 0 ) 时,部分颜色较深的字体图像则被 错误的划分到背景当中,仍然不能将字体图像和背景清晰的区分开来。因此,需 要选取一个适中的阈值,既能充分的保留字体的图像信息,又能最大程度上去除 背景可能造成的干扰。这个例子中我们选择了阈值t = 1 4 5 ,效果如图2 - 4 所示 阈值t = 9 0阈值t = 1 3 0 阈值t = 1 7 0 阈值t = 2 1 0 图2 - 3 二值化阈值的选取 图2 4 二值化( 阈值t = 1 4 5 ) 后的“春 字图像 9 耋 一 的图像膨胀和图像腐蚀的方法来对小孔进行填充。处理过程如图2 6 所示。 书车 簟 二塔诤 2 次图像腐蚀处理4 次图像腐蚀处理 一 2 次图像膨胀处理4 次图像膨胀处理 图2 6 图像腐蚀后的“春 字图像 1 0 华东师范人学硕上学位论文 书法碑帖文! 的笔划提取技术及j e 实现 小孔填充的具体实现方法如下: ( i )先对图像进行腐蚀处理,重复数次,使大量的“小孔都被填充或 腐蚀,同时不影响原始碑帖书法图像的连通性; ( 2 )再对图像进行相同次数的膨胀操作,将特征图像恢复到它原来的大 小。 如图2 - 6 所示,在对图中“春 字图像进行小孔填充处理之后,有效的消 除了大多数小孔干扰。剩余的干扰也被明显区分,可以手工去除。 见图2 7 ,原始图像在经过了一系列的去噪声,图形平滑,二值化以及小 孔填充的处理之后,字体图像质量得到了极大的改善。书法字体的特征信息也 逐渐清晰的显露出来。 图2 - 7 图像预处理结果 2 1 2 3 字形轮廓修复 碑帖书法作品,尤其是碑刻书法作品,常常由于长期的自然腐蚀,使得字 体边缘磨损,图像中字体轮廓的高频噪声增加轮廓的毛刺。这些噪声时常 会严重影响随后的图像处理效果。 傅立叶描述子是物体形状边界曲线的傅立叶变换系数。低阶傅立叶系数能 够反映大体形状,高阶傅立叶系数可以精确定义形状特征。傅立叶系数有能量 向低频集中的特性,故用较少的系数就可以达到区分描述不同形状边。根据以 上傅立叶描述子的两个特点,我们提取碑帖书法图像中的字体轮廓( 见2 3 节, 如图2 - 8 所示) ,对其进行傅立叶变换;然后,通过选择傅立叶描述子的个数 ( 变换系数的个数) 来修复轮廓形状,滤除高阶噪声【矧。对图2 7 的“春字 轮廓的修复效果见图2 9 。 图2 - 8 轮廓提取后的“春字图像 图2 - 9 轮廓修复后的“春”字图像 1 2 华东师范大学硕j :学位论文书法碑帖文! 声的笔划提取技术及j 喜实现 2 2 骨架提取 骨架是一种重要的图像目标几何特征,如何快速地获得二值图像的非畸变 骨架,是进行图像目标的形状分析、信息压缩、特征提取、模式识别等应用的 前提【1 5 】。同样,提取中国书法作品的骨架是对书法作品进行计算机模拟的前提 和基础。汉字笔划与笔划之间有特定的相互关系。对碑帖书法汉字图像进行细 化处理以提取该字的骨架有利于获取笔划相互之间的关系。书法汉字的骨架保 留了大部分的字体信息( 形状、特征等) ,并且骨架比字体本身要简单得多,因 此许多汉字笔划提取算法首先将字体图像进行细化处理。这在一定程度上简化 了提取难度。 2 2 1 图像细化算法分析 对细化的一般要求是【冽:( 1 ) 保证细化后曲线的连通性;( 2 ) 保留原图 的细节特征;( 3 ) 细化结果是原曲线的中心线;( 4 ) 保留曲线的端点;( 5 ) 细化处理速度快;( 6 ) 交叉部分中心线不畸变。 字体图像细化一般采用数学形态学方法或二值图像细化算法。 形态学的图像细化算法起源于图像集合运算。这类形态学细化算法常使用 击中击不中变换来对图像像素进行判断,然后根据运算结果来判定是否删除像 素点。它们的差别在于不同算法的判定条件不同。如h i l d i t c h 、p a v l i d i s 、 r o s e n f e l d 细化算法。这种算法设计灵活,易于实现,但骨架在线划交叉处易产 生较大的变形,收敛骨架不能保证为单像素宽,骨架不能保证居于笔画的中 心,抗噪性较差1 1 5 1 。 因此,本文采用一种改进的二值图像细化算法来进行骨架提取【1 5 】。 2 2 2 适合于中国碑帖书法图像的细化算法 而因自然磨损,以及使用不同的笔法以及水墨在纸纹理中的扩散导致的笔 画边界不光滑使得现有的骨架提取算法大多易产生骨架毛刺。唐瑶等【1 5 】提出的 一种改进的骨架提取算法尤其适合中国书法作品。该算法提取出的图像骨架较 为光滑,既保持了原图像的连通性及对称性,又基本保证了骨架的单像素宽, 对提取中国书法作品的骨架具有普遍的适用性。因此,本文借用了该方法来实 华东师范人学硕 :学位论文书法碑帖文字的笔划提取技术及其实现 现碑帖书法字的骨架提取。 算法基本思想:首先对字体图像进行细化,去除多余的像素点。同时为了 保持骨架的连通性,该算法在细化过程中保留了图像的内点、突出部分以及图 像中绝对不能被删除的特殊点( 如交叉点、拐角点等) ;其次,由于书法作品本 身笔画边界粗糙,所以得到的字体骨架图像中必然存在着一些多余的枝权。为 了获得光滑的图像骨架,需要将骨架图像上的毛刺进行删除;最后,为保证骨 架的单像素宽,再去掉多余的像素点。 图2 - 7 中碑刻书法字“春 的骨架提取效果如图2 1 0 所示: 图2 - 1 0 骨架提取后的“春 字图像 2 3 边缘检测和轮廓提取 图像的轮廓或边缘是图像最基本的特征,所谓边缘是指其周围像素灰度有 阶跃变化或屋顶变化的那些像素的集合。边缘中包含着有价值的目标边界信 息,这些信息可用于图像分析、目标识别以及图像滤波。提取边缘的目的是为 了突出图像的边缘信息,加强图像的轮廓特征,以便于人眼和机器识别。获取 书法作品中字体的边缘轮廓信息也是进行笔划提取和变形的必要前提。 常见的边缘大概分为三种,见图2 - 1 1 :第一种是阶梯形边缘( s t e p e d g e ) , 他两边的像素灰度值有着明显的不同。第二种是屋顶型边缘( r o o f - e d g e ) ,它位 于灰度值从增加到减少的变化的转折点。还有一种是线性边缘( l i n e - e d g e ) ,它 的灰度变化有一个明显的跳跃。如果一个像素落在图像中某个物体的边界上, 1 4 通常使用边缘检测器来实现边沿检测,它在数学上的涵义是一种基于梯度 的滤波器,又称边沿算子。如,p r e w i t t 算子、s o b e l 算子、高斯拉普拉斯算 子、r o b e r t 算子、h o u g h 变换等。 另一种获取图像外部轮廓信息的方法是轮廓跟踪。在对书法作品二值图像 的处理过程中,为了获取字体轮廓字体图像边界点坐标的集合,轮廓跟踪 的方法被广泛使用。二值书法字体图像中的轮廓总是连续、闭合的。以一个未 搜索过的边界点为起始,沿某一方向( 一般来说,外圈选逆时针方向,内圈选顺 时针方向) 跟踪环绕整个图像一圈便可以找到该部分闭合边界的边界点集合。如 此重复数次,便可跟踪出书法字图像中所有部分的边界点集合。 步骤1 :首先按从上到下,从左到右的顺序扫描图像,寻找没有标记跟踪 结束记号的第一个边界起始点a 0 ,a o 是具有最小行、列值的边界点。定义一个 扫描方向变量d i r ,该变量用于记录上一步中沿着前一个边界点到当前边界点 的移动方向,其初始化取值为 ( 1 ) 对4 连通区域取d i r = 3 : ( 2 ) 对8 连通区域取d i r = 7 : 步骤2 :按逆时针方向搜索当前象素的3 * 3 邻域,其起始搜索方向设定如 下: 华东师范大学硕士学位论文书法碑帖文字的笔划提取技术及其实现 ( 1 ) 对4 连通区域取( d i r + 3 ) m o d4 ; ( 2 ) 对8 连通区域,若d i r 为奇数取( d i r + 7 ) m o d8 ;若d i r 为偶数取 ( d i r + 6 ) m o d8 : 在3 x 3 邻域中搜索到的第一个与当前像素值相同的像素便为新的边界点 a n ,同时更新变量d i r 为新的方向值。 步骤3 :如果a n 等于第二个边界点a l 且前一个边界点a n 一1 等于第一个边 界点a o ,则停止搜索,结束跟踪,否则重复步骤2 继续搜索。 步骤4 :由边界点a o 、a 1 、a 2 、a n - 2 构成的边界便为要跟踪的边 界。 图2 - 1 2 所示为对图2 7 中的图像做轮廓跟踪后得到的图像,最后得到了一 条完整的轮廓曲线。 2 4 单字切分 图2 一1 2 轮廓跟踪后的“春”字轮廓图 单字图像的分割是进行计算机进行书法学习、模拟,必不可少的一环。也 是使机器理解书法作品所必须跨越的一步。目前,专门针对碑帖书法作品的单 字图像分割研究不多。各项研究主要集中于手写数字、汉字的分割。我们结合 汉字字符的分割方法和书法作品的特点做了这方面的尝试。 1 6 华东师范人学硕士学位论文书法碑帖文字的笔划提取技术及其实现 2 4 1 汉字切分方法分类 随着应用领域的不断增加,汉字切分技术被越来越多的研究和应用。目 前,汉字字符的切分方法大概可分为一下几判2 7 】【3 0 l : 2 4 1 1 基于统计方法的切分 基于统计方法的切分,是根据字符的总体统计分布特征,来确定字符之间 的界线。判别时以字符的平均字宽作辅助判别,统计分布特征的代表性和稳定 性对切分的正确性及收敛性起很重要的影响。这种方法适用于字符宽度比较 大,且相差不大的场合例如,直方图投影、基于b f a ( b a c k g r o u n da n d f o r e g r o u n da n a l y s i s ) 的数字切分等。 b f a 方法,首先进行前景、背景分析( 前景、背景的细化) ,找出前景、 背景的特征点,然后通过计算特征点组合的混合高斯概率密度,来确定最佳的 特征点组合,这些特征点的连线即切分线。 2 4 1 2 基于结构的切分 基于结构的切分,即从字与字之间以及汉字本身的结构入手,综合分析、 寻找切分的规则。例如,基于图的连通性的切分连通域法,笔画包围盒( 又 称笔画跟踪法) ,滴水算法( d r o p f a l l i n g ) ,l d p ( l i m i t e dd y n a m i c p r o g r a m m i n g ) 算法等。 滴水算法是模拟水滴从高处向低处滴落的过程来进行字符串的切分,按照 重力作用规则的限定,水滴只能向下滴落或水平滚动,水滴经过的路径就是切 分路径。 l d p ( l i m i t e dd y n a m i cp r o g r a m m i n g ) 算法是一种基于动态规划算法的手写 数字串切分方法,搜索空间和搜索方法受到限制,主要是为了防止非法切分路 径的出现,并降低运算复杂度。采用l d p 算法可以避免滴水算法中陷入局部最优 的问题。 2 4 1 3 基于识别的切分方法 即在实际切分前,对各种可能存在的切分结果进行识别,通过对识别结果 的判别来选择最终的切分点。常用的基于识别的切分方法有递归切分算法和基 于隐马尔可夫模型的算法。 1 7 华东师范大学硕j :学位论文书法碑帖文字的笔划提取技术及其实现 递归切分算法首先通过粗略的图像分析寻找所有可能的切点,然后采用矩 形浮动窗口( 窗口左边界的位置固定,右边界位置按照不同的切点而变化) 对 窗口内的图像依次进行识别。每识别出一个字符,就将窗口中的位图从待识别 图像中切掉,对剩余图像继续进行识别,直到每个窗口中的子图像都能找到匹 配原型。该方法采用的是矩形窗口,如果粘连字符发生交叉现象,在识别时仍 然会遇到困难。 基于隐马尔可夫模型( h i d d e nm a r k o vm o d e l ,h 删) 是一种用参数表示的两 机理的随机过程。它是将汉字的偏旁部首作为切分的基本单元,首先采用投影 法对汉字串做粗切分,将汉字串图像转化成字段图像虚列;然后,将分割出的 多种图像( 包括单个汉字的部首,完整的汉字以及汉字部首的组合等) 全部送入 h m m 识别器进行识别,得到几种识别后的观察虚列,接下来应用动态规划方法 ( 如y i t e r b i 算法) 快速有效地找出其中最有的识别结果。最后将识别出的结果 反馈给汉字切分,得出正确的切分结果。 2 4 2 书法作品单字图像分割 综上所述,目前主要的图像切分方法有的切分效果不甚理想、有的实现过于 复杂。并且他们大多并不适用于碑帖书法作品的单字图像切分。书法作品汉字排 列不规整,汉字结构复杂,使得上述通常的方法难以普遍取得较好效果。因 此,在特定的情况下,将这些方法按照某种方式结合起来使用,使得可以发挥 各方法的优点,是一种新的尝试。本文针对书法作品的特点,结合了几种常用 的切分方法,为碑帖书法文字图像的单字分割给出了一种简单、有效的解决方 案。 2 4 2 1 特征分析 中国书法文字风格千变万化,时而豪迈奔腾,时而中规中矩,时而不拘一 格,时而婉约内敛。即使如此,大多数书法作品尤其碑贴拓片,在文字排列布 局上还是有一定的规律可循。缘于中国古代的书写习惯,古代的书法作品通常 以列为分隔,按照从上倒下,从右往左的规则书写,如图2 一1 3 所示。因此,一 般文字排列从列上看来是比较规整的。列与列之间就如同两列队伍一般,保持 着一定的距离,如图。而从行排列上看来,则没有如此讲究。所以书法作品的 单个汉字分割,以分列开始较为合理,可以先将碑帖书法作品分割成单列的书 1 8 华东师范大学硕上学位论文 书法碑帖文字的笔划提取技术及其实现 法图像。然后再以列为单位将单列书法图像上的文字逐个的分开。 2 4 2 2 直方图投影 河 图2 - 1 3 书法作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论