




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 摘要 计算机书法创作模拟涉及人工智能,图像处理,认知科学等。计算机书法生 成过程中需要大量的字库,中国古代的书法碑刻是一个自然可选的素材。从碑刻 书法的提取到字库的形成需要经过数字化拍照、去噪、二值化、轮廓提取、曲线 拟合、字形生成与存储等步骤。 本文从书法碑刻文字的预处理,轮廓提取,特征提取和字体轮廓平滑等3 方面提出了一种基于傅立叶描述子的书法碑刻文字字形复原方法。 在预处理阶段,先后对输入碑刻文字图像采用中值滤波、二值化和填充小孔 处理。在轮廓提取和轮廓平滑阶段,首先采用八邻域搜索法对填充后的文字字形 图像进行轮廓提取,得到连通的字形外轮廓,然后采用基于傅立叶描述子的特征 提取和边缘平滑技术对字形轮廓进行重构。在轮廓平滑阶段,通过用较少的傅立 叶描述子重构字体的轮廓,既有效恢复了碑刻文字轮廓同时也实现了轮廓的平 滑。 最后,设计了一个简单的图像处理验证系统。实验结果表明,本方法有一定 的效果,能够满足一定的用户需求。 关键词:碑刻文字;轮廓检测,平滑;傅立叶描述子 兰查堑蔓查兰堕圭兰垡笙茎 兰三堡皇堕塑垄三箜生鲨壁型奎兰兰堑墨垦垫查 a b s t r a c t c o m p u t e rc a l l i g r a p h yi sar e l a t i v e l yn e w r e s e a r c hd i r e c t i o n , i n v o l v i n ga r t i f i c i a l i n t e l l i g e n c e ,i m a g ep r o c e s s i n g , a n dc o g n i t i v e s c i e n c e s t h i sp a p e rp r e s e n t sa c a l l i g r a p h yt a b l e tr e c o v e r yt e c h n o l o g yb a s e d o nf o u r i e rd e s c r i p t o r s t h ep u r p o s ei st o p r o v i d eb a s i cc o m p u t e rc a l l i g r a p h yf o n tt ob eu s e di nc o m p u t e rc a l l i g r a p h yc r e a t i o n t h r e ea s p e c t sa l ed i s c u s s e d i nt h ep r e p r o c e s s i n gp a r t ,m e d i a nf i l t e r i n g t e c h n o l o g yi su s e dt od e n o i s et h et a b l e ti m a g e t h e nt h ei m a g e w a sb i n a r i z e d a f a r t h a tt h ei m a g ew a sf i l l e da n dt h et i n yh o l e sw e r ew i p e do u t i nt h ee d g ed e t e c t i o na n d s m o o t h i n gp a r t ,t h ee i g h t f i e l ds e a r c h i n gm e t h o di su s e df o re d g ed e t e c t i o nt og e tt h e o u t e rc d g co ft h ec a l l i g r a p h yf o n t l a t e ro n , t h ef e a t u r ee x t r a c t i o na n de d g es m o o t h i n g t e c h n o l o g yb a s e do nf o u r i e rd e s c r i p t o r si su s e d i nt h ee d g es m o o t h i n gp a r t , t h e o r i g i n a le d g ew a sp r e s e r v e da n ds m o o t h e dw i t hl e s sf o u r i e rc o e f f i c i e n t s i ne d g e r e b u i l d i n g , f i n a l l y , as y s t e mb a s e do nc x l m a g et ov e r i f y o u rm e t h o di sd e s i g n e d t h e e x p e r i m e n t a lr e s u l t ss h o wt h a ti t h a sac e r t a i ne f f e c to nc a l l i g r a p h yd o c u m e n t s ,a n d c a ns a t i s f ys o m ec u s t o m e rr e q u i r e m e n t s k e y w o r d s :t a b l e t ;e d g ed e c t e c t i o n ,s m o o t h i n g ;f o u r i e rd e s c r i p t o r s ; 基于傅立叶描述子的书法碑刻文字字形复原技术 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究成果据我 所知,除文中已经注明引用的内客外,本论文不包含其他个人已经发表或撰写过的研究成 果对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意 作者签名:盔暨筮磊 日期:2 盈:丑 学位论文授权使用声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅有权将学位论文的内容编入有关数据库进 行检索有权将学位论文的标题和摘要汇编出版保密的学位论文在 解密后适用本规定 学位论文作者签名:书b 1 5 :1 驾t 期: 丑罩: 十 华东师范大学硕士学位论文 基于博屯叶描述子的书法碑刻文字字形复原技术 1 1 研究背景 第1 章绪论 在计算机书法创作模拟过程中,需要创作用书法字库。如果书法字库不完善, 计算机也不可能凭空创造出令人满意的书法作品。从碑刻书法的提取到字库的形 成需要经过数字化拍照、去噪、二值化、轮廓提取、曲线拟合、字形生成与存储 等步骤。 不过遗憾的是,经过数百年的风化腐蚀,保存这些书法作品的碑刻在不同程 度上遭到破坏,碑帖上的字迹往往是模糊的,而且伴有大量的腐蚀噪声,如图 1 1 所示。工匠在刻碑的过程中也常常因为人为的失误对字形产生影响,因此需 要相应的计算机技术恢复碑刻的原貌。其中去噪和字形复原是关键问题。 参考文献【1 】在做二值化的同时可去除一些噪声,但不能明确区分文字和噪 声,也不能有效去除面积较大的块状噪声,更没有任何复原文字的作用。 参考文献【2 】利用文字自身结构的特点可有效去除位置上与文字分离的噪 声,但不能有效区分文字轮廓上的噪声,也不能复原文字轮廓上的噪声对字形的 破坏。 由于噪声是以不同的形状和大小随机分布的,很难区分噪声和文字,特别是 文字轮廓上的噪声,很多去噪方法在去噪的同时常常会破坏文字原有的字形,因 此需要一种既能有效去噪又能正确复原字形的新方法。 本文采用如下一种新的思路和方法,首先对碑刻图像进行平滑处理,去除部 分噪声,然后进行二值化操作从平滑后的碑刻图像中提取出文字,再用形态学里 的腐蚀和膨胀方法去掉文字上的小孔,然后通过轮廓提取得到文字的字形,最后 对受到破坏的轮廓用基于傅立叶描述子的复原方法对字形进行修复。 图1 1 伴有严重噪声的书法碑刻 4 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 1 2 图像处理技术的发展现状 我们生活在一个信息时代,人类大量的信息来自视觉系统,也就是从图像中 获得的,这里的图像是广义的,例如照片,绘图,视觉等等。图像带有大量的信 息,所谓百闻不如一见,说的就是这个道理。 客观世界在空间上是3 维的,但是一般从客观景物得到的图像是2 维的,一 幅图像可以用一个2 维数组触) 来表示,这里的工和y 表示2 d 空问中x y 轴的 坐标的位置,而,这表示图像在坐标点g 中的某种性质f ,比如灰度。常见的 图像是连续的,即f , r , y 可以是任何的实数。为了能让计算机对图像进行加工, 需要把连续的图像在坐标空间x y 和性质空间f 都离散化。这种离散化了图像就 是数字图像。一般f , r 。v 都在整数集合里面取整数值【3 】。 图像处理在广义上是各种与图像有关的技术的总称。目前人们主要研究的是 数字图像,应用计算机对图像进行处理。这包括利用计算机和其他电子设备进行 及完成一系列工作,例如图像的采集、获取、编码、存储和传输,图像的合成和 产生,图像的显示和输出,图像的变换、增强、恢复,图像的分割,目标检测, 表达和描述,特征的提取和测量等等。另外,图像处理还可以包括为上述功能而 进行的硬件设计及制作等方面的技术。对各种图像处理技术的研究,更多地得益 于数字信号处理、时间序列分析、参数估计、离散变换、模式识别、自适应技术 以及感知生理一心理学的理论进展。从研究方法上面来看,图像技术与数学、物 理学、生理学、电子学及计算机科学等许多学科互相借鉴;从研究范围来看,它 与模式识别、计算机视觉、计算机图形学等学科专业互相交又。另外,图像技术 的研究进展和人工智能、神经网络、遗传算法、模糊逻辑等理论和技术有着密切 的联系,其发展也是和通讯、医学、遥感、工业自动化等许多领域不可分割的。 在6 0 年代,第3 代计算机的研究成功,以及数学上快速傅立叶变换( f f t ) 算法理论的建立和应用,使得对图像的某些处理得以实现,人们从而逐步开始利 用计算机对图像进行加工利用。在1 9 6 4 年,美国喷射推进实验室( j p l ) 进行了太 空探索工作,当时用计算机来处理测距器7 号发回的月球图片,以校正飞船上电 视摄像机中各种不同形式的固有的图像畸变,这些技术都是图像增强和复原的基 础。j p l 以及世界各国有关部门已把数字图像处理技术从空间技术开发到生物医 学、x 射线图像增强、光学显微图像分析、遥感图像分析、粒子物理、地质勘探、 人工智能和工业应用中来。 到了7 0 年代,图像处理有了长足的发展,1 9 7 6 年,第一部图像技术的专著 d i g i t a lp i c t u r ep r o c e s s i n g ) ) ( r o s e n f e l da k a kaq 也由a c d e m i cp r e s s 出版。到 了8 0 年代,各种硬件( 比如高性能显卡、获取2 d 3 d 数字图像的设备) 的出现使 华东师范大学硕士学位论文基于傅矗叶描述子的书法碑刻文字字形复原技术 得我们可以很好地获取及处理二维和三维图像,这时是图像技术应用飞速发展的 时代。9 0 年代以后,图像技术更是以广泛的应用深入人类的生活和社会发展的 方方面面【圳。 现在图像技术的应用主要包括以下几个方面; 1 1 遥感技术 遥感技术可以是飞机遥感和卫星遥感技术,卫星遥感和航空测量有大量的图 像需要处理,处理有两部分内容,一是图像校正,由于卫星、飞机是空中运动物 体,装载的成象传感器受卫星或飞机的姿态、运动、时间和气候条件等影响,摄 取的图像存在畸变,需要自动校正。第二个内容是通过分析、处理遥感图像,有 效地进行资源、矿藏勘探、国土规划、灾害调查、农作物估产、气象预报以及军 事目标监视等。 医用图像处理 医学上不管是基础科学还是临床应用,都是图像处理种类极多的领域。最普 遍使用的是计算机断层扫描成像,亦称为c t 技术。近年来又出现的核磁共振, 使人体免受各种硬射线的伤害,并且图像更为清晰。 3 1 工业领域中的应用 在工业领域中的应用一般有以下几方面:工业产品的无损探伤,表面和外观 的自动检查和识别,装配和生产线的自动化,弹性力学照片的应力分析,流体力 学图片的阻力和升力分析。 钔军事公安方面 各种侦察照片的判读,运动目标的图自动跟踪技术,雷达、声纳图像处理, 军事仿真等。在公安中的指纹、人脸、虹膜识别,印鉴、伪钞识别,跟踪、窃视、 交通监控、事故分析中都己经用到了图像处理的技术,例如车牌识别系统己经投 入了运作,人脸识别也开展了很长的时间。 1 3 书法碑刻文字字形复原中的难点 我们的目的是要从碑刻中分离出我们需要的书法字和笔划边界。碑刻是由许 多的汉字组成的,因此首先需要的是把各个汉字分割开来,然后再分别对每个字 进行变化复原。不过由于碑刻文字的年代比较久远,有些字与字之间可能会有轻 微的带笔( 噪声) ,可能在分割的过程中还需要人工的干预判断。不过这不在本 文的讨论范围之列。本文假设已经得到了分离出的单个书法字,我们需要做的就 是对其就行去噪,提取轮廓,字形轮廓修复的处理过程。由于部分碑刻受到的腐 蚀过大,边界模糊不清,有些笔划已经相互交错,因此去噪和字形复原将是我们 整个系统中的一个关键性的问题。 6 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 1 4 论文结构 本文主要是以计算机书法字库构建为背景,分析了系统实现过程中所采用的 技术方法研究。着重分析了碑刻中汉字字形的提取,复原过程,本文下面的结构 如下: 第二章主要是一些图像处理技术的理论铺垫,简要介绍了图像处理中常用的 形态学方法和傅立叶变换的知识,为后面的章节做准备。 第三章是碑刻文字处理过程中的第一步即预处理的介绍,包括图像平滑,二 值化以及小孔填充等操作。 第四章是本文的核心部分。重点介绍了文字廓提取以及傅立叶描述子在碑刻 文字的边缘平滑中的应用。 第五章是系统实现以及实验结果展示。 第六章为全文总结与展望。 7 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 第2 章傅立叶变换及形态学方法介绍 2 1 傅立叶变换及其在图像处理技术中的应用 2 1 1 基本理论 傅立叶变换作为一种正交变换可将空间域中复杂的卷积运算转化为频率域 中简单的乘积运算。人们在频率域中可以有效地实现图像增强、特征提取、图像 恢复、纹理分析与水印嵌入,因而在图像处理中得到了广泛的应用。 维连续傅立叶变换的定义如下: 对于连续时间变量f 的信号( 函数巩o ,如i f ( t ) 满足狄里赫莱条件; 1 具有有限个间断点; 2 具有有限个极值点; 3 绝对可积。 则脚的傅立叶变换为: f 似) 一ff (t)e一“dt(2-t) 对应的反变换为: ,( f ) - j 二f o 弘2 “d u 式中,“为频域变量,f 为虚数单位, 对。 ( 2 - 2 ) i 一j 。式( 2 - 1 ) 与式( 2 2 ) 称为傅立叶变换 信号,的傅立叶变换,姐) 一般为复数,从而可表示为复数形式 ,0 ) 一r ( u ) + i i ( u )( 2 - 3 ) ( 2 4 ) 式( 2 - 3 ) 中,r 0 ) 与砸) 分别为风h ) 的实部与虚部。,伽) 也可以写成指数形式 f ( u ) i f 0 ) i e 印扣 式( 2 4 ) 中 i f ( u ) l 。压丽百丽( 2 5 ) 妒 ) 一a r a a n 1 ) r 0 ) 】( 2 6 ) 伊 ) 为相角;f ) 伪幅度,也称为信颚f ) 的傅立叶谱,其平方称为雕) 的能量 谱,即 8 华东师范大学硕士学位论文 基于博立叶描述子的书法碑刻文字字形复原技术 e ( u ) - i f ( ) 1 2 一r 2 ) + j 2 0 )( 2 7 ) 在工程应用中狄里赫莱条件一般是可以满足的,即傅立叶变换是存在的【5 1 。 对于离散信号 触) h = o ,1 ,2 n - l ,其离散傅立叶变换及其反变换分别为 f 。) 一万11 磊4 - 1 ,o ) e x p 卜了i 2 n u j _ 川一薹川e x p 【等】 ( 2 9 ) 式中,“称为空间频率。 类似于连续情形,离散傅立叶变换可表示为复数形式与指数形式 6 1 ,可以定 义相应的实部、虚部、相角、幅度( 傅立叶谱) 与能量谱。 2 1 2 二维图像的离散傅立叶变换 由于图像信号是二维信号,需要利用二维傅立叶变换。对于二维离散信号 f ( m , n ) l m = 0 , 1 ,m - 1 ,雄= 0 1 1 ) ,其离散傅立叶变换为 f 力一吉羹薹厂伽朋e x p h 幼( 百m u + 剥n v ( 2 - 1 0 ) 式中,h = 0 , 1 ,m - 1 ,y = 0 1 。n 1 ,称为空间频率。反变换式为 ,) - 去m 荟- i n 荟- i 盹岣眯幼曙+ n v 】( 2 - 1 1 ) 式中,m = 0 , 1 ,m - 1 ,厅= o 1 ,n - 1 。 在图像处理中,一般选择为方阵,即取m = o 此时,采用如下的定义式( 其 中“,v = 0 1 ,n - 1 ,m ,弗= o 1 ,灿1 ) f 。力- 专薹墓,伽朋e x p 【4 h ( 竺些;勘 ,伽,胛) - 专荟n - 1 n 薹- 1 f 力e x 蚱h ( 竺! 昔竺) 】 2 2 形态学方法介绍 2 2 1 基本思想 ( 2 - 1 2 ) ( 2 1 3 ) 形态学的基本思想是用具有一定形态的结构元素去量度和提取图像中的对 9 华东师范大学硕士学位论文 基于傅立叶描述子的书法碑刻文字字形复原技术 应形状以达到对图像分析和识别的目的。形态学方法利用一个称作结构元素的 “探针”收集图像的信息,当探针在图像中不断移动时,便可考察图像各个部 分之间的相互关系,从而了解图像的结构特征。形态学基于探测的思想,与人的 f o a ( f o c u so f a t t e n t i o n ) l 拘视觉特点有类似之处。作为探针的结构元素,可直接 携带知识( 形态、大小、甚至加入灰度和色度信息) 来探测、研究图像的结构特 点。 形态学作为一种用于数字图像处理和识别的新理论和新方法,它的理论虽然 很复杂,被称为“惊人数学”,但它的基本思想却是简单而完美的。形态学图像 处理流程如图2 1 所示。 2 2 2 二值图像处理 图2 1 形态学处理方法 二值图像是指那些灰度值只能取两个可能值的图像,这两个值通常取为0 和1 。习惯上认为取值1 的点对应于景物中的点,取值为0 的点构成背景。这类 图像的集合表示是直接的。考虑所有1 值点的集合( 即物体) x ,则x 与图像是一 一对应的。我们感兴趣的也恰恰是x 集合的性质。 如何对集合x 进行分析呢? 数学形态学认为,所谓分析,即是对集合进行 变换以突出所需要的信息。其采用的主观“探针”与客观物体相互作用的方法。 “探针”也是一个集合,它由我们根据分析的目的来确定。术语上,这个“探针” 称为结构元素。选取的结构元素大小及形状不同都会影响图像处理的结果。剩下 的问题就是如何选取适当的结构元素以及如何利用结构元素对物体进行变换。为 此,数学形态学定义了两个最基本的运算。称为腐蚀和膨胀【。”。腐蚀和膨胀是一 对对偶运算。 1 二值腐蚀运算 腐蚀是表示用某种“探针”( 即某种形状的基元或结构元素) 对一个图像进行 探测,以便找出图像内部可以放下该基元的区域。它是一种消除边界点,使边界 华东师范大学硕士学位论文基于傅证叶描述子的书法碑刻文字字形复原技术 向内部收缩的过程。可以用来消除小且无意义的物体。腐蚀的实现同样是基于填 充结构元素的概念。利用结构元素填充的过程,取决于一个基本的欧氏空间概念 一平移。我们用记号以表示一个集合a 沿矢量x 平移了一段距离。即: 41 口+ 工:口4 ( 2 1 4 ) 集合一被曰腐蚀,表示为a o b ,其定义为: a o b - x :b + 工c 爿( 2 - 1 5 ) 其中a 称为输入图像,b 称为结构元素。a o b 由将口平移工仍包含在爿内 的所有点工组成。如果将口看作模板,那么a o b 则由在将模板平移的过程中, 所有可以填入彳内部的模板的原点组成,如图2 2 所示。根据原点与结构元素的 位置关系,腐蚀后的图像大概可以分为两类: 如果原点在结构元素的内部,则腐蚀后的图像为输入图像的子集,如图2 3 所示嗍。 如果原点在结构元素的外部,那么,腐蚀后的图像则可能不在输入图像的内 部,如图2 4 所示。 图2 2 腐蚀运算示意图 图2 3 腐蚀类似于收缩 蠢9 露 圈霆 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 bn l o 图2 4 腐蚀不是输入图像的子图像 腐蚀除了用填充形式表示外,还有一个更重要的表达形式: a o b r 一b :b e b ( 2 1 6 ) 这里,腐蚀可以通过将输入图像平移- b ( b 属于结构元素) ,并计算所有平移 的交集而得到。 2 二值膨胀运算 膨胀是腐蚀运算的对偶运算,可以通过对补集的腐蚀来定义。我们以彳。表 示集合的补集,雪表示口关于坐标原点的反射。那么,集合a 被口膨胀,表示 为a o b ,其定义为: 彳。口- m o b f 但1 乃 为了利用结构元素曰膨胀集合爿,可将口相对原点旋转1 8 0 度得到后,再利 用百对a 。进行腐蚀。腐蚀结果的补集,便是所求的结果如图2 5 所示。 图2 5 膨胀预算示意图 麓由童 膨胀还可以通过相对结构元素的所有点平移输入图像,然后计算并集得到, 可用如下表达式描述: 爿。口- u 彳+ 6 :b s b ( 2 - 1 8 ) 此方程定义的膨胀,历史上称为m i n k o w s k i 和。 华东师范大学硕士学位论文基于傅茁叶描述子的书法碑刻文字字形复原技术 腐蚀具有收缩图像的作用,膨胀具有扩大图像的作用。利用腐蚀和膨胀运算 的特点可以完成一些特殊的图像处理过程。合理的选择结构元,腐蚀运算还可以 去除图像的噪声,但是在去除噪声的同时,改变了原图像的形状。图2 6 就是被 噪声污染的图像,选择不同的结构对图像进行腐蚀运算,可以不同程度的去除噪 声,但对图像的形状也有不同程度的改变。 ( c )q ) a ) 铍噪声污染的巨象;( b ) 利用水平线形结 勺元进行腐蚀的结累; ( c ,利j ;l 垂直线形鳐构元痿蚀的锚聚:埘利用方形站毒j 元遴行塌蚀的结襞 图2 6 删腐蚀运算的去噪作用 3 膨胀和腐蚀的对偶性 膨胀和腐蚀这两种运算是紧密联系在一起的,一个运算对图像目标的处理相 当于另一个运算对图像背景的处理,可以将这种对偶性表示为: o 丑) 一a o 劈( 2 - 1 9 ) ( 彳e 口y a o 屠( 2 2 0 ) 膨胀和腐蚀的对偶性可借助图2 7 来说明。其中图( a ) 和图( b ) 分别分别给出集 合a 和结构元素b ,图( c ) 和图( d ) 分别给出4 0 曰和a o b ,图( e ) 和图( f ) 分别给出a 和! b ,图( g ) 和图( h ) 分别给出a e 妇和a o 挎( 其中深色点在膨胀结果中代表膨 胀出来的点,而在腐蚀结果中代表腐蚀掉的点) 。比较图( c ) 和图( g ) 可验证式 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 ( 2 - 1 9 ) ,比较图( d ) 和图( h ) 可验证式( 2 - 2 0 ) 。 图2 7 膨胀和腐蚀的对偶性示倒 1 4 华东师范大学硕士学位论文 基于傅屯叶描述子的书法碑刻文字字形复原技术 第3 章书法碑刻文字的预处理 书法碑刻在保存过程中会受到各种自然和人为因素的干扰和影响,图像的画 质也会因噪声在不同程度上出现歧变。为了将碑刻上的字转换成可以用计算机处 理的图像,必须对其进行预处理。本文对输入碑刻文字进行了平滑,二值化,小 孔填充等预处理。预处理的目的是去除图像中的噪声,加强图像中的有用信息, 并对输入方式或其他原因造成的退化现象进行复原,图像预处理过程是对图像的 一个过滤过程,要排除干扰保留需要处理的部分,并过滤掉不需要的部分。由于 一般碑刻的年代都比较久远,噪声比较大,其中含很多无效的像素点,这会影响 以后的处理,增加计算量,因此首先完成的是尽可能准确的从读入图像中取出包 含整个笔划完整边界的图像部分,这个过程的主要难度在于判断图像是否属于需 要保留的部分,且必需保证其准确性,否则将会对下一步图像分析和判断造成严 重的影响。 3 1 图像平滑 图像在生产和传输过程中常受到各种噪声的干扰和影响,使图像质量下降, 为了抑制噪声改善图像质量,必须对图像进行平滑处理,这可在空间域或频域中 进行,在平滑噪声时应尽量不损害图像中边沿和各种细节。 对于滤除图像中的噪声,人们己经提出了很多的方法。通常,将数字图像的 平滑技术划分为两类:一类是全局处理,即对噪声图像的整体或大的块进行校正 以得到平滑的图像,例如在变换域中使用w i e n e r 滤波、最小二乘滤波等,使用这 些技术需要知道信号和噪声的统计模型,但对于大多数图像而言,人们不知道或 不可能用简单的随机过程精确的描述统计模型,而且,这些技术计算量也相当大: 另一类平滑技术是对噪声图像使用局部算子,当对某一像素进行平滑处理时,仅 对它的局部小邻域的一些像素加以运算,其优点是计算效率高,而且可以多个像 素并行处理。 3 1 1 维纳( w i e n e r ) 滤波 维纳( w i e n e r ) 滤波可以归于反卷积( 或反转滤波) 算法一类,它是i 刍w i e n e r 首 先提出的,并应用于一维信号,并取得很好的效果。以后算法又被引入二维信号 华东师范大学硕士学位论文基于傅屯叶描述子的书法碑刻文字字形复原技术 处理,也取得相当满意的效果,尤其在图像复原领域,由于维纳滤波器的复原效 果良好,计算量较低,并且抗噪性能优良,因而在图像复原领域得到了广泛的应 用,并不断得到改进发展,许多高效的复原算法都是以此为基础形成的。 维纳滤波原理 二维维纳滤波的原理框图如下。图像触) 被 g y ) 线性模糊,加入噪声后成 为降质图g 圆y ) 的,经维纳滤波器,滤波后得到复原图像,0 ,_ ) ,) 。如图3 1 所示: ,“一 利用最小均方误差估计,把维纳滤波应用在图像处理中,使图像估计,0 ,y ) 与原始图像触奶嘎芦满蹙 卸舳力一m y ) 1 2 】。m i n - ( 3 1 1 即司“ 一q 毛力譬( 焉力p 卜m 觚,满足此式的维纳滤波器就为: 形( 。再蔽= = 罚f 芝宝 。力 其中的日力,矸和,) 分别是 0 力和瞰) 的傅立叶变换,f 伽,吐m ,d 是触) 和 n 0 ) 的傅立叶变换。而功率谱为: 匕( ,) 叫,( 叻1 2 ,只( _ ,v ) - - i z c ( u , p ) 1 2 我们定义p , ,v ) 只 ,v ) ,即信号功率谱和噪声功率谱的比值为信噪比,但通常 c _ 瓦石薪 因而式( 3 - 2 ) 可变为: 帅,2 篇教, , 维纳滤波器的估计值户(甜,v)=!涨i d i d 。舢维纳滤波器的估计值: 、”,- 。 ( 3 4 ) 维纳滤波平滑结果分析 我们挑选最简单的横画“一”做实验。 1 6 一 口 驴 一母 一 华东师范大学硕士学位论文 基于傅屯叶描述子的书法碑刻文字字形复原技术 图3 2 待处理的横画“一” 上图中的横画“一”是从碑刻上分离出来的单个字,可以看到图中有许多我们不 需要的信息,这将极大的影响我们的后续处理。对其进行维纳滤波结果如图3 3 : 图3 3 维纳滤波后的结果围 可见,维纳滤波后的横画“一”去除了许多无用的信息,不仅实现了图像的 平滑化,也保持了字体的大部分边界信息。这为后续的二值化等处理提供了极大 的方便。 3 1 2 中值滤波 中值滤波原理 中值滤波是一种非线性信号处理方法,与其对应的中值滤波器也就是一种非 线性滤波器。中值滤波器于1 9 7 1 年提出并应用在一维信号时间序列分析中,后 来被二维图像信号处理技术所引用。它在一定条件下,可以克服线性滤波器( 如 邻域平滑滤波等) 所带来的图像细节模糊的情况,而且对于滤除脉冲干扰及图像 扫描噪声最为有效。在实际运算中并不需要图像的统计特性,这也带来不少方便。 由于中值滤波是一种非线性运算,对随机输入信号的严格数学分析比较复杂,下 面采用直观方法简要介绍中值滤波的原理。 中值滤波就是用一个奇数点的移动窗口,将窗口中心点的值用窗口内各点的 中值代替。假设窗口内有五点,其值为8 0 ,9 0 ,2 0 0 , 1 1 0 和1 2 0 ,那么此窗口内各 点的中值为1 1 0 。 设有一个一维序列 如,五,取窗口长度( 点数) 为m ( m 为奇数) ,对其进行中 值滤波,就是从输入序列中相继抽出m 个数允,丘1 ,五,a l ,五。,其中五 为窗口中心点值,v = ( m 1 ) 2 ,再将这m 个点按其值大小排序,取其序号为中心 1 7 华东师范大学硕士学位论文 基于傅立叶描述子的书法碑刻文字字形复原技术 点的那个数作为滤波输出。用数学公式表示为: h 一1 只- m e d l ,正,五+ , i e n ,v 一二二( 3 - 5 ) 二 若把中值滤波的概念推广到二维,并利用某种形式的二维窗口,则可对二维 中值滤波做如下定义: 设锄,( 力,2 ) 表示数字图像各点的灰度值,滤波窗口为a ,) , 为窗1 3a 在点翰的中值。则: y 0 = m e d 即 = m e d w m u ”h ( r s ) a o j ) n ( 3 6 ) 二维中值滤波的窗口形状和尺寸对滤波效果影响很大,不同的图像内容和不 同的应角要求,往往采用不同的窗口形状与尺寸。常用的二维中值滤波窗口形状 一般采用线状、方形、圆形、十字形以及圆环形等。窗口尺寸一般先用3 7 , 3 ,再 取5 x 5 逐渐增大,直到滤波效果满意为止。就一般的经验来讲,对有缓变的较长 轮廓线物体的图像,采用方形或圆形窗口为宜;对于包含有尖顶物体的图像,用 十字形窗口,而窗口大小则以不超过图像中最小有效物体的尺寸为宜。 对一些内容复杂的图像,可以使用复合型中值滤波。如中值滤波线性组合、 高级中值滤波组合、加权中值滤波以及迭代中值滤波等。 - 中值滤波平滑结果分析 我们也对图3 2 的横画“一”做了中值滤波的平滑处理,使用的是3 x 3 窗口。 结果如下: 图3 4 中值滤波后的效果图 与前面提到的维纳滤波方法相比。整体平滑程度上差距不大,维纳滤波效果 甚至更好一些,不过在字体笔划的边界部分,中值滤波的效果图显然要更好一点。 中值滤波后的笔划边界清晰可见,这对于后续的边界提取做了良好的铺垫。这主 要是因为维纳滤波是一种全局平滑技术,它的平滑因子是针对整个图像而设定 的。而中值滤波作为一种局部的非线性平滑技术,在这种情况下能够更好的突出 整个字体的边界特征。这也是本文采用它的一个主要原因。 华东师范大学硕士学位论文 基于傅立叶描述子的书法碑刻文字字形复原技术 3 2 图像二值化 根据图像处理的目标要求,需要把多灰度级的图像变成只有两个灰度级的图 像,即对图像进行二值化。设图像触) 的灰度值范围在【4 期,二值化阐值设为 z = r 曲) ,则二值化处理的一般式为: ,、n 当,o ,_ ) ,) 耐 g 协 y j 。1 0 当,o ,_ ) ,) 耐 g o ,力是二值图像,通常我们用1 来表示对象物( 黑色区域) ,用0 来表示背景 区域( 白色区域) 。对阈值哟选择有多种方法,它决定着二值图像的质量。 针对图3 4 ,本文给定的阈值功1 1 0 ,得到的结果如图3 5 所示。 图3 5 二值化后的横画“一” 3 3 基于形态学方法的内部填充 在对图像进行二值化操作后,得到了图3 5 所示的图像。如图3 6 所示,从 中我们可以看到,除了那个最大的连通区域( 横画“一”) ,此外还存在一个比较 明显的小孔和数个非常细微的小孔。 图3 6 需要填充的小连通l 基域 由于后续的轮廓提取以及轮廓平滑操作要求整个图像只包含一个连通的区 域,因此这里需要再做些处理。我们拟采用前面章节提到的形态学图像填充方法。 在二值图像中最常发现的一个问题是,检测到的特征对象中常有孔眼。在二 进制图像中,孔的定义是,一个内部象素未被选定的区域( 其值为0 ) ,并被值 为1 的象素完全包围。图3 6 中显示的即一个孔的示例。 在形态学中,腐蚀是表示用某种“探针”( 即某种形状的基元或结构元素) 对 一个图象进行探测,以便找出图象内部可以放下该基元的区域。它是一种消除边 界点,使边界向内部收缩的过程。膨胀是腐蚀运算的对偶运算。因此,腐蚀具有 1 9 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 收缩图象的作用,膨胀具有扩大图象的作用。利用腐蚀和膨胀运算的特点可以完 成一些特殊的图象处理过程。 本文的做法是先对图像进行腐蚀,直到所有的小孔都被填充。而后再对图像 进行膨胀操作,将特征图像恢复到它原来的大小。这样既能把小孔填充,又不改 变原图像的大小。处理结果如图3 7 所示。 图3 7 形态学填充效果图 可以看出,字体的边界部分并未因腐蚀和膨胀操作而产生大的改变,细节部分未 有大的丢失,反而比原图像( 图3 5 ) 在边界部分更加平滑化( 去除了不少的毛 刺) 。这也为后续的操作打下了一个良好的基础。 。 2 0 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 第4 章书法碑刻文字字形的笔划轮廓提取 及平滑 本章主要包括两部分。第一步是根据上一章的结果图像做边缘检测,提取了 字形的轮廓后,然后再根据基于傅立叶描述子的算法对提取出的字体轮廓做平滑 处理。最后得到我们所需要的结果图像。 4 1 轮廓提取 边缘特征是图像最为有用的高频信息,边缘检测是图像处理中一个困难问 题,实际图像的边缘是各种类型的边缘和它们模糊化后结果的组合。所谓边缘( 或 边沿) 是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合,边缘广泛 存在于物体与背景之间、物体与物体之间、基元与基元之间,因此,它是图像分 割所依赖的重要特征,本节我们将介绍图像边缘的检测和提取技术。 图像边缘提取和分割是图像处理中的重要内容。它是我们进行更高层次图像 处理如特征描述、识别等内容的基础。边界提取实际上就是对象素进行分类,某 类点称为边界点,其他为非边界点。 物体的边缘是由灰度不连续性所反映的【9 】,经典的边缘提取方法是考察图像 的每个像素在某个邻域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规 律,用简单的方法检测边缘,这种方法称为边缘检测局部算子法【加l 。 如果一个像素落在图像中某一个物体的边界上,那么它的邻域将成为一个灰 度级变化带,对这种变化最有用的两个特征是灰度的变化率和方向,它们分别以 梯度向量的幅度和方向来表示。 二维的图像可以理解为由不同的封闭区域组成,边缘的作用就是区分各个区 域以反映重要的景物结构。根据图像中边缘区域的灰度在空间中的变化形式,一 般分为三种类型:阶跃型、屋脊型和线条型。阶跃型边缘一般对应着物体的反射 边缘,是最常见的边缘灰度变化类型。理想的阶跃型边缘具有图4 1 0 ) 所示的模 型的特性。实际上,由于图像采集等因素的影响使边缘模糊,阶跃型边缘被模拟 成具有“类斜面”的剖面线。图4 1 m ) 显示了灰度级剖面线的一阶导数和二阶导 数。 华东师范大学硕士学位论文 基于傅立叶描述子的书法碑刻文字字形复原技术 二二 二二二:芝二 a ) 理怂阶双边缘( b 斜渐边缘 图4 1 阶跃型边缘模型 边缘检测的实质是采用某种算法检测出图像中灰度的非连续性,同时确定它 们在图像中的精确位置【1 1 】。从图4 1 可知:阶跃型边缘两边的象素灰度值有明显 的不同,对于这种边缘二阶方向导数在边缘处是零交叉,因此可通过检测其剖面 的二阶导数过零点来确定边缘的位置。 八邻域搜索法 一般可以通过边缘检测的方法得到边界点的坐标信息,边缘检测有微分法、 梯度法和拉普拉斯算子法等,而这些方法都是并行处理技术,检测出来的边界点 往往是不封闭的,本文采用了属于串行处理技术的八邻域搜索算法提取字体边界 点的坐标。 图像中的任一点总有8 个点和它相邻,即8 邻域点,若当前点p ( x ,y ) 是一 个边界点,则下一个边界点一定在点p ( x ,y ) 的八邻域内,该邻域内的八像素的坐 标表示和位置编码表示如图4 2 ( a ) ,( b ) 所示。 x 1 ,y 1x ,y - 1x + l ,y - 1 x - 1 ,yx ,yx + l ,y ix 1 ,y + lx ,y + lx + l ,y + l 图4 2c a ) 八邻域的坐标表示 3 21 4 x ,y 0 567 田4 2 ( b ) 八邻域的位置编码表示 为了处理上的方便,我们对前面得到的二值化后的图像作反色处理,即背景 和前景倒换。反色后的效果如图4 3 。 华东师范大学硕士学位论文 基于傅立叶描述子的书法碑刻文字字形复原技术 图4 3 反色后的效果 以下的步骤都是根据图4 3 的图像来进行的。 本文采用迷宫算法【1 2 1 ( 回溯法) 来检测整个字体的边界点,最后得到一条 封闭曲线上所有边界点的边界坐标。 设图像中背景点像素值为0 ,对象物点为1 ,晶为第雄个边界点,n 的初始 值为0 ,并令d 为八邻域像素点的位置编码,表示搜索的起始位置,提取边界点 坐标的边缘检测算法如下: 第一步:从左到右,自上而下扫描二值图像,当该点的象素值内够) = 1 时, 此点就定义为边缘检测的起始点岛。取d = 5 开始搜索八邻域内的下一个边界点。 把初始点坐标g ) 以及d = 5 压入个栈中。 第二步:从d 开始按逆时针方向依次检查当前边界点的八邻域像素点,当第 一次出现像素点值为1 时,且该点未被访问过( 即不在已走过的路径上) 该点就 是新的边界点s ,( h 岛+ 1 ) ,并记下它在八邻域中的位置编码d 。把这个点的信息 存入栈中,并标记其已访问。若遍历完八个方向都未能找到象素值为1 而且未曾 被访问过的边界点,则作退栈操作。当前点s 设为& l ,同时搜索方向置为前一 次搜索方向的下一个。若栈空,则报告边缘检测失败,未能找到一条完整的路径。 第三步:如果新边界点品= s o ,即回到了起始点,跟踪结束。否则,把岛 作为新的当前点,d = 5 ,回到第二步。 经过以上三个步骤,便得到一条连续的,封闭的曲线。效果如图4 4 所示, 图中所呈现的即是横画“一”的一个封闭的完整轮廓。 图4 4 边缘检测的效果图 4 2 基于傅立叶描述子的轮廓平滑 在对字体做了轮廓提取操作后,我们得到了如图4 4 所示的效果图。虽然已 华东师范大学硕士学位论文基于傅立叶描述子的书法碑刻文字字形复原技术 经完整的呈现了边界曲线,但是我们可以看到,在边界的某些部分,还存在许多 非常明显的锯齿状图案。我们希望得到的是平滑的边缘曲线,因此需要过滤掉轮 廓曲线的高频部分,保留低频部分。 由于傅立叶描述子在边界描述方面的良好特性,本文拟采用基于傅立叶描述 子的特征提取方法,为此,先介绍有关离散傅立叶变换以及傅立叶描述子的相关 知识。 4 2 1 离散傅立叶变换 本文中需要对两组坐标进行傅立叶变换,因此这里首先介绍一下离散傅立叶 变换的相关知识。 。傅立叶变换是线型变换的一种,它提供了一种解决线型系统问题的解决办 法。傅立叶变换在很多学科的理论中起着重要作用,尽管可以象对待其他变换一 样,把傅立叶变换看做纯数学的函数,但在许多领域,傅立叶变换也同样产生它 们的函数一样的明确的物理意义 用个互相间隔缸单位采样函数,使其成为系列 厂瓴) ,瓴+ 缸) ,f ( x o + 2 缸) ,”,瓴+ 【一1 】缸) 规定, ) - f ( x o + x a o ,这时工为离散值x = o , 1 ,2 ,, n - 1 ,上述序列表示为 ,( 0 ) ,( 1 ) ,( 2 ) ”- , f ( 一1 ) 这时傅立叶变换对为 f ) 。专荟,p 【一j 2 u u x n 】 ,o ) 一, f ( u ) e x p j 2 u u x n 式中,f o ) - ,o 缸) 一o ,1 ,2 ,n 一1 ,且血- a x ) ,相应于 0 , a u ,2 a u ,( - 1 ) a u 傅立叶变换对f ( x ) 一f ( u ) 离散傅立叶变换满足正交条件 万ii 刍7 - i 刚2 u u 圳】c x p 【_ j z , r u 舢】一翟急 实用上,常令n = 2 , n 次幂。 考虑蜘系数,= 4 的原信号序列, ) = ,) 扳1 ) 次2 ) 兵3 ) ) 的傅氏变换 f o ) 。言薹,o ) e x p 卜j 2 ,r u x n 】 - 4 薹 f ( x ) c x p j 2 u , x 4 华东师范大学硕士学位论文 基于傅立叶描述子的书法碑刻文字字形复原技术 展升: h - 0 ,( o ) 一争,( 啪o + f ( 1 ) e o + ( 2 ) e o4 - f ( 3 ) e o 】 “- 1 , ,( 1 ) 一年,( 啦o + f ( 1 ) e ,- + ,( 2 ) e _ 2 x + ,( 3 弦1 】 11h h 2 ,( 2 ) - 【,( o 弘o + f o ) e 1 了+ f ( 2 )
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 格林童话中的神奇森林读后感(6篇)
- 电子信息工程信号处理方向知识考点解析
- 法律英语合同文本知识
- 投融资决策中的风险评估与管理机制不健全
- 公司员工办公桌椅配置表格
- 小学数学竞赛活动对学生的启发
- 语言学习机构经营状况对比表
- DB15-T 2580-2022 草种质资源库建设和管理技术规范
- 酒店运营及管理咨询服务合同
- 记校园生活的美好时刻作文(4篇)
- 《短视频拍摄与制作》课件-3短视频中期拍摄
- MOOC 人格与人生-苏州城市学院 中国大学慕课答案
- (正式版)JBT 11517-2024 刮板取料机
- 2024届上海市徐汇区八年级下册数学期末考试试题含解析
- 下肢动静脉溃疡的护理
- 七章资本资产定价模型
- T-CALC 003-2023 手术室患者人文关怀管理规范
- 四年级语文 囊萤夜读微课-“江南联赛”一等奖
- 中医眼科常见病弱视的中医调节指南与药物疗法
- 《民法典》医疗损害责任篇培训
- 视觉功能评估的方法和工具
评论
0/150
提交评论