(模式识别与智能系统专业论文)页面倾斜检测与版面分析算法的研究.pdf_第1页
(模式识别与智能系统专业论文)页面倾斜检测与版面分析算法的研究.pdf_第2页
(模式识别与智能系统专业论文)页面倾斜检测与版面分析算法的研究.pdf_第3页
(模式识别与智能系统专业论文)页面倾斜检测与版面分析算法的研究.pdf_第4页
(模式识别与智能系统专业论文)页面倾斜检测与版面分析算法的研究.pdf_第5页
已阅读5页,还剩75页未读 继续免费阅读

(模式识别与智能系统专业论文)页面倾斜检测与版面分析算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

篓圭笙苎 蔓堑塑墼笙型芝望垂坌堑苎鎏篓登墨一 摘要 版面分析与理解技术主要研究如何将纸质文档转化为电子表示,并进一步理解为 计算机可处溅的符号表示的整个过程。版面分析与瑕解技术是o c r ( 光字符识别) 疆统靛重要缎成部分。论文营先麓述了o c r 系统及萁与页葱颧斜检测与叛西分援熬 关系;总结圈颓了该领域笈震历程和现状。接着鼠文糖图像的特点斑发,介绍了几种 幽像平滑和二值化方法。通过实验分柝,比较了这些髀法的实验及优劣。针对扫描图 像可能产生的倾斜,论文提出了一釉基于图像的逻辑避算和最小二乘法豹页面倾斜检 溺方法:蓄宠定义了一系裂逻辑运篓冀孑;在分褥葵予淫覆懿基确主,添逮了楼璇簿 算法的指导意义;最后给出了算法的黑体实现。实验结果表明该算法具有准确魔高、 速度快而且与内容无关等优点,具有一定的理论价值和较强的实用价值。版面分柝中, 蘩予递归和投影豹多叉辩模型算法是舨灏分饕令经典的算法,毽该算法豹实验援辘 严重受限于溺值的选取,魏莱闽值的谗取不当,将造成文本区域的避分割现象。为了 克服这个缺点,论文提出了种改进算法,它引入了“自底向上”策略中的区域合并 思想,从而改荣了传统算法的实验性能,提赢了算法的鲁棒性。最聪用基于连通域特 经毽靛方法遴霉亍送缓识裂。蘧惹论文对敝瑟分害l 察区域谖秘算法戆囊验数据送行了强 澎分析,给出了算法的优缺点,探讨了导致算法不足的原因。最后,总结了论文的成 果和不足,给出了对该领域研究的看法相做论文期间的体会。 关键词: 版面分析版筒分割倾斜检测链码投影递归多分法区域合并区域识别 毽兰婆兰 蔓垂堡塑兰塑童鉴耍茎堑兰鲨塑楚窒一 a b s t r a c t d o c u m e n ta n a l y s i sa n du n d e r s t a n d i n gi st or e s e a r c hi n t o 也e o r i e sa n dt e c h n o l o g i e s d u r i n gt h ew h o l ep r o c e d u r ec o n v e r t i n gp a p e r d o c u m e n t si n t oe l e c t r o n i cf o r m a t s d o c u m e n t a n a l y s i sa n du n d e r s t a n d i n g i s i m p o r t a n tp a r to fo c r ( o p t i c a lc h a r a c t e rr e c o g n i t i o n ) s y s t e m 。p r o l e g o m e n o ni n t r o d u c e sb r i e f l yo c r s y s t e m ,e x p a t i a t e ss t a t u sa n d a c t i o no ft h i s t e c h n i q u ei no c rs y s t e m a n dr e v i e w st h ee v o l u t i o n a lc o u r s ea n ds t a t u sq u o p r e p r o c e s s i n g i si m p o r t a n ts t a g eo fd o c u m e n ta n a l y s i sa n du n d e r s t a n d i n g ,t h i sp a p e re n u m e r a t e ss e v e r a l f a m i l i a ra p p r o a c h e so f i m a g es m o o t h i n g a n d b i n a r y b a s e d o nt h ee x p e r i m e n t s ,t h i sp a p e r c o m p a r e dp e r f o r m a n c eo f t h e s ea l g o r i t h m s p a g es k e wd e t e c t i o na n dc o r r e c t i o ni sa l s oa n i m p a s s a b l ep a r to f p r e p m c e s s i n g a n r m o v a t i v ea p p r o a c h i sp r e s e n t e dt od e t e c ts k e w a n g l e , s k e wd e t e c t i o nb a s e do ni m a g el o g i co p e r a t i o na n dl m s t h i sp a p e rd e f i n e ss e r i a ll o g i c a r i t h m e t i co p e r a t o r s ,p r o v e sp r o p e r t i e so ft h e s eo p e r a t o r s ,a n da n a l y z e st h ed i r e c t i v ea c t i o n o ft h e s ep r o p e r t i e st os k e wd e t e c t i o na l g o r i t h m f i r s t l y , s l a n t w i s ep a g ei sb i n a r i e d ,t h e n , u s e dl o g i c a lo p e r a t o rtt oa c tt h eb i n a r yi m a g e 。w ec a ng e tas o l i dg r a p h i cb l o c k 。t h s b l o c kc a nm a x i m i z e a p p r o x i m a t e b e e l i n ei n f o r m a t i o no fs l a n t w i s e p a g eb o u n d a r y s e c o n d l y , w e u s e4 o r i e n t a t i o nc h a i nc o d e st or e p r e s e n tf o u rb o u n d a r yo ft h eb l o c k ,f i n a l l y , w ee x t r a c ta p p r o x i m a t eb e e l i n ei n f o r m a t i o nf r o mf o u rc h a i n s ,a n dc a l c u l a t e ss k e wa n g l eo f b e e l i n eb a s e do nt h el m s 。e x p e r i m e ms h o w s 也i sa l g o r i t h mi sf a s ta n da c c u r a t e s ot 艇s a p p r o a c h h a sc e r t a i nt h e o r e t i cv a l u ea n dp r a c t i c a l v a l u e p r o j e c t i o n - b a s e dr e c u r s i v e a l g o r i t h m i sac l a s s i c a l a l g o r i t h m f o rd o c u m e n t s e g m e n t a t i o n b u t t h i s a l g o r i t h m p e r f o r m a n c e i sr e s t r i c t e d s e r i o u s l yb y t h r e s h o l d 1 1 1 。s u i t e dt h r e s h o l dw i l ir e s u l t i n s u p e r - s e g m e n t a t i o no f t e x tr e g i o n i no r d e r t oo v e r c o m et h i sd e f e c t ,t h i sp a p e rs m a r t l yu s e s t h ei d e ao f r e g i o nc o m b i n a t i o no fb o t t o m u ps t r a t e g yf o fr e f e r e n c e 。w h i c hi m p r o v e s 氇e p e r f o r m a n c eo f t r a d i t i o n a la l g o r i t h m r e g i o nr e c o g n i t i o na p p r o a c hi sb a s e do nc o n n e c t e d c o m p o n e n t f e a t u r e s i na d d t i o n ,t l l i sp a p e ra n a l y z e se x p e r i m e n t p e r f o r m a n c e so f d o c u m e n t s e g m e n t a t i o na n dr e g i o nr e c o g n i t i o n i nd e t a i la n dl i s t sr e s p e c t i v es t r o n gp o i n t sa n dd e f e c t s 。 a sf o rd e f e c t s ,t h ea u t h o rd i s c u s s e sr e a s o n sb r i n g i n go nt h e s ed e f e c t s 。i na d d i t i o n ,l a r g e n a m b e r so ff i g u r e sa 诧s h o w e d 昭i l l u m i n a t ef a r t h e r i nt h ee n d t h ep a p e rs u m m a r i z e s h a r v e s t sa n dd e f i c i e n c i e so ft h i sa c a d e m i cd i s s e r t a t i o na n d p r e s e n t st h eo p i n i o n sa b o u tt h i s f i e l da n dm y e x p e r i e n c e s k e y w o r d s :d o c u m e n ta n a l y s i s ,d o c u m e n ts e g m e n t a t i o n ,s k e wd e t e c t i o n ,c h a i nc o d e s , p r o j e c t i o n ,r e c u r s i v ep o l y t o m y ,r e g i o nc o m b i n a t i o n ,r e g i o nr e c o g n i t i o n l i y6 2 3 1 9 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名:趣叁拳枷年年月,一日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的全部或部分内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:丝塾整沙正年? 月日 璧圭垫塞 蔓垂塑壁垒篓皇錾至茎堑燮叠塞一 1 绪论 1 1 问题的提出 随着多媒俸诗算橇赣露技术的鑫耨舞弊,荤楚豹键盘、嚣舔输入技术己远遴不鼹 满足人们的需求。汉字传娩的输入方式人工输入,劳动强度大,遽腹慢,一般的使用 者每分钟输入不足1 0 0 汉审。所以这种方法不适用于需要处理大量文字资料的办公自 动诧、文搂繁瑾、圈套清摄管理等场会。汉字懿 键纛输入鼓零正辩军突霆,冀串基 于语音识剐技术的听写枫,基于汉字识别技术的汉字识别软件都樽到了很大的发展。 特别是汉字识别中的o c r 技术正在为人们所接受,成为未来电脑不可缺少的汉字输 入方式,搜中文信息处理及计算机推广癍焉有了一个烫广泛兹空趣。 1 1 1o c r 系统简介 一o c r 及箕应焉 o c r 是“光学字符识剐”( o p t i c a lc h a r a c t e rr e c o g n i t i o n ) 的英文缩写。光学 字符识别作为模式识别学科中一个相对古老的研究领域,在模式识别的历史中有漾要 的地位l 】 l 引。中文o c r 系统是针对汉字镶怠高速输入计算辊豹闯题,致力予解决濒撬 汉字使蔼者低遮信患输入与高速信悫楚瑾斡矛詹,孰聪提高整个诗算梳系统的效率。 用户只要用搠描仪将整个页面图像输入计算机,o c r 系统就会自动产生汉字文本文 件,比手工输入要快几十储。o c r 系统主要的应用领域有:办公自动化中印刷体 汉字、英文、鞠文等文转炎瓣戆蠡动输入:建立汉譬文麸搂素瘁;语言处瑗中文 啼吝秘资料的自动输入;汉字文档图像的压缩存储和传输;书刊自动阅读器,肖人 阅读器:粥训资料的再版输入,古籍熬理:智能全文信息管理系统,汉英翻译系 统;名片识潮管理系统;表格、票据、发票识慰系统;网络濑舨,无纸饿,办公 馨。 二o c r 的工作原理 o c r 系统是一种汉字文稿的自动输入方式。其工作原理是:通道扫描仪等光学输 入设各获取纸张主载文字躅冀蘩塞,蛰文鞴敬鏊缳羲入给诗冀瓤,谤葵秘取窭每个字 的图像并利用备种模式识别算法分析文字形态特征,判断出文字的标准编码,将熊转 换成为汉字的编码,最后按格式存储为计算机的文本文件格式。 堡主笙苎 墨亘塑塾竺型皇墼耍坌堑竺堡塑堕一 三本课题与o c r 的关系 版面分析是数字化进程中非常重要的一环,是利用o c r 技术的前提。所有的o c r 算法均是基于单个字符的,假定用户提供某个字符的图像,输出只是字符的计算机编 码。因此为了将信息电子化,就需要一个对扫描图像进行预处理,它将扫描图像上的 各个字符标记出来,以便于o c r 处理,这个过程就称为版面分析。近几年来,在复 杂版面的分析和识别方面,出现了引人注目的迅速发展。1 9 9 1 年,国际模式识别协 会决定每两年召开一次国际文件分析和识别会议i c d a r ( i n t e r n a t i o n a lc o n f e r e n c e o n d o c u m e n t a n a l y s i s a n dr e c o g n i t i o n ) ,版面分析和版面识别是最重要的议题之一,成为 国际模式识别学界颇为关注的研究项目。 1 1 2 版面理解 版面理解( d o c u m e n tu n d e r s t a n d i n g ) 包括版面分析( d o c u m e n ta n a l y s i s ) 和l 版面识别 ( d o c u m e n tr e c o g n i t i o n ) 两部分。版面分析( d o c u m e n ta n a l y s i s ) 和版面识别( d o c u m e n t r e c o g n i t i o n ) 是两个密切相关的过程。版面分析的主要任务是利用计算机自动地对印 刷版面的图像数据进行处理和分析,标识出版面上的文字、图像、图形及表格区域的 位置、属性和逻辑关系,以便识别器正确地查找到文字域进行识别。版面分析是实现 文件的几何结构分析。而版面识别则是对各个分栏的性质和分栏之间的顺序做出判断 和识别,同时,对于文本性质的分栏还需要指出它是横版还是竖版,是一般的正文还 是标题:对具有多个段落的文档,还需要指出各段落的先后顺序,以保证识别后的文 件具有正确的语义关系。 图1 1 _ 2 1o c r 系统的一般结构示意图( 其中虚线部分为版面理解) 版面分析和版面识别实际上都是一个特定的图像理解问题,其研究内容涉及到图 像分析、模式识别、人工智能等诸多领域。这两者之间的关系十分密切,前者是对文 件的几何结构的分析,而后者是对文件的逻辑结构的识别,这些都是整个o c r 系统 的重要组成部分l 。图l _ 1 2 1 就是目前的o c r 系统的一般结构,从中可以看到版 面分析和版面识别在整个系统中的地位和作用。版面分析结果的好坏,直接影响到字 符分割的正确率,从而影响到整个系统的识别率;而版面识别的结果,不仅对识别率 有影响,而且决定了系统的输出结果能否具有正确的语义关系和逻辑关系。 篓圭釜茎蔓垂鳖叁整篓童整垂坌堑兰堕整塑签一 1 2 发展现状与应用领域 1 2 1 国外情况 舨面分掇与理解技本融寿四十多年酌历史,光学字符识别( o c r ) 是其最早期的 瘦雳。,卡年代旱蘩,敝瓣分褥与理解授零酌初麓磷究大多集中予辩布局结稳较篱单 的文本文档页面进行分割【4 j ,到九十年代初,对文档内部对象进行逻辑标识的研究开 始逐步展开i 剐。目前,版面分析与理解技术的研究已发展到针对备个不同用于领域的 文档采两不溺耱技术,多热发逮辩学臻巍,蒡疑决安繇涵蘧。 目前,许多大学和研究机构都纷纷在版面分析与理解领域建立研究中心或实验 室,并取得了许多重要的研究成果。这般研究机构分别从不同的角度对版面分析与理 解技术以及焚中各个阶段豹簿法进彳亍研究。其中较热著名豹研究机构包括:1 9 7 8 警成 立的美国缀豹翔立大学b u f f a l o 劳校斡文锱分析与浚溺中,l , ( c e d a r ) 是在文稿图像分 析与理解领域中较早建立的研究机构之一该中心以数字化的文档作为研究对象,主要 研究方向包括:手写体识别、信封与信件的自动处理、智能字符识别、表格处理以及 强文交罄识粼等等。熬拿大c o n c o r d i a 大学模式谖爨每撬器饔戆磺究孛,l , ( c e n p a r v l i ) 于1 9 8 8 年9 月正式成立,该中心在国际字符识别权威d r c y s u e n 的带领下,在字 符识别、文档阁像分析与理解以及自然语言理解等方筒的研究居世界领先水平。1 9 8 8 冬建立的德嚣d f k i 研究中心包括五个主要磅究小缎,其中之一就爨交著名文掇辫豫 分析专家d f 。a d e n g e l 镰黪的信患管理与文档努轿,j 缀。美国n e v a d a ,l a sv e g a s 大学 的信息科学研究所( i s r i ) 予1 9 9 0 年成立,主要任务是提高文档理解的自动化技术。该 研究所每年述举办文档分析与信息检索研讨会( s y m p o s i u mo nd o c u m e n ta n a l y s i sa n d i n f o r m a t i o nr e t r i e v a l ,s d a i r ) 。美嚣w a s h i n g t o n 丈学懿智戆系绞嶷验室娃s 秘程叛嚣 分析与理解领域最重要的贸献是开发了用于o c r 和文档分析与理解算法的c d r o m 文档数据库( u 、n i ,u w - i i ,u w - 1 1 1 ) 。谈文档数据瘁不仅包括各文本、图纸文档的图 像,还包括文档中穗应对象魏字符、符号翘线条等的密关信息,便予对文搂分攒冬理 解过程孛鹳备算法遴行系统、客观的评价。此夕 迸褥敝蓠分析稻瑷解的研究枫构还缀 多,例如:夔国m a r y l a n d 大学语言与媒体处理实验黧( l a m p ) 。他们与w a s h i n g t o n 大学合作的文档属性格式描述d a f s 是个通用的文档结构表示标准。意大剥f i r e n z e 大学窝s i e n a 大学的会终鹣实验室一文鹣分辑技零磷究实验室( d a n 豫) 。意大翮b a r i 大学的知识获取与机器学差 ( l a c a m ) 实验室等等。 颈士论变 甄蔼赖斜捡铡与舨藕分错算法的研究 1 2 ,2 溪内情提 我因在o c r 技术方面的研究工作起步较晚,在7 0 年代才开始对数字、英文字母 及符号的识别进行研究。7 0 年代寒开始进行汉字识别的研究,到1 9 8 6 年汉字识别的 硬交逡入一令实矮瞧貔瓣骏,取缮了较大懿或粱,不多骚究肇位程继整窭了中文o c r 产品。我国o c r 都是伽r 演变过来的,我国的魃研究部门程8 0 年代初就开始对o c r 识别进行研究,如:清华的吴佑寿教授、丁晓脊教授、夏莹教授、北大的顾小凤教授、 j e 信的张瞬中教授、巾科院的裁熬节薅士、李明敬潜,恁们霹戮称终我潮o e r 疆究 开发孰镪中豹导航入。我雷瑶前锼翔的文本型o c r 软件主簧商清华文通t h - o c r 、北 信b i o c r 、中自i c r 、沈阳自动化所s y o c r 、北京曙光公司n i 一0 c r ( 已被中自汉王并 购) 等,甄配的扫描仪则使用市面上的平板扫描仪。从8 0 年代开始,o c r 盼研究开发 羲一妻受黧藿家“8 6 3 ”请翔戆资勒,我国在镶崽蔽零领域聪穗豹努力,溅经有了匆 步的回报。如“8 6 3 ”项目的启用辫汉王最新推出的专业版“新世纪o c r ”,将我国 当今的o c r 技术推进了新的巅峰。目前正在实现将o c r 软件针对表格形式的特征设计 了大量懿凭证功能,饺褥识别壤发燮裹、识爨遥发更抉,势鬃笼遥应不固繇凌夔壤爱 提供了多稀识燕方式逡项,支持单祝和网络搡佟,极大地方便了使用,谈缴用范围更 加广泛,有达到各种不同用户的应用要求。相信经过众多专家或专业人士的努力。及 国家在依息产业领域的大力资助,使o c r 进入到嬲络的各个镞域,会有更多的新品群 奉簸绘鲻户,篷r 菝零褥会毫一令矮鹩飞获。 1 3 本文的研究工作 遥馨来,舨瑟努耩与理勰领域骚到了广泛的荚注。由予版面的复杂性,仍存在许 多值得探讨的问题。本文的研究工作主要包括:版面分析预处理、页面倾斜检测与校 正、版蕊分割与区域识别类等内容。 r 眩。, 其它 8 婴主造塞 蔓塑堡堑垫篓童蔓耍坌堑茎造签堑壅 一一一 ( 2 ) 中僵滤波法 中值滤波是一种非线性信峙处理方法,与其对应的中值滤波器当然也就是一种菲 线性滤波器。中值滤波器是在1 9 7 1 年由j w j u k e y 首先提出并应用在维信号处理 技术 时闯序列分孝厅) 中,艏来被二维图像信号处理技术髓引用。中值滤波在一定条 件下,可以克服线性滤波器如最小均方蓑滤波,平均筐滤波,平滑滤波等方法所带来 的圈像细节模糊,而且对滤波脉冲干扰及图像扫描噪声媛为有效。在实际运算中并不 需要图像的统计特性,所以使用也较为方便。 中值滤波裁是用个会有驽数点的浸动塞口,对塞目正中点的焦用密口内各点黪 率蕊代替。设有一个一缎序列,( 1 ) ,f 2 ) ,( 哟,取窑鞠长度为m m 为奇数) ,对 此一维序翔进行中值滤波,就是从输入序歹d 中相继抽出州个数 f ( i - v ) ,f ( i 1 ) ,( f ) ,f ( i + 1 ) ,f ( i + v ) ;其中f ( i ) 为窗口中心点值,v = 渤i ) 2 。 鞭烬这个执馕按其数骥大小翘 序,取其感号为亚中间酆个数 乍为滤波辕出。中毽滤波 法瓣公式必: g ( i ) = m e d f ( i v ) ,( f ) ,f ( i + v ) 其中v = f m i ) 2 i z ; 二维中值滤波可表示为: y , s 。嗨d 毛 其中:a 为京口; 舂 必二维数据彦到。 一i 维中傅滤波的窗口形状翻尺寸设计对滤波效果影响较大。不同的熙像内容靼不 网熬应用要求,缝缝采用不尉豹密鞠形状鄹尺寸。常用二维中毽滤波窿蠲形状裔线型、 方型、因型、十字型戬及因环墅等。窝日尺寸般先桶3 再取5 逐步增大,直到滤波 效采满意为止。通常情况,对于有缓变的较长轮廓线物体的图像,采用方形或圆形窗 豳为宜;对于包含有尖顶角物体的图像,适宜用十字形窗口;砸鬻口太小则以不超过 图像中最小鸯效物体静尺寸为蜜。匿2 ,l 。2 + 1 给出了中傻滤波几种常用窗瞄; 二频率域平滑 图2 ,1 2 1 中值滤波的几种常用窗口 9 竣士论文 页垂犊瓣检测姆舨嚣分析算法豹麟究 图像经二维傅里叶( f o u r i e r ) 变换厝,其边缘、跳跃部分以及噪声基本都含程高 频分量中。频率域平滑就怒遴过低通滤波器滤除高频分量,从丽去除噪声,使图像得 戮平游。萁数学表达式寿: g ( ) = h 。) _ 式中最。 是原始图像豹f o u r i e r 变换频谱,g 。) 是平滑后图像豹f o u r i e r 交换频谱, h ( 。) 是低通滤波器的频率响应函数。对于低通滤波器来说,h ( 。) 应对高频部分由衰 减作用而又不影响低频分爨。 | ) 理想低逶滤波嚣 一个理想二维低通滤波器的传递函数袭示如下: = d ( ) d o d f ”d o 昱弋中d o 为瑕您低道滤波器的截止频率,怒一个规定的非负量。b 。) 楚从频率域的原 点到点( “,v ) 的距离,即: 壤。) = ( ”2 + v 2 严 理想滤波嚣不可用硬件实现,但可用计算机模拟。 一个n 阶b u t t e r w o r t h 低通滤波嚣的传递函数袭示船下: m 2 面对1 l 十( 压一1 ) i 掣l 圈2 - l - 2 2 理想低通滤波器频晌特性图图2 1 2 3b u t t e r w o r t h 低通滤波嚣频响特性网 硕士论文 簧垂摆藉礁捌与叛瓣分辑算法瓣研究 式中d ( 。】= ( “2 + v 2 ) 2 ,d o 为截止频率。b u t t c n v o n h 滤波器又称最大平坦滤波器,与 理想低通滤波器不同,它的带通与带阻之间没有明显的不连续性,而是一个平滑的过 渡带。因照,通常把只。) 下降至某一僮的那点定为截止频率。上式采露下降到致。, 静l ,压的郡一点为截止频率。 ( 3 ) 指数低通滤波器 指数低通滤波器是图像处理中另一种常用的平滑滤波器。它的传递函数如下式所 示: = e x p ( e x p ( h 喜蝌”; 壤叫2 h 司署| 式中d ( ”) 2 2 + v 2 ) j ,n 是决定衰减率的系数,d o 为截止频率,上式中取,) 为 最大馕的;。 0 2 ( 4 ) 梯形低通滤波器 梯形低通滤波器的传递函数由下式表示: 1 d ( 。) d o 警要琢蛾砖 d l 臻一最 “。一“”、 0 d 式中d ( 。) = 2 + v 2 ) i ,d 。和d ,要满足d 。d l 的条件。一般把传递函数的第一个转 折点矾定义为截止频率,而d l 可以任意选取,只需大于d 0 即可。 慝2 - 1 2 - 4 指数低遄滤波嚣频响特性图圈2 1 2 5 梯形低通滤波器频喻特性固 堡主堡苎墨亘塑型焦型兰鉴亘坌堑兰鲨塑竺茎 2 ,1 3 实验结果与分析 为了比较各种平滑方法对不同噪声类型的影响,首先选用了一幅未受污染的图 像,然后人为加上高斯白噪声、椒盐噪声及乘性噪声。再对在这些受理想噪声污染的 图像进行滤波平滑。下面分空间域和频率域分别讨论。 一空间域平滑实验结果分析 分别用4 点窗口、8 点窗口邻域平均及5 5 中值滤波滤除高斯白噪声、椒盐噪 声及乘性噪声。由于篇幅原因,本文附图只给出了滤波高斯白噪声的效果图,分别见 附图图3 、图4 、图5 所示。 通过与原图像及加噪图像比较可以发现,4 点窗口、8 点窗口邻域平均及5 5 中值滤波以图像模糊为代价( 特别是边远、轮廓及线条部分) ,可不同程度地滤除相关 噪声。4 点窗口邻域平均由于取得邻域较小,滤除效果不是很好,仍有不少噪声残留, 但图像模糊程度却是最小的:8 点窗口邻域平均增大了邻域范围,能够基本滤除噪声, 图像的模糊程度也不太严重;5 5 中值滤波窗口取得相对较大,能够较好地滤除噪 声,但同时图像的模糊程度也随之增大。 对于不同的噪声,滤波效果又有不同。椒盐噪声由于是黑图像上的白点,白图像 上的黑点,与周围各点的灰度值差异较大,容易滤除,采用4 点窗口邻域平均即可较 好地滤除,能够保持较好的图像轮廓、边缘、线条等细节。高斯白噪声采用8 点窗口 邻域平均即可很好的滤除,图像也不太模糊。乘性噪声由于和图像信号是相关的,往 往随图像信号的变化而变化,故较难通过邻域处理来滤除,采用5 5 中值滤波可基 本滤除噪声,但图像模糊程度较高。 二频域法实验结果分析 分别用理想低通滤波器、b u t t c r w o n h 低通滤波器、指数低通滤波器及梯形低通滤 波器滤除高斯白噪声、椒盐噪声及乘性噪声。滤波高斯白噪声的效果图见附图图6 、 图7 和图8 、图9 所示。 通过与原图像及加噪图像比较可以发现,频域低通滤波法可以一定程度地滤除图 像中的噪声,但同样也会带来不同程度图像模糊、振铃现象等副作用。 理想低通滤波器在平滑处理过程中会产生较严重的模糊和振铃现象。这种现象是 由f o l l r i e r 变换的性质决定的。有卷积定理知g ( 。) 、h ( 。) 、l 。) 的f o u r i e r 逆变换g ( 。) 、 啊。) 、。) 在空域有如下卷积关系: g ( w ) 2 h ( ) + ) 而由于理想低通滤波器的传递函数h ( 。) 是理想的矩形特性,其反变换 。必然会产 堡主堡苎里耍堡型丝型量堡耍坌堑簦些望堕堑 生无限的振铃特性。经与一。1 卷积后,给g ( 。) 带来了模糊和振铃现象,d o j 越z j 、这种 现象越严重,当然平滑效果也就较差。这是理想低通滤波器不可克服的弱点a 但它的 噪声平滑效果是最好的。 与理想低通滤波器相比b u t t e r w o r t h 低通滤波器处理过的图像模糊程度大大减少。 这是因为它的传递函数h 。、苇是陡峭的截止特性,它的尾部包含有大量的高频成分。 同时,b u t t e r w o r t h 低通滤波器处理的图像没有振铃现象,这是由于在滤波器的带通和 带阻之间有一平滑过渡的缘故。但它的噪声平滑效果一般。 指数低通滤波器处理的图像比b u t t e r w o r t h 低通滤波器稍微模糊一点,这是因为 指数低通滤波器比b u t t e r w o r t h 低通滤波器有更快的衰减率。同样,由于指数低通滤 波器的传递函数也有较平滑的过渡带,它处理的图像没有振铃现象。 梯形低通滤波器的频率响应特性图的形状介于b u t t e r w o r t h 低通滤波器和指数低 通滤波器之间,其处理效果也就介于两者之间。梯形低通滤波器处理的图像有一定的 振铃现象。由以上比较分析可得到4 种低通滤波器的性能特性表: 表2 1 3 1四种频域低通滤波器的实验性能对照表 滤波器类型图像模糊程度振铃程度噪声平滑效果 理想低通严重严重最好 梯形低通轻较轻好 指数低通较轻无较好 b u t t e r w o r t h 低通很轻无一般 对于不同的噪声,频域平滑用于去除高斯自噪声的效果最好,去除椒盐噪声与乘 性噪声的效果相对差些。 2 2 文档图像二值化 所谓二值图像,就是指图像上的所有点灰度值只有两种可能,不为0 就为”2 5 5 ”, 也就是整个图像呈现出明显的黑白效果。为了得到理想的二值图像,一般采用阈值分 割技术,它对物体与背景有较强对比的图像的分割特别有效,它计算简单而且总能用 封闭、连通的边界定义不交叠的区域。所有灰度大于或等于阈值的像素被判决为属于 物体,灰度值用”2 5 5 ”表示,否则这些像素点被排除在物体区域以外,灰度值为0 , 表示背景。这样一来物体的边界就成为这样一些内部点的集合,这些点都至少有一个 邻点不属于该物体。如果感兴趣的物体在内部有均匀一致的灰度值,并且其处在一个 具有另外一个灰度值的均匀背景下,使用阈值法可以得到比较好的效果。如果物体同 背景的差别不在灰度值上( 比如纹理不同) ,可以将这个性质转换为灰度的差别,然 颟士诧文 更越梭豁检测鼙舨蕊势折算蛙的i i 冀 尉利用闽值化技术来分割谈图像。为了使分割更加鲁棒,适用性更强,系统最好w 以 囊动选择阀德。基于物体、环境和应用域等知识的图像分割算法比旗子固定闽缀的算 溱蔓其畜营遮瞧藉适痘性。这些躲谖毽戆:对应予魏髂鼹匿像荻囊姆经、秘俸懿尺寸、 物体在图像中所占的比例、图像中不同豢型物体的数髓等。其中图像直方图就是种 获度特性,通常被用来作为分割图像的工具。 这些方法划分残卡类捧1 1 9 t :( ) 壹方豳方法与袁方塑变换法;( 2 ) 最大类溺方差 法;( 3 ) 最小误差法与均匀化误差法,( 4 ) 共生矩阵法:( 5 ) 矩量保持法;( 6 ) 最大熵方 法,( 7 ) 简单统计法与局部特性法,( 8 ) 概率松弛法;( 9 ) 模糊集方法,( 1 0 ) 其他方法。 下面介绍本文所采用的几耪方法。 2 2 1 类问方箍自动阈值法【1 0 j 假定露像中只有灰瘦藏爨各异的霹标帮背景。鼓裔在英灰度蠹方圈选择合适的门 隈,才可能将疑划分成目标和背景。从模式识别理论来看,不同的门限值导出不同的 类别分离性能,只有合适的( 或最佳的) 门限值才能绘出合适的( 戚最佳的) 类别分 藤淫簸。嚣纛馕耀类聚豹方差来爨弱不霹魍陵麓分类麓豹分离性黥,并鑫建导爨爨趣 闽值。 设图像中的灰度范围为 0 ,1 ,l - 1 ,选择门限t 将划为两类:c 。: o ,l ,t ,c 1 : t + 1 , t + 2 ,f 蛰。将壹方萤归一位,獒鸯壤率分蠢 1 - t p 。= 百n i p ,0 ,p ,= l 1 i = 0 其中n 为像素豹个数,致为获疫i 豹豫豢个数。q 秘g 类懿类出现攒率极均壹鼷分 掰童班下给爨: 鼠 t 棚o = p ( c o ) = 只= 脚( f ) t _ o i - l l = p ( c i ) = p ,= l 一国( f ) i - i + l 舻骞引铲筹,= 0 “,l , 1 4 硕士论文页面倾斜检测与版面分析算法的研究 其中c o ( t ) = p 。:争徊峨:趔 “2 荟1 概砌,2 等岩 ,;r +- 一w v , ( f ) = z i p , 所= ( ,一1 ) = 驴 对于任何t 值都能使下式成立 o 卢o - i - 国l l = r ,o ) o + l = i c 0 和c l 类的方差可由下式求得: c r 0 2 = ( f 一盹) 2 p ,c o 。 q 2 = ( j 一“) 2 p 。o j 按照模式识别的理论,可以求出两类的类内方差、类间方差和总体方差,先选用下面 的公式: 且盯2 + 盯日22 盯r 2 盯2 = 0 ) o 7 。2 + 1 盯l 2 ( 2 2 1 9 ) o j o ( 。一, u r ) 2 + 脚l ( i 一r ) 2 = 0 ) 0 0 ) i ( i 一。)( 2 2 i 1 0 ) i - i 盯,2 = z ( i 一,) 2 p 国 组合分析这些类别方差,可以衡量不同门限导出的类别的分离性能。可选用以下 三个准则测量: 五:乓,t :乓 盯盯2 这三个准则彼此等效。注意到盯,2 和2 是门限t 的函数,听2 与t 无关。由于盯。z 是基于二阶统计特征,而盯。2 是基于阶统计特征,所以选用叩作为测量是最简单晶。 极大化的过程就可以i i 绷l l i ! f i 艮t ,所以最佳门限,应当为: :鲁听 = 叩 硕士论文 萸面倾斜检剥譬舨垂势折算法鹊蜡究 2 2 2 最佳熵囱动阈僚法 r + = a r g m a x l ? 信息论中用熵作为不确定的度量,或者说对随机实验结果的不知性度量。如果 令实验结栗蠢尼令独立戆蘩零事箨凌藏,番个基零搴佟窭现懿禳率攀先霹鞋翔遂,那 么实验后人们到底获得多少信息量? 虽然,所得到的信息量与人们_ 搴先知道的备个基 本事件的出现概率成反比。对于确定要发生的事件,没有任何信息;而对于最不确定 楚否发生熬事传,剩获褥竣多懿售惑。瓣予基理概率凳p ,瓣第i 令攀 孛,聚获缮靛 信息量可表示为 = l n ( 1 p ) = - l n p , 巍予这穆壤纛其毒霹絮注,鄹么整令实羧结栗获取豹嫔惠量为 h = e ( ,) = 一p ,l n p , 这裁是蘩患论串戆熵( s h a n n o n ) 。 当将熵概念用于图像分割时,基本愁研究图像灰廉直方图的熵测量,并由此自动 找出最佳门限分割图像。从不同的角度定义熵,就会有不同的方法。有以下三种基于 熵的自动阙使法: ( 1 ) k s w 麓方法f 1 它是由k a p u r 等人提出的基于两个分布假设的熵方法。已知p op l j - 一,p 。为次度 缀的概率分布,现在有这个分布导出两个概率分布,篡中个描述 0 ,l ,f 的灰度分 奄,另一令翅聚捶透器+ l ,一l 戆灰发分毒。这嚣个分枣是 爿:等,号,等 p ? 。p ? j:p ? 趴啬1 ,等1 ,器1 一z + 一只。一置 与每个分布有关的熵分别照h 。( f ) 和h 。( r ) : 露觯,= 一骞号,n 警= 一毒;骞尹净箴一霉t 摊,= ;珏霉+ 每 泣z z 。t , 州= 嵩盎h 尚。一志t 扣吣一”舳”删叫,吲+ 等 堡主笙奎 蔓薹堡筮熊型兰錾垂坌篓燕笙整堑塞 ( 2 2 2 2 ) 其中霉。窆p ,蜀。一窆a l n 热,嚣,:一1 - ! 鼽l n 只。圈像中躺总熵好为f 。( f ) 与 i ;0j = 0 t = 0 h 。( f ) 之和,即 黔,喇- 吲等+ 等 使憨熵取最大值鲍t ,将作为分害露标和背景的最佳嘲值: t + a r g m a x 一1 h ( t ) ( 2 ) 基于二维熵的自动阀值法i l 2 j 利用灰度的空阈分布,将一线熵推广至t j - - 绫熵,使阈馕赫选择更加合璞。在这个 方法中,剃矮获度豹察阀分毒表凌定演翡准委| j ,求凄每一个豫索灰疫蓬农该像素与两 围像素平均灰度值的联合概率,从而决定一个熵平面。 若获度分布有删个不同值,平均灰度也有脚个不同值。每一像素的灰度值与其 平均获浚篷缝残一对,每一对震予一令二缍簿。簿豹慧数隽搬+ 牌,实验豹缀素总鼗 为 。( j ,j ) 对的出现的总数( 频率) 兀除以像素总数( 2 ) 定义为联含概率p , 假定图像有目标a 和背景b 两类组成,各自商不同的概率函数。若在 ,) 设置门 限,髫橼a 部分的檄率只。“= l ,s ;j = 1 ,f ) 袭示了条件概零。经过归一纯处理, 霹稼a 麓瘸h ( 矗) 为: 日( 4 ) = 一( 乃8 , ) i n ( p 。只) 揖i ,l 其孛 只= 一p ,l n p “ 件l j = t h ( 矗) 髫戳改写为; ( 一) = l 只 岛l n p 一p 。l n 只】= i n p , , + 也只 i t it t i 荬孛 h 。= 一岛1 n 珊 i = 1 j = l 类纭豹,对鹜景瑟都努懿熵l ( b ) 定义为: 曼圭笙壅墨堕塑塑塑型量坚耍坌塑竺鲨塑墅窒 日( b ) = 一【乃( 1 一只) 】l n 岛( 1 一只,) i = s + l i t + l 其中 1 ( 1 只) p 。 1 n p 。一l n ( 1 一只) 】 i = s + l j = t + t = i n ( 1 一只) - t - ( h 。一h 。) ( 1 一只) 日。= 一p 口l n p , 只要在由f = s + 1 ,m 一1 与= 1 ,t 和由f = l ,s 与,= h 1 ,m 一1 所定义的 两个区域内p 。近似为0 ,h ( b ) 的表达式是有效的。因为许多情况下可以忽略离开对角 线教远的概率,这个假定是合适的,可以减少计算时间。 因此,图像的全局熵妒( s ,f ) 可以定义为上述两个熵之和: 妒0 ,f ) = h ( a ) + h ( b ) = l n p 。,( 1 一只,) 1 + h 。只+ ( 。一h 。) ( 1 一只,) ( 2 2 2 1 1 ) 通过极大化e ( s ,) ,可以找到最佳的( s ,r ) ,确定最佳闽值。 2 2 3 实验结果与分析 这里给出一个二值化的示例。图2 2 3 1 是原图像,图2 2 3 2 类问方差自动阈 值法( o t s u 算法) ,图2 2 3 3 是k s w 熵方法( 一维最大熵闽值分割) ,图2 2 3 4 是基于二维熵的自动阈值法( 二维最大熵法闽值分割) 。 虽然图2 2 3 1 已经是从几十幅扫描文档中选择出的较差区域了,但这幅图像的 质量仍然不足以显示各个算法的特点。这里也只能泛泛的讨论一下这些算法实验性能 和优缺点。 一、0 t s u 运算简单、稳定可靠、适用性强,但当图像中目标与背

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论