(信号与信息处理专业论文)测井图纸矢量化技术研究.pdf_第1页
(信号与信息处理专业论文)测井图纸矢量化技术研究.pdf_第2页
(信号与信息处理专业论文)测井图纸矢量化技术研究.pdf_第3页
(信号与信息处理专业论文)测井图纸矢量化技术研究.pdf_第4页
(信号与信息处理专业论文)测井图纸矢量化技术研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(信号与信息处理专业论文)测井图纸矢量化技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨工程大学硕士学位论文 摘要 石油和天然气是重要的能源,也是十分宝贵的化工原料,因此世界各国 对油气的勘探与开发都特别重视。测井信息的数字化将有利于数据的存储、 管理、分析、共享和网络传输,所以测井图纸的矢量化就成为了各油田的核 心工作之一。 工程图纸矢量化是将纸介质工程图纸扫描输入计算机后,对所得的扫描 图像加以分析、识别,最终重建其中的目标对象的过程。矢量化研究是图纸 复用、自动理解等应用的基础,有较高的应用价值。本论文研究的测井图纸 是进行油气勘探开发时使用的工程图纸。目前通常采用数字化仪或国外矢量 化软件来完成这一工作,但是速度较慢,效率较低。因此,如何把图纸上的 测井信息快速地自动识别和提取出来,就成为亟待解决的问题。 本文针对上述要求开展了测井信息自动识别与提取的研究工作。本文的 研究思路即首先针对计算机清绘图纸和蓝晒图纸的特征设计出不同的图纸预 处理方法,使处理过的图纸效果达到曲线跟踪算法的要求,再利用一种统一 的算法对不同类型的曲线进行跟踪,达到识别图纸信息的目的。另外本文还 对矢量化之后的图纸反演技术进行了探讨。本文完成的工作主要有以下几点: 1 、清绘图纸中的网格识别。在空域中设计了“基于阶跃点定位的十字模 板匹配法 有效地解决了网格的识别问题,为后续的曲线跟踪提供了方便。 2 、针对蓝底退化图纸的特点提出了“生成背景法”。该算法能够有效地 从测并工程图纸中分离出前景信息,为进一步矢量化打下了基础。 3 、在确定一系列优选法则的基础上采用了一种由局部到整体的跟踪方法 “扩散法”,利用该算法可以将测井曲线快速地自动识别和提取出来。 4 、针对不同的使用要求分别研究并实现了三种不同的反演方式。 关键词:测井图纸;矢量化;预处理;曲线跟踪;图纸反演 哈尔滨工程人学硕十学位论文 a b s t r a c t o i la n dn a t u r a lg a sa l eb o t hi m p o r t a n te n e r g ya n dp r e c i o u sc h e m i c a l r e s o u r c e s ,s oi ti sn o ts u r p r i s e dt h a ta l lt h ec o u n t r i e sp a ys p e c i a la t t e n t i o nt ot h e i r o i le x p l o i t a t i o n ap a r to ft h ek e yw o r ko fe a c ho i lf i e l di st ot a k ef u l la d v a n t a g e s o ft h ew e l ll o g g i n gi n f o r m a t i o no ng r a p h s ,a n a l y z ea n de x t r a c tt h ei n f o r m a t i o n c o n t a i n e d ,a n ds t o r et h e mp r o p e r l y v e c t o r i z a t i o n ,i e r a s t e r - t o v e c t o rc o n v e r s i o n ,i st h ep r o c e s so fa n a l y z i n gt h e s c a n n e di m a g eo fa l le n g i n e e r i n gd r a w i n gi np a p e rf o r ma n dr e c o g n i z i n gt h e g r a p h i co b j e c t si nt h ed r a w i n g , a n df i n a l l y , g e n e r a t i n gt h ev e c t o rf o r m a tf i l e v e c t o r i z a t i o ni st h ef o u n d a t i o no ft h ea c t i v i t i e so fr e u s i n go l dd r a w i n g sa n dt h e a u t o m a t i ci n t e r p r e t a t i o no fe n g i n e e r i n gd r a w i n g s t h e r e f o r e ,i th a sb e e na n ds t i l l i saw e l l f o c u s e dt o p i ci nr e s e a r c hf i e l d w e l ll o g g i n gg r a p h ,d i s c u s s e di nt h i s p a p e r i sak i n do fe n g i n e e r i n gd r a w i n g , w h i c ha r eu s e df o ro i la n dn a t u r a lg a s e x p l o i t a t i o n t h eu s u a lw a yt ov e c t o r i z i n gt h ew e l ll o g g i n gi n f o r m a t i o ni s a p p l y i n gf o r e i g ns o f t w a r e ,b u ti ti ss l o wa n di n e f f i c i e n t h o wt ov e c t o r i z et h e i n f o r m a t i o nr a p i d l ya n dc o r r e c t l yr e m a i n st ob ea ne m e r g e n tu n r e s o l v e dp r o b l e m t os o l v et h ep r o b l e m ,t h i sd i s s e r t a t i o np e r f o r m sat h o r o u g hr e s e a r c ho n a u t o m a t i cv e c t o r i z a t i o n o u rp l a ni s ,f i r s t ,d e s i g nd i f f e r e n tp r e t r e a t m e n tm e t h o d s b a s e do nd i f f e r e n tc h a r a c t e r i s t i c so fn o r m a l g r a p h a n db l u e p r i n t ,a f t e r p r e t r e a t m e n te a c hk i n do fg r a p hc a nm e e tt h es a m er e q u i r eo fo n eu n i f o r mt r a c i n g a l g o r i t h m ,a n dt h e n ,t r a c i n gw e l ll o g g i n gc u r v e sb yu s i n gau n i f o r ma l g o r i t h m b e s i d et h a t ,t h i sd i s s e r t a t i o na l s od i ds o m er e s e a r c ho nt h ei m p o r t a n tt e c h n i q u eo f g r a p hr e d r a w i n g t h em a i nj o bt h i sd i s s e r t a t i o nd i di sa sf o l l o w s : 1 t h er e s e a r c ho nh o wt oe x t r a c t i n gt h eb a c kg r i d so fn o r m a lg r a p h t h i s d i s s e r t a t i o ng i v e sam e t h o db a s e do ns p a t i a lr e c o g n i z i n g ,c a l l e d “s t e pp o i n tb a s e d 哈尔滨下程大学硕十学位论文 c r o s sm a t c h i n g ”,c a r le x t r a c tb a c kg r i d sf r o mn o r m a lg r a p he f f e c t i v e l y 2 i nt h er e s e a r c ho fb l u ep r i n tp r e t r e a t m e n t ,t h i sd i s s e r t a t i o np r o p o s ea “b a c k g r o u n d r e b u i l t ”m e t h o d t h em e t h o dc a l l i m p l e m e n tf o r e g r o u n d a n d b a c k g r o u n ds e g m e n t a t i o nf o rb e t t e ra n a l y z i n gt h ew e l ll o g g i n gg r a p h s 3 t r a c k i n ga l g o r i t h mf o rc u e s _ 一“p e r v a s i o nm e t h o d ”t h ea l g o r i t h mi s d e s i g n e db a s e do nas e r i e so fo p t i m i z a t i o np r i n c i p l e s ;i tc a l ld i s t i l ll o g g i n gc u r v e s o fw e l ll o g g i n gg r a p h sq u i c k l ya n da u t o m a t i c a l l y 4 d e s i g na n dr e a l i z et h r e ed i f f e r e n tg r a p hr e d r a w i n gm e t h o d sf o rd i f f e r e n t p u r p o s e k e y w o r d s :w e l ll o g g i n gg r a p h ;v e c t o r i z a t i o n ;p r e t r e a t m e n t ;a i i v e st r a c i n g ;g r a p h r e d r a w i n g 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导下, 由作者本人独立完成的。有关观点、方法、数据和文献的引用 已在文中指出,并与参考文献相对应。除文中已注明引用的内 容外,本论文不包含任何其他个人或集体已经公开发表的作品 成果。对本文的研究做出重要贡献的个人和集体,均已在文中 以明确方式标明。本人完全意识到本声明的法律结果由本人承 担。 、山 作者( 签字) :型懒 日期:刁帕7 年弓月伍日 哈尔滨工程大学 学位论文授权使用声明 本人完全了解学校保护知识产权的有关规定,即研究生在校 攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨 工程大学有权保留并向国家有关部门或机构送交论文的复印件。 本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据 库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本 学位论文,可以公布论文的全部内容。同时本人保证毕业后结合 学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈 尔滨工程大学。涉密学位论文待解密后适用本声明。 本论文溜在授予学位后即可口在授予学位1 2 个月后口 解密后) 由哈尔滨工程大学送交有关部门进行保存、汇编等。 作者( 签字) :凌掺导师( 签字) :移耀锋 日期:御7 年;月7 二日口7 年岁月卢目 哈尔滨工程大学硕士学侥论文 第1 章绪论 1 1 引言 在油田勘探与开发过程中,测井是确定和评价油、气层的重要手段之一, 也是解决一系列地质问题的重要手段。它能直接为石油地质和工程技术人员 提供各项资料和数据。在石油勘探工程领域,测井解释成果图是一种被广 泛使用的测井资料【2 l ,随着石油勘探开发新技术的发展,对测井图纸的应用 将会更加深入与频繁。但模拟测井仪器所得到的测井信息绘制在图纸上,数 量多,不利于保存和利用。因此有必要建立测井信息的数据库,使测井信息 以矢量化的形式存储起来,便于曲线形态的反演以及应用计算机进行分析, 这就要求对图纸进行矢量化处理,所涉及到的技术属于工程图纸矢量化范畴。 将纸质工程图纸扫描输入计算机后,对所得的扫描位图加以分析、识别, 最终重建其中的图形对象的过程,称为工程图纸矢量化【3 1 ,如图1 1 所示。 纸质 扫描矢量化 扫描图像图形文件 工程图纸 图1 1 工程图纸矢量化不意图 矢量化的输入数据是将工程图扫描后得到的光栅图像,输出数据是工程 图中包含的图形对象,其核心技术是图形识别技术。早期矢量化的输出数据 是用短线段、折线等细碎矢量表示的低级矢量格式,例如借助数字化仪将图 纸一点一点地扫描入计算机,或者将图纸扫描后使用某种骨架线提取算法( 如 细化方法) 进行自动转换。 工程图纸矢量化研究的最初目的是为了易于编辑和节省图纸的存储空间 1 4 1 。在工程设计过程中,需要保存大量的图纸,也经常要将陈旧的图纸进行 局部或整体的修改后重新使用。图纸扫描后得到的光栅图像以像素为表示单 元,因此对其中的图形对象的编辑只能通过像素级的操作进行,效率很低。 l 哈尔滨工程大学硕士学位论文 而且,图像中包含大量的冗余信息,例如一张么o 尺寸的工程图纸用3 0 0 a p f 的 分辨率,单色扫描后的扫描图像文件大小在1 5 m b 左右,对图纸管理系统而 言是很大的开销。将图像文件转化为图形文件既可以在不损失信息的前提下 大幅度减少存储空间,又可以灵活、高效地编辑和复用已有工程图纸,因此 有明显的应用价值。工程图纸矢量化无论是在国内还是国外都已经成为热门 的研究课题。 一般来说,工程图纸矢量化技术的研究有两个主流:一个是基于细化方 法的矢量化【5 】,即将扫描的图纸图像通过线条细化得到单点宽的连通线,再 进行像素点跟踪和矢量化,该方法的缺点是处理速度慢,跟踪效果受图像背 景影响很大;另一个是基于像素的线条轮廓跟踪【6 1 ,其优点是跳出了单个像 素点的跟踪层次,充分利用了线条轮廓的方向等信息,但是它的线条跟踪还 是基于像素处理的,抗噪声性能较差,而且没有针对背景网格进行抗噪处理, 对于虚线等特殊曲线尚无比较有效的提取算法。 国内外在工程图纸矢量化方面的研究己经进行了许多年,但是研究的对 象多集中在机械、建筑、电子等工程领域,对石油领域较少涉及,对复杂图 纸以及在使用、保存和扫描过程中引入噪音干扰的退化图纸的自动转换精确 度尚不能令人满意,因此对测井图纸的矢量化仍然有较大的研究空间。 1 2 研究的目的与意义 在日益复杂的油气滚动勘探开发过程中,对新、老油井的重新认识与解 释己成为十分重要的课题。在重新解释评价过程中,往往需要矢量化的测井 数据,这就要求针对图纸进行矢量化处理。测井工程图纸矢量化处理的一个 重要手段是数字化桌,然而数字化桌的处理速度慢,效率低,各操作人员提 取的精度差异较大,难以控制,而且最终得到的数字化结果不能立刻使用, 还必须经过多道后期的处理环节才能生成矢量化文件。此项工作需要投入大 量的人力和物力,且远远不能满足勘探开发工作的进度和精度需要。在这样 的大背景下,大庆油田采油三厂委托我方开展了测井图纸矢量化技术的研究。 哈尔滨 二程大学硕士学位论文 据大庆采油三厂技术人员介绍,大庆油田开发至今已积累大约1 9 万件的 测井和试井资料。它们是开发方案编制、常规应用分析、油藏数值模拟、精 细油藏描述、储层反演以及商品化专业软件必须用到的基础资料,每年都需 要投入大量的人力物力加以保存。测试单位的原图经过多年保存已经收缩变 形,破损严重,查找困难。随着油田开发的逐步深入,监测井次和监测项目 的增加,监测成果也逐年增多,历史资料和实时资料的大量堆积,给保存带 来了诸多不便。矿场技术人员在使用过程中,每次都到本单位资料室或厂档 案室借阅资料,由于图纸数量巨大,工程人员在查找使用这些图纸时非常不 方便,从而降低了工作效率,也很难发挥出它应有的作用 7 1 。 随着油田数字化进程的加快,亟需这些作为深入应用基础数据的矢量化 的测井信息。但测井曲线解释成果图绘制在纸上,对其进行进一步分析和应 用只能停留在手工观察的层次上,实际的应用很难进行。因此有必要将图纸 进机,建立测井曲线的数据库,便于曲线形态的反演及应用计算机进行分析。 同时由于纸质测井解释成果图数量庞大,十分不利于保存,由于时间及人为 等原因,有很多图纸遭到了不同程度的损坏。如果能在保证精度的条件下, 完成图纸进机,就可以解决图纸的保存问题,并切实地保证了数据的不丢失。 综上所述,研究测井图纸矢量化的方法在以下三个方面对油田具有重大意义。 l 、降低管理成本、延长保存期限。 2 、提高利用效率和科研生产水平。 3 、进一步推进测井数据库建设,实现测井数据的资源共享,提高工作效 率和工作质量,推动油田数字化发展。 实际上不光石油地质行业将信息存储在图纸上,生物医学、地震等行业 中,都可能将数据保存在图纸上。对于该技术的研究不仅可以解决石油地质 领域纸质图纸信息的矢量化,在生物医学、建筑、服装、地震等行业中,都 有借鉴意义。如果能将其中的有用信息变成矢量化数据进行存储,就可以方 便地实现这些资源的查询、导出、再利用、信息共享和交流,为将来实现全 自动的数据分析做好准备。因此该项技术的研究具有非常广泛的应用价值。 哈尔滨工程大学硕士学位论文 1 3 国内外研究现状 图纸矢量化技术是近年来发展起来的具有重要应用前景的图像处理新技 术,它能够自动扫描图纸并将其转变成规范化的格式。通过将直观而缺乏逻 辑性的大量点阵数据转化成少量的比较抽象而富于逻辑性的图形数据,从而 大大减少图纸更新和维护耗费的人力资源,而且更加便于存储、修改、查询 和复用,具有很高的研究价值和广阔的应用前景。 1 3 1 工程图纸矢量化的发展状况 工程图纸矢量化的研究是从7 0 年代开始的,最初的应用范围很窄,主要 处理地图和电路图,方法单一,通常采用细化算法或轮廓检测算法加以简单 的线条拟合得到矢量化结果。贝尔实验室在7 0 年代中期开展了对逻辑电路图 矢量化的研究;在国内,清华大学的博士生俞斌在8 9 年以逻辑电路图为应用 背景进行了基于b a g 数据结构的图纸矢量化的研究;中华测绘研究技术服务 公司也对地形图图形数据的图纸矢量化问题进行了探讨。9 0 年代是矢量化研 究的高潮,针对图纸矢量化技术的研究较多,成立了一些专门性的组织并召 开了一系列国际会议,提出了一些矢量化的算法,如有向边界法、线条轮廓 跟踪法等。 现在,矢量化已经广泛应用在很多领域,如地理信息系统g i s s l 【m 1 、工 程业1 ( l 、房地产业0 5 1 1 6 i 、乃至服装制造业【1 7 l 。工程图纸矢量化研究较多 针对机械图、电子图和建筑图,已经提出了多种矢量化方法,也出现了一些 商品化的矢量化软件,如德国s o f t e l e c 公司的v p s t u d i o 、挪威r a s t e r e x 公司 的r x s p o t l i g h t 、美国g t x 公司的g t x r a s t e rc a d 儿晒等等。现有方法的普 遍缺点是精度和速度不高,对噪音、缺损敏感等,尚不能满足工程自动化的 需要。因此,图纸矢量化研究仍然是模式识别领域中的一个热点。 1 3 2 测井图纸矢量化的发展状况 由于图纸矢量化研究开展的较晚,成型的高效产品不多,大多是针对某 4 哈尔滨工程大学硕士学位论文 种特定类型的图纸的实验系统或试销产品。目前对图纸矢量化的研究主要针 对电子线路图、机械工程图、建筑设计图及地形地貌图等工程图纸,而针对 测并解释成果图的处理研究的不多。为数不多的测井数字扫描系统,经试用 跟踪效果并不理想,速度也不是很快。 在国内,能对测井曲线进行自动提取的应用软件非常少,仅有清华大学 自动化系有该方面的研究,其研究侧重于彩色曲线的提取。根据从测井公司 了解到的情况,需要矢量化的图纸基本上都是过去十几年甚至几十年前的图 纸,这些图纸以单色调的蓝图居多,而彩色图较少,因此需要有能够处理此 类图纸的应用软件。 原石油部也就是现在的石油天然气总公司,曾经从国外引进并在国内推 广过一种基于l a g 数据结构的测井曲线跟踪软件。该软件只能处理单一的、 绘制在标准坐标图纸上的测井曲线解释成果图,缺少通用性,对众多的其他 类型的图纸无法识别。该软件可以跟踪那种测井曲线与背景反差较大( 曲线灰 度值比网格、背景以及噪声等的灰度值都大) 的简单的曲线,并先后经过清华 大学、哈尔滨工程大学的师生对其跟踪结果进行了一定的修改和处理,但效 果还是不够理想,而且还要求图纸比较完整清晰,对扫描仪器的要求也很高; 之后大庆石油学院李春生教授及几位老师带领他们的学生又对处理结果进行 了进一步校正,经过几年的努力,效果还是基本可以达到用户的要求的。 近年来四川大学图像信息研究所也在原石油部推广的软件的基础上开发 出了测井曲线矢量化软件,据其宣传也基本能够处理简单的测井曲线。但这 些只是针对特定的一类曲线,是测井曲线中最简单的一类,各个采油厂都存 有大量的种类繁多的测井曲线( 据统计有1 0 0 多种) ,如何处理各种各样的测 井曲线,并提供一种行之有效的跟踪方法的框架,将是油田技术人员最希望 解决的问题。 国外测井曲线矢量化软件中最著名的是n e u r a z o g ,其软件在处理过 程中,遇到连续曲线和其它曲线交叉时,停顿比较频繁,经人工干预后才能 继续跟踪;对于虚线,则完全依赖于操作人员手工的逐点点取。该软件人机 哈尔滨工程大学硕十学位论文 交互性好,能实时显示,曲线的提取精度高,曲线文本信息的录入方便。但 该软件在跟踪的基础上没有充分利用曲线自身的各项信息,导致背景对曲线 识别产生了非常大的影响,而且该系统价格非常昂贵。 1 4 论文研究思路 测井图纸中的信息分为文字信息与图形信息。文字信息可以采用手工录 入的方法存储,所以本文不再进行详细论述;图形信息包括曲线、曲面和网 格等信息,对这些信息的识别是本文考虑的重点。 从用户的角度来看,本文研究的矢量化过程如图1 2 所示- o 图1 2 测井图纸矢量化示意图 从实际应用的角度考虑,图纸的情况千差万别,其中的曲线类型更是多 种多样,如果对于每一种不同的图纸或曲线都采取不同的方法进行处理则工 作量过于庞大,无法实现。但是单从图纸的类型出发,可以将图纸简单划分 为计算机清绘图纸和蓝晒图纸两大类。如果针对这两种不同类型图纸的特点 6 哈尔滨工程大学硕士学位论文 设计有效的预处理方法,使得处理过的图纸具有相同的效果,再使用一种统 一的方法来跟踪不同类型的曲线,则工作难度将会大大降低。本文的研究思 路即首先针对计算机清绘图纸和蓝晒图纸的特征设计出不同的图纸预处理方 法,使处理过的图纸效果达到曲线跟踪算法的要求,再利用一种统一的算法 对不同类型的曲线进行跟踪,达到识别图纸信息的目的。在复用图纸的时候 可以将识别过的信息按照图纸反演的算法重新绘制出来。 1 5 论文结构 第1 章从论文研究的背景入手,介绍课题研究的目的意义、国内外研究 现状及论文的组织结构。 第2 章对计算机清绘图纸中的网格识别问题进行研究。网格是用来定位 的重要信息,对其进行识别的效果将直接影响到图像重建及信息校正等一系 列问题,另外对背景网格的识别有利于排除网格对于曲线跟踪的干扰。本文 从频域与空域两个方面入手,根据不同的处理需要讨论各种算法的差异,并 且采用“基于阶跃点定位的十字模板匹配法 ,有效地解决了网格的消除与提 取问题,为后续曲线跟踪提供了方便。 第3 章主要探讨早期蓝图的预处理方法。蓝图的处理区别于计算机清绘 图纸的特征在于其背景与前景对比度小,噪声影响大。由于蓝图的图纸情况 复杂,识别率低,对其矢量化一直是个难题。本文针对蓝图的特点提出了“生 成背景法,有效分割了蓝图的前景与背景,为蓝图的处理打下了基础。 第4 章在前三章的基础上对于经过预处理的图纸中的曲线信息进行跟 踪。在研究了行相邻图l a g 结构的基础上设计了一种由局部到整体的曲线跟 踪算法“扩散法”,利用该算法可以将测井曲线快速地自动识别和提取出 来,实现了对各类型曲线的跟踪。 第5 章介绍图纸反演。图纸的反演是图纸复用、自动理解等应用的基础。 本章将介绍三种不同方式的反演及其实现,主要涉及到图纸压缩保存、定位、 曲线校正等技术。 7 哈尔滨工程大学硕七学侮论文 第2 章清绘图纸网格识别技术 2 1 引言 对于计算机清绘图纸来说,图纸比较清晰,背景与前景信息之间的对比 度较大,其中唯一的干扰来自背景网格。由于网格与曲线的频繁交叉可能会 使后续的曲线跟踪工作受到影响,因此有必要首先将网格识别出来并将其消 除掉,这一方案符合信号处理的经典方法,即先对带有噪声的信号进行滤波 处理,最大限度地削弱噪声,然后再对信号进行恢复和提取。 本文从频域与空域两个方面入手根据不同的处理需要讨论各种算法的差 异,并且采用了“基于阶跃点定位的十字模板匹配法”,从而有效地解决了网 格的消除与提取问题,为后续曲线跟踪提供了方便。 为了方便分析与对比,本章的算法验证均采用同一幅包含曲线与网格的 5 1 2 x 5 1 2 大小的图纸局部截图为例,如图2 1 所示。 8 “”2 1 ”“”。鼍“”。、 1 一一1 翻嗣鞠霹w # z 弼_ 、 之 f 、 , j 、 , 图2 1 用于网格识别的图纸局部 8 哈尔滨工程大学硕士学位论文 2 2 基于二维傅立叶变换的网格消除 2 2 1 二维傅立叶变换 傅立叶变换是线性系统分析的一个有力工具,它使我们能够定量地分析 诸如数字化系统、采样点、电子放大器卷积滤波器等的作用。把傅立叶变换 的理论同其他物理解释相结合,将有助于解决许多图像处理问题。 考虑到图像是二维的信号,因此需要讨论二维傅立叶变换,二维傅立叶 变换的正、逆变换公式如下: ,们:广r,y ) j 2 a ( u x f ( uf ( x e - j 2 a ( u a + v y ) 出咖( 2 1 ) ,力= li ,y ) 出砂 ( 2 - 1 ) 。 ,) :rr r ( u , v ) p d 2 a ( u x 圳(2-2f(x yf ( u d u d v 2 - 2 ) ,) = i ) p 州 () 对于m n 数字图像阵列f ( x ,y ) ,0 x m 和0 ysn ,由于f ( x ,y ) 是离散的,所以在变换时采用二维离散傅立叶变换,其形式定义为: f ( u ,1 ,) = 厂( x ,y 弦叫2 州脚p 叫2 州m ( 2 3 ) x = oy z o f ( x , y ) = 击萎丢凡咖“2 州川“2 州m 哕( 2 - 4 ) 在数字图像处理领域中,f ( x ,y ) 可以用来表示一幅图像,而f ( u ,v ) 就表 示该图像的频谱。二维离散傅立叶变换的频率谱、相角和能量谱与二维连续 傅立叶变换的形式类似,只是独立变量是离散的。 因为傅立叶变换后,时域与频域形成了对偶关系,因此通过傅立叶变换 也可以达到简化某些运算的目的。另外,经过傅立叶变换之后,可以获得原 图像信号的频域分布情况。由于图像中不同特性的像素具有不同的频域特性, 因此。可以在频域上设计相应的滤波器,以达到滤除某些信息,或者保留某 些信息的目的。 在实际处理中,可以用“低频部分反映图像的概貌,高频部分反映图像 的细节”来总结频域上的信息强度与空域上的像素特性之间的关系。根据这 一对应关系,可以利用傅立叶变换获得图像的幅频特性,并进而实现图像的 滤波处理。 晗尔滨工程大学硕士学位论文 2 22 基于二维傅立叶变换的网格消除 通过对如图2 1 所示的局部测井曲线图纸的观察不难发现,需要消除的 背景网格主要是一些规则的矩形方格,这些矩形方格是由一系列水平和垂直 方向的直线按等距离平行交叉得到的,从信号处理的角度来看这些平行线交 织在一起形成类似方波的信号,由此推断网格信息属于变化平缓的内容,其 频谱的特征应该是能量主要集中在低频。如果对这种包含有矩形方格的图纸 扫描图像进行傅立叶变换,其结果将是在中央呈十字形的频谱,而中央的这 个十字形区域恰好是频谱中的低频部分其中包含着网格信息。如果这个推 断是正确的,那么对其频谱做高通滤波,然后做傅立叶反变换,就可以将网 格噪声滤去。 为了验证网格信息属于低频的推断,我们以图21 为例,对其进行二维 傅立叶变换,得到如图2 2 所示的频谱。滤除其中的高频部分只保留中央的 十字形低频部分,然后进行傅立叶反变换,效果如图2 3 所示。 图2 2 频谱示意圈 哈尔滨工程大学硕士学位论文 图2 j 低频段反变换效果图 从图中可以看出频谱低频段中确实包含着网格信息,另一方面由于曲线 的形态在图中极为模糊,可以断定曲线信息只有很少部分处于该频段之中。 这样一来,从原图中除去低频信息不会对曲线造成较大影响但却可以将网格 消除掉。由于变换后废度发生了变换,因此不能简单地将图23 所得到的结 果与图2 - 1 进行相减操作消去网格。 本文在验证丁前面的推断后是采用高通滤波的方法来消除网格的。以图 2l 为例,对其进行二维傅立叶变换可以得到如图2 2 所示的频谱图像。该频 谱图像的中央较为明亮的十字形区域即为包含网格信息的低频频段。选择合 适的窗口大小对该频谱做高通滤波处理,从中滤掉该十字区域中的低频分量, 然后作反变换恢复原始图像,如图2 4 所示。此时可以发现原图21 中的网格 线被消除掉了,但是由于频率变换和滤波本身会引入一些混迭效应,反变换 后的图像中有大块的灰色区域,另外图像的清晰程度受到了影响。为了方便 后续的矢量化工作,本文采用二值化的方法增强其效果,二值化后的效果如 图25 所示。 图2 4 经过高通滤波之后的图像 o ! 。: : 一 1 2 、罗0 。 哈尔滨工程大学硕士学位论文 通过实验验证可知,基于二维傅立叶变换的网格消除方法可以消除图纸 中的背景网格线,但其对于网格的交叉点的消除效果并不理想,必须再经过 一次空域滤波才能将交叉点去掉。另外滤波窗口的选择目前还没有一个统一 的标准,只能依靠经验选择,滤波窗口越大网格滤除效果越好,但曲线信息 的损失也就越大,而且混叠现象也越严重。 基于二维傅立叶变换的网格消除方法的优点是对背景网格的依赖性不强, 一般不会损失曲线信息。由图2 4 可以看到,由于滤波消除了低频分量,反变 换后网格线已经被去掉了。但是由于频率变换和滤波本身会引入一些混迭效 应,反变换后的图像会有大块的灰色区域。其缺点是由于做了空间变换,算 法运算量比较大,速度慢;且图像长宽须为2 的整数次幂,才能进行快速傅 立叶变换,这种处理具有特殊性,不是普适算法。 2 3 空域网格识别算法 空域网格识别算法从网格的空域特征入手,直接对图像进行处理,而不 进行频域的变换,即直接对读入到计算机内的二维数组进行处理,以达到识 别并消除网格的目的。由于空域算法直观、简单并且易于实现,因此当前的 网格识别算法研究多集中于此,如从图像全局出发考虑的投影法、针对网格 线的直线特征进行识别的h o u g h 变换法和基于击中击不中原理的十字模板 匹配法等 3 2 1 ”1 。 本章将会在介绍两种常规算法一“阶跃点法 和“直线模板匹配法” 的基础上,结合这两种算法的优点采用“基于阶跃点定位的十字模板匹配法” 弥补这两种算法中存在的不足。 2 3 1 阶跃点法 所谓“阶跃点”即是在横向或纵向扫描图像时,灰度梯度较大的目标区 域边界点。如图2 6 所示,纵向扫描线s 1 和各个横向网格线g 1 g 4 的交点 c 1 c 4 都是“阶跃点”。在实际的图纸中,尤其是扫描图纸中,对于一条直 线进行像素扫描时,“阶跃点 应该是成对出现的。 13 哈尔滨工程大学硕士学位论文 ;s l ; g 1 - 1 卜- - - 一 c 1 ; g 2 _ i 卜一 c 2i g 3 - 卜- - - - - - 一 c 3 ; g 4 - - - - 1 - - - - - - 一 c 4i ; v 图2 6 阶跃点示意图 在测井图纸中,对同一条曲线定位的所有网格大小是不变的。在使用“阶 跃点法”的时候,首先对需要进行网格识别的区域分别按照横向和纵向扫描; 在扫描过所有行和列的基础上,对行和列中的所有间距小于某一阑值的“阶 跃点之间的距离取平均值可以得到网格线的宽度;对所有间距大于某一阈 值的“阶跃点之间的距离取平均值可以得到网格线之间的跨度。由于网格 区域是一个矩形区域,所以只要能够定位该矩形区域的边界,就可以从边界 网格线开始,根据计算出来的网格线宽度和网格线跨度来定位其他网格线了。 因为相互平行的网格线即使在图纸倾斜的情况下仍然是平行的,所以该 算法具有不受图纸倾斜影响的优点,另外利用“阶跃点法”计算网格跨度之 后只要找到横向和纵向两条边界网格线就可以定位所有的网格线了,计算简 单易于实现。但是由于该算法中没有检查定位是否准确的机制,因此在计算 网格跨度的过程中一旦引入误差,则该误差将会随着定位网格线的增多而累 积进而导致整个网格识别算法的失败。 2 3 2 十字模板匹配法 观察测井图纸,在网格背景中存在很多横线和纵线交叉的点。如果能够 准确找到这些交叉点并把它们连结起来,那么就可以将网格线消除干净了。 为了寻找交叉点,预先定义一个十字形模板,由击中击不中原理搜索图中网 1 4 哈尔滨工程大学硕士学位论文 格区域。设定阈值f ,当相关性大于阈值时,认为搜索到交叉点,这些区域 就是交叉点所在的区域。击中击不中运算相当于一种条件严格的模板匹配, 它不仅指出被匹配点所应满足的性质,即模板的形状,同时也指出这些点所 不应满足的性质,即对周围环境背景的要求。 首先简单介绍一下击中击不中变换( h i t m i s s t r a n s f o r m ) 3 4 1 。击中击不 中是一种数学形态学算子,可以用它来匹配局部结构单元,是一种模板匹配 的变形。利用它可以找到特定形状( 如拐角和边界) 的模式。一般来说,物 体的结构可以由物体内部各成分之间的关系来确定。为了研究物体的结构, 可以逐个地利用各种成分对其进行检验,判定哪些成分在图像内,哪些在图 像外,以此确定图像的结构。 给定图像x ,不相交集合对s ( s ,s ,) ,即: s ,us ,= s ,s ,ns ,= o ( 2 5 ) 则击中击不中变换定义为: xp s = 和is x 且s 2 x c ) ( 2 - 6 ) 其中x c 表示x 的补集,s 称为“击中”结构单元,依赖于目标物体;s ,称 为“击不中”结构单元,与背景有关。根据以上原理设计十字模板,“十字 形为击中模板,“十”字形的四个角为击不中模板。 图2 7 十字模板示意图 首先在图像上寻找十字形交叉点。击中模板用于检测在上下左右四个方 1 5 哈尔滨工程大学硕士学位论文 向上是否分别存在目标点,如果四个方向上目标点的个数都能落入某一个阈 值范围内,则认为击中,否则认为击不中,即失败,那么不再进行下一步击 不中模板的匹配测试。如果击中测试成功,那么我们则进行击不中的测试。 在这里,我们将对右上角,左上角,左下角,右下角用击不中模板进行匹配。 即检测这四个角是否是不存在目标点,如果四个角各自的目标点数都落于某 一阈值范围内,即目标点数非常少或没有,则认为击不中模板匹配成功了。 当击中模板和击不中模板同时满足阈值条件时,就认为找到了网格交叉点。 但由于曲线和网格线也有交叉,可能会把这些交叉点误定为网格交叉点,影 响正确辨识率。另外,模板长度和击中击不中阈值的确定要靠经验得到,仍 然缺乏普适性。 2 3 3 基于阶跃点定位的十字模板匹配法 通过前面的介绍可以看到“阶跃点法 和“十字模板匹配法”都各自存 在着不足。“阶跃点法”计算简单但是会出现误差累积,难以准确定位网格; “十字模板匹配法”虽然可以准确定位网格,但计算量大,又没有可以参考 的模板长度。本文将在这两种算法的基础上介绍一种新算法一“基于阶跃 点定位的十字模板匹配法”,将两种算法结合起来,用它们各自的优势来弥补 对方的劣势,利用“阶跃点法”计算简单的特点来简化“十字模板匹配法”, 同时利用“十字模板匹配法 准确定位的特点消除累积误差对“阶跃点法” 的影响。“基于阶跃点定位的十字模板匹配法”的原理如图2 8 所示。 “基于阶跃点定位的十字模板匹配法主要识别横向与纵向网格线相交 所形成的网格交点,将网格交点连接起来即可形成整个网格。在识别网格时 首先按照“阶跃点法的原理对需要进行网格识别的区域分别按照横向和纵 向扫描,根据灰度跳变点之间的距离计算出该区域的网格线宽度和网格跨度; 然后在该区域中找到横向和纵向的边界线并由此定位网格区域的顶点;在搜 索网格交点时,从区域顶点出发,按照网格跨度的大小定位到下一网格交点 最可能出现的位置,以该位置为中心确定一个搜索范围,在搜索范围内利用 1 6 哈尔滨工程大学硕士学位论文 “十字模板匹配法”匹配到欲搜索的网格交点。因为有了“阶跃点法”的定 位保证,所以匹配过程中只须验证模板的击中即可:然后根据新搜索到的交 点确定下一个交点;每行的第一个交点按上一行与之同列的交点以相同原理 确定, 横向边界 _磷i 网恪跨度、_ 纵向阚恪跨度 l_ 州格线宽度 _l- _l 【2 髓h 网恪踌腰 - i l _ 】,:纵“网格跨度i i 一一1 一一:f 网恪线霓发 网格线 口 网格交痔 一 十字模扳 圈2 8 “蓦于阶跃息定位的十罕模板匹配_ i 去”原理图 以图2 8 为例,假设己经定位了网格交点爿( y ) ,如果要搜索与其相 邻的网格交点b ,则从a 点出发定位到点b ( 如,y 日) 其中, x8=xj ( 2 - 7 ) y 。= y 。+ 横向网格跨度+ 3 2 网格线宽度 ( 2 - 8 ) 然后以占点为中心确定一个如图2 8 中虚线所示大小的搜索区域,在该区域 中利用图示大小的“十字模扳”匹配到距离b 点最近的网格交点。为了验证 晴尔滨工程大学硕士学位论文 该算怯的性能,本文利用“基于阶跃点定位的十字模板匹配法”对图2 1 所 示图像进行了网格识别,效果如图29 所示。 ,) 、 、 f 、) l 7 : 、 j f 图2 9 * 基于阶跃点定位的十字模板匹配法一效果图 “基于阶跃点定位的十字模板匹配法”利用“阶跃点”进行定位,减小 了搜索范围并将十字模板简化为一个击中模板,降低了计算量;利用“十字 模板”确定网格交点的位置,使识别更加准确;另外每次以新确定的交点为 基础搜索下一个交点,避免了累积误差造成的定位错误。 2 4 本章小结 本章从频域与空域两个方面入手研究,在频域中利用网格的低频特征采 用二维傅立叶变换的方法得到图像的频谱,并通过“高通滤波”的方法消除 了网格。在空域中,本章首先讨论了“阶跃点法”和“十字模板匹配法”并 且分析了这两种算法的优缺点,在此基础上提出了“基于阶跃点定位的十字 模板匹配法”,将两种算法的优点结合起来,弥补了原有的不足,从而有效地 解决网格的识别问题,为后续的曲线跟踪提供了方便。 哈尔滨工程大学硕士学位论文 第3 章蓝图预处理技术 3 1 引言 在计算机清绘图纸出现之前测井曲线是绘制于蓝图之上的。在蓝图中前 景信息与背景信息之间的对比度小,识别难度大。因此在矢量化这种类型的 图纸时必须首先经过预处理,使之达到矢量化算法的要求。一般采用的预处 理包括二值化处理和去噪处理,该过程的效果将直接影响整个矢量化过程的 结果。其中二值化处理的目的是分割图像的前景与背景,用只有黑白两种颜 色的极端情况使前景与背景之间的对比度达到最大。 测井工程图纸一般幅面宽达8 0 c m 左右,长度为几十厘米到几米甚至几 十米,如此大幅面的图纸经过长时间的保存之后常常会出现由于光照、腐蚀、 潮湿、人手摩擦、断裂修补等原因而造成的褪色、变色、变形等退化现象。 目前许多陈旧图纸存在严重退化,特别是对于蓝底图纸,采用经典的“大津阈 值法”使用单一阈值进行二值化,一方面可能使大量信息丢失,另一方面分割 出来的信息往往粘连在一起模糊不清,给后续文字、符号和图形的提取、分 类及识别带来较大困难。 针对这一情况,本文提出了一种有效的方法实现退化图纸的前、背景分 割,为进一步分析测井工程图纸提供了方便。下面首先分析了经典的“大津阈 值法”并给出其效果,通过其与本文方法的对比可以看出本文方法在分割退化 测井工程图的前景、背景方面的优越性能。 3 2 “大津阈值法”求解分割阈值 3 2 1 “大津阈值法 “大津阈值法”是1 9 8 0 年由日本的大津展之提出来的。“大津阈值法” 的基本思想是:把灰度直方图在任意一个灰度值处分割成两组,求此时分得 的两组间的方差值;对所有灰度值都进行这个操作,其中取得最大方差值的 1 9 哈尔滨工程大学硕士学位论文 灰度值即为目标灰度阈值。该方法是基于“类间距离最大准则”的,同时也 可以证明是基于误分概率最小准则的。它可以在直方图无明显双峰时也可以 得到满意的结果。 下边给出“大津阈值法”的计算公式: 设一幅图灰度值为l 所级,灰度值珀勺像素个数为。则总的像

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论