(通信与信息系统专业论文)图象识别在彩色印刷质量检测中应用的研究.pdf_第1页
(通信与信息系统专业论文)图象识别在彩色印刷质量检测中应用的研究.pdf_第2页
(通信与信息系统专业论文)图象识别在彩色印刷质量检测中应用的研究.pdf_第3页
(通信与信息系统专业论文)图象识别在彩色印刷质量检测中应用的研究.pdf_第4页
(通信与信息系统专业论文)图象识别在彩色印刷质量检测中应用的研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 。计算机图象识别属于模式识别,是一门新兴的学科,具有广泛的应用前景。 近年莱,随着对此技术不断增长的需求以及计算机、数字信号处理、图象处理、 数字成像等技术的进步,促使其得到了迅速发展,且可实际应用的领域也越来 越拓宽,成为目前热点研究课题之一。寸 本文全面阐述了受鱼印刷品质量的自动检测。对颜色的阙值选取进行了分 析,并把计算机的自动识别和理解图象等计算机图象处理技术应用到彩色印刷 品质量检测中。 本文完成的主要工作如下: 1 对彩色色度闽值选取进行研究,并得出满意的结果。 2 利用计算机图象处理中的模式识别、图象分割和边缘提取等技术对彩色 印刷品进行质量检测的算法进行研究。 3 对彩色印刷品质量进行计算机自动检测的硬件平台进行了研究,并建立 了硬件平台。 4 按照设计的算法编制了彩色印刷品质量检测的程序软件。 在硬件平台上,我们对彩色印刷品进行了质量检测的实验,结果达到了与 设计相符的满意的效果,证明硬件调试平台设计合理、采用的算法和程序正确 有效。又 差健遢。数据采戴套色精度、色度、闽值图象分害模式识别_ 特征提取 a bs t r a c t c o m p u t e ri m a g er e c o g n i t i o nb e l o n g s t op a r e mr e c o g n i t i o n i t sa n e w l ye m e r g i n gb r a n c ho ft e c h n i q u ea n dh a s aw i d es p r e a da p p l i c a b l e p r o s p e c t s r e c e n ty e a r s w i mt h e i n c r e a s i n gr e q u i r e m e n t s f o rt h i s t e c h n i q u ea n dt e c h n i c a lp r o g r e s s o fc o m p u t e r , d i g i t a ls i g n a lp r o c e s s , i m a g ep r o c e s sa n dd i g i t a lp i c t u r e a l l t h e s ea c c e l e r a t e dt h e r a p i d d e v e l o p m e n tf o rt h i st e c h n i q u e t h ep r a c t i c a la p p l i c a t i o nf i e l d sa r ew i d e r a n dw i d e ra n di th a sb e c o m eo n eo f t h ea c t i v es t u d ys u b j e c t s t h i sp a p e rp r e s e n t e da no v e r a l li n t r o d u c t i o no fc o l o rp r e s sq u a l i t v a u t o m a t i cc h e c k i n g ,a n a l y z e dt h em e t h o do fs e l e c t i o nf o rc o l o rt h r e s h o l d v a l u ea n d 印p l i e dc o m p u t e ri m a g ep r o c e s st e c h n i q u e ,s u c ha s :t m a g e a u t o m a t i c r e c o g n i z i n g a n d u n d e r s t a n d i n g i n t oc o l o r p r e s sq u a l i t y c h e c k i n g t h i sp a d e rm a i n l yf i n i s h e dt h ef o l l o w i n gw o r k s : 1 s t u d y i n gt h em e t h o do fc o l o rt h r e s h o l dv a l u es e l e c t i n ga n dg e t t i n ga s a t i s f y i n ga p p l i c a b l et h r e s h o l dv a l u e 2 u s i n gc o m p u t e ri m a g ep r o c e s st e c h n i q u e :p a t t e r nr e c o g n i t i o n ,i m a g e s e g m e n t a t i o na n de d g ee x t r a c t i o n t om a k ead e e p 咖d yf o rt h e a l g o r i t h mo fc o l o rp r e s sq u a l i t yc h e c k i n g 3 m a k i n gas p a d yf o rh a r d w a r ep l a t f o r mo fc o l o rp r e s sq u a l i t yc o m p u t e r a u t o m a t i cc h e c k i n ga n d s e t t i n gu pa h a r d w a r ep l a t f o r l n 4 a c c o r d i n gt ot h ea l g o r i t h m ,p r o g r a m m i n gs o f t w a r ef o rc o l o rp r e s s q u a l i t yc h e c k i n ga n do p e r a t i n gi to nt h eh a r d w a r ep l a t f o r m k e yw o r d s :d a t ac o l l e c t i o n ,d o u b l e c o l o rp r e c i s i o n ,c h r o m a ,t h r e s h o l d v a l u e ,i m a g es e g m e n t a t i o n ,p a t t e r nr e c o g n i t i o n ,f e a t u r ee x t r a c t i o n 麟c | | 裟曼嚣鼬 一鬻豫瓣忠 鎏一 一一 壹喜砻l 删霉 图象识别在彩色印刷质量检测中应用的研究 第一章绪论 印刷生产的现状 印刷业有悠久的历史,在越来越重视信息、文化的今天,印刷品在人们的 生活中占据着重要的地位,它的质量也在不断提高。如果说活字印刷是古代印刷 史上的一大创举,彩色印刷就是近代印刷业的一次革新。它生动、美丽、给人鲜 明印象。随着技术、经济的进步人们对彩色印刷质量有着越来越高的要求。如 何使颜色更逼真,并且在无数次的印刷中保持一致,是所有印刷厂头痛的技术问 题。 印刷过程是一个复杂的过程,其中包括一系列工序,如纸张的供给;油墨 及其辅料的供给;印刷品的验收及包装等。最终成果是要获得优质的印刷品。 印刷生产过程的特点是其物理化学过程的多样化,它形成一个工艺过程的 长链。原始印刷材料( 纸、硬纸板、油墨等) 的特点是几何和物理机械参数的极 大的不稳定性,在很大程度上,这些参数依外部条件而变动。这种情况就可能导 致印刷品参数的极大偏离。为了得到合格的最终产品,工艺过程的中间参数应当 保持在一个足够小的范围内。所以,印刷生产的一个重要特征就是,必须按照给 定的规律改变很多工艺过程参数或以规定的精度把它们保持在给定的水平上。 目前,印刷技术所处的状态是需要准确而又迅速的控制各种工艺和生产过 程。这首先要求生产过程中的各种参数尽量恒定,或者以某种确定的规律改变。 例如在轮转印刷机中,为了得到高质量的印刷品,在机器的整个运行过程中应 考虑卷简的直径不断变小的因素,以保证纸带进入印刷设备时的张力恒定不变。 而在轴制动的情况下,如果没有调节器,张力可以变化几倍。除此之外,卷 简形状的不规则或者其圆心不在旋转轴上的情况都会使张力产生波动,造成印刷 品质量的下降。 可见,印刷工业中存在着诸多问题,面f 临当前印刷速度越来越快,印刷质 量要求越来越高,人工检测也越来越不可靠的现状,印刷业呼吁自动检测的实现。 二二研究内容及技术难点 我们的研究题目是对烟标做印刷质量自动检测。基于印刷过程的复杂特性, 急需对其进行准确的、有效的控制。而对印刷过程的控制,首先要将印刷过程调 节到最佳的工作条件,以便获得高质量的印件,而后再在批量印刷的过程中保持 所有烟标的一致性。 1 、烟标的特点 目前,烟标的印刷是采用高速凹版滚筒印刷,每秒印刷3 米,每卷印刷纸 长为2 万米,宽6 3 厘米。由于每个烟标宽l o 厘米,长2 0 厘米,可以同时印刷 六组烟标。这样在印刷纸的两端都有l5 厘米的富余白边,现在烟厂在这两个白 边上印刷了一些定位套色标记来检测套色精度。 在印刷时以白色为底版,以红、黑、金三色模板依次对流水线上的传输 纸带进行套印。这个项目具有如下特点: ( 1 ) 整个检测图象中仅有黑、白、红、金四种颜色,即在做识别分类时只需 考虑这四个样式库。由于是采用覆盖式套色,该图象不含有纹理特征,无须保存 渐进色信息,属于简单图象。 ( 2 ) 纸带传输方向与传输速度均由设备确定,印刷过程中基本保持不变,可 基本实现同步。 图象识别在彩色印刷质量检测中应用的研究 一 ( 3 ) 考虑到实际工程需要需给予适当的容错范围。厂家要求精度警到0 2 毫米,、面对于小于0 2 毫米的错误忽略不计。由采样定理而知,采样精度必须为 0l 毫米。 2 、厂家的检验要求 烟厂根据多年来印刷经验指出可能出现的印刷质量问题: ( 1 ) 纵向套色不准。 ( 2 ) 由于颜色不均而引起的色饱和度的变化。 ( 3 ) 可能在一种版上粘上另一种颜色,从而在印刷品上出现明显的瑕疵 根据这些质量问题,厂家提出了以下的质检要求: f 1 ) 纵向套色的自动检测。 ( 2 ) 印品颜色饱和度检测。 ( 3 ) 印品质量的全面检测。 3 、解决问题的难点 为了完成厂家的要求,需要对印刷品质量作实时检测,但由于一幅图象包 含大量的信息,通常用象素作为图象的基本信息单元。处理一帧图象一般就是对 其全部象索点进行逐个处理,且处理过程中的常用算法又往往涉及相邻象索点之 间的运算。因此受目前硬件水平的限制,对整个烟标2 0 c m 1 0 c m 做在线的实时 检测是本方案的难点。 三项目的可行性 计算机图象识别属于模式识别,是一门新兴的学科,具有广泛的应用前景。 近年来,随着对此技术不断增长的需求以及计算机、数字信号处理、图象处理、 数字成像等技术的进步,促使其得到了迅速发展。为了完成彩色印刷品质量自动 检测就可以采用计算机图象识别技术。 在前期准备工作中,我查阅了大量资利,并了解了目前印刷厂的生产状况, 发现国内至今没有印刷品自动检测设备。这一方面是由于技术问题,过去没有高 性能的摄影机和处理速度足够快的计算机。二是出于经济效益考虑,印刷品价值 低,设备自动化所需的花费高过生产废品价值许多。现在,随着集成化程度的提 高,摄象机和计算机价格在降低。厂方经过预算认为,对某些高档次香烟烟标实 现自动检测,是有经济效益的,所以才开展这方面的研制开发。 针对烟标质量检测的特点和现有的硬件水平,我们将烟标的质量检测分为 两部分进行:一是在线检测:它只对预先在烟标空白边界上印刷的彩色色块( 要 求厂家在印刷时,同时在空白处印刷上一些预先定义的彩色色块) 作检测,判断 色块套色精度、色彩饱和度是否符合标准,并提供必要的信息以便于调节。二是 线下检测:它是在精确保证被测图象位置正确的前提下,对整幅图象做质量检测, 包括着色是否正确,是否出现脏点或漏印,是否出现人为划痕等。 本论文中讨论的检测方法与传统方法不同,也没有类似经验可借鉴,属于 初次尝试,可能有许多不完善的地方,但我认为它是可行的。从某种角度上说, 它的工作原理类似于过去的目视检测方法。为了更直观地说明这种方法,我作了 如下两个框图进行比较。左边的反映了目视检测方法的步骤,右边是自动检测法 的流程,它们是一一对应的。 由图ll 可以看到,我们用“电眼”一摄象机代替了人眼,它准确、快速、 客观,不会疲倦,可以忠实地记录每一帧图象,目前最快的快门速度为十万分之 一秒,可达到实时检测的要求;我们用数据采集卡把每帧图象变成以r 、g 、b 值存储的数据,把数据传给计算机,就象我们目视图象时,视觉细胞感知不同颜 图象识别在彩色印刷质量检测中应用的研艽 色的光。把色彩感觉传给中枢神经;我们用电脑代替人脑,运行预先编制的程货, 对图象数据作分析,得出检测的结果,而不是让人“跟着感觉走”。用这种方法, 我们可以大大提高色度检测的速度和精度,非常有应用价值。 摄象机和数据采集卡属于硬件设备,只要配置得当即可a 主要要解决的一 是计算机根据什么来判断和怎样判断。二是怎样保证摄象机拍摄出正确的图象。 如果做到这两点,应该说这种方法就是可行的。 图il 四、工作原理及系统框图 首先,用摄象机采集图象,并把视频信号输入到图象采集卡;然后在图象 采集卡中实现模拟信号到数字信号的转换,这些数字信号暂时存放在计算机内存 中;最后,计算机处理器调用程序把该图象的数据与已存入的正确值进行比较并 在屏幕上显示结果或者把这些数字信号传输给其他硬件设备而进行对印刷机的自 动调整。该原理框图如下 印 摄图象数 计结 刷 象据采集算 果 品 机机 入视频模捌信号传输数模转拶 訇象处理 图l2 在下面的几章里,我将分别介绍色制系统和色度阀值的选取的研究、硬件 平台设计、在线检测研究、以及全面质量检测研究。 图象识别在彩色印刷质量检测中应用的研究 第二章色制系统和色度阈值选取的研究 利用数字信号处理的方法对彩色印刷品进行质量检测,将遇到的问题之一 就是判断各种颜色的正确性,这就需要确定对应合格颜色的数据范围t 本章首先 介绍常用的色度学系统,然后介绍利用排序法和统计法确定色度阈值的方法。 第一节色制系统的选取 色度学 2 】是对颜色进行测量和确定的一门技术科学,它起源于纺织、印刷 工业、电影工业,又推广至工农业等各个领域。色度学的任务就是用数量化来表 征色觉特性,它涉及光学、光化学、视觉生理、视觉心理等各方面问题,是一门 复杂的边缘学科。 为了客观地测量物体的颜色,人们发明了分光测色仪器和色度计。为了了 解它们的工作原理,我们要知道不同的颜色是怎样形成和被观测的及他们的标定 方法。人们能在自然光和灯光照射下看物体具有不同颜色【3 ,是因为光中含有 不同的光谱成分。当它照射到物体表面上,部分波长的光被吸收,部分被反射, 反射光进入人眼后,被视网膜上含有红、绿、蓝视色素的锥体细胞接收,从而有 了色彩感觉。光的波长不同,引起人眼颜色感觉不同,波长由长到短,对颜色感 觉由红到紫。实验发现任何色光都可以用红、绿、蓝三原色以不同比例配制出 来。红、绿、蓝也称三原色,简称r g b 。对于色度在不同领域的研究和应用, 国际照明委员会( c i e ) 制定了些色度系统。下面介绍几种常见的色度系统。 一r g b 系统 r g b 系统是c i e 于1 9 3i 制定的标准色度系统,它是迄今应用最广泛的色 度系统。 在r g b 系统中,任一颜色可用红( r ) 、绿( g ) 、蓝( b ) - - 原色相加混合出来, 颜色方程为: ( 0 ;r ( r ) + g ( g ) + b ( b )( 1 ) 其中“s ”表示视觉上相等,即颜色匹配。与待测色达到色匹配时所需的 三原色的数量,称为三刺激值,也就是( 1 ) 式中的r 、g 、b 值。一种颜色与 一组r 、g 、b 数值相对应,颜色感觉可通过三刺激值来表示。 在颜色匹配实验中,对应一种波长的单色光可以得到一组三刺激值r 、g 、 b 。对不同波长的单色光做一系列匹配实验,可以得到对应于各种波长单色光的 三刺激值。若将各单色光的辐射能量值都保持为相同( 这样的光谱称为等能光谱) 来做上述系列实验,所得到得三刺激值称为光谱三刺激值,也就是匹配相等能 量光谱色的三原色数量,用符号,耳,b 表示。为匹配波长 的等能光谱色( c ) 的颜色方程为: ( c - ) = ,( r ) + 占( g ) + 占( b )( 2 ) r g b 比例为i :l :1 等量关系时,匹配标准白光。 为了更直观地确定一个颜色,还可以在色度图上用色度图坐标定出它的位 置。在只考虑彩色光度的情况下,起决定作用的是r 、g 、b 的比例关系,而不 是数值大小,所以可令: 4 图象识别在彩色印刷质量检测中应用的研究 月 严瓦i 西 9 2 志g ( 3 ) 置 尺+ + 疗 、7 b = 垒 r + g + b 显然 r + g + b = 1 ( 4 ) r 、g 、b 叫做色品坐标。 因为三个相对色系数和为l ,所以选用其中两个就可表示色度,r g b 色度 图就是用r _ g 直角坐标表示各种色度是所画的平面图形。如图21 1 : 5 氏。 i ( g j 。 4 9 、 8 6 ( b ) iili。4 、 一l 5 一1 o 一0 5 a 6 0 n ,o 5 1 o 1 5 4 5 0 ” 7 0 0 ,。7 a n 图2 1 1r g b 色度图 图中由w - 、【g 1 、【b z 点连成的三角形称为彩色三角形。由三基色混合成 的各种颜色均在三角形内。偏马蹄形曲线是光谱轨迹,曲线边标明了相应波长。 整个自然界的彩色都能用闭合曲线及其内部相应点坐标表示,物理意义清楚。 1 9 3 i c i e r g b 系统的r ,g ,6 光谱三刺激值是从实验得出的,本可以用于色度学 计算,但由于用来标定光谱色的原色出现负值,计算极不方便,因此c i e 推荐 了一个新的国际通用色度学系统一1 9 3l c i e x y z 系统。 二x y z 系统: x y z 系统是在c i e r g b 系统基础上,改用三个设想的原色( x ) 、( y ) ( z ) 建芷的一个新色度图,如图21 2 。 1 9 3 1 c i e x y z 系统较之c i e r g b 系统有以下两点好处: ( 一) 避免了1 9 3 l c i e 。r g b 系统中的r ,g ,b 光谱三刺激值和色度坐标出现负 值。由设想三原色组成的三角形色度图能包括整个光谱轨迹,且光谱轨迹及轨迹 以内的色度坐标均为正值。 ( 二) 规定( x ) 和( z ) 的亮度为0 ,x z 线称为无亮度线,线上各点只代表色度, 但y 既代表色度,也代表亮度,使亮度计算较为方便。 r g b 系统与x y z 系统间可以相互转换,变换矩阵如下: 刚2 7 6 8 9 1 7 5 1 8 10 0 0 045 9 0 7 0 刘0 6 0 1 圈g c5 00 0 0 05 6 5 0 55 9 4 3b , fyi = j j ( ) z o l i 图212x y z 色度图 由图2 1 1 和图2l2 可知,在c i e 色度图上。每点都代表某一确定的颜 色。这个颜色的位置是由一定数量的红、绿、蓝三原色的相加混合来确定的。每 一种颜色在色度图上虽然是一个点,但对视觉来说,当这种颜色的坐标位置变化 很小时,人眼仍然认为它是原来的颜色,而感觉不出它的变化。可见,每一个颜 色虽然在色度图上占一个点的位黄,而对视觉来说,它实际上是一个范围,这个 范围内的变化在视觉上是等效的,我们将人眼感觉不出的颜色变化范围叫颜色的 容差,这是本论文研究问题之一。 三y u v 系统 麦克亚当( d lm a c a d e n ) 在c i e 色度图上不同位置选择了2 5 个颜色点, 确定其颜色辨别的恰可察觉差,实验结果见图2l3 。围绕颜色点的标准差点可 连成一个椭圆形,2 5 个颜色点的椭圆形大小不一,长轴方向不一。也就是说, 图上的色度空间在视觉效果上不是等差的,所以不能正确反映颜色的视觉效果。 由于1 9 3 1 年色度图的不均匀性,在考虑不同颜色之间的关系时,常会给人们造 成错误的印象,似乎图上两个颜色分开的距离是对他们感觉差异的度量。而其实, 在人限辨别颜色不敏感的区域,两颜色坐标点的距离较大,视觉效果可能还很接 近;而在视觉敏感区较近的两点可能已“谬以千里”了。为了克服c i e l 9 3 1 色度图的上述缺点,根据麦克亚当的工作制定了c i e l 9 6 0 均匀色度标尺图,简 称c i e l 9 6 0 u c s 图,如图2l4 ,为工业上大多数颜色检查工作所采用。 图的横坐标u ,纵坐标为v ,可用c i e l 9 3 l 色度图x ,v 坐标转换: u = + 1 5 j ,+ 3 z x + 1 5 j ,+ 3 z 、7 它没有亮度坐标,所以在给h ju ,v 坐标时必须单独注明y 值。 y = 02 9 9 r + 05 8 7 g + 01l4 b ( 7 ) 6 图象识别在彩色印刷质醚检测- i :应用的研究 一一一 在图21 4 中绘出了图2i 3r f2 5 个椭吲,这2 5 个颜色范围虽不是等大的 图形,但已是在一个平面上所能做剿的最均匀的转换。 图213 恰可察觉差椭圆图 o 图2 1 4c i e 9 6 0 u c s 图 四盂塞尔系统 无论是r g b 系统还是x y z 系统,都是基于物理特性的,抽象且不直观的。 在色度学中,颜色的命名是三刺激值:x 、y 、z ;r 、g 、b ;色品、亮度、主 波 等。而通常用金黄、天蓝、桃红:明亮、浓淡等词汇来表示颜色,虽然它们 不如色度学的命名准确,但形象通俗,表达了人们的心理颜色视觉。孟塞尔颜色 系统是从心理学角度,根据颜色的视知觉特p 埘训定的颜色分类和标定系统,目前 己得j :0 广泛应用。 如图2l5 孟塞尔颜色立体示意图和罔2j6 的颜色立体水平剖面图,它把 颜色特性分为亮度、色度和饱和度。立体的r i 】央轴代表亮度等级,白色在项部。 黑色在底部,分0 1 0 共1 1 个等级。块颜色样品离开中央轴的水平距离代表 饱和度的变化,也分为许多视觉上相等的等级,中央轴上饱和度为0 ,离中心越 远,饱和度越大;而颜色立体水平削m ll 的各个方向代表不同色调,圆周上的各 点代表不同色调的光谱色。标定力法是先写出色调h ,然后写亮度v ,斜线后 写饱和度s : hv i s = 色调毙艘饱和度 ( 8 ) 孟塞尔系统的优点就是对人心雕更射感知。 以二是目前常用的色度系统,此外还有沟:多改进型色度系统,如奥斯瓦尔 德糸统,c | e 1 9 7 6 l * a + 空问等,z i ! 此1 i 任赘述。 7 0 o 0 o o o 0 图象识别在彩色印刷质量检测中应用的研究 图2 1 5 孟塞尔颜色立体模型 图21 6 颜色立体剖面图 王i 选择r g b 系统的依据 在众多的色度系统中,经过比较我选择c i e r g b 色度系统。这主要基于以 下原因: 1 、如上所述,r g b 系统形象直观,容易理解。 2 、本论文的程序是在w i n d o w s 环境中开发的。w i n d o w s 环境的图象的基 本格式是b m p 格式,它采用的是r g b 系统,并且在程序运行中文件可以直接 读取r 、g 、b 值运行速度快,适合实时检测。 3 、本论文讨论的是对红、黑、金三色进行检测,选用r g b 系统可以很方 便地设定红色,节约内存空间和处理时间。 4 、由于x y z 系统是为了计算方便设计的,在物理意义上难理解;y u v 系 统适用于彩色电视机【6 】,做图时不直观,故都不宜采用。 第二节b m p 图象文件格式 b m p 图象文件格式【4 】【5 】是微软公司为其w i n d o w s 环境设置的标准图象格 式,而且w i n d o w s 系统软件中还同时内含了系列支持b m p 图象处理的a p i 函 数,随着w i n d o w s 在世界范围内的不断普及,b m p 文件格式无疑也已经成为p c 机上的流行图象文件格式。 b m p 文件格式具有如下主要特点: ( 1 ) 每个文件只能存放一幅图象。 ( 2 ) 图象数据是否采用压缩方式存放,取决于文件的大小和格式,可由用户 根据需要进行选择。 虽然非压缩的b m p 格式的文件所占用的存储空间大于经过压缩处理的文 件,但应用程序对其处理时不必进行压缩与解压缩操作,可以大大提高处理速度。 因为是用来对图象进行实时检测,我选择了非压缩的b m p 格式。 非压缩格式的b m p 图象文件采取一种通用的格式。其结构可分为三部分: 文件头、调色板数据以及图象数据。其中文件头的长度为固定值5 4 个字节;调 色板数据对所有不超过2 5 6 色的图象模式都需要进行设置,但对于真彩色模式, 其对应的b m p 文件结构不存在相应的调色板数据的设置信息。由于摄入图象为 真彩色模式,敌这一项设置不存在。 b m p 图象的数据阵列记录了图象中每一点的象索值,w i n d o w s 处理位图数 据的方式是:从位图的左下角开始,按照由左至右,由下而上的顺序逐行扫描, 并将位图的象素值逐一进行记录,这些记录象索值的字节组成了位图阵列。b m p 图象识别在彩色印刷质量检测中应用的研究 图象存储的排列格式是以图象的左下角为起点存储图象,而不是以习惯中的左上 角为起点。 我在本论文中的所有图蒙都是b m 2 格式。 第三节红、黑、金三利- 颜色色度阈值的设定 一阈值的作用 因为我们要检测的烟标是彩色的,为了得到正确的结果,我们做了大量的实 验。我们通过对合格和不合格的烟标以及其他一些印刷品的检测,结果发现,即 使看上去非常均匀、密实的印刷品,其每个象素r 、g 、b 值也是不同的,甚至 差别很大。这是因为印刷精度远远跟不上摄象机的分辨率,所以不能用某一个或 某几个象素点的值做判断。因此,我将每个色块中所有r 、g 、b 值分别求平均, 用得到的均值作为可判断的标准值。这样,对一帧图象的色度检测就简化成了对 每种颜色三个数值的判断,只要这三个数值在合格阈值内,就表明该颜色色度符 合标准,否则给出出错信息。那么,阈值是怎么设定的呢? 在大多数判断中,只有对或错的区别,正确值只有一个,而在本课题中,“正 确”的概念是一个范围,这是由人眼的特点决定的,在这个范围内,色度的变化 是人的视觉所察觉不到的所以只要样品r 、g 、b 值在这个范围内,就可以认 为是合格的印刷品。这个范围,以数值形式表现,就是闽值。但是每个人的视觉 敏锐度,颜色分辨率和对色差的容忍程度不同,只有通过大量观察者的观察结果, 经过统计分析。才能得到准确和成熟的r 、g 、b 阀值。但由于条件所限,这是 不可能实现的。 虽然没有大量的观察者,我们却有大量的数据可供参考。数据的来源是印刷 合格的印刷品,应该说可以很好地描述标准色度。我们希望通过对数据的分析, 得到在标准色度图象中r 、g 、b 值的浮动范围。在这个基础上,得出色度判别 阈值。我先后采用了两种方法:排序法和统计法。 二用排序法选定阙值 怎样知道样品上红、黑、金三种颜色的r 、g 、b 值范围呢? 仅以红色为例: 首先,我采集了2 0 个正品烟标,把它们分别作成b m p 文件,在显示器上显示。 选择一小块纯正的红色区域( 1 厘米乘l 厘米) 。所谓纯正,是指看起来比较均 匀,一般处在大面积同颜色区域中心,以减少边缘颜色渗透的影响。把这一小块 区域剪切下来做成一个b i v l p 文件。1 厘米见方的区域包括一万个象素点,每个 点有r 、g 、b 三个值。分析这些数据发现,比如r 值,绝大部分处于2 3 0 到2 5 0 之间,但偶尔也会有零到几十这样的数值,这是因为印刷精度不能保证每个象素 点大小的位置都印上颜色。如果能得到这些值的浮动范围,就可以用其中9 0 的数据范围作阙值。9 0 的比例是通过实验得出的,我用9 0 作为基准截取r 、 g 、b 阕值,用上、下限值分别配制成两种红色,与标准红色作比较,看看能否 接受。我也用过9 5 、8 5 、8 0 、7 5 等分别作实验,最后选定了9 0 ,而用 同样方法金色就选用了5 0 ,我认为这时颜色失真不大,可以接受。当然,这 里的不足就是它是以我个人的眼睛和经验来判断的,也许在我看来可以接受的在 有些人看来是不合格的:或者我认为不合格的别人认为已经不错了。所以这个值 不够客观,如果要投入使用,还需要进行大量实验和计算,在此暂时定为9 0 和5 0 。 为了得到这些范围内的数据范围,我采用冒泡排序法: 9 图象识别在彩色印刷质量检测中应用的研冗 冒泡法的基本思路是:将相邻两个数比较,将小的调到前头。比如有8 、4 、 3 、1 四个数。第一次将8 和4 对调,第二次将8 和3 对调,第三次将8 和l 对 调,如此进行三次后,得到4 、3 、l 、8 的顺序可以看到,最大的数8 己“沉 底”,最小的数l 己向上浮起”一位。然后进行第二轮比较,经过这次比较后, 顺序变为3 、l 、4 、8 。可以推知,三轮比较后,得到由d , n 大的顺序l 、3 、4 、 8 。也就是说,对n 个数,进行n 1 轮比较,在第j 轮比较中要进行n - j 次两两比 较。据此画出流程图如图23 i 。 输a n 个数给a 1 】到a n f o r | - 1t oi i l f o r i = lt on 一 输出a 到a 【n 图23l 这样,通过对r 、g 、b 各一万个数值的分别排序,就得到了它们的由小到 大顺序,以红色图像r 值为例取其中9 0 的数据,也就是去掉前5 较小的数, 和后5 较大的数,取剩下值的最大和最小值作阈值。 排序法容易想到,也容易实现。从统计学上说,它属于一种统计近似法,在 得不到准确分布或分布过于复杂时可用,但它不是最准确的方法。比如,印刷用 的颜料其实配制得比较准确但是由于印刷中纸张含水量或附着力不同,致使印 刷的密度下降,有些象索点没印上。这样,选取的红色区域中r 、g 、b 零值就 很多。按排序法,也许前5 去除的几乎都是零,而同时去掉的后5 却都是合 乎标准的值。这样得出的结果,整体的r 、g 、b 值都偏低,所取的闽值自然不 准确。所以我经过进一步的研究和学习,采用了另一种更精确的方法一统计筛选 数据法。 三用统计筛选数据法确定阈值 l 、统计学概念 数理统计学是数学的一个分支学科【7 】,它研究怎样去有效地收集、整理和 分析带有随机性的数据,以对所考察的问题作出推断或预测,直至为采取定的 决策和行动提供依据和建议。它主要分为两大类:( 一) 试验的设计与研究,即 研究如何对随机现象进行观测、试验以取得有代表性的局部观测值。( 二) 统 计雄断,即研究如何对已取得的观测值进行整理、分析、并作出决策的方法,以 推断总体的规律性。本论文主要侧重后一种方法。 首先,引入几个常用概念: 总体:在数理统计中把研究对象的全体叫做总体,而把组成总体的每个元素 叫做个体。在实际中,我们关心的通常的是个体的某个指标。假设指标为x ,它 的分布函数是f ( x ) ,方便起见,可以把这个数量x 的所有可能取值看作是总 体,并称这一总体为具有分布函数f ( x ) 的总体。因此,总体就是一个带有确 定概率分布的随机变量。 样本:从一个x 中随机地抽取n 个个体x ,x ,k ,这样取得的( x , 图象识别在彩色印刷质量检测中应用的研究 x ,x ) 称为总体x 的一个样本,样本中个体的数目n 称为样本容量。 正态分布:设连续型随机变量x 的概率密度为 ,吐 f ( x ) = i 兰一f ”:, x 0 为常数,则称x 服从参数为i t , d 的正态分布,且称x 为正态变量。 记为x n ( 川,o - 2 ) 。正态分布是概率论和数量统计中最重要的一种分布,在实 际问题中大量随机变量服从或近似服从正态分布。一般说来,只要某一个随机变 量是大量相互独立的偶然因索之和,而且每个因素的个别影响在总的影响中所起 作用都很微小,那么就可以断定这个随机变量服从或近似服从正态分布,正态分 布在各种概率分布中屠首要地位。正态分布的概率密度f ( x ) 的图形如图232 图232正态分布概率密度图 当= o ,仃= l 时称x 服从标准正态分布,记作x n ( 0 ,1 ) 。 2 、为什么统计方法更准确 在本课题中每幅图象的r 、g 、b 值是一个总体。r 、g 、b 是这个总体的 三个指标,它们的分布函数分别是f ( r ) 、f ( g ) 、f ( b ) 。为了方便起见,我 们把它看作三个总体。在一个总体中,例如r 中,有一些不合格的数据,例如 前面所说的因印刷精度不高所致的过多的零值。不加选择地对所有数据排序算阈 值,就产生了误差。我们可以用统计的方法摘除这些不合格数据,使阈值更趋完 善。 我们可以预测,如果数据比较正常,应该接近于正态分布。那么,如果能得 到所有数据的分布曲线,在正态分布曲线之外的“毛刺”,就应该是多余的不合 格数据。去除这些无用数据,剩下的数据可以组成一个r 值的样本,这个样本 中的个体都是合格数据。取样本8 0 的个体数据,就得到了比排序法更加精确 的阈值。 为了得到总体的分布曲线,我借助j 统汁分析系统专用s a s 软件。 3 、s a s 软件使用 s a s 软件 8 是美国使j i j 箍为广泛的二i 大著名统计分析软件( s a s ,s p a s s , s y s t a t ) 之一,是日前国际l 二最为流行的一种火型统计分析系统,被誉为统计 分析的标准软件。 图象识别在彩色印刷质量检测叶| 应用的研究 s a s 为r s t a t i s t i ca r i a l y s i ss y s t e m ”的缩写,意为统计分析系统。s a s 集数 据存取、管理、分析和展现于一体,为不同应用领域提供了卓越的数据处理功能。 s a s 的设计思想是为统计学家和科学:f 作蕾提供这样的一个工具,利用它可以 完成包括从简单的描述性统计到复杂的多变数分析的各种运算,使人们有更多的 时问和精力用于分析和解释计算的结果,而不必为如何获得这些结果花费过多的 时间和精力。其功能强大,统计方法齐全,使用简单,操作灵活。 使用s a s 对数据作分析,可以得到反映数据集中特性的平均数、众数和中 位数,反映离散特性的方差、标准差和变异系数等。对分布形状的度量可得到峰 度系数和偏度系数。还可以得到正态分布统汁数,画出正态分布概率密度图。利 用s a s 的这种功能,我们可以对r 、g 、b 三个总体作出分布曲线,去除使曲线 不服从正态分布的数据,找到合格样本。 一个完整的s a s 程序包括两个部分。第一部分准备数据,称为数据步( d a t e s t e p ) ;第二部分分析数据,称为过程步( p r o cs t e p ) 。数据步用于为s a s 的 分析过程准备数据。s a s 将数据读入,存储在临时数据集中,过程步才能进 行分析。我把用来作阈值设定的标准红色图象的r 、g 、b 值分别作成三个t x t 文件,以外部数据的形式传给s a s 。实现起来是这样的: 举例来说,我把图象的g 值存成名为“r e d g r e e nt x t ”的文件。它的数据步程 序如下: l i b n a m eb s “c :s a s s a s u s e r ”: d a t eb s , i n f i l e “a :r e d g t 。e e nt x t ”, i n p u t v a l u e ; l i b n a m e 是库关联语句,将库目录名b s 与d o s 子目录c :s a s s a s u s e r 关联,在c 盘s a s u s e r 子目录下建立一个永久数据集b s ;d a t e 语句表明开始创建s a s 数据集, i n f i l e 语句指明外部数据文件;i n p u t 语句描述输入数据。这样就建立了一个永久数 据集b s 。 接下来,就是对已建立的数据集中的数据进行分析并给出处理结果。一个过 程步即是完成某些操作的一个程序模块,调用不同过程,即可应用不同方法对数 据进行处理。本次编程主要调用两种过程: ( 1 ) p r o c u n i v a r i t e p l o tf r e q n o r m a l ; p r o c 表示进程步:u n i v a r i t e 表示单变数分析;p l o t 产生正态分布概率密度图: f r e q 产生累计频数分布表:n o r m a l 给出正态分布统计数。用于我们分析数据分布。 ( 2 ) p r o cc a p a b i l i t y d a t e = b s g r a p h i c s : h i s t o g r a mv a l u e n o r m a l ; h i s t o g r a m 可画出数据的直方图,并根据数据的均值画出正态分布曲线,便 于观察数据分布与正态分布的差距,直观明了。 首先,对数据不加选择地全部输入例如输入标准红色图象的r 值,得到 的直方图和数据如图233 曲线为以数据均值为中心的正态分布曲线。 可见,除了最左边有一些0 到5 之间的值,其余的都位于2 3 0 到2 5 0 之间。 由f 直方图横坐标由0 到2 5 5 每个枉体宽度为8 ,不能准确体现数据分布,离 正态分布也相去甚远。所以我们可以借助i f 语句,预先对数据进行部分剔除。 在i n p u t 之前- 加入“i f 2 0 0 ( v a l u e ( 2 5 5t h e no u t p u t ” 再运行程序后,得到直方图如图234 。 图象识别在彩色印刷质量检测中应用的研究 : r c , :毒 t 膏搴 pt r ,e _ :1 t 篁 o p i i n gd e n 豉i t yo u r v o so f , s u m r ,一 0 s 2,s l ie n ) i 摹1 4 i - i t t i ,! o u - l e c l _ 、一: 一i i q i - w i d l l i ,q i 毒_ 一毫,4 i , 图2 3 3 全部数据分布图 摅 一 橛 t i j髓2 ,毒st ,i t 。-毒i i 。了毫3 ,0 u t o i w : 一俐i ( 1 h - l i i i i d 4 i m i - - 糟, 图2 3 4 优化数据分布图 可见,数据已有了很大改善,比较接近正态分布。此时,u n i v a r i t e 过 程的输出结果包括基本统计数和正态分布概率图如下: c a p a b 儿r r y m o m e n t s n9 7 0 4 s u m w 曲 9 7 0 4 m e a n2 3 98 1 0 8 s u m 2 3 2 7 1 2 4 s t d d e v1 8 1 7 9 1 5 v a r i a n c e 3 3 0 4 8 1 6 s k e w n e s s- 0 2 4 9 0 8 k u r t o s i s07 4 8 6 3 5 c v0 7 5 8 0 6 2 q c m n d l e s p e t e ( r o to b sq l b 蝴ce s tq u a n t i l o 102 3 52 3 55 8 2 5 0 2 3 72 3 6 8 2 1 1 0 02 3 9 2 3 7 4 8 l 2 5 02 3 92 3 8 5 8 5 5 0 0 2 4 02 3 98 1 1 7 5 02 4 12 4 10 3 7 9 0 02 4 22 4 2 1 41 9 502 4 3 2 4 2 8 0 l 9 9 02 4 4 2 4 4 0 4 0 1 2 p 1 0 :8 c 6 : i t 2 0 图象识别在彩色印刷质量检测中应用的研究 h is t o g r a m 2 4 7 5 + 术 幸 宰 幸_ 肆 木车扣i 肆木扫i 呻 和h 蚪奉呻木书h 睥扣h 昧书扣# _ 聿 奉书h 肆事蝌扣纠肆扣h 。聿扣h 呻和h 肆书扣h 蚪料掌h 幸奉 2 4 0 5 + j h 聿料肆料肆扣h 肆扣h 聿和h 啐扣h 啤扣i 和h 睥扣h 中h 聿扣h 宰和翻中抖 书h 肆牢扣褂肆扣啉和h 呻奉h 呻丰口h 【料木扣h 呻和科呻车_ q 雌 扣h 砷车扣h 肆和愀和哮中h 。幸扣h 啉 幸和h 睥掌扣h c 料 芈蝌 # 幸 2 3 3 b + 车 z l 其中,n 为样本值;m e a n 为均值:s t dd e v 为标准差:s u m 为和:v a r i a n c e 为 方差:s k e w n e s s 为峰度:k u r t o s i s 为偏度;c v 为变异系数。q u a n t i l e 表中给出各 百分比所对应的数值的约值和精确值。9 0 数据的准确闽值就是5 到9 5 对应的 2 3 7 到2 4 3 。正态分布概率图中每一方柱右侧是统计出的此数值在总数据中所占 个数,非常直观。 同样,对其它各组数据进行s a s 统计,通过看图剔除不合理数据,再从统 计结果中读取9 0 9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论