(通信与信息系统专业论文)数字仪表动态显示字符的计算机自动识别.pdf_第1页
(通信与信息系统专业论文)数字仪表动态显示字符的计算机自动识别.pdf_第2页
(通信与信息系统专业论文)数字仪表动态显示字符的计算机自动识别.pdf_第3页
(通信与信息系统专业论文)数字仪表动态显示字符的计算机自动识别.pdf_第4页
(通信与信息系统专业论文)数字仪表动态显示字符的计算机自动识别.pdf_第5页
已阅读5页,还剩73页未读 继续免费阅读

(通信与信息系统专业论文)数字仪表动态显示字符的计算机自动识别.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 数字仪表动态显示字符的计算机自动识别 摘要 随着科技的发展 各行业的管理手段从人工逐步转变成自动或半 自动方式 尤其在化工 冶金等行业 和较恶劣环境下进行实时监控 时 为提高生产率和减少人为因素造成的误判 需采用自动控制系统 来完成 通过预先设定的控制条件与被识别的数显仪表的字符相比较 而执行自动控制操作是一种便捷和灵活的控制方案 而在该系统中数 字仪表字符的动态识别是非常重要的一环 这正是本文的研究内容 数显仪表字符的动态识别系统作为一个综合的实时计算机视觉 系统主要包括 图像的预处理 字符块定位 字符串的分割和分类器 识别设计 图像的预处理包括彩色图的灰度化 图像的闽值化 去噪 边缘检测等 对于单个数字仪表图像采用了区域生长法实现了定位 利用垂直投影法实现了对字符串的分割 而字符的识别则利用b p 神 经网络法来进行分类识别 本文的创新之处为 采用数学形态法和连通域标记法来定位多个 仪表数字区域的位置 利用字符的自适应宽度和字符间隔 确定字符 串中小数点位置 采取全局自适应带动量项的快速b p 算法进行识别 不仅实现了图像中单仪表的字符识别 而且该方案适用于图像中多个 仪表的字符识别 其识别率和识别速度都达到了比较理想的效果 关键词 字符块定位 字符分割 图像预处理 b p 神经网络 浙江工业大学硕士学位论文 t h e c o m p u t e r a u t o m a t i c r e c o g n i t i o nc h a r a c t e r o f n u m e r a li n s t r u m e n t d y n a m i c d i s p l a y e d a b s t r a c t w i t ht h ed e v e l o p m e n to f s c i e n c ea n dt e c h n o l o g y t h em a n a g e m e n t m e a n so fe v e r yw a l ko fl i f ei s c h a n g i n gi n t o a u t o m a t i z a t i o no rh a l f a u t o m a t i z a t i o nf r o m m a n p o w e r e s p e c i a l l y i no r d e rt or e a lt i m es u p e r v i s e i nc h e m i c a l i n d u s t r y m e t a l l u r g y f i e l d sa n do t h e rr e l a t i v es c u r v i n e s s e n v i r o n m e n t a n di m p r o v i n gp r o d u c t i v i t ya n dr e d u c i n gm i s c a r r i a g eo f j u s f i c ef o rt h ef a c t o ro fh u m a nm a d e a u t o m a t i cc o n t r o ls y s t e mc a nb e a d o p t e dt o r e a l i z et h e a i m i ti s ac o n v e n i e n ta n d a g i l es c h e m eb y c o m p a r i n g t h ee n a c t m e n tc o n d b i o na n dt h e r e c o g n i z e d n u m e r a lo f i n s t r u m e n tt or e a l i z ea u t o m a t i cc o n t r o l o p e r a t i o n s or e c o g n i t i o nt h e s t r i n go fn u m e r a li n s t r u m e n ti sv e r yi m p o r t a m w h i c hi so b j e c to ft h i s t h e s i s t h er e c o g n i t i o ns y s t e mi sa i n t e g r a t e dr e a lt i m ec o m p u t e rv i s i o n s y s t e m w h i c h c o n s i s t so f i m a g e p r e p r o c e s s s t r i n gr e g i o nl o c a t i o n s t r i n g s e g m e n t a n dc h a r a c t e rr e c o g n i t i o n t h e p r e p r o c e s s i n go fi m a g ei n c l u d e s g r a y i n g o fc o l o r i m a g e s m o o t h i n g l i n e a rt r a n s f o r m i n go f 蓼a y b i n a r i z a t i o n e d g ec h e c k i n ga n ds oo n w eu s et h er e g i o ng r o w t hw h e n t h e r ei so n l yo n ei n s t r u m e n ti ni m a g e i no r d e rt os e g m e n tt h es t r i n gi n t o s i n g l ec h a r a c t e r w ea d o p tt h ev e r t i c a lp r o j e c t i n gt os e g m e n ts t r i n g t h e b pn e u r a ln e t w o r ki su s e dt oc l a s s i f i c a t i o n r e c o g n i t i o n t h ei n n o v a t i o n p o i n t i sa s f o l l o w i n g u s i n g o fm a t h e m a t i c a l m o r p h o l o g ya l g o r i t h m a n dc o n n e c t r e g i o na l g o r i t h ma c h i e v e s t h el o c a t i o n m u l t i i n s t r u m e n t r e g i o n s a d o p t i n g t h e a d a p t a b l e c h a r a c t e rw i d t ha n d c h a r a c t e ri n t e r v a li n f o r m a t i o nt ol o c a t et h er a d i x p o i n t t h e w h o l e a d a p t a b l e f a s tb p a l g o r i t h m w i t hm o m e n t u mi t e m i s u s e d s i n g l e i n s t r u m e n tc a nb er e c o g n i z e d b u ta l s om u l t i i n s t r u m e n ti ni m a g ec a nb e r e c o g n i z e d a n d t h e r e c o g n i t i o n r a t ea n d r e c o g n i t i o nv e l o c i t ya r e i d e a l k e y w o r d s s t r i n gr e g i o nl o c a t i o n s t r i n gs e g m e n t i m a g e p r e p r o c e s s i n g b p n e u r a ln e t w o r k 绪论 第一章绪论 1 1 研究背景 随着信息社会的不断发展 图像处理与计算机视觉技术在各行各业的应用中 不断走向广泛和深入 汽车牌照的自动识别便是一个很好的例证 同时随着科学 技术的不断进步 各行业的管理手段正从人工管理逐步转变成自动或半自动方 式 尤其在化工和冶金等行业 以及在比较恶劣的环境场合下需要进行实时监控 时 为了提高生产率和减少人为因素所造成的误判 需要采取自动控制系统来实 现控制任务 为了使自动控制系统能够很好的实现控制功能 那么首先需要将数 字仪表显示的数据进行动态识别 然后根据所识别的数据同控制条件进行比较 从而实现下一步的自动控制功能 因此数字字符的识别功能在此就显得相当重 要 本文所研究的数字仪表动态显示字符的计算机自动识别系统就是为了实现此 目的 1 2 字符识别研究现状 数字仪表动态显示字符的计算机自动识别属于人工智能 模式识别 智能控 制和数字图像处理等领域 是 f l 涉及数字 计算机科学 自动化技术和电子工 程技术的边缘学科 早在五十年代人们就开始了印刷体字符识别的研究 在以后的三十年中不断 出现一些不太成熟的软件 随着计算机硬件技术的飞速提高 到了八十年代后期 字符的快速识别成为可能 九十年代初 大量豹o c r 方面的论文和系统见诸于世 以及车牌识别系统的初步成功 著且s p i e i e e e 在这一方向也曾举行过多次会 议 大大推动了该方向的研究 所有这些研究为数字仪表显示的数字字符的识别 提供了理论上的指导 目前离线的文字字符识别产品已大量问世 有代表性的国 内外系统和研究小组有 1 美国e x p e r v i s i o n 的p t k r e c o g n i t i o n t o o lk i t s 美国纽约州立大学b u f f a l o 分校的c e d a r 研究中心 加拿大c o n c o r d i a 大学的c e n p a r m i 实验室 浙江工业大学硬士学位论文 i 日本东芝的t e x t r e a d e r 法国的银行支票识别系统 国内有清华大学电子系 清华大学计算机系 北京信息工程学院 北京邮电 大学信息系 沈阳自动化所 中自汉王和清华紫光的o c r 产品等 同时国内外对车牌识别系统做了深入的研究和开发 在国外已有不少关于汽 车牌照自动识别的文章发表 有的已经很成熟 投入了实际使用 早在7 0 年代 国外就有自动车牌检测系统用于检查被盗车辆的情况 时至今日 已达到很高的 应用水平 在各种应用中有对静态图像处理的系统 如h u a n g m u h w a n g 的 a p c b a s e d c a rl i c e n c ep l a t e r e a d e r 在收费站硬件设旌条件较好的 条件下 平均0 7 秒内识别率达到9 7 1 2 j 也有以汽车速度受时限时掐摄的准静 态汽车牌照图像为处理对象的实例 如p a o l oc o r n e l l i 的 o p t i c a lr e c o g n i t i o no f m o t o rv e h i c l el i c e n s ep l a t e s 是以收费站实时拍摄的汽车准静态图像为处理对 象 对上千幅图像的识别率接近9 1 3 l 这些系统的成功实现大大受益于国外牌 照的规范统一 国外现有的一些类似产品有 以色列h it e c h 公司的s e e c a r s y s t e m 一系列产品 香港a s i a v i s i o nt e c h n o l o g y 公司的v e c o n 新加坡o p t a s i a 公司的v l p r s 产品等 其中v e c o n 和v l p r s 产品主要适合于香港和新加坡 的车牌 h it e c h 公司的s e e c a rs y s t e m 有多种的变形产品来分别适应某一个国 家的车牌 s e e c a rc h i n e s e 系统可以对中国大陆的车牌进行识别 但也很大的 缺陷 而且不能识别车牌中的汉字 另外日本 加拿大 德国 意大利 英国等 发达国家都有适合于本国车牌的识别系统 国内做得较好的产品主要是中科院自动化研究所汉王公司的 汉王眼 除 此之外国内的亚洲视觉科技有限公司 深圳市吉通电子有限公司 中国信息产业 部下属的中智交通电子系统有限公司等也都有自己的产品 另外西安交大的图像 处理与识别研究室 上海交大的计算机科学与工程系 清华大学人工智能国家重 点实验室 浙江大学的自动化系等有都做过类似的研究 如浙江大学研发的 便 携式无触发行进中车辆车牌自动识别检测系统 i q 其识别率达到9 6 取得了 显著的经济效益和社会效益 虽对数字仪表的识别没有涉及过 但原理同车牌识 别类似 这些都为数字仪表动态显示字符的计算机自动识剐奠定了基础 浙江工业大学硕士学位论文 1 3 识别控制系统与数显字符识别的解决方案 本文所提出的识别和控制系统其功能模块如图卜1 所示 通过此闭环控制系 统来实现识别和控制 图l l 识别和控制系统图 而本文的目的就是为了实现数字仪表动态显示字符的动态识别 其解决方案 如图卜2 所示 即要经过图像预处理 字符块定位 字符分割 特征提取识别四 个模块 最终达到识别的目的 图卜2 字符识别系统处理流程图 1 4 本文章节安排 本文第二章介绍了数字图像预处理方面的基本知识 彩色图像韵灰度化 二 值化 线性变换 边缘检测等 第三章主要介绍了利用区域生长法和数学形态法 来定位字符串区域 第四章主要介绍了投影法和字符自适应宽度的字符分割 第 五章介绍了b p 神经网络对字符的识别 第六章对全文进行了总结 浙江工业大学硕士学位论文 数字图像预处理 第二章数字图像预处理 数字图像处理是一门新兴学科 它跨越了许多领域 为此本章将简要的对它 进行介绍 2 1 数字图像处理基本概念 图像的数字处理是以计算机为中心 包括各种输入 输出及显示设备在内的 数字图像处理系统上进行的 是将连续的模拟图像变成离散的数字图像后 用建 立在特定的物理模型和数学模型基础上编制的程序控制 运行并实现种种要求的 处理 利用计算机对图像信息的处理 其处理特点可以基本分成两大类 一类是以最终恢复原图像为前提的信息压缩和用与原图像相异的形式有效 的表现和显示图像的图像变换处理 基于图像数据压缩的图像传输和存储 通过 图像变换来改善图像的增强和恢复 都属于这一类 另一类对图像的处理 主要是提取特征信息 其处理的最终目的是为了识别 处理是对于那些用于判别景物的特征信息给予抽取 而其他信息则尽量予以舍 弃 以达到高度的信息压缩 并根据抽取的特征信息进行分类和识别 这一类对 图像的计算机处理 属于数字模式识别的范畴 本文的目的就在于此 2 1 1 图像处理所涉及的领域弘1 图像处理涉及了多种学科理论和应用知识 包括人工智能 计算机视觉 机 器人技术 拓扑学等多种学科 下面简要的介绍一下 人工智能 人工智能简称a i a r t i f i c i a li n t e l l i g e n c e 是一门5 0 年代 中期才诞生的新兴学科 人工智能学者认为 计算机不仅是一种会做数学运算的 机器 而且能做原来只有人才能做的具有智能的工作 人工智能就是用计算机来 模拟人的思维和行为 如问题求解 学习 推理 理解自然语言等 人工智能的研究是多方面的 但从根本上来说 一是问题求解中的搜索问题 二是知识信息的处理问题 即获取知识 表达知识和利用知识 搜索是经典人工 智能研究的核心 知识及其表示 基于知识的推理以及机器学习是当代人工智能 浙江工业太学硕士学位论文 数字图像预处理 研究的热门课题 计算机视觉 计算机视觉就是用机器人模拟人的眼睛和大脑 对客观世界进 行视觉感知和解释 众所周知 视觉对人类来说是最有用的 但也是最复杂的一 种感知周尉环境的手段 随着科学技术的日益发展 计算机视觉的应用范围正在 不断扩大 计算机视觉是机器人智能及第五代计算机的关键因素之一 计算机视 觉的一般目的是根据从某 景物的图像中提取的信息对这一景物作结构描述 识 别和理解 模式识别 模式识别问题指的是对一系列过程或事件的分类和描述 要加以 分类的一系列过程和事件可以是 系列物理的对象 也可以是 些比较抽象的如 心理状态等 具有某些相类似的性质的过程或事件就分为一类 对于一个具体问 题 模式类的总数由具体应用所决定 人工神经网络 人工神经网络 a r t i f i c i a ln e u r a ln e t w o r k 简称 a n n 是在对入脑组织结构和运行机制的认识理解基础之上模拟其结构和智能 行为的一种工程系统 早在本世纪4 0 年代初期 心理学家m ec u l l o c h 数学家 p i t t s 就提出了人工神经网络的第一个数学模型 从此开创了神经科学理论的研 究时代 其后 e r o s e n b l a t t w i d r o w 和j j h o p 蠡e l d 等学者又先后提取了感知模 型 使缛人工神经网络技术得以蓬勃发展 人工神经网络是由大量的神经元广泛 互连而成的系统 它的这一结构特点决定着人工神经网络具有高速信息处理的能 力 由于人工神经网络中神经元个数众多以及整个网络存储信息容量的巨大 使 得它具有很强的不确定性信息处理能力 即使输入信息不完全 不准确或模糊不 清 只要输入的模式接近于训练样本 系统就能给出正确的推理结论 图像变换 一般指利用正交变换 诸如傅立叶变换 余弦变换 沃尔什变换 小波变换等 的性质和特点 将图像转换到变换域中进行处理 如把时间域或空 间域的图像转换到频率域的变换处理以改善图像的质量 同时还因为大多数变换 都有快速实现的方法 从而大大提高了处理运算的速度 该部分主要研究各种变 换模型和处理方法 图像增强 指利用各种数学方法和变换手段提高图像中的对象与非对象的对 比度与图像清晰 对象指所需要研究的目标 非对象指对象以外的背景 从而突 出人或其他接受系统所感兴趣的部分 例如强化图像的高频分量 则可使图像中 浙江工业太学碛士学位论文 数字图像预处理 目标轮廓清晰 细节明显等等 该部分主要研究各种增强模型和处理方法 图像复原 在景物成像过程中 由于目标的高速运动 散射 系统畸变 噪 声干扰等因素 使最后形成的图像存在种种恶化 把恶化了的图像复原到能真实 反映原景物图像的处理 称为图像复原 该部分主要研究各种校正模型和处理方 法 图像压缩编码 把数字化的图像数据按一定规则进行排列或运算的过程 称 为图像编码 利用图像本身的内在特征 通过某种特殊的编码方式 达到减少图 像数据时空占用量的处理叫做图像压缩编码 该部分主要研究各种校正模型和处 理方法 图像分析基础 图像处理的另一个重要分支是图像分析 它主要研究图像特 征 图像分割 图像描述以及一些图像分析算法 2 1 2 图像的数字化表示 6 1 为了利用数字计算机来处理图像 首先必须把连续的图像变换成离散的数字 图像 一幅数字图像f x y 是在其空间坐标上和灰度上都离散化并进行数字编 码的图像 图像f x y 在空间坐标上的离散化称为采样 图像f x y 在灰度上 的离散化称为量化 经过采样和量化 图像f x y 可以用一个矩阵来表示 取 行和列的交点标出图像的每个像素 每一像素对应一个灰度值 为实现数字化 灰度值必须离散 例如分成k 个等级 一般量化与采样数值都取为2 的整数幂 如一幅图像用5 1 2 行x5 1 2 列的矩阵来表示 即像素数为5 1 2 x 5 1 2 灰度量化 2 5 6 2 的8 次方 那么其二进制信息量为 5 1 2 x 5 1 2 x8 2 0 9 7 1 5 2b i t 2 2 数显仪表图像预处理 拍摄到的数显仪表图像是彩色图像 其存储量很大 光照度不够均匀所造成 的图像灰度过于集中 由c c d 摄像头 获得的图像经过a d 数 模转换 该功 能在图像系统中由数字采集卡来实现 转换 线路传送都会产生噪声污染等 所 以需要进行一系列的预处理 彩色图的灰度化 图像平滑 灰度的线性变换 图 浙江工业大学硕士学位论文 6 数字图像预处理 像的闽值化 边缘检测等 下面将对各个部分作详细的介绍 2 2 1 彩色图像变换成灰度图 国际照明委员会 c l e 7 1 选择红色 7 0 0 o o n m 绿色 a 5 4 6 1 0 n 和蓝色 五 4 3 5 8 0 n m 三种单色光作为颜色系统的三基色 这就是c i e 的r g 1 3 颜色表示系统 彩色图像即真彩色图 y n t t2 4 位图 每个像素壹接用r g b 这三个分量字节来表示 它包括色调 饱和度 和亮度 因此彩色图像的 存储量相当巨大 而灰度图只有亮度 那么只需一个字节来表示 这样大大的节 省了存储空间 从而提高了处理速度 所以有必要将彩色图像转换为灰度图像 我们所处理的数显仪表图像就是真彩图 采用现行标准的平均值法 用卫表示灰 度化后的灰度值 有 g o 3 0 r o 5 9 g o 1 1 b 2 1 得到的灰度图有利于后面的进一步处理 真彩图如图2 1 灰度图如图2 2 图2 1 宾彩图 图2 2 灰度图 2 2 2 图像平滑 图像平滑的目的是为了消除噪声 图像噪声的来源有三嗍种 一为在光电 电磁转换过程中引入的人为噪声 二为大气层电磁暴 闪电 电压 浪涌等引起 的强脉冲性冲激噪声的干扰 三为自然起伏性噪声 由物理量的不连续性或粒子 性所引起 这类噪声又可分成热噪声 散粒噪声等 噪声的消除又可以分为空间 域或频率域 本课题中只讨论空间域中的领域平均法和中值滤波法 浙江工业大学硕士学位论文 7 数字图像预处理 邻域平均法是 种局部空间域处理的线性算法 设一幅图像厂 x y 为n x n 阵列 平滑后的图像为g x y 它的每个像素的灰度级由包含在 x j 的预定领 域的几个像素的灰度级的平均值所决定 采用下式就可得到平滑的图像 如 2 万1 蒹 2 2 式中的x y o 1 2 n 一1 s 是 x y 点邻域中心点的坐标的集合 不包括点 z y m 是s 内坐标点的总数 一般情况下 可采用四邻域和八邻域 不过 邻域越大 则图的模糊程度就越大 以上算法简单 计算速度快 但它的主要缺点是在降低噪声的同时使图像产 生模糊 特别在边沿和细节处 模糊则更加厉害 为了降低这种不利因素 可以采用阈值法 即根据下列准则形成平滑图像 出棚 击 磊p 玎 卜y 卜击 髻c m 斗r 协 if x y 其它 式中r 是一个规定的非负阈值 当一些点和他们邻域的差值不超过规定的7 时 仍保留这些点的像素灰度值 这样平滑后的图像比邻域平均法模糊度减少 当某 些点的灰度值与各邻域的均值差别较大时 它必然是噪声 则取其邻域平均值作 为该点的灰度值 它的平滑效果仍然比较好的 中值滤波是一种非线性滤波 由于它在实际运算过程中并不需要图像的统计 特性 所以比较方便 中值滤波首先是被应用在一维信号处理技术中 后来被二 维图像信号处理技术所引用 在一定条件下 可以克服线性滤波器所带来的图像 细节模糊 而且对虑除脉冲干扰及图像扫描噪声最为有效 但是对一些细节多 特别是点 线 尖顶细节多的图像不宜采用中值滤波的方法 中值滤波就是用一个含有奇数点的滑动窗t 2 1 将窗1 2 1 正中那一点的灰度值用 窗口内各点的中值代替 假设窗口有5 点 其值为8 0 9 0 2 0 0 1 1 0 1 2 0 那么窗 口内各点的中值即为1 1 0 设有一个一维序列 取窗口长度为m m 为奇数 对此序列进行 中值滤波 就是从输入序列中相继抽出肌个数 z z 其中 为窗 浙江工业大学硕士学位论文 8 数字图像预处理 口的中心值 y 翌 再将这肌个点值按其数值大小排列 取其序号为中间 z 的那个数作为滤波输出 用数学公式表示为 z m e d f z f z v 2 4 上 例如 有一个序列为 o 3 4 0 7 重新排序后为 o 0 3 4 7 则m e d o 3 4 0 7 净3 此例若用平滑滤波 窗口也是取5 那么平滑滤波输出为 f 0 3 4 0 7 5 2 8 与邻域平均相比 中值滤波保持了输入波型的上升边 缘 这是中值滤波的一个重要特征 由于数显仪表的字符串中存在小数点 采用中值滤波可能会把小数点当作噪 声被虑除掉 所以本文中采用邻域平均法来去取噪 其效果图如图2 3 所示 2 2 3 灰度的线性变换 灰度的线性变换属于点运算的范畴 灰度的线性变换就是将图像中所有的点 的灰度按照线性灰度变换函数进行变换 该线性灰度变换函数 x 是一个一维 线性函数 f x f a x 归 2 5 灰度变换方程为 d b d a f a d 归 2 6 式中参数 为线性函数的斜率 归为线性函数在y 轴上的截距 d a 表示 输入图像的灰度 d 表示输出图像的灰度 当f a 1 时 输出图像的对比度将 增大 当f a 1 时 输出图像的对比度将减小 当月 1 且声 0 时 操作仅使 所有像素的灰度值上移或下移 其效果是使整个图像更暗或更亮 如果翩 0 暗区域将变亮 亮区域将变暗 点运算完成了图像求补运算 特殊情况下 当 f a l 归 0 时 输出图像和输入图像相同 当f a 1 归 2 5 5 时 输出 图像的灰度正好反转 一般情况下 字符是以高亮度的白色出现的 背景是以低 亮度的黑色表示的 而在字符识别阶段 需要使字符是以黑色表示 便于识别 浙江工业太学硕士学位论文 9 数字图像预处理 所以需要将颜色反转处理 其反转图像的结果如图2 4 所示 图2 3 邻域平均滤波图图2 4 二值图反色图 2 2 4 自适用阈值的二值化 图像的二值化可分为全局二值化和局部二值化 传统的阈值选取方法很多 但大多要求知道目标和背景的一个先验概率分布 从而利用贝叶斯公式得到一个 满足这种分布的概率意义下的最佳阈值 对实际数显仪表来说 这种办法是不合 适的 因为仪表目标点的统计本身就是一个比较困难的问题 而且如果用这种方 法 该闽值会对仪表图像有严格的要求 当仪表图像中包含有背景值时 肯定会 对阈值的选取产生影响 阈值的选取根据不同的恩路也有多种不同的方法 1 概率统计方法 假设g 为阈值 小于g 的点构成目标 此时根据目标点在图 像中所占比例p 统计灰度值为0 1 2 一 g 的点 直到比例关系最接近p 时为 止 此时的阈值就为图像阈值 2 对于质量非常好的图像 目标点和背景的灰度差值较大时 可以简单的使用 最大灰度值和最小灰度值的均值作为图像的分割阙值 3 假设g 为阈值 那么分割后的目标点和背景点占多数 而灰度值为g 的点占 少数 这时可以将点最少的灰度值作为阈值 这也正是灰度直方图波谷法的原理 在直方图波谷法中背景和目标点占据了图像的大多数点 形成了两个峰 而靠近 阕值的边界点很少 形成两蜂之间的波谷 如果直方图的双峰变化比较复杂 这 时波谷的寻找就成为该方法的瓶颈 4 在背景向目标过渡时 边缘点是灰度值跃变最大的点 可以考虑使用边缘的 浙江工业大学硕士学位论文 1 0 数字图像预处理 灰度值作为图像阈值 在局部阈值分割时 可以使用这种方法选取阈值 即在小 窗口内找梯度最大的点的灰度值作为阈值 首先介绍o t s u 全局阈值法 做灰度值分布直方图动态找波谷的方法 取 波谷作为图像分割的整体阈值 具体公式为 假设灰度值为1 m 级 灰度i 的 像素数为 则像素总数 各个灰度值的频率p n 以 p 3 焉 2 7 2 8 灰度值七把m 级灰度值分为两段 c o l 2 七 和c 1 承 1 k 2 m c 的 频率矾 p j 七 c 1 的频率彬 p i 1 一矽 七 c o 的平均值 铲喜甓 器 c l 的平均值 l r 耋 簖 丽u u k 其中 概是整体图像的平均灰度 1 1 是有 o 暇 l 两组间的方差 2 1 0 t 哥 f p 是阈值七的平均灰度 于 l z l j 2 七 w o u o 一 2 彬 i u 2 w o 啊 u l 一 o 2 堕里盟二业丝 2 一1 1 女 l 一形 七 使 从1 到删逐一变化 使d 2 女 最大的k 即为阈值 这里占2 七 可称为阈值 选取函数 实际上计算的就是两部分形心的距离 占2 七 最大就对应着两部分的 浙江工业太学硕士学位论文 数字图像预处理 距离最大 阈值确定后就可以对全图进行二值化处理了 处理过程简单 就是把 小于闽值的灰度作为背景灰度区域 大于闽僮的灰度值作为目标 对于光照不均的情况 其直方图双峰的谷底不明显 有时会出现单峰甚至多 峰的情况 如图2 5 此时 背景中某些地方的灰度级会接近甚至超过前景 利 用全局二值化将使比较接近的字符产生粘连的情况 而b e r n s e n 1 局部闽值法能 解决此问题 下面就介绍b e r n s e n 局部阈值法 1 垂 l 川 o 凳舅三老舅 悟 2 2 5 边缘检测 边缘是指其周围像素灰度值有阶跃性变化或屋顶变化的那些像素点的集合 浙江工业大学硕士学位论文 数字图像预处理 边缘广泛存在于物体与背影之间 物体与物体之间 图像基元与基元之间 它是 图像分割所依赖的重要特征 物体的边缘是灰度的不连续所反映的 经典的边缘 提取方法是考察图像的每个像素在某个邻域内灰度的变化 利用边缘邻近一阶或 二阶方向导数变化规律 用简单的方法检测边缘 这种方法称为边缘检测局部算 子法 i l l 边缘的种类可以分为两种 一种称为阶跃性边缘 它两边的像素的灰度值有 着显著的不同 另一种称为屋顶状边缘 它位于灰度值从增加到减少的变化转折 点 对于阶跃性边缘 二阶方向导数在边缘处呈零交叉 而对于屋顶状边缘 二 阶方向导数在边缘处取极值 如果一个像素落在图像中某一个物体的边界上 那么它的邻域将成为一个灰 度级的变化带 对这种变化最有用的特征是灰度的变化率和方向 它们分别以梯 度向量的幅度和方向来表示 边缘检测算子检查每个像素的邻域并对灰度变化率 进行量化 也包括方向的确定 大多数使用基于方向导数掩模求卷积的方法 下 面介绍几种常用的边缘检测算子 1 r o b e r t s 边缘检测算子 r o b e r t 算子采用对角方向相邻两像素之差 即定义 v f m 一f m 一1 h 一1 2 1 4 v m l 行 一f m 玎一1 2 1 5 所以可以得到r o b e r t 梯度的卷积摸板如下 匪田臣圈 其处理后如图2 7 浙江工业大学硕士学位论文 数字图像预处理 图2 6 二值图 2 p r e w it t 边缘检测算子 为了在检测边缘的简时减少噪声的影响 图2 7r o b e r t s 边缘检测图 p r e w i t t 从加大边缘检测算子的模 板大小出发 有2 x2 扩大到3 3 来计算插分算子 如下表格所示 lo1 l01 f i o 1 一1 1 1 0oo l1 1 经过处理得到图2 8 3 s o b e l 边缘检测算子 s o b e l 算子在p r e w i t t 算子的基础上 对4 一邻域采用带权值的方法计算差 分 该算子不仅能检测边缘点 且能进一步抑制噪声影响 但检测的边缘较宽 其算子模板如下 l 一1 2一l 0 oo i 2 1 一101 一2 o 2 i i 01 图像中的每个点都要同这两个核做卷积 一个核对垂直的边缘响应最大 另一个 对水平边缘响应最大 两个卷积的最大值作为该点的输出 经过处理得到图2 9 图2 8p r e w i t t 边缘检测图2 9s o b e l 边缘检测 2 3 本章小结 本章介绍了数字图像处理的基本概念 应用领域 以及一些基本的图像预处 理方法 图像的灰度变换 图像平滑中的邻域平均法和中值滤波法 灰度的线性 新江工业大学颈士学位论文 1 4 数字图像预处理 变换 选择阈值的图像二值化中的o t s u 全局闷值法和b e r n s e n 局部阙值法 以 及边缘检测中的r o b e r t s 边缘检测算子 p r e w i t t 边缘检测算子和s o b e l 边缘检 测算子 这为后续的定位和识别打下了基础 浙江工业大学硕士学位论文 j 5 字符块定位 第三章字符块定位 引言 仪表的字符块定位属于图像分割的范畴 图像分割 2 i m a g es e g m e n t a t i o n 是计算机视觉领域中的重要内容之一 往往是实现字符图像识别时首先需要完成 的操作 它是根据图像的某些特征或特征集合的相似性准则 对图像像素进行分 组聚类 把图像平面划分为一系列 有意义 的区域 使其后的图像分析 识别 等高级处理阶段所要处理的数据量大大减少 同时又保留有关图像结构特征的信 息 由于分割中出现的误差会传播至高层处理阶段 因此分割的精确程度是至关 重要的 图像分割方法可分为结构分割方法和非结构分割方法两大类 结构分割方法 是根据图像的局部区域像素的特征来实现图像分割 如灰度阈值 区域生长 纹 理结构分析 这些方法是假定事先知道这些区域的特征 或者是在处理过程中能 够求得这些特征来寻找各种形态或研究各像素群 在结构分割方法中还有一种技 术是一开始就着眼于保持边缘的性质 跟踪边缘并形成轮廓 即基于边缘信息的 图像分割方法 边缘检测方法使用局部窗口操作 可检测出通过给定点的边缘或 边界 但不能体现全局的区域边界 而且边缘跟踪的顺序操作在很多程度上限制 了分割的速度 应用统计模式识别 神经网络方法或利用景物的先验知识实现的 图像分割方法属于非结构方法 这类方法是根据图像的二维随机线性模型来构造 分类的特征矢量 自适应图像分割是近年来提出的一种新方法 它将局部并行区 域感知与全局随机统计最佳逼近相结合 实现了一种非监督的图像分割 3 1 区域生长法定位字符块 考虑到结构分割方法较之非结构分割方法要简单 更重要的是 结构分割方 法能够达到理想的结果 本课题所研究的仪表图像 通过前面的预处理即 c c d 拍摄的数码管显示的数字字符的彩色图像经过灰度亿变为2 5 6 色的灰度图 然 后采用邻域平均滤波法去除噪声 得到质量较好的图像 并将其二值化 得到二值 图像便于下一步的字符区域的定位 本文根据所识别的仪表图像的特点 数码管 浙江工业大学硕士学位论文 1 6 字符块定位 显示的数据区的背景是一片黑色的矩形区域 这片区域中大部分象素灰度值同其 四邻域相同 所以采用区域生长方法来分割字符区域 3 1 1 区域生长的基本原理 区域生长的基本思想是将具有相似性质的象素集合起来构成区域 具体实现 是对每个分割的区域找个种子象素作为生长的起点 再将种子象素周围四邻域中 与种子象素有相同或相似的象素 根据某种事先确定的生长或相似准则来判定 合并到种子象素所在的区域中 将这些新象素当作新的种子象素继续进行上面的 操作 直到再没有满足条件的象素可被包括进去 这样一个区域就生成了 在实际 应用区域生长法时需要解决三个问题f 1 1 选取或确定一组能正确代表所需区 域种子象素 2 确定在生长过程中能将相邻象素包括进来的准则 3 制定让生 长过程停止的条件 3 1 2 投影法获取种子点像素 所谓投影法就是分析图像的横纵方向的投影值 求图像的行投影和列投影的 公式如下 m 第 列的纵向积分投影 v s u m j x i 3 一1 j 月 第f 行的横向积分投影 一s u m i x i j l 3 2 其中m 和n 分别为图像的行的数目和列的数目 为了找到种子点像素 就是要找到种子点的横 纵坐标 那么我们首先将图 像作横向投影 以黑色像素作为统计的对象 即将每行的黑色像素累加保存在数 a m 里 数组中必将出现邻近的好些数值 a i i a i a i m 接近 于是 把其最中间的那行的数值保存下来 即把i 的值保存下来 这样就的到了种子点 的横坐标 同理 把图像作纵向投影 把每列的黑色像素累加保存在数组b i n 中 数组 中也将出现邻近的一些数值 b j f b j b jq t 相近 于是把数值 保存下 浙江工业大学硕士学位论文 字符块定位 来 这样就得到了种子点的纵坐标 然后把点 f 点的值取出 判断 f 是否 为零 为零则将此点作为种子点 若不为零则取 f 的四邻域 按逆时钟方向 取点 的点 同时判断是否为零 直至找到零像素点 并以此为种子点 这样种 子点的找寻就实现了 3 1 3 区域生长算法分析 为了使生长过程能够在各个方向都比较均匀 使最终得到的分割结构和实际 目标比较相似 本文采用先进先出队列 按层次遍历了由起始点开始生长所建立 的结构 根据需要 对图像中的每个象素点加上一个标签 判定是否已经生长的标 签 初始情况下这个标签为0 算法如下 建立一个队列且置空 在经过预处理的图像中 选取象素点 f 作为种子 象素 将 f 点纳入队列中 并使该点的相应的标签置为o 判断队列是否为空 如果队列中存在元素 则继续下面的步骤 否则结束 生长 选取队列中的第一个元素 f j 点 观察 f 力点的四邻域点a b c d 的 标签 如果生长标签为0 进 步判断该点的灰度值是否满足生长条件 如果 生长标签为非0 则不考虑该点 表明该点已经并入目标区 如果该象素点满足生长条件 把该象索点加入队列 并且将标签景为非0 如此循环直到四邻域点都经过判断 删除队列中的首元素 返回步骤 队列为空 则表示在己生长的区域里没有象素点满足事先规定的生长准赠 就停 止生长 在生长结束后 再扫描整幅图像的每一个象素点 如果生长标签为非0 则表明该点在目标区 3 1 4 生长判决条件 根据上述生长方式 判决条件就是判断点是否能纳入列队的条件 存在如下 两个方面 浙江工业大学硕士学位论文 该点是否为已生长的并且被纳入了目标区域 如果已在目标区 则停止 如果 在目标区以外 就进一步判断下厦 是否同时满足 该点的灰度值是否满足生长条件 即该点与已生长区域的相似性判决标准 相 似性判决标准一般有如下2 种不同的标准 1 灰度相似性判决标准 1 设己分割区域r 的灰度值为x 待测象素点灰度为y 则待测象素点与已分 割区域相似性s 表示为下式 s w y x 2 3 3 式中 w 为非负权值 对于足够小的s 可认为待测象素与已分割区域相似 并入已分割的目标中 否则不进行合并 同时用y 更新均值 矗 服 j 1 3 4 式中 是已生长区域的象素个数 2 均方差判决 设已生长的区域像素个数为n 从1 开始每增长一个点就加1 灰度均值为 牙 待测像素灰度为y 定义r 的均值和方差为 矜吉 姜 棚 3 5 盯2 邝 一司2 3 6 则均方差相似性准则为 丁 等1 沪秒 j c 一 z 若7 1 足够小 可认为待测像素与已分割区域相似 并入已分割的目标中 同时用 y 和 3 4 式更新均值 用 3 8 式更新方差 盯 2 脚卜 2 y 一瓦删 2 力 瓦州一i 甜 2 3 8 本文采用灰度相似性判决标准 经过处理得到了待识字符块区域 如图3 1 浙江工业大学硕士学位论文1 9 字符块定位 3 2 所示 图3 1 二值图图3 2 字符串区域定位图 3 2 数学形态学的基本算法 当被识别的图像中存在多个仪表 那么要把各个仪表的字符块分别提取出 来 那么采用上面的方法不能达到此目的 所以提出了利用数学形态学的方法来 定位各个字符串区域 数学形态学方法主要针对边缘图像 所以先采用边缘检测 的p r i w i t t 算子对图像进行边缘提取 然后进行数学形态处理 下面将介绍数学 形态的基本知识 3 2 1 什么是数学形态学 数学形态学ds m a t h e m a t i cm o r p h o l o g y 是 种应用于图像处理和模式识别 领域的新的方法 它是分析几何形状和结构的数学方法 是建立在集合代数基础 上 用集合论方法定量描述几何结构的科学 数学形态学是由一组形态学代数运算算子组成的 最基本的形态学运算算子 有 腐蚀 e r o s i o n 膨胀 d i l a t i o n 开 0 p e n i n g 和闭 c l o s i n g 用这些运 算算子及组合来进行图像形状和结构的分析和处理 数学形态学的基本思想方法对图像处理的理论和技术产生了重大影响 许多 非常成功的理论模型和视觉检测系统都采用了数学形态学算法作为其理论基础 或组成部分 事实上 数学形态学已经构成一种新型的图像处理方法和理论 形 态学图像处理已成为计算机数字图像处理的一个主要研究领域 这门科学在计算 机文字识别 计算机显微图像分析 如定量金相分析 颗粒分析 医学图像处 理 工业检测 如印刷电路自动检测 机器人视觉等方面都取得了许多非常成 浙江工业大学硕士学位论文2 0 字符块定位 功的应用 有些计算机图像处理和分析系统把形态学运算作为基本运算 由此出 发来考虑体系结构 一些形态学的算法 已经做成了计算机芯片 许多研究成果 已作为专利出售 其影响已波及到与计算机图像处理有关的各个领域 包括图像 增强 分割 恢复 边缘检测 纹理分析 颗粒分析 特征生成 骨架化 形状 分析 压缩 成分分析及细化等诸多领域 目前 有关形态学的技术和应用正在 不断地发展和扩大 形态学的理论基础是集合论 在图像处理中形态学的集合 s e t 代表着黑白 和灰度图像的形状 如黑白二值图中所有黑色像素点 p i x e l 的集合组成了此图 像的完全描述 在一个集合中 将进行形态变换的像素点是被选择的集合x 而此集合的补z 是没有被选择的集合 通常被选择的集合是图像的前景 f o r e g r o u n d 而未被选择的集合是图像的背景 b a c k g r o u n d 3 2 2 数学形态学中的基本符号和术语 既然数学形态学是建立在集合论的基础上的 那么在介绍数学形态学的算法 之前 先来了解一些集合论和数学形态中符号和术语 1 元素和集合 在数字图像处理的数学形态学运算中 把一幅图像称为一个集合 对于二值 图像而言 习惯上认为取为0 的点构成背景 对于一幅图像彳 如果点a 在a 的 区域内 那么就说口是彳的元素 记为d a 否则记作d 仨a 对于两幅图像a 和b 如果对b 中的每一个点b b b 都有b a 那么称 b 包含于a 记作b a 如果同时还有4 中存在至少一个点 口 a 且盯萑b 那么b 真包含于a 记作b a 根据定义可以知道 如果b a 那么必有 b 互a a 互a 恒成立 2 交集 并集和补集 两个图像集合a 和b 的公共点组成的集合称为两个集合的交集 记为 a n b 即a n b 缸l 口 z 且口 b 两个集合a 和b 的公共元

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论