版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章绪论
1.1概述
人类在征服自然、改造自然和推动社会进步的过程中,面临着自身能力、能量的局限性,因而创
造和创造了许多机器来辅助或代替人类完成任务。智能机器或智能机器人是这种机器最理想的模式。
智能机器能模拟人类的女能、能感知外部世界,有效解决问题。
人类感知外部世界:视觉、听觉、嗅觉、味觉、触觉
眼耳鼻舌身
所以对于智能机器,赋予人类视觉功能极其重要。
机器视觉:用计算机来模拟生物(外显或宏观)视觉功能的科学和技术。
机器视觉目标:用图像创立或恢复现实世界模型,然后认知现实世界。
1.2机器视觉的研究内容
1输入设备成像设备:摄像机、红外线、激光、超声波、X射线、CCD、数字扫描仪、超声成像、
CT等
数字化设备
2低层视觉(预处理):对输入的原始图像进行处理(滤波、增强、边缘检测),提取角点、边缘、
线条色彩等特征。
3中层视觉:恢复场景的深度、外表法线,通过立体视觉、运动估计、明暗特征、纹理
分析。系统标定
4高层视觉:在以物体为中心的坐标系中,恢复物体的完整三维图,识别三维物体,并确定物体的
位置和方向。
5体系结构:根据系统模型(非具体的事例)来研究系统的结构。(某时期的建筑风格一据此风格设
计的具体建筑)
13机器视觉的应用
工'也检测一文件处理,亳微米技术一多媒体数据库。
许多人类视觉无法感知的场合,精确定量感知,危险场景,不可见物感知等机器视觉更显其优越十
足。
1零件识别与定位
生产线机器人足球赛
2产品检验
外形、外表、装配位置、超声探测内部裂纹和气孔
3移动机器人
双目识别恢兔场景。无人驾驶汽车
4遥感图像分析
航空摄影、气象卫星、资源卫星
航空摄影:利用普通摄影机航拍。制图、制导用
气象卫星:红外成像、气象云图
海洋资源:合成孔径雷达,跳取海辰形象。找矿农作物调查,自然灾害测报,生态环境检
测。
5医学图像分析
X射线、CT(ComputerTomography)核磁共振MRI(magneticresonanceimaging),超声成像。
作用:(I)图像增强、标记、染色
(2)专家系统,自动研制
6平安鉴别、监视跟踪
车辆识别、车牌号识别
人脸、眼底、指纹、表情
7其他
体育运动分析:游泳
制衣〔人体扫描)
影视制作
1.4人类视觉简介
1人眼所能看到的光谱范围,只是电磁波辐射范围的很小的一局部,为380nm-780nm,可见光谱
38078()
紫外紫蓝青绿黄橙红红外
2人眼的构造
角膜占外表的1/6具有屈光作用
晶状体、玻璃体等都有屈光作用
视网膜:杆状细胞(暗)
锥状细胞(明)但工
瞳孔
3视觉信息处理
虹膜
(1)凫度(2)形状[3)运动\[4J颜色深度感[6:通道(7)并行
人眼对运动物体特别敏感
锥状细胞有三种,分别对430、力MX57O,敏息晶状体(调焦)
深度感因视差而产生视觉过程:
另外:人对光的感觉有潜伏期,屡次闪光会导致闪烁的知觉。
降龙十八章
(2)视觉的空间特性
小而弱的光点单独呈现时可能看不见,但当多个连在一起咋为一个大的光点时同时呈现时便能看见
了。
视觉度表示人所能看到景物细节的准确性。
觉察:检测在视野中的某个给定物体是否存在
定位:对两物体相对位置精确I(分的能力
解像:守一祯觉形状各组成局部二间距离的区分能力C
认知:综合供能力觉察包括目』度绫定位解像认知
13J形状知觉:轮廓、图形、背爆:
轮廓:轮廓把物体与视野中的其它局部区分开来,轮廓不等于形状。
轮廓只是边界,是局部概念,而形状那么是全体概念。
主观轮廓:
主观轮廓产生的必要条件是有些不完整的因素出现将它完整起来就有一种把它变成简单和稳定正规图
案的倾向。
(4)视觉的相对性
视觉感知的结果不仅仅取决于刺激本身,还与经验比照有关系。(早晨、中午的太阳哪个更近)
前景与背景:
前景:视觉关心的主体。
背景那么是与前景相关联的其它刺激
视觉知觉的比照:11)前景和背景可相互置换
(2)前景受背景的影响
⑸视觉的选择性
听而不闻视而不见。依赖先验知识而取向。
(6)视觉的整体性
对局部感知之和而产生的一种整体知觉经验
(7)视觉的恒常性
亮度恒常性:黑布、白布各自一半在阳光下,一半在阴影中,我们仍然能够判定它为黑布白布。
大小恒常性:物体在视网膜上的象随距离而变化,但我们的感觉那么并不是大小的变化而是距离
的变化。(感觉到远方的牛仍然比近处的狗大)
形状恒常性:直线投影为一点,通过经验加以矫正
颜色恒常性:在相当宽的光明变化条件中,能够感受到颜色的恒常。
(8)视觉的组织性
相似性
接近性
科行点列0°OOOO三列点列
按行按列
封闭性
封闭轮廓更容易够成图形。
连续性
•条直线和曲微的屡次父汇,,百邺上.倾向于连续
(9)错视现象
H
i
1.5颜色和知觉
牛顿用三棱镜研究白光的折射,就此便发现白光可被分解成一系列从紫到红的连续光谱。从而证明
白光是由不同颜色的光线相混合而形成的,而这些光实际上是不同频率的电磁波。
(1)无颜色白一》灰f黑黑白系列
颜色
(2)有颜色除黑白系列之外的各种颜色
色觉的产生:光源的光―反射或透射—》视网膜—人脑解释
物体均匀的反射各种光一白色
物体只反射某种或某几种颜色一》彩色
CIE国际明度委员会
R:700nm(570)
G:546.Inm(540)光的三基色
B:435.8nm(430)二基色叠加形成三补色
颜料的三基色正是光的三补色。
人眼的锥状细胞有三种,分别对430,540,570)匕谱敏感。
设三种刺激量分别为:X、Y、Z那么:
YXZ
V=,X=,Z=
Z+Y+ZX+Y+ZX+Y+Z
为刺激量的比例系数,称为色系数。可见:
x+y+z=1
CIE1931色度图
①三色比例系数x、y、z均大于零。
②Y的数值正好是彩色光亮度。
③x=y=z表示标准白光。
这样:
(D每一点对应一种颜色。
。色度图边界上二点代表纯颜色。
③连接两端点直线上的点可由二端点颜色合成。
3端点三角形内的颜色可由三端点颜色合成。
3基色不能组合出所有的颜色。
补色律:两个以适当比例混合能得到白色或灰色的颜色,互称为补色。
中间色律:两个非补色混合,便产生•个新的中间色或混合色,色调的混合比例确定。
代替律:如颜色
X+Y»B,A+B»C那么有A+X+Y»C
颜色模型
①RGB模型(面向显示器、打印机等硬设备)
规划为单位正方体
那么所有RGB的值在[0,1]
R=700nm
G=546.1nm
B=435.8nm
根据不同需要提出了:RGB、CMY、XYZ、
YIQ、HSV(HIS)
标准白色的RGB光通量私、九、0B为:
媒:%:%=1:4.5907:0.0601
这样把九通量为1L山的红色,4.5079流明的绿光,0.0601流明的蓝九作为三基色的单位基色量。
这样某彩色光通量(C)=R(R)+G(G))+B(B)
(C)表示光的明亮程度,其色度只取决于R、G、B之间的比例关系。
•••口A
RGLB
r=------------,g=------------,D=---------------
R+G+BR+G+BR+G+B
r、g、h为色度坐标,r+g4-h=I
②CMY
各种光也都可以用CMY三基色混合而成。
RGB,由黑一》白,增色过程。
CMY,由白一黑,减色过程。
(绘图,打印机)颜料。
④YIQ
保证彩色电视和黑白电视的兼容。NTSC(国际电视系统)协会。
Y对应于XYZ中的Y,为亮度信息。
选择三色的基色量为R=0.299,G=0.587,B=O.1I4
Y=O.299R+O.587G+O.II4B
规定:
I=0.74(R-Y)-0.27(B-Y)
Q=0.48(R-Y)+0.41(B-Y)
综合有:
这里RGB为NTSC制式RGB
⑤HIS模型
H:色调。混合光谱中的主要波长。
S:饱和度。•定色调的纯度。纯光谱色是
完全饱和,参加反九饱和度逐渐减小。
i:密度、亮度(与反射率成正比)
RGB至HIS转换
HIS转到RGB
HG[O,120°]
Seos”
/?=;[1+]
cos(60'—H)
发光强度定义:光源540x1(严"z的单色光,在指定方向辐射强度为%83%〃
1.6光度学
光度学:研究光的强弱的学科。[Photometry)
当光源足够小,或足够远,以至于眼睛无法分辨形状时,光源为点光源。
点光源Q沿某个方向r的发光强度I定义为此方向上单位立体角内发出的光通量。°。单位为流明
(Lm)o
以r为轴取一个立体角元&内的光通量为d(/)沿I■方向的发光强度为:
/二或(单位角内的光通量)
dQ
b
发光强度的单位为cd(坎[德拉]),lcd=lYsr
led发光强度的点发出的总光通量为4nlm。
sr为球面度,球心对球面的总球面度为4n。
实际中的光源总有一定的发光面积—扩展光源。扩展光源外表的每个面元ds沿某个方向r有一定
发光强度di
沿r观察,那么ds'=dscos0投影面积
那么面元ds沿r方向的光度学亮度B定义为在此方向上单位投影面积的发光强度。
高度:
「dldidd)"3"/
B=---=----------=--------------单位:cd/
(1S1dScos。/"
被照外表照度:一个被光线照射的外表上的照度,为照射在单位面积上的光通量,设面积ds上的
光通量为d6,那么:
12
照度E=^单位:IX(勒[克斯])1Lx=1^2lm/m
照度
光学系统的像面照度和其他外表的照度是必须了解的光学量。参看图141,从轴面上的面元dAi、
辐射到接收面上的面元dA2的辐射通量为:
4①2=LdAid。,CosO
式中
图xx辐射的传播
而从物面辐射到接收面的总辐射通量为
设物面是朗伯面,即L与面元dAi的位置无关,那么
由此
式中B2称为辐射传输系数,它只与外表的形状、位置、大小和方向有关。是一纯粹儿何量。日2是一二
重积分量,很难计算,不过现在已经对一些典型情况,计算出了结果,并且列出了表格,可供查阅。
像面照度
光学系统像面上的照度会受两方面的影响:(1)光学系统的会聚和发散作用;(2)光学系统的吸收、
反射、散射和挡光的作用;为了简单起见,将忽略第(2)种影响,而对于第(1)种影响将通过光学系
统的几何度G表示出来,并使这一计算变得很简单。
几何度G的定义为
式中
这是投影立体角,它是接收面dAz对物面dA,所张立体角在物面法线方向的投影的积分。
几何度G只和光源的几何尺J、光源到光学系统的距离、光学系统的入瞳尺、J以及光学系统的结构
有关。当光能通过光学系统且不存在损失时,G是不变量,即在光学系统内的不同截面上,G都是相同
的。假设从图L4—2观察那么有
Gs=Ge=Gx=Gi
式中Gs、Ge、Gx、Gi分别是光学系统的物面S、入瞳面e、出瞳面x、像面i
的几何度。
区1.4-2
从上可以看出;
(1)几何度G可以表示光学系统传输辐射的能力;
(2)可以根据易于计算的截囿上的G值,计算出任一截向上的照度。
例如:(1)光能无损失的光学系统像面中心的辐射度
由①=ZAQ得到
式中,a是光学系统的纵向放大率。
(2)视场角为0处像平面上的辐照度。
比拟物方侧物点1和轴上点0所对应立体角的大小。对于物点1,入瞳所对应的立体角为
式中Q。是入瞳对轴上点0所张的立体角,故轴外点像平面的辐照度为
上式说明:像面照度耳与光学系统的相对孔径(弓)的平面成:E比,又和视场角0的余弦的4次方成正
比;
需要特别注意的是:E,oocos40,这将严重影响像面照度的均匀性。但是,对于野外景物,它并不
是朗伯体,而是各向均匀发光体,那么用8cos3。。
1.7视觉的空间知觉
人眼能在高和宽为2D空间上形成的视象得到一个3D视觉空间。
①非视觉性深度线索
眼睛聚焦调节:
观察远点不同的物体时,眼睛调节晶状体,使成清晰象,这种调节活动给大脑提供信息,
提供深度估计。
据此一共焦测距法
双眼视轴的融合
观察远近不同的物体,双眼自幼调节使视轴对准视网膜中心,做幅合运动。
提供距离信息f三角测距法
②双眼深度线索
中央眼确定主观视觉方向,视觉
是产生立体知觉和深度知觉。(单独产生)
(图像复合后相当于1只眼睛看到)
③单眼深度线索
大小:尺寸相近的物体,近:成像大;远:成像小
物体的遮挡:遮挡来判断物体的前后距离
光亮与阴影:近:物体明亮;远:物体灰暗
颜色分布:近:黄或红;远:蓝
空气透视:近:轮廓清晰;远:模糊不清
纹理:近:纹理稀疏;远:纹理密集
运动:近:视角变化大;远:视角变化小
(坐车过电线杆,和远处的树)
第二章图像的采集和量化
2.1采集装置的性能指标
接受外界的鼓励并产生响应,把模拟的响应转化为数字化的信号,从而可被计算机利用。
采集装置功能:
①接受辐射(光、声、电)
②进行模数转换。
采集装置性能指标:
①线性响应:输入物理信号的强度与输出响应信号的强度之间关系是否线性。
②冠敏度:绝对灵敏度用能拾测到的最小光子数表示。
相对灵敏度用能使输出发生一级变化所需九子数表示。
③信噪比:所采集的图像中有用信号与无用干扰的(能量或强度)比值。
④阴影(不均匀度):输入物理信号为常数而输出的数字形式不为常数的现象。
⑤象素形状:一般为正方形,但也有其它形状(如运动)。
⑥频谱灵敏度:对不同频率辐射的相对灵敏度。
⑦快门速度:采集拍摄时间。
⑧读取速度:信号数据从敏感单元读取(传输)的数率。
2.2电荷藕合摄像器件
面阵CCD原理。(帧转移型,隔列转移型,线转移型)
面阵CCD的根本特性参数:
①光电转移特性
光电转换因子Y,一般99.7%。
②光谱响应
③动态范围:输出信号峰值电压与均方根噪声电压之比。
噪声源:电荷注入器件引起的噪声。
电荷转移过程中,电荷量变化引起的噪声。
拾测时产生的噪声。
④暗电流:正常工作时,MOS电容处F未饱和的非平衡状态,但由于热激发产生的少量载
流子使系统趋向平衡。
暗电流是判断一个系统好坏的重要标志。
⑤分辨率:像元位数高的器件具有更高的分辨率。
面阵CCD,只评价其水平分辨率,
且用电视线数的评价方法。
在•幅图像上,在水平方向能够分
辨出的黑白条数一一分辨率。
⑥填充系数Fb
电敏感区域占整个矩阵面的比例b
F=n--xlOO%
bxb
⑦拖影:由存放器电荷移位时留下的剩余
电荷量产生。
三管CCD彩色摄像机
分光棱镜―三色―三CCD接收—►RGB信号
单管CCD彩色摄像机
栅状滤色器一►三色—►三CCD接收—►RGB信号
(例举液晶显示器)
特种CCD图像传感器
①微光CCD图像传感器(多帧积累〕
直视夜视仪f微光透视图像传感器
特点:便于图像处理,实现远距传输或遥控,实现自动控制直接用于制导、
录像并长期保存。
②红外CCD图像传感器(IRCCD)
用于夜视,、跟踪制导、红外侦察、预警。(海湾战争)
主动红外电视摄像:
红外光源[红外光源,半导体激光器)
红外摄像器件(CCD)
红外变像管:把不可见的红外线转变成可见光。
③X光CCD图像传感器医疗影像+工业探测
目标:小剂量X光照射,图像远程传输。
2.3CCD相机
①分类:彩色相机黑白相机
②按次敏度划分:普通型(照度1〜3kix),月光型(照度0.1lux)
星光型(照度0.01hix),红外型(红外照明,天光线)
③按CCD灵敏度尺寸分为1/4inch,1/3inch,1/2inch,Iinch相机。
④按扫描方式:有面扫描和线左描方式,面扫描乂分为逐行扫描和隔行扫描。
⑤按同步方式:内扫描(普通相机),外同步功能相机。
CCD相机主要功能调节
①同步方式选择:内同步(利用内置的同步信号发生器产生同步信号):
外同步(外触发信号);
电源同步(利用电源完成垂直同步);
②自动增益控制:CCD信号的视频放大器,时不同照度而随之改变增益,可使相机在较大的光照范
围内进行工作。
③背儿补偿:自动补偿(AGC)以整个视场平均值来确定(亮背景,喑前景)启动背九补偿,那么
AGC只对前景视场求平均确定增益。
④电子快门:CCD仅输出快门开启时的光电荷信号,其余时间那么被泄放。最短电子快门为1/1000S.
⑤丫校正:Lr=V(机器视觉丫=1)
光(L)-CCD-电(V)f显示器f光。
要保持二次转换中的综合特性具有线性。
@自平衡(仅用于彩色相机):对景物图像进行色温补偿,分为自动调节和手动调节两种。
CCD相机接口:
①光学接口
②信号接口:
RS422:双绞线,相机具有110。终端负载。
CameraLink:控制信号、视频信号、串行通讯。
LVDS(低振幅差分信号):低电压和低电压驱动实现了低噪声和低功耗.
IEEE1394:串行接口(Firewire)-400Mbps,不需要集线器就可以连接63台设备,连接电脑可省
去图像采集卡。
2.4彩色数码相机
图像一镜头一CCD-A/D一数字信息存储
数码相机的最大特点是它的一系列的二进制数据和标准的图像存储方式把所摄图像存放在机内存储器,
并可以通过专用接口与通用计算机联机,实现图像传输和计算机处理的功能。
分辨率高达3060x20360
主要性能:
1.分辨率:常有1600x1200,1024x768,640x780。
2.色彩深度:专业的到达36位或24位。
3.焦距:可高达10倍光学变焦,数码变焦。
4.光圈快门:快门1/50076s广角光圈25〜什6;长焦光圈f3.8〜f240
5.图像存储:内置存储卡JPG格式120K。
6.取景器“观看拍摄效果和编辑修改(液晶)。
7.接口功能:RS232、SCSI、USB。1394接口。
8.其他接口:自动测光、自动调焦、自动闪光、自拍。
2.5常用的图像文件格式
1.BMP
2.GIF
3.TIFF(TIF)
4.JPEG(JPG)
(依据数字图像处理内容简单扩展)
2.6照明系统设计
照明系统设计的根本因素:
①镜头的视场:被测物尺寸一镜头视场一最正确照明[照亮整个视场)
②照明系统与工作间距:镜头到工作距离一照明系统到工作间距一光源到工作距离
③工件的外形,条纹及颜色:工作外表形状、平坦度、粗糙度、颜色
④成像物镜自配:针对确定的成像物镜进行光源设计一划痕、缺陷、印纹等能被清晰显现。
⑤照度自配:根据CCD的光外表动态响应范围确定适宜的像外表度。
照明系统的选择:
①直接型:
沐光方式高环形光反射型
低角度方式低环形光漫反射
条形方式条形光源
聚光方式聚光高亮方式(激光)
②投射型:
高亮投射照明
导光面(光板)投射照明
线条光源投射照明
③同轴光照明:与光轴平行的平行光均匀照明工件。
④不同频率光线照明(多彩)
第三章二值图像分析
一幅数字图像是一个二维阵列,阵列元素值称为灰度值或强度值.实际上,图像在量化成数字图像前是
一个连续强度函数的集合,场景常息就包含在这些强度值中.图像强度通常被量化成256个不同灰度级,
对某些应用来说,也常有32、64、128或512个灰度级的情况,在医疗领域里甚至使用高达4096(12bits)
个灰度级.很明显,灰度级越高,图像质量越好,但所需的内存也越大.
在机器视觉研究的早期,由于内存和计算能力非常有限,而且十分昂贵,因此视觉研究人员把精力
主要集中在研究输入图像仅包含两个灰度值的二值视觉系统上.人们注意到,人类视觉在理解仅由两个
灰度级组成的线条、轮廓影像或其它图像时没有任何困难,而且应用场合很多,这一点对研究一值视觉
系统的研究人员是一个极大的鼓舞.
随着计算机计算能力的不断增强和计算本钱的不断下降,人们普遍开始研究基于灰度图像、彩色图像和
深度图像的视觉系统.尽管如此,二值视觉系统还是十分有用的,其原因如下:⑴计算二值图像特性
的算法非常简单,容易理解和实现,并且计算速度很快.⑵二值视觉所需的内存小,对计算设备要求
低.工作在256个灰度级的视觉系统所需内存是工作在相同大小二值图像视觉系统所需内存的八倍.如
假设利用游程长度编码等技术[见3.4节)还可使所需内存进一步减少.由于二值图像中的许多运算
是逻辑运算而不是算术运算,所以所需的处理时间很短.(3)许多二值视觉系统技术也可以用于灰度图
像视觉系统上.在灰度或彩色佟像中,表示一个目标或物体的一种简易方法就是使用物体模板(mask),
物体模板就是一幅二值图像,其中I表示口标上的点,。表示其它点.在物体从背景中别离出来后,为
了进行决策,还需要求取物体的几何和拓扑特性,这些特性可以从它的二值图像计算出来.因此,尽管
我们是在二值图像上讨论这些方法,但它们的应用并不限于二值图像.
一般来说,当物体轮廓足以用来识别物体且周围环境可以适当地控制时,二值视觉系统是非常有用的.当
使用特殊的照明技术和背景并且场景中只有少数物体时,物体可以很容易地从背景中别离出来,并可得
到较好的轮廓,比方,许多工业场合都属于这种情况.二值视觉系统的输入一般是灰度图像,通常使用
阈值法首先将图像变成二值图像,以便把物体从背景中别离出来,其中的阈值取决于照明条件和物体的
反射特性.二值图像可用来计算特定任务中物体的几何和拓扑特性,在许多应用中,这种特性对识别物
体来说是足够的.二值视觉系统三经在光学字符以别、染色体分析和工业零件的以别中得到了广泛应用.
在下面的讨论中,假定二值图像大小为〃zx〃,其中物体像素俏为1,背景像素值为0.
3.1阈值
视觉系统中的一个重要问题是从图像中识别代表物体的区域1或子图像),这种对人来说是件非常容易
的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域别离出来,需要首先对图像
正行分割.把图像划分成区域的过程称为分割,即把图像厂区刃划分成区域/不〃2,…,〃…使得每一个区
域对应一个候选的物体.下面给山分割的严格定义.
定义分割是把像素聚合成区域的过程,使得:
•c=整幅图像({R}是一个完备分割).
•({用是一个完备分割).
•每个区域H满足一个谓词,即区域内的所有点有某种共同的性质.
•不同区域的图像,不满足这一谓词.
正如,面所说明的,分割满足一个谓词,这一谓词可能是简单的,如分割灰度图像时用的均匀灰度分布、
相同纹理等谓词,但在大多数应用场合,谓词十分复杂.在图像理解过程中,分割是一个非常重要的步
骤.
二值图像可以通过适当地分割灰度图像得到.如果物体的灰度值落在某•区间内,并且背景的灰度值在
这一区间之外,那么可以通过阈值运算得到物体的二值图像,即把区间内的点置成I,区间外的点置成
0,对于二值视觉,分割和阈值化是同义的.阈值化可以通过软件来实现,也可以通过硬件直接完成.
通过阈值运算是否可以有效地进行图像分割,取决于物体和背景之间是否有足够的比照度.设一幅灰度
图像尸上刀中物体的灰度分布在区间⑺,内,经过阈值运算后的图像为二值图像EU/1,即:
1如果7;<F[Z,j]<7;
(3.1)
0其它
如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示为:
1如果尸j]eZ
6['/]=(3.2)
o其它
其中Z是组成物体各局部灰度值的集合.图3.1是对一幅灰度图像使用不同阈值得到的二值图像输出
结果.
阈值算法与应用领域密切杆关.事实上,某一阈值运算常常是为某一应用专门设计的,在其它应用
nj域可能无法工作.阈值选择常常是基于在某一应用领域获取的先验知识,因此在某代场合下,前几轮
运算通常采用交互式方式来分析图像,以便确定适宜的阈值.但是,在机器视觉系统中,由于视觉系统
的自主性能(autonomy)要求,必须进行自动阈值选择.现在三经研究出许多利用图像灰度分布和有关
的物体知识来自动选择适当阈值的技术.其中的一些方法将在3.2节介绍.
图3.1一幅灰度图像和使用不司阈值得到的二值图像结果.上左:原始灰度图像,上右:阈值T=100;
左下:T=128.右下:Tl=100|T2=128.
3.2几何特性
通过阈值化方法从图像中检测出物体后,下一步就要对物体进行识别和定位.在大多数工业应用中,
摄像机的位置和环境是的,因此通过简单的几何知识就可以从物体的二维图像确定出物体的三维位
置.在大多数应用中,物体的数量不是很多,如果物体的尺寸和形状完全不同,那么可以利用尺度和形
状特征来识别这些物体.实际上在许多工业应用中,经常使用区域的一些简单特征,如大小、位置和方
向,来确定物体的位置并识别它们.
3.2.1尺寸和位置
一幅二值图像区域的面积(或零阶矩)由下式给出:
4一Im-1
A=ZZ仇(3.3)
1=0j=0
在许多应用中,物体的位置起着十分重要的作用.工业应用中,物体通常出现在外表1如工作台面)上,
而且摄像机相对台面的位置也是的.在这种情况下,图像中的物体位置决定了它的空间位置.确定物体
位置的方法有许多,比方用物体的外接矩形、物体矩心(区域中心)等来表示物体的位置.区域中心是
通过对图像进行“全局”运算得到的一个点,因此它对图像中的噪声相对来说是不敏感的.对于二值图
像,物体的中心位置与物体的质心相同,因此可以使用下式求物体的中心位置:
〃一1加一|〃一11
立z如,刃=zz沏,/
沁。六。沁。六。(3.4)
♦一1一一1阳一1
江Z即,刃冏"]
i=0j=0i=0j=0
其中元和歹是区域相对于左上角图像的中心坐标.物体的位置为:
ft网0
-_i=0J=0______
A(3.5)
n-izn-1
i=0六0
A
这些是一阶矩.注意,由于约定),轴向上,因此方程3.4和3.5的第二个式子的等号右边加了负号.
3.2.2方向
计算物体的方向比计算它的位置稍微复杂一点.某些形状(如圆)的方向不是唯一的,为了定义唯一的
方向,一般假定物体是长形的,其长轴方向被定义为物体的方向.通常,二维平面上与最小惯量轴同方
向的最小二阶矩轴被定为长轴.
图像中物体的二阶矩轴是这样一条线,物体上的全部点到该线的距禽平方和最小.给出一幅二值图像
BUJJ,计算物体点到直线的最小二乘方拟合,使所有物体点到直线的距离平方和最小:
始限力(3.6)
z=0j=0
其中弓是物体点亿刃到直线的距离.为了防止直线处于近似垂直时所出现的数值病态问题,人们一般
把直线表示成极坐标形式:
/7=xcos8+ysin。(3.7)
如图3.2所示,。是直线的法线与x轴的夹角,P是直线到原点的距离.把点口力坐标代入直线的极
坐标方程得出距离V:
/=(xcosO+ysin。一/7)?(3.8)
图3.2直线的极坐标表示
将方程3.8代入方程3.6并求极小化问题,可以确定参数/?和。:
〃一1"I
/=ZZ(/cos6+为sin。”)?即,力(3.9)
z=o;=0
令2?对夕的导数等于零求解0得:
p=(xcos^+ysin^)(3.10)
它说明回归直线通过物体中心(无方).用这一P值代入上面的那么极小化问题变为:
/=acos?O+bsinOcosO+csin?。(3.11)
其中的参数;
”一lr.i-l
i=0j'=0
n-]m-\
〃=(勺一幻(y厂刃(3.⑵
j=oj=0
1-j州-1
c=ZE(为-刃加;力
r=0>0
是二阶矩.表达式/可重写为:
♦111
Z~=—(a+c)+—(a-c)cos2〃+一〃sin2〃(3.13)
222
对??微分,并置微分结果为零,求解理[:
tan2<9=—(3.14)
a-c
因此,惯性轴的方向由下式给出:
sin28=士〒叮
正+(a-c)2
v(3.15)
cos26>=±-=a~C
技+(a-c)2
所以由才2的最小值可以确定方向轴.注意,如果〃=o,a=c.那么物体就不会只有唯一的方向轴.物
体的伸长率E是炉的最大值与最小值之比:
£=ZnwL(316)
3.2.3密集度和体态比
区域的密集度(compact)可用二面的式子来度量:
A
c=—(3.17)
P~
其中,〃和A分别为图形的周长和面积.根据这一衡后标准,圆是最密集的图形,其密集密度为最大值
1/4万,其它一些图形的比值要小一些.让我们来看一下圆,当圆后仰时,形状成了一椭圆,面积减小
了而周长却不象面积减小的那么快,因此密集度降低了.在后仰到极限角时,椭圆被压缩成了一条无限
长直线,椭圆的周长为无穷大,故密集度变成了零.对于数字图像,A///是指物体尺寸1像素点数量)
除以边界长度的平方.这是•种很好的散布性或密集性度量方法.这•比值在许多应用中被用作为区域
的一个特征.
密集度的另一层意义是:在给定周长的条件下,密集度越高,围成的面积就越大.注意在等周长的情况
下,正方形密集度大于长方形密集度.
体态比定义为区域的最小外接矩形的长与宽之比,正方形和圆的体态比等于1,细长形物体的体态
比大于1.图3.3所示的是几种形状的外接矩形.
图3.3几种外接矩形示意图
3.3投影
给定一条直线,用垂宜该直线的一簇等间距直线将一幅二值图像分割成假设干条,每一条内像索值
为1的像素个数为该条二值图像在给定直线上的投影(projection).当给定直线为水平或垂直直线时,
计算二值图像每一列或每一行上像素值为1的像素数量,就得到了二值图像的水平和垂直投影,如图3.4
所示.由于投影包含了图像的许多信息,所以投影是二值图像的一种简洁表示方式.显然,投影不是唯
一的,同样的投影可能对应不同的图像.
图3.4一幅二值图像及其水平投影图
在某些应用中,投影可以作为物体识别的一个特征.投影既是一种简洁的图像表示,又可以实现快
速算法.下面介绍对角线投影的求解方法.对角线投影的关键是计算当前行和列对应的投影分布图位置
标号.设行和列的标号分别用i和./表示.假设图像矩阵为〃行机列,那么,和J的范围分别为0到〃-1
和0到m-1.假设对角线的标号4用行和列的仿射变换(线性组合加上常数)计算,即:
d=ai+bj-vc(3.18)
对角线投影共时应〃+m-1个条,其中仿射变换把右上角像素映射成时角线投影的第一个位置,把左
下角像素映射成最后一个位置,如图3.5所示,那么当前行列对应的标号d的公式为:
d=i—j+m—I(3.19)
图3.5二值图像及其对角线上的投影图
3.4游程长度编码
游程长度编码(run-lengmencoding)是另一种二值图像的简洁表示方法,它是用图像像索值连续为1的个
数(像素1的长度)来描述图像.这种编码已被用于图像传输.另外,图像的某些性质,如物体区域面
积,也可以从游程长度编码直接计算出来.
在游程长度编码中经常运用两种方法,一种是使用1的起始位置和1的游程长度,另一种是仅仅使
用游程长度,但须从1的游程长度开始描述,如图3.6所示.
01100111000011111101
00011111101111111111
11111000001000001111
1的游程(2,2)(6,3)(13,6)(20,1)
(4,6)[11,10)
(1,5)(11,1)[17,4)
1和0的游程长度:0,2,2,3,4,6,1,1
0,3,6,1,10
5,5,1,5,4
图3.6一幅简单二值图像的游程长度编码.
如果用第二种方法来表示图像每行的游程长度,并用以代表图像第i行的第4个游程长度,那么全
部1的游程长度之和就是所求物体的面积.
〃一国
A=£(3.20)
/=0k=0
其中叫是第i行游程个数,(叫-1)/2取整,表示I的游程个数.
由游程长度编码能很容易地计算水平投影而无需变成原来的图像.使用更巧妙的方法也能从游程长度编码计算出垂
直和对角线投影.
3.5二值图像算法
从背景中别离出物体是一个困难的问题,在此将不讨论这个问题.这里假设物体可以从背景中别离,并
且使用某一谓词,可以对图像中属于物体的点进行标记.因此,问题就变为如何将一幅图像中所有被标
记的点组合成物体图像.这里还假设物体点在空间上是非常接近的.利用空间接近概念可以评格定义,
利用此定义研究的算法可以把空间上非常接近的点聚合在一起,构成图像的一个成分(component).下
面首先引进一些定义,然后讨论有关算法.
3.5.1定义
⑴近邻
在数字图像中,一个像素在空间上可能非常接近其它一些像素.在用方格表示的数字图像中,一个
像素与其它四个像素有公共边界,并与另外四个像素共享顶角.如果两个像素有公共边界,那么把它们
称为4一近邻(4-neighbors).同样,如果两个像素至少共享一个顶角,那么称它们为8—近邻.例如,位
于乩刃的像素有四个4一近邻:["1,力,[i+1,力,[仃+1].它的8—近邻包括这四个4
一近邻,再加上[i-lj-1],[i+1,/-1],+D+L/+1].一个像素被认为与它的4一近邻
是4一连通(4-connected)关系,与它的8—近邻是8—连通关系(如图3.7).
[LlJ+lj
[MJ]
r/j+n|
[W-1]口kj+HW-1]3
[计1,刀u+ij-np+ij]ii+lj+l]
图3.7矩形像素网格的4—近邻和8—近邻示意图.像素刀位于图的中心.
⑵路径
从像素区,/。1到像素必的路径(paih)是指一个像素序列[电[。],用,力],•・・,也,41,其中像
素&,人」是像素上+「八+/的近邻像素,OWkW〃-1.如果近邻关系是4一连通的,那么路径是4一路径;
如果是8一连通的,那么称为8一路径.图3.8即为路径的两个简单例子.
图3.84—路径和8—路径示意图
⑶前景
图像中值为1的全部像素的集合称为前景(foreground),用S表示.
(4)连通性
像素P,夕如果存在一条从〃到q
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年南通市如皋市保安员招聘考试真题附答案解析
- 电工(高级)资格证考试复习试题及答案详解(真题汇编)
- 电工(高级)资格证考试综合检测题型汇编含答案详解(培优a卷)
- 2025年盘锦市盘山县辅警招聘考试真题附答案解析
- 体育场馆设施租赁及赛事举办合作协议
- 2025年辽源市东辽县保安员招聘考试真题附答案解析
- 电工(高级)资格证考试考试模拟试卷附完整答案详解(各地真题)
- 2025年博尔塔拉蒙古自治州辅警招聘考试真题附答案解析
- 电工(高级)资格证考试考前冲刺练习题【预热题】附答案详解
- 电工(高级)资格证考试考试押题卷附答案详解【预热题】
- 个体工商户登记(备案)申请书
- 篮球原地投篮教学
- 购销摄像机合同范本
- 电力系统经济学原理课后习题及答案
- 智能水杯行业状况分析报告
- 电力部门春节安全生产培训
- 公司财务部门工作职责
- 人教版九年级数学上册22 3 3拱桥问题和运动中的抛物线 一课一练 (含答案)
- 2023年个税工资表
- 网球运动基本知识及规则课件
- 2023新青年新机遇新职业发展趋势白皮书-人民数据研究院
评论
0/150
提交评论