版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目录考红色部分目录i第1章 绪 论11.1 数字图像处理的概念11.2 图像处理的历史及应用21.3 数字图像处理分析系统2第2章 视觉和图像的生成42.1 视觉现象42.1.1 亮度适应和鉴别42.1.2 同时对比度42.1.3 对比灵敏度42.1.4 Mach效应42.1.5 主观轮廓52.1.6 空间错觉52.2 颜色视觉62.2.1 光和颜色62.2.2 颜色的表示62.3 像素间的基本关系62.3.1 邻域62.3.2 连通性62.3.3 距离度量6第3章 图像变换73.1 概述73.2 离散傅立叶变换DFT73.2.1 数字图像傅立叶变换的频谱分布和统计特性73.3 图像变换的通用
2、公式73.4 离散余弦变换83.5 Radon变换8第4章 图像增强94.1 图像增强原理及方法94.2 空域变换增强(点运算)94.2.1 直接灰度变换94.2.2 直方图调整104.3 空域滤波增强114.3.1 空域滤波基本原理114.3.2 平滑滤波114.3.3 锐化滤波(sharpening filter)124.4 频域滤波144.4.1 低通滤波144.4.2 高通滤波14第5章 图像复原155.1 基本概念155.2 逆滤波155.3 维纳滤波155.4 约束最小二乘方滤波15第6章 图像编码166.1 图像压缩编码基础166.1.1 图像压缩编码的必要性:目的166.1.2
3、 图像压缩编码的可能性:冗余166.1.3 图像压缩编码的分类166.2 信息理论基础166.3 熵编码186.3.1 哈夫曼编码186.3.2 香农-范诺编码196.3.3 算术编码206.3.4 行程编码(RLE)206.4 预测编码216.5 变换编码216.6 JPEG编码216.6.1 JPEG编码标准216.6.2 JPEG编码流程21第7章 图像分割 Image Segmentation237.1 概述与分类237.2 基于灰度的分割(区域相关技术)237.3 基于边缘的分割(边缘检测)237.4 基于区域的分割技术24第8章 数学形态学图像处理258.1 数学形态学概述258.
4、2 二值形态学258.2.1 二值形态学的基本运算258.2.2 二值形态学的应用258.3 灰度形态学258.3.1 膨胀与腐蚀258.3.2 形态学滤波26第9章 图像特征分析279.1 概述279.2 形状特征描述279.2.1 链码279.2.2 几何特征描述289.2.3 形状特征描述289.3 其他特征描述299.3.1 拓扑描述符29问答题31计算题33第1章 绪 论1.1 数字图像处理的概念1 图像l “图”是物体投射或反射光的分布l “像”是人的视觉系统对图的接受在大脑中形成的印象或反映。l 图像是客观和主观的结合。l 在人类接受的信息中,图像等视觉信息所占的比重约达到75%
5、。2 图像的分类l 模拟图像:连续的光学信号。l 数字图像:离散的数字信号,便于计算机处理。n 一幅数字图像可以定义为一个二维函数f(x,y)。n x和y是空间坐标,(x,y)表示图像中抽样到的一个点,称为图像元素或像素。n f(x,y)表示一个像素的强度或灰度。n x、y、f(x,y)都是离散的数值。3 数字图像的分类l 黑白(二值)图像:f(x,y)取值0或1,一个像素占1个bit。l 灰度图像:f(x,y)取值0到2n-1,一个像素占n个bit。l 彩色图像:f(x,y)为一个三元组(r,g,b),分别表示红、绿、蓝三个分量的强度。n 24位真彩色:每个分量占8个bit,一个像素共24个
6、bit。4 数字图像处理l 数字图像处理:使用计算机分析处理图像的技术n 广义的数字图像处理是指从图像获取到图像信息输出的全过程,即数字图像处理分析系统,包括5个部分:u 图像采集u 图像通信u 图像存储u 图像显示u 图像处理和分析n 狭义的数字图像处理仅指其中对图像信息进行处理和分析。5 图像处理技术l 图像预处理n 图像数字化:采样、量化n 图像变换n 图像编码n 图像增强n 图像恢复n 图像重建:根据二维图像构造三维图像l 图像分析n 图像分割n 图像识别l 图像理解6 图像工程l 图像工程:图像处理技术的整体框架。l 图像工程的三个层次n 图像预处理:对图像进行各种加工以改善图像的视
7、觉效果。从图像到图像。n 图像分析:主要是对图像中感兴趣的目标进行检测(分割)和测量(特征提取),提取出对它进行描述的信息。结果:可以是对图像进行描述的特征数据(如长度、面积等),或用符号表示的特征(如:如用a表示,用b表示| )。从图像到数值或符号。n 图像理解:在图像分析的基础上,找出各目标的性质和它们之间的相互联系,得出对图像内容和含义的理解以及对客观场景的解释。1.2 图像处理的历史及应用1. 图像处理的应用电磁波谱:伽马射线、X射线、紫外线、可见光、红外线、微波、无线电波、超声波1.3 数字图像处理分析系统1 数字图像处理分析系统的基本结构1) 图像采集l 图像传感器和数模转换器l
8、图像传感器品种繁多。常见的有:电视摄像机、扫描仪、数码相机l 目前常用的两种图像传感器件n CCD:面阵和线阵两种形式n CMOS:集成度更高2) 图像显示(图像输出)常用的图像显示设备:电视监视器、电脑显示器、投影仪、打印机等3) 图像存储l 常见图像存储器件n 各种RAMn 磁盘、光盘、闪盘n 数字磁带4) 图像通信l 图像通信必须有图像通信接口或设备,还必须有通信信道l 一幅电视图像:720*576*3*810Mbits,用128kbps的ISDN信道传输要1.3分钟,用2Mbps的信道也要5秒。电视图像需要25幅/秒。5) 处理和分析第2章 视觉和图像的生成2.1 视觉现象2.1.1
9、亮度适应和鉴别l 视觉惰性n 暗光适应:需2030秒n 亮光适应:需12秒l 暂留视觉l 人眼能适应的光强度达1010l 同时鉴别出的光强度变化范围就窄的多,256级灰度已足够l 主观感觉亮度与进入眼内的光强基本呈对数关系2.1.2 同时对比度l 相同亮度的物体,背景不一样时感觉到的亮度不一同2.1.3 对比灵敏度l Weber比n 在相当宽的光强范围内I/I为一常数,约为0.02;在最好的背景亮度下,可达0.01n 但在亮度很强或很弱的情况下,这个比值就不再保持为常数。2.1.4 Mach效应Mach效应:在观察不同亮度形成的区块的边界时,会感觉暗区更暗,亮区更亮。过高或过低估计不同亮度区域
10、边界值。2.1.5 主观轮廓2.1.6 空间错觉2.2 颜色视觉2.2.1 光和颜色l 人眼中有红、绿、蓝三种色感细胞可用红、绿、蓝三种颜色来配置任何一种颜色l 三基色,加性彩色系统:红光、绿光、蓝光l 三补色,减性彩色系统:青、品红、黄l 颜色的三种基本特征量n 辉度:亮度n 色调:颜色n 饱和度:色彩的纯度。饱和度高,色彩浓;饱和度低,色彩发白。n 色调和饱和度合起来称为色度2.2.2 颜色的表示 l RGB模型l YIQ模型(NTSC彩色电视)l YUV模型(PAL彩色电视)l HSI模型n H:色调n S:饱和度n I:辉度2.3 像素间的基本关系2.3.1 邻域l 4-邻域: N4(
11、p)l 8-邻域: N8(p)l 对角邻域:ND(p)2.3.2 连通性l 相同性质的像素相邻称它们是连通的l 设像素p和r有相同的性质,我们定义如下三种连通1) 4连通:r在N4(p)中,则p和r为4连通2) 8连通:r在N8(p)中,则p和r为8连通3) m连通(混合连通):若r和p满足u r在N4(p)中u 或r在ND(p)中,且N4(p)N4(r)是空集则称r和p是m连通的2.3.3 距离度量l 街区(city-block)距离l 棋盘(chessboard)距离第3章 图像变换3.1 概述l 数字图像处理的方法分为两类:空间域处理法(空域法)和频域法。l 空域法与频域法n 空域法:直
12、接对图像矩阵进行处理。n 频域法:将图像从空域变换到频域,然后在频率域对图像进行各种处理,再将所得的结果进行反变换,即从频率域变换到空间域,从而达到图像处理的目的。u 任何函数(包括非周期性函数)都可以用周期性函数乘以加权函数的积分来表示。3.2 离散傅立叶变换DFT3.2.1 数字图像傅立叶变换的频谱分布和统计特性l 频谱分布u 左上角为直流分量u 四个角为低频分量u 中央为高频分量l 进行频率位移后的频谱分布u 中心为支流分量u 中央部分为低频分量u 外围为高频分量 (a) 原图像(b)无平移的傅立叶频谱(c)平移后的傅立叶频谱 l 傅立叶变换的频谱统计特性n 零频率分量F(0,0)也称为
13、直流分量,反映图像的平均亮度n 低频分量,反映图像灰度变化缓慢的区域,85%的能量集中在低频区n 高频分量,反映图像灰度阶越变化的区域,高频分量主要是图像的边缘、细节以及噪声。3.3 图像变换的通用公式1 通用公式及变换核的可分离性和对称性g(x,y,u,v)为正变换核,h(x,y,u,v)为反变换核l 如果则变换核是可分离的; l 如果g1和g2、h1和h2形式一致,则变换核是对称的。正交变换具有可分离性和对称性3.4 离散余弦变换3.5 Radon变换Radon变换是计算图像在某一指定角度射线方向上投影的变换方法。l 投影重建n 可以利用拉东逆变换进行投影重建。u 投影的数目越多,重建的效
14、果越好。u 投影的数目越少,效果越差,会产生虚假点。n 投影重建的一个应用就是CT( 断层成像) 。为了对断层进行投影扫描,必须使用有穿透能力的成像技术,如X 射线、伽马射线、超声波、核磁共振等。 l 在大多数应用中,没有原始图像来计算投影。例如,X射线吸收重建,投影是通过测量放射线沿不同角度穿透物理标本的衰减过程而构造出来的。 第4章 图像增强4.1 图像增强原理及方法 l 图像增强的目的n 改善图像的视觉效果n 突出图像的特征,便于计算机处理。l 图像增强按作用域分为两类,即空域处理和频域处理。n 空域处理是直接对图像进行处理;u 空域变换增强(点运算):基于像素点u 空域滤波增强:基于模
15、板,对图像的处理是对小的子图像(模板)进行的。n 频域处理则是在图像的某个变换域内,对图像的变换系数进行运算,然后通过逆变换获得l 图像噪声的概念n 所谓的图像噪声,是图像在摄取时或是传输时所受到的随机干扰信号。n 常见的有椒盐噪声和高斯噪声。 u 椒盐噪声的特征:出现位置是随机的,但噪声的幅值是基本相同的。u 高斯噪声的特征:出现在位置是一定的(每一点上),但噪声的幅值是随机的。 4.2 空域变换增强(点运算)4.2.1 直接灰度变换l 什么是灰度变换:将一个灰度区间映射到另一个灰度区间的变换称为灰度变换。l 灰度变换的目的:灰度变换可使图像动态范围加大,图像对比度扩展,图像清晰,特征明显,
16、是图像增强的重要手段。l 灰度变换的分类n 线性变换u 比例线性灰度变换u 分段线性灰度变换n 非线性变换1 比例线性灰度变换l 原图像灰度范围为a,b,希望变换后灰度范围扩展到c,dl 如果将灰度范围充分扩展到0,255l 图像灰度反转2 非线性灰度变换l 对数变换 l 指数变换 l 幂次1. 变换 n 当g<1时,具有扩展低亮度区、压缩高亮度区的效果,图像变亮;n 当g>1时,性能正好相反,具有压缩低亮度区、扩展高亮度区的效果,图像变暗。n 而当c=g=1时,输出正比与输入,图像无变化。 n 应用:“g校正”(伽马校正),CRT显示器4.2.2 直方图调整1 灰度直方图的定义l
17、 直方图是用来表达一幅图像灰度级分布情况的统计特性。 n 横坐标:灰度rn 纵坐标:为某一灰度值rk的像素个数nk或是灰度出现的概率P(r)2 直方图与图像清晰性的关系(a) 动态范围窄,对比度低,偏暗(b) 动态范围窄,对比度低,偏亮(c) 动态范围窄,对比度低(d) 动态范围宽,对比度高3 直方图均衡化l 直方图均衡化的基本思想是把原始图像的直方图变为均匀分布的,扩展图像灰度的动态范围,达到增强图像对比度的效果。4.3 空域滤波增强在待处理的图像中逐点移动模板,对每个(x,y)点,滤波器在该点的响应通过事先定义的关系来处理。4.3.1 空域滤波基本原理l 空域滤波的主要内容n 平滑滤波:柔
18、化图像或消除噪声。类似于频域滤波的低通滤波。u 线性平滑滤波u 非线性平滑滤波n 锐化滤波:增强图像的边缘和轮廓,使细节更加清晰。类似于频域滤波的高通滤波。 u 线性锐化滤波 u 非线性锐化滤波 4.3.2 平滑滤波平滑滤波的目的:柔化图像和消除噪声1 线性平滑滤波:均值滤波l 在图像上,对待处理的像素给定一个模板,该模板包括了其周围的邻近像素。将模板中的全体像素的均值来替代原来的像素值的方法。l 均值滤波器的改进加权均值滤波n 均值滤波器的缺点是,会使图像变的模糊,原因是它对所有的点都是同等对待,在将噪声点分摊的同时,将景物的边界点也分摊了。n 模糊程度与邻域半径成正比nn 为了改善效果,就
19、可采用加权平均的方式来构造滤波器。n 如下,是几个典型的加权平均滤波器。2 非线性平滑滤波器中值滤波虽然均值滤波器对噪声有抑制作用,但同时会使图像变得模糊。即使是加权均值滤波,改善的效果也是有限的。为了有效地改善这一状况,必须改换滤波器的设计思路,中值滤波就是一种有效的方法。l 中值滤波n 设有一个一维序列f1, f2, , fn,取窗口长度(点数)为m(m为奇数),对其进行中值滤波,就是从输入序列中相继抽出m个数fi-v, , fi-1, fi, fi+1, , fi+v(其中fi为窗口中心点值,v=(m-1)2), 再将这m个点按其数值大小排序,取其序号为中心点的那个数作为滤波输出。用数学
20、公式表示为中值滤波器 实例与均值滤波类似,做3*3的模板,对9个数排序,取第5个数替代原来的像素值。中值滤波相对均值滤波,边界更清晰,降噪效果稍差。l 中值滤波器与均值滤波器的比较n 对于椒盐噪声,中值滤波效果比均值滤波效果好。 u 椒盐噪声是幅值近似相等但随机分布在不同位置上,图像中有干净点也有污染点。u 中值滤波是选择适当的点来替代污染点的值,所以处理效果好。u 因为噪声的均值不为0,所以均值滤波不能很好地去除噪声点。n 对于高斯噪声,均值滤波效果比均值滤波效果好。 u 高斯噪声是幅值近似正态分布,但分布在每点像素上。u 因为图像中的每点都是污染点,所以中值滤波选不到合适的干净点。u 因为
21、正态分布的均值为0,所以均值滤波可以消除噪声。3 平滑滤波器的问题l 经过平滑滤波处理之后,图像就会变得模糊。l 分析原因,在图像上的景物之所以可以辨认清楚是因为目标物之间存在边界。l 而边界点与噪声点有一个共同的特点是,都具有灰度的跃变特性。所以平滑处理会同时将边界也处理了。4.3.3 锐化滤波(sharpening filter) l 图像锐化的目的:消除图像模糊,加强图像的目标边界和图像细节l 图像平滑的基本方法是积分l 图像锐化的基本方法是积分的逆运算微分n 线性锐化滤波:一阶微分n 非线性锐化滤波:二阶微分1 一阶微分梯度算子f(x,y)在(x,y)的梯度 其模值 近似梯度模值 l
22、直接差分算子 l Roberts算子 l Sobel算子 l Prewitt算子 2 二阶微分:拉普拉斯算子(Laplacian) 1.离散函数的拉普拉斯算子拉普拉斯(Laplacian)算子,二阶偏导数的和。是一个标量,具有各向同性的性质。拉普拉斯算子: 3 一阶与二阶微分的边缘提取效果比较以Sobel及Laplacian算法为例进行比较。l Sobel算子获得的边界是比较粗略的边界,反映的边界信息较少,但是所反映的边界比较清晰;l Laplacian算子获得的边界是比较细致的边界。反映的边界信息包括了许多的细节信息,但是所反映的边界不是太清晰。4.4 频域滤波l 引起图像质量下降的噪声在图
23、像的傅里叶频谱中占据的是高频段;l 图像的边缘在傅里叶频谱中占据的也是高频段;l 图像的主体或图像中灰度变化较缓的区域在频谱中占据的是低频段。4.4.1 低通滤波在频域中采用滤波器衰减高频分量、保留低频分量的过程称为低通滤波。l 低通滤波可以消除噪声,起到图像平滑的增强作用l 由于虑除了某些边界对应的频率分量,而使图像变得模糊,图像模糊的程度与截止频率有关4.4.2 高通滤波在频域中采用滤波器衰减低频分量、保留高频分量的过程称为高通滤波。l 高通滤波可以增强图像的边缘,起到图像锐化的增强作用l 高通滤波器基本上抑制了图像中的平滑信息,因此如要在保持图像基本信息的基础上实现锐化,就需要采用高频加
24、强技术。第5章 图像复原5.1 基本概念l 先研究图像退化(质量下降)的原因,利用图像退化的先验知识,建立相应的复原函数,从而恢复降质图像的本来面目。n 因此,图像恢复要将退化过程模型化,再采用相反的过程恢复图像的本来面貌。l 图像复原与图像增强的异同图像复原与图像增强的目的都是在某种意义上对图像进行改进,即改善输入图像的质量,但二者使用的方法和评价标准不同。图像增强技术一般要利用人的视觉系统的特性,目的是取得较好的视觉效果,并不需要考虑图像退化的真实物理过程,增强后的图像也不一定要逼近原始图像。而图像复原则认为图像是在某种情况下退化了,即图像品质下降了,通过先验知识建立图像退化过程的模型,并
25、且采用相反的过程恢复出原始图像。l 退化的典型表现为:模糊、失真、噪声等l 退化的原因:大气湍流,光学系统中绕射,传感器非线性,相对运动、摄像时扫描线非线性大气湍流引起图像模糊l 图像复原方法n 无约束复原:逆滤波n 有约束复原:维纳滤波、最小二乘方滤波5.2 逆滤波5.3 维纳滤波 维纳滤波需要知道原始图像和噪声的功率谱。得到结果是平均意义上的最优。当噪声不存在时,逆滤波与维纳滤波可以获得相同的复原效果。当噪声存在时,维纳滤波显然优于逆滤波。5.4 约束最小二乘方滤波 需要知道噪声的均值和方差。 对每一幅图像都能产生最优的结果。 第6章 图像编码6.1 图像压缩编码基础6.1.1 图像压缩编
26、码的必要性:目的l 减少数据量:存储量、传输时间n 人类信息获取85%来自视觉系统例 61 图像压缩编码的必要性一般彩色电视信号,YIQ色空间中各分量的带宽分别为4.2MHz、1.5MHz、0.5MHz,采样原理,采样频率>=2倍原始信号频率,量化为8bit,1秒钟的数据量为(4.2+1.5+0.5)*2*8=99.2Mbits,约为100Mbits/S。1GB的CD-ROM存1分钟的原始电视节目。HDTV数据量约为1.2GBits/S,1GB存6秒钟HDTV。彩色静止图像:3*1024*1024*8=3MB,6.1.2 图像压缩编码的可能性:冗余一般来说,图像数据中存在以下几种冗余:1
27、、空间冗余:2、时间冗余:3、结构冗余:4、信息熵冗余:5、知识冗余:6、心理视觉冗余:既然图像中存在信息冗余,就有可能对图像数据量进行压缩,针对数据冗余的类型不同,可以有多种不同的数据压缩方法,本章将讨论各种压缩方法。6.1.3 图像压缩编码的分类l 编码技术n 熵编码(统计编码):Huffman编码、香农-范诺编码、算术编码、行程编码n 预测编码n 变换编码n 混合编码l 是否有失真n 无失真编码:无损,可逆n 有失真编码:有损,不可逆6.2 信息理论基础设一个离散信源X:其概率分布:满足某个信源符号xk,如果它出现的概率是pk l xk的信息量l 熵 单位:比特/符号 ll 平均码长l
28、编码效率l 冗余度l 压缩比Ls为压缩前的编码长度,Ld为压缩后的编码长度例 62 图像熵设则,各信源符号自信息量:信源熵 编码方法:a,b,c,d用码字00,01,10,11来编码,每个符号用2个比特。平均码长也是2比特。 例 63 图像熵设则,各信源符号自信息量:信源熵 两种编码方法: 1、a,b,c,d用码字00,01,10,11来编码 平均码长:平均码长大于信源的熵 2、 a,b,c,d分别用码字0,10,110,111来编码 平均码长: 平均码长等于信源的熵 例 64 图像熵设则,各信源符号自信息量: 信源熵 用例2第二种编码方法 ,平均码长1.85大于信源熵 l 可得到
29、几点提示:n 信源的平均码长lavg>=H(X);也就是说熵是无失真编码的下界。n 如果所有I(xk)都是整数,且l(xk)=I(xk),可以使平均码长等于熵。n 对非等概率分布的信源,采用不等长编码其平均码长小于等长编码的平均码长。n 如果信源中各符号的出现概率相等,信源熵值达到最大,这就是重要的最大离散熵定理。6.3 熵编码变长最佳编码定理在变长编码中,对出现概率大的信息符号赋予短码字,而对于出现概率小的信息符号赋予长码字。如果码字长度严格按照所对应符号出现概率大小逆序排列,则编码结果平均码字长度一定小于任何其他排列形式.6.3.1 哈夫曼编码根据变长最佳编码定理,Huffman编码
30、步骤如下:(1)将信源符号xi按其出现的概率,由大到小顺序排列。(2)将两个最小的概率的信源符号进行组合相加,并重复这一步骤,始终将较大的概率分支放在上部,直到只剩下一个信源符号且概率达到1.0为止;(3)对每对组合的上边一个指定为1,下边一个指定为0(或相反:对上边一个指定为0,下边一个指定为1);(4)画出由每个信源符号到概率1.0处的路径,记下沿路径的1和0;(5)对于每个信源符号都写出1、0序列,则从右到左就得到非等长的Huffman码。例 65 哈夫曼编码一幅20×20的图像共有5个灰度级:s1,s2,s3,s4,和 s5,它们的概率依次为0.4,0.175,0.15,0.
31、15和 0.125。Huffman编码过程示意图编码后均码长 图像熵 l Huffman编码的特点是:(1)Huffman编码构造程序是明确的,但编出的码不是唯一的,其原因之一是两个概率分配码字“0”和“1”是任意选择的(大概率为“0”,小概率为“1”,或者反之)。第二原因是在排序过程中两个概率相等,谁前谁后也是随机的。这样编出的码字就不是唯一的。(2)Huffman编码结果,码字不等长,平均码字最短,效率最高,但码字长短不一,实时硬件实现很复杂(特别是译码),而且在抗误码能力方面也比较差。(3)Huffman编码的信源概率是2的负幂时,效率达100%,但是对等概率分布的信源,产生定长码,效率
32、最低,因此编码效率与信源符号概率分布相关,故Huffman编码依赖于信源统计特性,编码前必须有信源这方面的先验知识,这往往限制了哈夫曼编码的应用。(4)Huffman编码只能用近似的整数位来表示单个符号,而不是理想的小数,这也是Huffman编码无法达到最理想的压缩效果的原因。6.3.2 香农-范诺编码1 香农-范诺编码香农-范诺(Shannon-Fannon)编码也是一种常见的可变字长编码。与哈夫曼编码相似,当信源符号出现的概率正好为2-i(i<0)时,采用香农-范诺编码同样能够达到100%的编码效率。香农-范诺编码的理论基础是符号的码字长度Ni完全由该符号出现的概率来决定,即 (7.
33、2.1)式中,D为编码所用的数制。 香农-范诺编码的步骤如下:(1) 将信源符号按其出现概率从大到小排序; (2) 按照式(7.2.1)计算出各概率对应的码字长度Ni;(3) 计算累加概率Ai,即 (7.2.2)(4)把各个累加概率Ai由十进制转化为二进制,取该二进制数的前Ni位作为对应信源符号的码字。2 二分法香农-范诺编码根据变长最佳编码定理,编码步骤如下:(1) 从左到右对上述概率从大到小排序;(2) 从这个概率集合中的某个位置将其分为两个子集合,并尽量使两个子集合的概率和近似相等,给前面一个子集合赋值为0, 后面一个子集合赋值为1;(3) 重复步骤2,直到各个子集合中只有一个元素为止;
34、(4) 将每个元素所属的子集合的值依次串起来,即可得到各个元素的香农-范诺编码。 例 66 二分法香农-范诺编码设一幅灰度级为8(分别用l1、l2、l3、l4、l5、l6、l7、l8表示)的图像中,各灰度所对应的概率分别为0.40、0.18、 0.10、 0.10、0.07、 0.06、 0.05、0.04。 6.3.3 算术编码算术编码不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上的0到1之间的一个区间(Interval),其长度等于该序列的概率,再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。消息序列中的每个元素都要缩短为一个区间。消息序列中元素越多,所得
35、到的区间就越小,当区间变小时,就需要更多的数位来表示这个区间。采用算术编码每个符号的平均编码长度可以为小数。6.3.4 行程编码(RLE)行程编码又称行程长度编码(Run Length Encoding, RLE), 是一种熵编码,其编码原理相当简单,即将具有相同值的连续串用其串长和一个代表值来代替, 该连续串就称为行程,串长称为行程长度。例如,有一字符串“aabbbcddddd”, 则经行程长度编码后, 该字符串可以只用“2a3b1c5d”来表示。行程编码分为定长和不定长编码两种。定长编码是指编码的行程长度所用的二进制位数固定,而变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进
36、行编码。使用变长行程编码需要增加标志位来表明所使用的二进制位数。行程编码比较适合于二值图像的编码,一般用于量化后出现大量零系数连续的场合,用行程来表示连零码。如果图像是由很多块颜色或灰度相同的大面积区域组成的,那么采用行程编码可以达到很高的压缩比。如果图像中的数据非常分散,则行程编码不但不能压缩数据,反而会增加图像文件的大小。为了达到较好的压缩效果,一般不单独采用行程编码,而是和其他编码方法结合使用。例如, 在JPEG中,就综合使用了行程编码、DCT、量化编码以及哈夫曼编码, 先对图像作分块处理, 再对这些分块图像进行离散余弦变换(DCT), 对变换后的频域数据进行量化并作Z字形扫描,接着对扫
37、描结果作行程编码, 对行程编码后的结果再作哈夫曼编码。6.4 预测编码6.5 变换编码6.6 JPEG编码6.6.1 JPEG编码标准JPEG是面向静态图像编码的国际标准。在相同图像质量条件下, JPEG文件拥有比其他图像文件格式更高的压缩比。JPEG目前被广泛应用于多媒体和网络程序中,是现今万维网中使用最广泛的两种图像文件格式之一。JPEG是一种有损压缩,即在压缩过程中会丢失数据,每次编辑JPEG图像后,图像就会被重复压缩一次,损失就会有所增加。 JPEG允许四种编码模式(1) 顺序式(Sequential)DCT方式:从左到右、从上到下对图像顺序进行基于离散余弦变换(DCT)的编码。DCT
38、理论上是可逆的,但在计算时存在误差,因而基于DCT的编码模式是一种有损编码。(2) 渐进式(Progressive)DCT方式:基于DCT,对图像分层次进行处理,从模糊到清晰地传输图像(与GIF文件的交错方式类似)。(3) 无失真(Lossless)方式: 使用线性预测器,如DPCM, 而不是基于DCT。 (4) 分层(Hierarchical)方式: 在空间域将源图像以不同的分辨率表示,每个分辨率对应一次扫描, 处理时可以基于DCT或预测编码,可以是渐进式,也可以是顺序式。JPEG定义了三种系统:基本系统(Baseline System)、扩展系统(Extended System)和无失真压
39、缩系统(Lossless System)。一个符合JPEG标准的编解码器至少要满足基本系统的技术指标。6.6.2 JPEG编码流程基本的JPEG算法属于变换类编码,下面针对基于DCT的顺序式基本系统编码来说明JPEG的编码方法。 图 JPEG 编码流程图1 颜色空间转换、数据分块及采样2 DCT变换3 系数量化1)4 Z形扫描5 DC系数编码6 AC系数编码第7章 图像分割 Image Segmentation7.1 概述与分类l 图像分割:从图像中按一定规则划出感兴趣的部分或区域(称为目标或前景)n 图像分割是图像分析、图像识别、图像理解的关键一步n 必须针对特定的分割要求、图像性质采用或设
40、计不同的分割算法l 图像的特性图像分割基于像素的二个基本特性:n 同一目标内有相似性n 在目标的边界上,灰度有不连续性l 分割方法分类n 利用区域间灰度不连续性的基于边界的算法u 基于边缘的分割技术n 利用区域内相似性的基于区域的算法u 基于灰度的分割技术u 基于区域的分割技术7.2 基于灰度的分割(区域相关技术)l 基本原理:利用同一区域内象素相似性进行图像分割的技术。l 理想状态下,目标与背景之间的灰度值应当差异很大,且同一个对象具有基本相同的灰度值。体现在图像的灰度直方图上,就是直方图呈明显的双峰分布,两类物体灰度级间无交叠。7.3 基于边缘的分割(边缘检测) 根据灰度梯度的变化规律检测
41、出物体的边缘,将边缘闭合形成物体的边界,进而分割区域。1 边缘检测l 可利用一阶导数的幅值来检测边缘是否存在l 可用二阶导数的过零点检测边缘的位置2 梯度算子l Roberts算子l Sobel算子l Prewitt算子l 拉普拉斯算子l 高斯拉普拉斯算子(Marr-Hildreth算子):先高斯平滑滤波除去高斯噪声再用Laplacian算子7.4 基于区域的分割技术l 图像分割就是将图像分解成若干有意义的子区域,而分离区域(或对象)的依据是“同质”的概念,不论图像的来源以及反映的事物如何不同,同一物体在灰度、颜色、纹理、形状、大小等可测量的物理特征上总是具有同一性或相似性。1 区域生长法(R
42、egion Growing)l 基本思想:将具有相似性质的像素聚集到同一区域l 方法:n 先对每个需要分割的区域找一个种子像素作为生长的起点n 然后将种子像素周围与种子像素有相同或相似性质的像素,加入到种子像素所在的区域中n 再将这些新加入的像素做为新的种子,继续进行上面的过程,直到不再有像素加入区域分裂合并法l 在实际应用区域生长法时需要解决两个问题:n 选定一组能正确代表所需区域的种子像素;n 确定生长过程中将相邻像素加入进来的准则2 分裂合并法l 分裂合并方法n 将图像按一定的或随机的方式分裂成多个区域n 对每个区域,检查内部相似性u 如果区域内部像素性质不一致,则对该区域进一步分裂u
43、如果相邻区域有相似的性质,则将它们合并第8章 数学形态学图像处理8.1 数学形态学概述l 数学形态学以几何学和集合论为基础,应用于图像处理和模式识别等领域l 基本思想是用一个结构元(Structure element)作为基本工具取探测和提取图像特征。n 每个结构元,指定一个原点,作为结构元参与形态学运的参考点u 原点可以包含在结构元内部,也可以在结构元外部。8.2 二值形态学8.2.1 二值形态学的基本运算1 膨胀l 集合A被B膨胀定义为l 用B膨胀A得到的集合,是B的映像位移与A至少有一个非零元素相交时B的原点位置的集合l 膨胀是将与目标区域的背景点合并到该目标物中,使目标物边界向外部扩张
44、的处理。膨胀处理的作用是可以将断裂开的目标物进行合并,便于对其整体的提取。2 腐蚀l 腐蚀是膨胀的对偶,用B腐蚀A可表示成集合的包含变换l 腐蚀是一种消除连通域的边界点,使边界向内收缩的处理。腐蚀处理的作用是可以将粘连在一起的不同目标物分离,并可以将小的颗粒噪声去除。3 开操作和闭操作l 开操作:l 闭操作:l 开操作和闭操作的作用n 都能平滑边界n 开操作能把比结构元小的斑点、突刺滤掉,能切断细长搭接而起到分离作用n 闭操作能把比结构元小的缺口或孔填上,搭接短的间隙而起到连通作用8.2.2 二值形态学的应用1 骨架化 2 细化 3 提取边界4 二值除噪8.3 灰度形态学8.3.1 膨胀与腐蚀
45、1 灰值膨胀:图像变量2 灰值腐蚀:图像变暗3 灰值开运算:消除亮细节,保持图像整体亮度不变4 灰值闭运算:消除暗细节,保持图像整体亮度不变8.3.2 形态学滤波交替使用开运算和闭运算,开运算消除亮噪声,闭运算暗噪声第9章 图像特征分析9.1 概述图像表示与描述是图像识别和理解的重要组成部分。图像表示分成边界表示(如链码、边界分段等)和区域表示(如四叉树、骨架等)两大类。l 边界表示关心的是图像中区域的形状特征l 区域表示则倾向于反映区域的灰度、颜色、纹理等特征的特点l9.2 形状特征描述9.2.1 链码l 起点归一化n 同一目标会有不同的链码n 头尾相接后的循环链码应当是一样的n 起点归一化
46、:整数值为最小nl 旋转归一化n 差分链码9.2.2 几何特征描述1 周长链码表示:9.2.3 形状特征描述1 长轴和短轴l 长轴:边界上相隔最远的两点间的距离,也称为边界直径l 短轴:长轴的垂直方向l 最小外接矩形(MER):以长轴的长度和短轴的宽度构成的外接矩形n 将区域的边界以左右的增量旋转,从而得到一水平放置的外接矩形n 计算时只要找出x,y的最大和最小值就可计算外接矩形的面积2 矩形度 A0表示图形的面积,AMER表示图形最小外接矩形的面积矩形:R=1圆形:不规则:0<R<13 长宽比4 圆形度(1)致密度Cl 圆:l 其他:n 正方形:n 正三角形:5 球状性Sl 对于
47、一个二维区域的边界,可找到它的一个外接圆和一个内接圆,两个圆均以质心为圆心l 设内接圆的半径为ri,外接圆的半径为rc,则定义球状性(sphericity):l 若区域为圆形,则S=1,否则S<1l 它在平移、旋转和尺度变化时不变l 只要将圆换成球,可扩展到三维9.3 其他特征描述9.3.1 拓扑描述符l 图形的拓扑性质n 是指那些变形不发生撕裂或连接变化的情况下,不因图片变形而改变的性质l 区域的两种拓扑性质n 连通数C:白色区域的个数n 孔数H:被白色区域包围的黑色区域个数l 欧拉数(Euler number):E=C-H欧拉数 10欧拉数2 问答题问答题 01 写出图像灰度幂次变换
48、的公式,给出不同的参数取值下指数变换的效果。31问答题 02简述数字图像傅立叶变换的频谱分布和统计特性31问答题 03 平滑滤波和锐化滤波的目的各是什么,它们各有哪些方法或算子?31问答题 04简述均值滤波和中值滤波对高斯噪声、椒盐噪声的滤波作用及原因。31问答题 05 简述图像复原与图像增强的异同31问答题 06 简述图像分割的目的、依据和分类。32问答题 07简述二值图像处理中,膨胀、腐蚀和开运算、闭运算的作用。32问答题 01 写出图像灰度幂次变换的公式,给出不同的参数取值下指数变换的效果。当g<1时,具有扩展低亮度区、压缩高亮度区的效果,图像变亮;当g>1时,性能正好相反,
49、具有压缩低亮度区、扩展高亮度区的效果,图像变暗。而当c=g=1时,输出正比与输入,图像无变化。 问答题 02简述数字图像傅立叶变换的频谱分布和统计特性对图像进行离散傅立叶变换后,频谱图左上角为直流分量,四个角为低频分量,中央为高频分量。傅立叶变换的频谱统计特性:零频率分量F(0,0)也称为直流分量,反映图像的平均亮度;低频分量,反映图像灰度变化缓慢的区域,85%的能量集中在低频区;高频分量,反映图像灰度阶越变化的区域,高频分量主要是图像的边缘、细节以及噪声。问答题 03 平滑滤波和锐化滤波的目的各是什么,它们各有哪些方法或算子?平滑滤波:模糊图像或消除噪声。类似于频域滤波的低通滤波。锐化滤波:
50、增强图像的边缘和轮廓,使细节更加清晰。类似于频域滤波的高通滤波。 平滑滤波:均值滤波、中值滤波。锐化滤波:线性锐化滤波(拉普拉斯算子)、非线性锐化滤波(直接差分算子、Roberts算子、Prewitt算子、Sobel算子)。问答题 04简述均值滤波和中值滤波对高斯噪声、椒盐噪声的滤波作用及原因。答:高斯噪声:图像中每一点都存在噪声,噪声的幅值是随机分布的,从噪声幅值大小的分布统计来看,其密度函数服从高斯分布(1分)。椒盐噪声:噪声的幅值基本相同,但噪声在图像中出现的位置是随机的(1分)。对于椒盐噪声,中值滤波比均值滤波要好。原因:椒盐噪声是幅值近似相等但随机分布在不同位置上,图像中有干净点也有
51、污染点。中值滤波是选择适当的点来替代污染点的值,所以处理效果好。由于噪声的均值不为0,所以均值滤波不能很好地去除噪声点(2分)。对于高斯噪声,均值滤波效果比中值滤波效果好。原因:高斯噪声是幅值近似正态分布,但分布在每点像素上。因为图像中的每点都是污染点,所中值滤波选不到合适的干净点。因此对正态分布的高斯噪声,由于其均值为0,根据统计数学,均值可消除高斯噪声(2分)问答题 05 简述图像复原与图像增强的异同图像复原与图像增强的目的都是在某种意义上对图像进行改进,即改善输入图像的质量,但二者使用的方法和评价标准不同。图像增强技术一般要利用人的视觉系统的特性,目的是取得较好的视觉效果,并不需要考虑图
52、像退化的真实物理过程,增强后的图像也不一定要逼近原始图像。而图像复原则认为图像是在某种情况下退化了,即图像品质下降了,通过先验知识建立图像退化过程的模型,并且采用相反的过程恢复出原始图像。问答题 06 简述图像分割的目的、依据和分类。图像分割的目的是从图像中按一定规则划出感兴趣的部分或区域(称为目标或前景)。图像分割是图像分析、图像识别、图像理解的关键一步。图像分割基于像素的二个基本特性:同一目标内有相似性;在目标的边界上,灰度有不连续性。分割方法分类:利用区域间灰度不连续性的基于边界的算法:基于边缘的分割技术;利用区域内相似性的基于区域的算法:基于灰度的分割技术、基于区域的分割技术。问答题
53、07简述二值图像处理中,膨胀、腐蚀和开运算、闭运算的作用。答:腐蚀是一种消除连通域的边界点,使边界向内收缩的处理。腐蚀处理的作用是可以将粘连在一起的不同目标物分离,并可以将小的颗粒噪声去除。膨胀是将与目标区域的背景点合并到该目标物中,使目标物边界向外部扩张的处理。膨胀处理的作用是可以将断裂开的目标物进行合并,便于对其整体的提取。开运算是对原图像先进行腐蚀处理,后再进行膨胀的处理。开运算作用是可以在分离粘连目标物的同时,基本保持原目标物的大小。闭运算是对原图像先进行膨胀处理,后再进行腐蚀的处理。闭运算可以在合并断裂目标物的同时,基本保持原目标物的大小。计算题计算题 01 图像的大小、传输、压缩比33计算题 02分别用4连通、8连通和m连通的方法,画出下图中值为1的点的连通情况。33计算题 03 灰度线性变换33计算题 04 均值滤波和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年黄冈职业技术学院单招综合素质考试题库附参考答案详解(考试直接用)
- 2026年鞍山职业技术学院单招职业适应性测试题库附答案详解(综合卷)
- 2026年陕西交通职业技术学院单招职业适应性考试题库带答案详解(典型题)
- 2026年黑龙江农业工程职业学院单招职业技能测试题库含答案详解(黄金题型)
- 中国汽车工业工程有限公司2026届校园招聘备考题库及答案详解(新)
- 2026年吉林大学附属小学教师招聘考试备考试题及答案解析
- 2026浙江宁波市余姚经济开发区管委会招聘委派人员1人笔试模拟试题及答案解析
- 胶州楼盘营销方案(3篇)
- 营销计划-方案范文(3篇)
- 路边开挖应急预案(3篇)
- 2026年安徽工贸职业技术学院单招职业技能考试题库及答案详解(基础+提升)
- 2026云南德宏州瑞丽市人民法院招聘聘用制书记员2人考试参考试题及答案解析
- (一模)2026年深圳市高三年级第一次调研考试数学试卷(含官方答案及解析)
- 2026年亳州职业技术学院单招职业技能测试题库及答案详解(基础+提升)
- GB/Z 149-2026天然食品成分使用指南
- 公司能源计量管理制度
- 2026年春人教PEP版(新教材)小学英语四年级下册教学计划及进度表
- 高速公路危化品救援课件
- 除颤仪使用课件
- 2026年采购经理岗位面试指南与经典问题集
- 2023年湖北十堰郧阳中学自主招生数学试题真题(含答案详解)
评论
0/150
提交评论