《数字图像处理第》习题解答上传_第1页
《数字图像处理第》习题解答上传_第2页
《数字图像处理第》习题解答上传_第3页
《数字图像处理第》习题解答上传_第4页
《数字图像处理第》习题解答上传_第5页
已阅读5页,还剩30页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

胡学龙编著数字图像处理(第3版)思考题与习题参考答案目录第1章概述1第2章图像处理基本知识4第3章图像的数字化与显示7第4章图像变换与二维数字滤波10第5章图像编码与压缩16第6章图像增强20第7章图像复原25第8章图像分割27第9章数学形态学及其应用31第10章彩色图像处理32第1章概述11连续图像和数字图像如何相互转换答数字图像将图像看成是许多大小相同、形状一致的像素组成。这样,数字图像可以用二维矩阵表示。将自然界的图像通过光学系统成像并由电子器件或系统转化为模拟图像(连续图像)信号,再由模拟/数字转化器(ADC)得到原始的数字图像信号。图像的数字化包括离散和量化两个主要步骤。在空间将连续坐标过程称为离散化,而进一步将图像的幅度值(可能是灰度或色彩)整数化的过程称为量化。12采用数字图像处理有何优点答数字图像处理与光学等模拟方式相比具有以下鲜明的特点1具有数字信号处理技术共有的特点。(1)处理精度高。(2)重现性能好。(3)灵活性高。2数字图像处理后的图像是供人观察和评价的,也可能作为机器视觉的预处理结果。3数字图像处理技术适用面宽。4数字图像处理技术综合性强。13数字图像处理主要包括哪些研究内容答图像处理的任务是将客观世界的景象进行获取并转化为数字图像、进行增强、变换、编码、恢复、重建、编码和压缩、分割等处理,它将一幅图像转化为另一幅具有新的意义的图像。14说出图像、视频(VIDEO)、图形(DRAWING)及动画(ANIMATION)等视觉信息之间的联系和区别。答图像是用成像技术形成的静态画面;视频用摄像技术获取动态连续画面,每一帧可以看成是静态的图像。图形是人工或计算机生成的图案,而动画则是通过把人物的表情、动作、变化等分解后画成许多动作瞬间的画幅,再用摄影机连续拍摄成一系列画面,给视觉造成连续变化的图画。视频和动画都利用了视觉暂留原理。15如何在你的显示器上观测图像的像素1台笔记本的屏幕分辨率为1366768,长宽比例是43、169还是1610屏幕分辨率(以像素每英寸(DPI)为单位)是多少选择一个高分辨率图像、一个低分辨率图像,比较分别观察到像素时图像的放大倍数的差异。答可先拷屏,按照图12放大局部图像的方法观测图像。屏幕分辨率为1366768,表示宽高比为177861,而43133331,169177781,1610161。可见,此屏幕的宽高比最接近169。16如何在你的计算机上查看图像文件的各种属性答在WINDOWS操作系统下,鼠标指针指向文件名,可看到图像文件的“项目类型”、标记”、“分级”、“尺寸”、“大小”和“标题”属性(图16A)。右击图像文件名,单击弹出菜单的“属性”命令,可以看到“常规”和“详细信息”两个标签,其中“常规”标签指出文件名、存放“位置”、“时间”、文件“属性”等信息。“详细信息”指出“说明”、“来源”、“图像”、“照相机”、“高级照片”、“文件”等信息。1(A)鼠标指针指向文件名(B)常规(C)详细信息题16图图像属性17讨论在你的智能手机中哪些功能应用了图像处理技术。答根据手机功能和智能程度的不同,有彩信、视频、相机、游戏、二维码扫描、名片识别等。18设图117的文件名为“MICROSCOPICJP2”或“MICROSCOPICJPG”,尺寸为41403096。针对本图像,讨论可以进行哪些图像处理和图像分析操作答处理方面(1)对图像进行二维变换,观察图像的频谱;(2)图像增强由于光照不均匀,可以通过增强手段,图像暗处得到照度补偿;3)图像编码可以用DCT编码的JPEG格式存放JPEG图像,也可用DWT编码存放JPEG2000图像;(4)图像分割将感兴趣的目标从背景中分割出来,以便做进一步分析处理。图像分析(1)对观测对象进行形状分析;(2)对不同大小的颗粒做分布分析。19讨论数字图像处理的主要应用。进一步查找资料,写一篇关于你感兴趣的应用方面的短文。答图像处理的应用几乎渗透科学研究、工程技术和人类社会生活的各个领域。教师可以分组对学生布置以下6个方面的课题,通过阅读参考文献、网络资源等手段写数字图像处2理的主要应用的短文,并安排交流机会。1航天和航空技术方面的应用2生物医学工程方面的应用3通信工程方面的应用4工业自动化和机器人视觉方面的应用5军事和公安方面的应用6生活和娱乐方面的应用3(第2章图像处理基本知识21如何表示图像中一点的彩色值颜色模型起什么作用答图像中一点的彩色值颜色三维空间中的一个点来表示,每个点有三个分量,不同的颜色空间各分量的含义不同。颜色模型规定了颜色的建立、描述和观察方式。颜色模型都是建立在三维空间中的,所以与颜色空间密不可分。22色调、色饱和度和亮度的定义是什么在表征图像中一点的颜色时,各起什么作用答HSV模型由色度(H),饱和度(S),亮度(V)三个分量组成的,与人的视觉特性比较接近。HSV颜色模型用MUNSELL三维空间坐标系统表示。色调(H)表示颜色的种类,用角度来标定,用18001800或003600度量。色饱和度(S)表示颜色的深浅,在径向方向上的用离开中心线的距离表示。用百分比来度量,从0到完全饱和的100。亮度(V)表示颜色的明亮程度,用垂直轴表示。也通常用百分比度量,从0(黑)到100(白)。23按照波段的成像图像讨论图像的分类。答人们常见的是可见光成像,但在科学研究等领域,其他一些不同波段的电磁波成像技术会起到可见光成像无法替代的作用。下面是电磁波谱分布情况1、不可见光线伽马射线、X射线、紫外线;2、可见光线紫、蓝、青、绿、黄、橙、红;3、不可见光线近红外线、中间红外线、远红外线、微波、工业电波。按波长从短到长有(1)伽马射线图像伽马射线是由原子核受激产生的波长极短、能量极高的射线。天文学上利用伽马射线获取伽马射线暴图像。2)X射线图像X射线是由原子受激产生的,具有很强的穿透能力,其图像在医疗、探伤、物质结构分析等方面具有重要作用。(3)紫外线(UV)图像红外线波长短于可见光。230400NM的UV传感器可用于天文学、火灾检测、细胞的医学成像等。(4)红外线图像红外线波长长于可见光。红外遥感器接收地物反射或自身发射的红外线而形成的图像,可以解决在夜间观察目标光强不足及对比度差的困难。由于高于绝对零度的物体都会发出红外线,所以红外图像可以描述某个区域的温度分布,这在遥感技术中广泛使用,在医学成像和火灾监测等方面也有实际应用。(5)无线电波图像波长范围很宽,从MM到KM。常用射频成像法。由高频发射机发射的高频电磁波在传播过程中遇到具有不同电学性质的物体时,电磁波的传播规律将大大改变。根据无线电波测量的结果可以绘出物体内的结构图像,如毫米波人体安检成像技术。另一个获得重要应用的是SAR(合成孔径雷达)成像技术。SAR传感器波长通常在厘米级。SAR图像则只记录了一个波段的回波信息,以二进制复数形式记录下来。振幅信息通常对应于地面目标对雷达波的后向散射强度,与目标介质、含水量以及粗糙程度密切相关,而相位信息则对应于传感器平台与地面目标的往返传播距离。24设有大小为3232的图标,图标的每个像素有8种颜色,共有多少种不同的图标如果每100万个可能的图标中有一个有意义,识别一个有意义的图标需要01S,则选出所有有意义的图标需要多长时间解图标数为8323210925种4有意义的图标数10925/10610919种选择有意义图标的时间109190110918S可见随机图像的复杂度是非常高的。25讨论数字图像处理系统的组成。列举你熟悉的图像处理系统并分析它们的组成和功能。答如教材图26,数字图像处理系统是应用计算机或专用数字设备对图像信息进行处理的信息系统。图像处理系统包括图像处理硬件和图像处理软件。图像处理硬件主要由图像输入设备、图像运算处理设备(微计算机)、图像存储器、图像输出设备等组成。软件系统包括操作系统、控制软件及应用软件等。教材图26数字图像处理系统结构图26常见的数字图像处理开发工具有哪些各有什么特点答目前图像处理系统开发的主流工具为VISUALC(面向对象可视化集成工具)和MATLAB的图像处理工具箱(IMAGEPROCESSINGTOOLBOX)。两种开发工具各有所长且有相互间的软件接口。MICROSOFT公司的VC是一种具有高度综合性能的面向对象可视化集成工具,用它开发出来的WIN32程序有着运行速度快、可移植能力强等优点。VC所提供的MICROSOFT基础类库MFC对大部分与用户设计有关的WIN32应用程序接口API进行了封装,提高了代码的可重用性,大大缩短了应用程序开发周期,降低了开发成本。由于图像格式多且复杂,为了减轻程序员将主要精力放在特定问题的图像处理算法上,VC60提供的动态链接库IMAGELOADDLL支持BMP、JPG、TIF等常用6种格式的读写功能。MATLAB的图像处理工具箱MATLAB是由MATHWORKS公司推出的用于数值计算的有力工具,是一种第四代计算机语言,它具有相当强大的矩阵运算和操作功能,力求使人们摆脱繁杂的程序代码。MATLAB图像处理工具箱提供了丰富的图像处理函数,灵活运用这些函数可以完成大部分图像处理工作,从而大大节省编写低层算法代码的时间,避免程序设计中的重复劳动。MATLAB图像处理工具箱涵盖了在工程实践中经常遇到的图像处理手段和算法,如图形句柄、图像的表示、图像变换、二维滤波器、图像增强、四叉树分解域边缘检测、二值图像处理、小波分析、分形几何、图形用户界面等。但是,MATLAB也存在不足之处限制了其在图像处理软件中实际应用。首先,强大的功能只能在安装有MATLAB系统的机器上使用图像处理工具箱中的函数或自编的M文件来实现。其次,MATLAB使用行解释方式执行代码,执行速度很慢。第三,MATLAB擅长矩阵运算,但对于循环处理和图形界面的处理不及C等语言。为此,通应用程序接口API和编译器与其他高级语言(如C、C、JAVA等)混合编程将会发挥各种程序设计语言之长协同完成图像处理任务。API支持MATLAB与外部数据与程序的交互。编译器产生独立于MATLAB环境的程序,从而使其他语言的应用程序使用MATLAB。27常见的数字图像应用软件有哪些各有什么特点5FX,YFGX,YGF答图像应用软件是可直接供用户使用的商品化软件。用户从使用功能出发,只要了解软件的操作方法就可以完成图像处理的任务。对大部分用户来说,商品化的图像应用软件无需用户进行编程,操作方便,功能齐全,已经能满足一般需求,因而得到广泛应用。常用图像处理应用软件有以下几种1PHOTOSHOP当今世界上一流的图像设计与制作工具,其优越性能令其产品望尘莫及。PHOTOSHOP已成为出版界中图像处理的专业标准。高版本的PHOTOSHOP支持多达20多种图像格式和TWAIN接口,接受一般扫描仪、数码相机等图像输入设备采集的图像。PHOTOSHOP支持多图层的工作方式,只是PHOTOSHOP的最大特色。使用图层功能可以很方便地编辑和修改图像,使平面设计充满创意。利用PHOTOSHOP还可以方便地对图像进行各种平面处理、绘制简单的几何图形、对文字进行艺术加工、进行图像格式和颜色模式的转换、改变图像的尺寸和分辨率、制作网页图像等。2CORELDRAW一种基于矢量绘图、功能强大的图形图像制作与设计软件。位图式图像是由象素组成的,与其相对,矢量式图像以几何、色彩参数描述图像,其内容以线条和色块为主。可见,采用不同的技术手段可以满足用户的设计要求。位图式图像善于表现连续、丰富色调的自然景物,数据量较大;而矢量式图像强于表现线条、色块的图案,数据量较小。合理的利用两种不同类型的图像表现方式,往往会收到意想不到的艺术效果。CORELDRAW是当今流行的图像处理软件中为数不多的特点明显、功能强大的基于矢量绘图的软件包。利用它,可以方便地制作精美的名片、贺卡、书签、图书封面、广告、宣传画等作品。3ACDSEE快速、高性能的看图程序,是目前最享盛名的图片浏览器。它能广泛应用于图片的获取、管理、浏览和优化,支持BMP、GIF、JPG、TGA、TIF等超过50种常见的图形文件格式,图片打开速度极快,可以直接查看动画GIF,处理如MPEG之类常用的视频文件,还可以为每一个目录建立一个相册。ACDSEE可以从数码相机和扫描仪高效获取图片,并进行便捷的查找、组织和预览。ACDSEE还是得心应手的图片编辑工具,轻松处理数码影像,拥有去红眼、剪切图像、锐化、浮雕特效、曝光调整、旋转、镜像等功能,还能进行批量处理。28调用函数CFGCOVF,G计算出图像F和图像G的协方差矩阵是一个22的矩阵。说明该矩阵各个元素的含义,数值大小对图像特性的影响。答设FX,Y和GX,Y是大小为MN的两幅图像,则两幅图像之间的协方差矩阵为CFGCFG1MNM1N1X0Y0协方差矩阵CFG是两幅图像之间的相关程度的一种度量。协方差矩阵为零时表明两图像之间相互独立,反之表示两幅图像之间相互依赖。CFG越大,相关程度越强。CFG是22矩阵2COVF,GCFGCOVG,F式中,2F和G2分别是图像F和G的方差,COVF,G和COVG,F是图像F和G的协方差。6第3章图像的数字化与显示31光圈越大,摄取的画面是否越亮光圈的数字越小是否代表光圈越小28的光圈与56的光圈,哪个画面更亮光圈越小,画面是否越有立体感答光圈越大,光学镜头进光量越大,摄取的画面也越亮。光圈系数(F)反映镜头的通光量,以焦距F和通光孔径D表示。通光量与F值的平方成反比。所以光圈的数字越小代表光圈越大。28的光圈比56的光圈更亮。景深(DEPTHOFFIELD)是对某景物调焦,以形成前后清晰区域。景深与三个因素有关光圈、焦距和物距。光圈越小,景深越深。32换一幅图像,重新演算图36中实际图像量化的运行结果。解以将灰度为256降低为8(图D)为例编程并运行程序。LEVEL1256LEVEL28RATIOLEVEL1/LEVEL2I1IMREADCAMERAMANTIFSUBPLOT121IMSHOWI1SSIZEI1FORM1S1FORN1S2I2M,NUINT8ROUNDDOUBLEI1M,N/RATIOI2M,NUINT8RATIODOUBLEI2M,NENDENDSUBPLOT122IMSHOWI2IMWRITEI2,CAMERAMAN_DTIF程序运行结果如下(A)原始图像(灰度级为256)(D)灰度级为8教材图36不同量化级别对图像质量的影响33如何合理选取采样率和量化等级数答一般,当限定数字图像的大小时,为了得到质量较好的图像,可采用如下原则(1)对缓变的图像,应该细量化,粗采样,以避免出现假轮廓。(2)对细节丰富的图像,应细采样,粗量化,以避免模糊。734讨论基于二维采样定理,根据图像采集设备的分辨率计算最大像素数。答采集设备的分辨率反映了其采集图像时的细节效果。高分辨率才采集是保证图像高分辨率的基础。应该根据二维采样定理选择合适分辨率的采集设备,这样既能保证所需的图像质量,又能做到物尽其用。NYQUIST定理表明,为了正确判定信号频率,信号在一个周期内至少被采样两次。二维采样定理应用在实际图像的采集中,意味着如果要达到一个采集设备(如数码相机或扫描仪)最小的空间分辨率,至少需要采两个点。35验证图38一维向量量化的误差DX,CI的正确性。解DX,C0432212322132/41114/47/4DX,C14122323121429149/423/4DX,C24422323421120110/42/4DX,C34222123221324114/410/436计算图39图像X与图310码书C码字的误差,验证选择码字Y1作为X的二维向量量化编码的合理性。解原始图像块X是一个4灰度级的16维向量1000110022103211,如教材图39所示。码书Y00200121103200321Y21122221233101100Y11100111022103311Y30233013211311110均方误差为DX,Y025/16;DX,Y13/16;DX,Y225/16;DX,Y347/16。XY0Y1Y2Y3教材图39原始图像和灰度级教材图310码书CY0,Y1,Y2,Y3如图310所示。经均方误差准则计算可以发现码字Y1离X最近,故用索引01进行编码。37根据“电视行(TVLINE)”或扫描线的概念,摄像机的清晰度常用扫描线的线数表示。如果画面是43的,540线的像素分辨率多少720P是720线(P代表逐行扫描,I是隔行扫描),帧型为169,像素分辨率为1280720。解如果画面是43的,540线的像素分辨率是5404/354072054038摄像机和数码相机分辨率受到哪些因素限制是否越高越好如何进一步提高分辨率答分辨率往往是用户最关心的指标,但其上限受到像素极限尺寸、CCD制造工艺、设备性价比等因素限制,并不能无限提高。人们正在研究采用信号处理的超分辨率技术力求解决这些问题。39扫描仪的光学分辨率是6001200线,一个具有5000个感光单元的CCD器件,用于A4幅面扫描仪,A4幅面的纸张宽度是21CM,该扫描仪的光学分辨率是多少DPI解(1)6001200线,其中前一个数字代表扫描仪的横向分辨率,后一数字则代表纵向分辨率。8(2)DPI是指单位面积内像素的多少,也就是扫描精度,目前国际上都是计算一英寸面积内像素的多少。光学分辨率是扫描仪的光学部件在每平方英寸面积内所能捕捉到的实际的光点数,是指扫描仪CCD的物理分辨率,也是扫描仪的真实分辨率,它的数值是由CCD的像素点除以扫描仪水平最大可扫尺寸得到的数值。每一个感光单元对应一个像素。由于CCD感光单元个数为5000,21CM83英寸,所以该扫描仪的光学分辨率是5000/83602DPI,规格化为600DPI。91100000,按X方向进行FFT,得到列变换FU,Y1J1J1J1JFX,Y,并说明其物理意义。X0Y0FX,YEJ2UX/MVY/N,取(U,V)(0,0)X0Y0FX,Y。X0Y0FX,YEJ2UX/MVY/N,FX,YEJ2UX/MVY/N第4章图像变换与二维数字滤波41二维傅里叶变换的分离性有什么实际意义解该性质表明,一个二维傅里叶变换可由连续两次一维傅里叶变换(先行变换后列变换或反之)来实现。实现的方法如下图所示教材图33用两次一维DFT计算二维DFT42图像处理中正交变换的目的是什么图像变换主要用于哪些方面解正交变换可以使得图像能量主要集中分布在低频率成分上,边缘和线信息反映在高频率成分上。因此正交变换广泛应用在图像增强、图像恢复、特征提取、图像编码压缩和形状分析等方面。43110已知FX,Y000022000000000000,为什么FX,Y的前2行数值一样,但FU,Y的前2行却不一样44证明FX,Y的直流成分为F0,01N1N2X0N1Y0证明根据FU,V1MNM1N1得F0,01MNM1N1得证。其物理意义为FX,Y的直流成分为图像灰度的平均值。45由DFT的定义直接证明DFT的共轭对称性。证明由于FU,V1MNM1N1所以FX,Y1MNM1N1X0Y0101MNJ2UX/MVY/NX0Y0得证。46本章的例2中,在求解图像频谱的程序中为了增强显示效果,用对数对DFT的幅度进行压缩,然后将频谱幅度的对数值用在010之间的值进行显示。研究(1)对上述结果与不进行上述处理的直接显示效果进行比较。(2)对将频谱幅度的对数值用不同范围的值进行显示的结果进行比较。对研究的结果做出结论。解(1)适当修改例2的程序,即可得到进行对数处理(显示范围010)和未进行处理(显示范围0255)的显示效果(A)对数处理(B)直接显示(2)可见整体显示效果相差很大,特别在频谱的中心区域视觉效果有较大差别,而中心区域集中了图像的绝大部分能量,对图像分析和处理至关重要。47对0到2N1的2N个点的离散周期序列FCN做DFT,设W2NEKN12N1FCNW2NKNW2N2N02N27N0J22N,证明FCK证明这里是一维DCT问题,可参考一般的数字信号处理教材中的推导。48利用MATLAB函数DCT2对一幅88的图像进行DCT变换和反变换,进行原始图像和重建图像的误差比较分析。变换的参考图像为52626367798755595958616571796166706164736590109856972681131441046673711221541067069607077685875696865657894。采用Z扫描方式(参见第5章515)保留20个DCT变换系数进行重构图像,即将第21个以M1N1FX,YEFU,V2N1KFNCOS。63I8568104126886870645955586583后的变换系数置为0。计算重建图像J与原始图像I的均方误差,比较两者的差异。如果保留横向与纵向的坐标之和小于8的系数,比较上述结果。如果保留所有变换系数,再比较上述结果。这时有误差存在吗如果有误差,出现在何处1163解参考图像为856459555865832N1M1J0I0J,FIFI,J5262636779875559595861657179616670616473659010985697268113144104667371122154106706968104126886870607077685875696865657894参考图515,采用Z扫描,取前20个系数,其余系数为0重构图像。设原图像为F,重建图像为F,则均方误差计算公式1ERREMSMN1/2MATLAB程序如下I52636263677985875561667061647359659010985697259681131441046673587112215410670696168104126886870656070776858757164595561658379696865767894JDCT2IJ1,60第21个变换系数置于0FORI18FORJ18IFIJ7JI,J0ENDENDENDKROUNDIDCT2JERR0FORI18FORJ18ERRERRPOW2KI,JII,JENDENDERRSQRTERR/64程序运行结果如下变换系数为J,复原图像为K,均方误差为ERRJ6098750593542920362070266187366155352550558214954875011675319750366819075446615019317660521246158048879810875094685266391147579021117974753561543211001063007676333428641251963318113007054002550031428112217635345015022830729588298957062500644007554018821012026200814004046303469903687630071380644204203841986707819485351540416654019002582405206K6348517483706064625262911028570706259781131241028176626285122131106807362597710811490686469586283876959648766566669616682105775861646479102ERR740502当忽略IJ8的系数,这时有29个非0系数,均方误差明显减少,K62514968786056796157659510883647457587811813710772685960781191411137566696469981179770687866587082706070837158606558628389806867706576102ERR85746对取舍的系数不加限制,由于变换、反变换、重新量化产生的误差是很小的。运算结果如下J60987502920366187365935420702661553525505554875082149116753197503668190754466150193176605246158079021767633255003295882101202630074853548879811797434286414281198957620081380615404108750753561251962217606250140044420416654946851543233181353450644004630203840190026639114751100106300130070540001502283070755401882346990368719867078192582405206K52556166706164736359659010985697262596811314410466736358711221541067069676168104126886870131BINBXI1X013X0FXI01BIXB1IU111X0FXI01BIXB1I04F0F1F2F31111G111W1FX1BIXB1I1F0F1F2F34X0F11G111W2FX1BIXB1I2F0F1F2F34X01111G111W3FX1BIXB1I3F0F1F2F34X01111G796560707768587585716459556165838779696865767894ERR1,可见只有2个加黑的高频系数有误差。39在沃尔什变换中,当N8时,如果Z6,求BIZ。解BIZ代表Z的二进制表示的第I位值。N2N,故N3。Z6用二进制表示为0110,则B0Z0,B1Z1,B2Z1,B3Z0。410离散的沃尔什变换与哈达玛变换之间有那些异同解哈达玛HADAMARD变换和沃尔什(WALSH)变换的变换核都是由1,1组成的正交方阵。它们不同的地方在于变换矩阵的行列排列次序不同。哈达玛变换每行的列率排列是没有规则的,沃尔什变换的列率是由小到大。411求N8对应的沃尔什变换核矩阵。解N8偏大,以N4试验之。一维沃尔什变换的正变换核为GX,U1N1NI0U,则一维沃尔什变换为WU1N1NN1FX1BIXBN1IU。当N4时WUI0N1W04314F0F1F2F33I0414F0F2F33I0414F0F1F2F33I0414F0F1F2F314W11111F11GW31111GGFGGF,所以,变换核矩阵G为111111111G1113已知二维数字图像矩阵为F即W01111F0W241111F2F3变换的矩阵形式为W11N4G11111111根据图311,可以看出当N8时,变换核矩阵G为111111111111111111111111111111111111111111111111111111111111412333333333333333,求此图像的二维沃尔什变换。解程序为F3333333333333333G1111111111111111W1/16GFG运行结果为W3000000000000000413小波基函数和傅里叶变换基函数有何区别解小波信号的非零点是有限的。它与傅里叶变换的基函数(三角函数、指数信号)是不同的,傅里叶变换的基函数从负无穷到正无穷都是等幅振荡的。414一维小波变换如何同时实现时间频率分析功能如何扩展到在二维图像的空间频率分析解对照一维小波变换和二维图像的定义加以说明。15第5章图像编码与压缩51从哪些方面说明数据压缩的必要性答采用数字技术会使信号处理的性能大为提高,但其数据量的增加也是十分惊人的。图像数据更是多媒体、网络通信等技术重点研究的压缩对象。不加压缩的图像数据是计算机的处理速度、通信信道的容量等所无法承受的。这样的数据率是与当前信息存储介质的容量、计算机的总线速度以及网络的传输率不相匹配的。尽管人们在存储介质、总线结构和网络性能等方面不断有新的突破,但数据量的增长速度远超过硬件设施的提高水平,以上的矛盾仍然无法缓解。如果将上述图像信号压缩几倍、十几倍,甚至上百倍,将十分有利于图像的传输和存储。可见,在现有硬件设施条件下,对图像信号本身进行压缩是解决上述矛盾的主要出路。52数据没有冗余度能否压缩为什么答图像数据量大,同时冗余数据也是客观存在的。一般图像中存在着以下数据冗余因素(1)编码冗余;(2)像素间的相关性形成的冗余;(3)视觉特性和显示设备引起的冗余。理论上,数据没有冗余度是不压缩的,否则无法解码出原始数据。但在大部分应用场合下采用有损压缩,数据没有冗余度也可以进行压缩。53如何衡量图像编码压缩方法的性能答一般地,图像压缩应能做到压缩比大、算法简单、易于用硬件和软件实现、压缩和解压缩实时性好、解压缩恢复的图像失真小等。但这些指标对同一压缩方法很难统一,在实际系统中往往需要抓住主要矛盾,全面权衡。常用的图像压缩技术指标有(1)图像熵与平均码长;(2)图像冗余度与编码效率;(3)压缩比;(4)客观评价SNR;(5)主观评价。图像的主客观两种评价之间存在着密切的联系。但一般来说,客观评价高的主观评价也高,因此在图像编码的质量评价时,首先作客观评价,以主观评价为参考。55一图像大小为640480,256色。用软件工具SEA(VERSION13)将其分别转成24位色BMP,24位色JPEG,GIF(只能转成256色)压缩格式,24位色TIFF压缩格式,24位色TGA压缩格式,得到的文件大小分别为921,654字节;17,707字节;177,152字节;923,044字节;768,136字节。分别计算每种压缩图像的压缩比。解不计算较小的文件头和彩色查找表(LTU)的数据量,原始图像的数据量为6404801BYTE307,200BYTE。经转换后各种格式的压缩比如下24位色BMP格式307,200/921,6540333(增加了冗余度)24位色JPEG格式307,200/17,7071735GIF压缩格式307,200/177,15217324位色TIFF压缩格式307,200/923,0440333(增加了冗余度)24位色TGA压缩格式307,200/768,1360400(增加了冗余度)56讨论图像压缩方法的分类及其各自的特点。答一般数据压缩按信息损失的程度来分类。见教材图52常见数据压缩技术的分类。无损压缩HUFFMAN编码和SHANNON编码根据概率分布特性确定码长;游程编码根据连续灰度的游程来确定编码;算术编码随信源数据不断缩小的实数区间,然后用一个与实数对16应的二进制码代表被编码的信息;轮廓编码根据相同灰度的区域边界线进行编码。有损压缩预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起来,如将预测编码与变换编码相结合,以取得更好的效果。在现代压缩编码方法中,分形编码利用宏观与微观的相似性来压缩数据量,可以获得极大的压缩比。该方法压缩过程的计算量较大,但解压缩很快,适用于图像数据的存储和重现。模型基编码一种新型压缩方法。该方法在发送端利用已知且变化慢的场景得到数据量不大的模型参数,在接收端利用综合模型参数恢复原始图像。这一编码方法对于实时实现电视会议等具有显著意义。57大部分视频压缩方法是有损压缩还是无损压缩为什么答视频比静态图像数据量更大,同时可压缩的冗余信息更多。大部分视频压缩方法是以人眼感觉无明显失真为依据的,因此采用有损压缩。事实上,视频可以看成是一幅幅不同但相关的静态图像的时间序列。因此,静态图像的压缩技术和标准可以直接应用于视频的单帧图像。另外,利用视频帧间信息的冗余可以大大提高视频的压缩比。58若图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度电平值相等,能够说明上述两种情况下像素相关吗为什么答不能。像素的空间相关性和时间相关性是以空间和时间的相邻性为基础的。因此,图像上任意两像素点的亮度电平值相等或者任意两时刻同一位置上的像素的亮度电平值相等带有偶然性,不能说明两像素相关。59根据JPEG算法说明JPEG图像显示时会出现马赛克现象的原因。答由于JPEG算法将整幅图像分成若干个88的子块,解码也是以子块为单位的,所以块间的解码误差可能反映为方块效应,在视觉上会出现马赛克现象。510讨论混合编码的优点。答混合编码一般指将预测编码与变换编码相结合进行编码的方法。预测编码根据相邻像素相关性来确定后继像素的预测值,若用差值进行编码则可以压缩数据量;变换编码对原始图像进行正交变换,在变换域进行抽样达到压缩的目的;混合编码将两种编码方法结合起来,可以发挥两种编码方法的优点,取得更好的效果。511有了离散傅里叶及其快速算法FFT,为什么还要提出离散余弦算法DCT及其快速算法为什么许多视频国际标准将DCT作为帧内编码的基本压缩算法答在所有的变换编码方案中,离散KL变换是最佳变换,理论价值较高,常常作为对其他变换特性进行评价的标准。但此变换没有快速算法,在工程应用中受到限制。在次最佳变换算法中,DFT和DCT都是常用的变换编码方法,它们分别有快速算法FFT和FCT。这两种方法相比较,DFT涉及到复数运算,而DCT是实数变换具有十分吸引人的一些特点它是一种实数变换,计算量较小,其变换矩阵的基向量很好地描述了人类视觉的相关性,且对于大多数图像来说,该变换的压缩性能很接近离散KL变换,而且其变换矩阵与图像内容无关,另外由于它构造对称的数据序列,避免了在图像边界处的跳跃及所引起的GIBBS效应,并且也有快速算法,因而得到广泛的应用。作为准最佳变换,它已成为一些静态图像、视频压缩国际标准(或建议)中的基本处理模块。JPEG制定了基于DCT的有失真静止图像压缩标准。在MPEG视频编码器中帧内图像(I图像)采用DCT的编码方法。17512为什么二维DCT可以转换成两次一维DCT计算答参考第3章图像变换。二维变换可以分解成两次变换,如先进行变换,再进行列变换,或反之。513HUFFMAN编码有何优缺点答HUFFMAN编码在无失真的编码方法中效率优于其他编码方法,是一种最佳变长码,其平均码长接近于熵值。但当信源数据成分复杂时,庞大的信源集致使HUFFMAN码表较大,码表生成的计算量增加,编译码速度相应变慢;另外不等长编码致使硬件译码电路实现困难。上述原因致使HUFFMAN编码的实际应用受到限制。514HUFFMAN编码是最佳编码,为什么还要研究算术编码等其他熵编码算法答题512中讨论了HUFFMAN编码的优缺点,其他熵编码方法可以在某些性能上克服HUFFMAN编码的不足。如,虽然算术编码的硬件实现比HUFFMAN编码方法复杂,但对图像的编码测试结果表明,在信源符号概率接近的条件下,算术编码效率高于HUFFMAN编码。515算术编码有何优点举例说明其适用范围。答在信源符号概率接近的条件下,算术编码效率高于HUFFMAN编码。因此,在扩展的JPEG系统中用算术编码取代了HUFFMAN编码。另外,算术编码除了常见的基于概率统计的模式外,还有自适应模式。在这种模式下,各个符号的初始概率相同,它们依据出现的符号而发生变化。这种模式特别适用于不便于进行符号概率统计的实际场合中。516用JPEG标准,对于576行720列的CCIR601建议分辨率的彩色图像,其亮度分量可分割成多少个子块,而两个色差分量可分别分割成多少子块解对于576行720列的CCIR601建议分辨率的彩色图像,JPEG将其亮度分量分割成(576/8)(720/8)6480块。两个色差分量都可分割成两组(576/8)(360/8)3240块。517JPEG为什么要进行彩色空间转换答JPEG算法处理的是单独的彩色分量图像,所以来自其他彩色空间的图像数据要以JPEG格式保存,需要进行彩色空间的转换,如将RGB空间、YCRCB空间或转换为YUV空间等。518JPEG的量化表有何作用答量化的目的是为了压缩数据,同时也是图像质量下降的主要原因。所以设计合理的量化器十分重要。在保证图像质量的前提下,为了获得较高的压缩比,JPEG量化器利用人眼的空间视觉特性,相对于高频成分对低频成分采用较小的量化间隔和较少的比特数。又根据人眼对亮度信号比色度信号敏感的原理,对图像的亮度分量和图像的色差分量使用不同的量化表亮度量化表和色差量化表。量化表的元素即为量化间隔。对于CCIR601标准电视图像,JPEG标准提供了最佳的亮度和色度量化表。根据不同的应用需要,用户还可以设计或选择其他的量化表。519JPEG算法中DCT系数采用Z字形重排有何作用答DCT系数左上角(第1行第1列)为直流分量(DC系数),对88子块矩阵进行18Z字形编排则可将其余的交流分量(AC系数)按“频率”从低到高排列,形成164的矢量。这样排列可以增加“0”系数的游程长度,提高压缩效率。19180185128000解第6章图像增强61图像增强的目的是什么它包含哪些研究内容与图像复原有何区别解图像增强是指对图像的某些特征,如边缘、轮廓、对比度等进行强调或锐化,以便于显示、观察或进一步分析与处理。图像增强所包含的主要内容有1、空间域增强法包括点操作(如灰度变换、直方图变换等)、区域操作(平滑、锐化等)。2、频率域增强法采用二维数字滤波器实现低通滤波(平滑)、高通滤波(锐化)等。3、同态滤波法结合上述方法,实现空间域非线性运算并在频域高频增强。图像增强偏重于处理后主观效果,而图像复原偏重于成像前的客观现实。62试分别给出将灰度范围(10,100)拉伸到(0,150)和(10,200)、压缩到(50,100)和(10,125)、平移到(110,225)的线性变换。解设原始图像像素灰度F的范围为A,B,线性变换后图像像素灰度G的范围为A,B。灰度G与灰度F之间的关系为GABABAFA这里,A10,B100。题目给出四组A,B值,分别代入上述公式即可得出G和F的线性函数关系。教材图44线性变换63如图434所示,已知灰度图像FX,Y表示为如下矩阵,求经过反转变换后的图像GX,Y。反转变换GGF。20010016015510230(A)灰度图像矩阵(B)反转变换曲线图434灰度图像的反转012700127064试求灰度变换方程GGF,使其在范围10F150内为LNF的线性函数。解依题意,设GALNFB,当10F150时,G1FG2则G1ALN10BG2ALN150B所以AG2G1/LN15BG1ALN1065设有一幅6464的离散图像,其灰度分成8层,灰度NK的值和分布情况如表43所20示。试绘制该图像的直方图,并求经过直方图均衡后的图像的直方图。说明为什么对数字图像进行直方图均衡化后,通常并不能产生完全平坦的直方图。表43一幅图像的灰度分布KRKNK0056011/792022/7104633/770544/735655/726766/71707172解列表如下KRKNKPRRK0056001411/792002222/7104602633/770501744/735600955/726700766/71700047172002SK0140360620790880950991SK1/73/74/76/76/7111SKNKSPRSK1/75600143/79200224/710460266/71061026150901366试述图像平滑的目的、采用空间域和频率域滤波的原理。解(1)图像平滑是主要为了消除或减轻图像噪声。(2)空间域滤波主要通过邻域平均、中值滤波和边界保持滤波等方法达到图像平滑的目的。(3)空间域滤波是通过将图像变换成相应的频谱,在频域进行低通滤波,再进行反变换实现的。67试述中值滤波的特点。为什么对一些细节多,特别是点、线、尖点细节多的图像不适宜用这种方法答中值滤波便属于这一类的非线性增强方法,在去噪的同时可以兼顾到边界信息的保留。对消除孤立点和线段脉冲等干扰及图像扫描噪声最为有效,但对于消除高斯噪声的影响效果不佳。中值滤波首先选一个含有奇数点的窗口W,将这个窗口在图像上扫描,把该窗口中所含的像素点按灰度级的升(或降)序排列,取位于中间的灰度值,来代替该点的灰度值。二维中值滤波的窗口形状和尺寸对滤波性能的影响较大,以适应不同的图像内容和应用要求。由于采用窗口中灰度值排序的方法决定中值,对于一些细节较多的复杂图像排序后将会影响正常图像的内容,所以不宜采用这种方法。68如图635所示,设原图像为1010的点阵,求边界点保持不变、经过33窗口中值滤波的图像。211111111111111111111111555555111155555511115588551111558855111155555511115555551111111111111111111111图635受干扰的二维图像解(1)采用33窗口在图像上进行扫描,窗口中心值为窗口灰度值排序的中值。(2)采用中值滤波的程序验证结果I1111111111111111111111555555111155555511

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论