数字图像处理与Python实现 课件 赵彦玲 第1-4章 绪论、数字图像基础 -图像变换_第1页
数字图像处理与Python实现 课件 赵彦玲 第1-4章 绪论、数字图像基础 -图像变换_第2页
数字图像处理与Python实现 课件 赵彦玲 第1-4章 绪论、数字图像基础 -图像变换_第3页
数字图像处理与Python实现 课件 赵彦玲 第1-4章 绪论、数字图像基础 -图像变换_第4页
数字图像处理与Python实现 课件 赵彦玲 第1-4章 绪论、数字图像基础 -图像变换_第5页
已阅读5页,还剩159页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图像处理课程内容入门认识第7章图像分割第8章图像压缩基本操作应用第9章图像水印第10章指纹识别第11章深度学习综合案例第一章绪论1.1数字图像基本概念1.2数字图像处理1.3数字图像处理的主要应用1.4数字图像处理的发展1.5计算机视觉1.1数字图像处理概念图:反射光或透射光的分布,或自身发出的能量(客观)像:人的视觉系统对图的接收在大脑中形成的印象或认识(主观)什么是图像?客观和主观的结合要素:观察系统使用的光波段:可见光、红外、X射线、微波超声波、射线等1.1数字图像处理概念模拟图像和数字图像数字图像:由连续的模拟图像采样和量化而得。组成数字图像的基本单位是像素,所以数字图像是象素的小块区域组成的二维矩阵。像素:具有坐标和灰度值。像素值:图像在该位置的亮度。

模拟图像:采用数字化(离散化)表示和数字技术出现之前,图像是连续的。比如在海边用传统相机拍摄的照片就是模拟图像。第一章绪论1.1数字图像基本概念1.2数字图像处理1.3数字图像处理的主要应用1.4数字图像处理的发展1.5计算机视觉1.2数字图像处理概念借助计算机的运算能力,运用去噪、特征提取、增强等技术对数字图像处理。(1)提升图像的视觉感知质量(2)提升图像中的感兴趣区域或特征(3)方便图像的存储和传输数字图像处理的目的1.2数字图像处理数字图像处理的特点(与模拟图像相比)(1)可再现能力强(不易退化)(2)处理精度高(灰度级最高到32位以上)(3)适用范围广(4)灵活性高(线性与非线性、空域与频域、点区域和整体)1.2数字图像处理数字图像处理系统组成思考:你和好友们拍照,并将照片用手机发送给他们的全过程包括哪些步骤。图像获取图像存储图像处理图像传输图像展示1.2数字图像处理数字图像处理的三个层次图像处理:对图像进行加工,以改善图像的视觉效果;强调图像之间进行变换;从图像到图像图像处理图像分析:对图像中感兴趣的目标进行提取和分割,获得目标的客观信息(特点或性质);从图像到数据图像分析图像理解图像理解:研究图像中各目标的性质及其之间的相互联系;得出对图像内容含义的理解及原来客观场景的解释,

属于高层操作(符号运算)。1.3数字图像处理数字图像处理的三个层次图像处理图像分析图像理解第一章绪论1.1数字图像基本概念1.2数字图像处理1.3数字图像处理的主要应用1.4数字图像处理的发展1.5计算机视觉1.3数字图像处理主要应用数字图像处理常见操作(经典图像处理)(1)图像变换(2)图像增强(4)形态学操作(3)图像分割(5)图像压缩1.3数字图像处理主要应用遥感图像应用:资源调查、灾害监测、农林业规划、城市规划、环境保护等高分辨率通过安装在遥感平台上的遥感仪器对地球表面摄影或扫描获得的影像1.3数字图像处理主要应用工业与实验图像处理:自动装配生产线:实时图像处理机器人视觉:立体图像对处理无损探伤: 高能X射线探测金属内部车辆牌照识别:交通管制流动显示与测速:PIV粒子图像测速1.3数字图像处理主要应用军事公安图像处理:指纹图像处理:刑侦、司法鉴定、自动门卫枪纹图像处理:刑侦、司法鉴定面孔图像处理:自动门卫印章比对: 司法鉴定、银行支票笔迹比对: 刑侦、司法鉴定俄乌战争是人类首次人工智能(AI)战争你说:人脸识别技术能识别动物的脸、指纹吗?221.3数字图像处理主要应用影视图像处理:照片去模糊处理:焦距模糊、运动模糊绿幕剪影: 图像合成变脸特技: 帧间插值处理静止图像压缩:JPEG标准、网络传输动态图像压缩:MPEG标准、VCD和DVD数字电影院: 未来电影技术以下哪项内容不属于数字图像处理的范围提取图像边缘信息获取形状信息为处理问题简单化而进行的图像变换为图像中对象分类进行的目标检测有目的的增强图像的整体或局部特性ABCD提交单选题1分第一章绪论1.1数字图像基本概念1.2数字图像处理1.3数字图像处理的主要应用1.4数字图像处理的发展1.5计算机视觉1.4数字图像处理的发展起源1921年,纽约-伦敦海底电缆进行“数字图像传输”。传递时间从一个多星期减少到3小时1929年,伦敦-纽约15级色调传递照片。1964年,美国喷气推进实验室(JPL)使用数字计算机处理“徘徊者7号”太空船送回的4000+月球照片。1975年,GodfreyN.Hounsfield和AllanM.Cormack发明计算机断层技术(CT),获1979年诺贝尔医学奖。20世纪60年代末和70年代初开始用于医学图像、地球遥感监测和天文学等领域。1.4数字图像处理的发展发展趋势从低分辨率向高分辨率发展从二维(2D)向三维(3D)发展从静止图像向动态图像发展从单态图像向多态图像发展结合应用数学新进展1.4数字图像处理的发展AI时代+数字图像处理数字图像处理是人工智能的基石。(人工智能就是要实现计算机对人的视觉、听觉、嗅觉、味觉、触觉的模拟感知、思维决策和行为控制,视觉信息的智能化是最重要的方面。)从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,称为图像理解或计算机视觉。第一章绪论1.1数字图像基本概念1.2数字图像处理1.3数字图像处理的主要应用1.4数字图像处理的发展1.5计算机视觉1.5计算机视觉1.5计算机视觉图像处理&计算机图形学&计算机视觉图像处理(DIP)计算机图形学(CG)计算机视觉(CV)研究对象图像虚拟场景的描述(景象结构、表面反射特性、光源配置及相机模型的信息),通常是多边形数组图像或图像序列研究内容图像处理、图像分割、图像分析图形的构造,从数据得到图像视觉感知、图像理解研究输出由原始图像处理出分析结果生成图像(二维像素数组)图像序列对应的真实世界的理解(比如检测人脸、识别车牌)应用场景图像的基本处理图形成像、游戏类开发、视频渲染除了DIP之外,人工智能含量大1.5计算机视觉人脸识别是人工智能视觉与图像领域中最热门的应用人脸识别对结构化的人、车、物等视频内容信息进行快速检索、查询视频/监控分析无人驾驶自动驾驶增强现实、虚拟现实AR、VR应用领域1.5计算机视觉应用实例/1.5计算机视觉应用实例网易易盾/基于人工智能技术及大数据,提供智能文本图片视频内容安全服务第一章小结1.1数字图像基本概念1.2数字图像处理1.3数字图像处理的主要应用1.4数字图像处理的发展1.5计算机视觉图像处理技术有哪些用途?为每种用途举出一个应用实例。作答主观题10分数字图像处理列举数字图像处理包含的内容2.图像处理技术有哪些应用,为每种用途举出一个应用实例。作答主观题10分课程内容入门认识第7章图像压缩第8章图像分割基本操作应用第9章图像水印第10章指纹识别第11章深度学习综合案例第二章数字图像处理基础2.1色度学基础2.2图像的数字化技术2.3像素的基本关系2.4图像质量评价2.1色度学基础图:反射光或透射光的分布,或自身发出的能量(客观)像:人的视觉系统对图的接收在大脑中形成的印象或认识(主观)什么是图像?客观和主观的结合感光细胞杆状细胞:暗视器官锥状细胞:明视器官,在照度足够高时起作用,并能分别辨颜色2.1色度学基础颜色模型将电磁光谱的可见部分分为三个波段:红、绿、蓝(三基色)把三种基色光按不同比例相加称之为相加混色2.1色度学基础广泛使用的模型:面向机器(如显示器、摄像机、打印机等)的RGB模型面向颜色处理(也面向人眼视觉)的HSI(或HSV)模型(1)RGB模型(面向硬件设备的彩色模型)颜色模型三基色比例相加混色C=R(R)+G(G)+B(B)RGB000黑色001蓝色010绿色011青色100红色101品红110黄色111白色R=G=B灰色表2.1三基色相加混色表2.1色度学基础颜色模型人眼感受颜色:色调(hue)、饱和度(saturation)和亮度(Intensity/Lightness)色调(H):由颜色所在光谱中的波长决定,表示颜色的种类;颜色“质”的特征饱和度(S):取决于颜色中混入白光的数量,表示颜色的深浅;

混入的白光数量越多,其饱和度越高,颜色越鲜艳。亮度(I):取决于颜色的光强度,表征颜色的明亮程度;是颜色“量”的特征(2)HSI(或HSV)模型美国色彩学家孟塞尔(H.A.Munseu)于1915年提出,反映了人的视觉系统感知彩色的方式2.1色度学基础思考:如果你会如何描述一种颜色?“这是什么颜色?深浅如何?明暗如何?”2.1色度学基础颜色模型饱和度越大,颜色看起来越鲜艳(中心轴为灰色)HSI模型完全反映了人类感知颜色的基本属性:H和S分量与人感知颜色的特性一一对应,I分量与图像的彩色信息无关,在处理彩色图像时,可仅处理Ⅰ分量,结果不改变原图像中的彩色种类。HSI模型被广泛应用于以人的视觉系统感知颜色的图像表示和处理系统中。(2)HSI(或HSV)模型拓展学习:孟塞尔色彩标定方法颜色模型转换(1)RGB

HSI转换2.1色度学基础将R、G、B分量归一化到[0,1]范围内后,按如下公式转换:颜色模型转换(2)

HSI

RGB转换2.1色度学基础设S、I分量的值在[0,1]内,R、G、B分量的值也在[0,1]内:颜色模型转换为什么需要转换?2.1色度学基础如果直接对RGB模型中的R、G和B分别进行处理,很可能会引起三个量不同程度的变化,引起色差或失真。HSI模型使得在保持色彩无失真的情况下实现图像处理成为可能。I分量与图像的彩色信息无关;H和S分量与人感受颜色的方式紧密相联的。为什么HSI模型可以保证色彩无失真?图2.常见彩色图像处理流程

思考题:1、如何表示图像中一点的彩色值?

在常用的颜色空间中,哪个颜色空间最接近人的视觉系统的特点?用颜色三维空间中的一个点来表示,每个点有三个分量,不同的颜色空间各分量的含义不同。大量应用的是HSI模型,这个模型是由色度(H),饱和度(S),亮度(I)三个分量组成的,与人的视觉特性比较接近。该模型重要性在于:一方面消除了亮度成分I在图像中与颜色信息的联系,另一方面色调H和饱和度S分量与人的视觉感受密切相关。基于人的视觉系统的颜色感觉特性,使HSI模型成为一个研究图像处理的重要工具。HSI模型由色度(H),饱和度(S),亮度(I)三个分量组成的,与人的视觉特性比较接近。色调(H)表示颜色的种类,用角度来标定,用-180~180或0~360度量。饱和度(S)表示颜色的深浅,在径向方向上的用离开中心线的距离表示。用百分比来度量,从0%到完全饱和的100%。亮度(I)表示颜色的明亮程度,用垂直轴表示。也通常用百分比度量,从0%(黑)到100%(白)。2、色调、色饱和度和亮度的定义是什么?在表征图像一点颜色时,各起什么作用?张宇宁?第二章数字图像处理基础2.1色度学基础2.2图像的数字化技术2.3像素的基本关系2.4图像质量评价2.2图像的数字化技术图像的数学模型(矩阵表示)2.2图像的数字化技术图像的数学模型2.2图像的数字化技术图像的数学模型数字图像中的像素与二维矩阵中的每个元素图像的采样(空间)常用办法:对f(x,y)进行均匀采样,取得各点的亮度值,构成一个离散函数f(i,j)。奈奎斯特定理?采样率fs必须大于被测信号感兴趣最高频率分量的两倍。2.2图像的数字化技术图像的采样(空间)奈奎斯特定理2.2图像的数字化技术s(x)是由多个正弦信号叠加构成的波型函数数字通信的引路人采样率fs必须大于被测信号感兴趣最高频率分量的两倍。根据一维采样定理,若一维信号g(t)的最大频率为w,以()为间隔进行采样,则能够根据采样结果g(iT)(i=…,-1,0,1,…)完全恢复g(t)。T≤1/2wT≤wT≥1/2wT≥wABCD提交单选题1分图像的采样2.2图像的数字化技术图像的量化(灰度)M*N个采样点,每个像素量化后的灰度二进制位数为Q,一般Q总是取为2的整数幂,即Q=2k,则存储一幅数字图像所需的二进制位数b为:字节数:2.2图像的数字化技术图像的量化(灰度)2.2图像的数字化技术像素邻域2.3像素的基本关系ND(p)N8(p)N4(p)邻接性、连通性、区域和边界邻接性:

满足某一个灰度相似性定义的两个像素p和q是否具有相邻关系中的一种。p和q同属于C,当q处在p的4邻域中时,则它们为4邻接;当q处在p的8邻域或对角邻域中,称它们为8邻接,或对角邻接。2.3像素的基本关系第二章数字图像处理基础2.1色度学基础2.2图像的数字化技术2.3像素的基本关系2.4图像质量评价邻接性、连通性、区域和边界m-邻接性(满足下列条件之一即可):(1)q在p的4邻域中

(2)

q在p的对角邻域中且p的4邻域和q的4邻域的交集为空集,

(即交集中不存在属于集合C的像素)在不同的灰度集合定义下,图像中两个像素的邻接关系可能不一样2.3像素的基本关系集合C={2}时,点p(1,1)和q(2,2)是m邻接吗?是否AB提交单选题1分集合C={1,2}时,点p(1,1)和q(2,2)是m邻接吗?是否AB提交单选题1分点n(1,2)和p、q的关系是m邻接吗?是否AB提交可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。点n是在p、q的4邻域中,符合第一种m邻接的定义答案解析单选题1分邻接性、连通性、区域和边界m-邻接性

为什么要引入m邻接的定义??讨论:当集合C={1,2}时,(1)考虑8邻接关系时,坐标点s到点q的通路是否唯一?(2)考虑m邻接关系时,坐标点s到点q的通路是否唯一?s->t->n->qm邻接消除8邻接的二义性2.3像素的基本关系邻接性、连通性、区域和边界连通性点p(x1,y1)的像素与点q(x2,y2)的像素按某种邻接关系存在一条连通的路径连通性需要根据邻接关系来确定由p到q的路径:由点p到q所经历的路径的像素点序列路径的长度:从p点出发沿路径到q点所需走的步数分析:4邻域和8邻域情况下,点p和q是否连通?2.3像素的基本关系邻接性、连通性、区域和边界区域和边界区域:连通的像素点所组成的点的集合边界点:区域中的某一像素,如果存在某一个邻域不属于这一区域内边界:一个区域的所有边界点组成该区域的边界,这些边界点在区域内外边界:边界点并不在当前考虑区域内,但有一个邻域属于当前区域区域也分为4连通区域和8连通区域2.3像素的基本关系邻接性、连通性、区域和边界区域和边界边缘(edge)和边界(border)。边缘:灰度值存在差异的地方,通常指相邻像素之间的灰度值差大于某一个阈值边缘不一定是闭合轮廓,边界是闭合的轮廓2.3像素的基本关系距离度量给定3个点p(x,y)、q(s,t)、r(u,v),若满足以下三个基本条件,则度量函数D称为距离2.3像素的基本关系非负性与起始点无关直线距离最短(1)欧式距离:(2)城市距离:(3)棋盘距离:(a)欧式距离

(b)城市距离

(c)棋盘距离常见距离度量2.3像素的基本关系如下图像子集:(1)在图中画出V={0,1}时的p到q的最短m-连接通路,(2)计算p到q的欧式距离、城市距离和棋盘距离。作答可为此题添加文本、图片、公式等解析,且需将内容全部放在本区域内。(1)最短m-连接通路(2)答案解析主观题10分第二章数字图像处理基础2.1色度学基础2.2图像的数字化技术2.3像素的基本关系2.4图像质量评价图像质量的主观评价(最普通和最可靠的评价)两种:绝对方式和比较方式2.4图像质量评价绝对方式:让观察者观看一幅图像,按照预先规定的评定标准判断图像质量。

有时给观察者配备一套标准参考图像,以便评定时进行主观校准;

但有时,观察者不得不只根据以往的观察经验判断。质量尺度妨碍尺度5分丝毫看不出图像质量变坏5分非常好4分能看出来图像质量变化但不妨碍观看4分好3分清楚看出图像质量变坏,对观看稍有妨碍3分一般2分对观看有妨碍2分差1分非常严重的妨碍观看1分非常差表

绝对评价尺度图像质量的主观评价(最普通和最可靠的评价)2.4图像质量评价比较方式:请观察者评定一套图像,比较某一特定图组中图像的优劣。分值相对评价尺度绝对评价尺度5分该群中最好非常好4分好于该群中平均水平好3分该群中的平均水平一般2分差于该群中的平均水平差1分该群中最差非常差表2.3相对评价尺度与绝对评价尺度对比图像质量的主观评价(最普通和最可靠的评价)2.4图像质量评价优点:真实的反映图像直观质量,评价结果可靠,无技术障碍。缺点:主观测试受被测图像的类别以及试验观测条件的影响;

评价结果易受观察者的知识背景、心理变化、观测动机等因素影响;

依赖人眼视觉系统,难以找到合适的数学模型描述;

实施需要多人、多次重复实验,耗时多、成本昂贵、操作复杂,

不利于图像质量的实时评价,无法适用于所有场合。假如你是图像观察者,你认为在图像质量的主观评价中可能出现哪些情况?评价的准确性表现为实验结果的可重复性,要求对实验各方面的条件有严格规定对于熟悉的图像,你对损害度的鉴定不受影响对于不熟悉的图像,不影响你看出损害,不须外来有意提醒从一种观察条件变到另一种条件时,应用主观评价需加小心ABCD提交多选题1分图像质量的客观评价(最普通和最可靠的评价)1.均方误差 (MeanSquareError,MSE)

指被评价图像与参考图像对应位置像素值误差的平方均值。2.4图像质量评价MSE越大:图像像素值整体差异大,图像质量越差;均方误差为0,则被评价图像与参考图像完全一致。图像质量的客观评价(最普通和最可靠的评价)2.信噪比(SignalNoiseRation,SNR)

指被评价图像像素值的平方均值与均方误差比2.4图像质量评价在均方误差相同的情况下,对于不同图像,由于像素值不同,其信噪比很可能不同。图像质量的客观评价(最普通和最可靠的评价)3.峰值信噪比(PeakSignalNoiseRation,PSNR)2.4图像质量评价第二章数字图像处理基础小结2.1色度学基础(常见颜色模型)2.2图像的数字化技术(量化、采样的理解)2.3像素的基本关系(基本概念)2.4图像质量评价(mse,snr,psnr)自2009年至2022年,现场发掘面积400多平方米,清理陶俑220余件,陶马16匹,以及车马器、兵器等千余件组。”

---3月16日晚,央视《新闻联播》报道了此次发掘取得的成果。央视新闻客户端、人民日报客户端、新华网、光明网、中国网、央广网、环球网、凤凰网等多家权威主流媒体重磅聚焦兵马俑一号坑第三次发掘获多项新发现,数字图像处理课程内容入门认识第7章图像压缩第8章图像分割基本操作应用第9章图像水印第10章指纹识别第11章深度学习综合案例第三章数字图像处理基础3.1图像的表示方法3.2数字图像文件格式3.3Python图像处理基础3.1图像的表示方法M*N的二维矩阵(其中,M为图像的行数,N为图像的列数)5种图像的表示方法:二进制图像、索引图像、灰度图像、RGB图像和多帧图像3.1.1二进制图像1位表示一个像素,非0即1,通常0表示黑色,1表示白色优点:缺点:二值图像当表示人物或风景图像时只能描述轮廓占用空间少二维逻辑矩阵3.1.2灰度图像8位表示一个像素值,0表示黑色,255表示白色,1~254表示不同的深浅灰色单色图像数据类型:8位无符号整数、16位无符号整数或双精度类型。无符号整型:像素在[0,255]或[0,65535]范围内;双精度类型:像素在[0.0,1.0]范围内。3.1.3RGB图像3个大小相同的二维数组表示一个像素,分别代表R、G、B这3个分量真彩色图像3.1.4索引图像伪彩色图像包含:一个数据矩阵X和一个颜色映射(调色板)矩阵map。数据矩阵:8位无符号整型、16位无符号整型或双精度类型。颜色映射矩阵map:m*3的数据阵列,

[0,1]之间的双精度浮点型数据,

每一行表示红色、绿色和蓝色分量。3.1.5多帧图像用于需要对时间或场景上相关图像集合进行操作的场合。在Python中,支持在同一个数组中存储多幅图像,用一个四维数组表示,第四维用来指定帧的序号多帧图像数组中,每一帧的大小和颜色分量或调色板必须相同多页图像或图像序列计算下列未经压缩的BMP图像文件的数据量(字节):大小为256×256的黑白位图文件()大小为256×256的256色索引位图文件()大小为256×256的32位真彩色位图文件()256*256,256*256*8,256*256*4256*256/4,256*256,256*256*32256*256/8,256*256,256*256*4256*256/8,256*256*8,256*256*32ABCD提交单选题1分第三章数字图像处理基础3.1图像的表示方法3.2数字图像文件格式3.3Python图像处理基础3.2数字图像文件格式头文件:制作图像的公司规定,

一般包括文件类型、制作时间、文件大小、制作人及版本号等信息。常见:BMP、GIF、JPEG和TIFF3.2.1BMP图像Windows操作系统的标准文件格式,应用广泛。大部分BMP文件是不压缩的形式,但支持图像压缩。BMP文件结构3.2.2GIF图像CompuServe公司在1987年开发的图像文件格式,任何商业目的使用均须由公司授权。为数据流设计的一种传输格式,不作为文件的存储格式,它具有顺序的结构形式。文件结构文件标志块:识别标识符GIF和版本号。逻辑屏幕描述块:定义图像显示区域的参数,包含背景颜色信息、显示区域大小、纵横尺寸、颜色深浅及是否存在全局彩色表。全局彩色表:其大小由图像使用的颜色数决定。图像数据块:包含图像的描述块、局部彩色表、压缩图像数据、图像控制扩展块、无格式文本扩展块、注释扩展块和应用程序扩展块,此部分可以默认。尾块:三维16进制数,表示数据流已经结束,此部分可以默认。3.2.2GIF图像支持背景透明,生成非矩形的图片。支持动画,在Flash动画前唯一的动画形式。支持图形渐进,渐进图片将比非渐进图片更快地出现在屏幕上,让访问者更快地知道图片的概貌。支持无损压缩,所以它更适合于线条、图标和图纸。优点&缺点缺点:只能显示256色而应用范围受限,不能用于储存和传输真彩的图像文件。所以GIF图像文件格式成了Internet上最流行的图像格式。3.2.3JPEG图像由(国际)联合图像专家组(JointPhotographicExpertsGroup)提出静止图像压缩标准文件格式,面向常规彩色图像及其它静止图像的一种压缩标准。扩展名为jpg或jpeg。图像JPEG压缩效果演示第三章数字图像处理基础3.1图像的表示方法3.2数字图像文件格式3.3Python图像处理基础3.3Python图像处理基础基础图像处理任务:

显示;基本的操作,如裁剪、翻转、旋转;

图像分割,分类和特征提取;

图像恢复、识别等常见的图像处理库历史悠久,功能强大,被认为是Python官方图像处理库。PIL(PythonImagingLibrary)Pillow是PIL的一个派生分支,发展成比PIL本身更具活力的图像处理库。将其封装成Python的库(pip即可安装),且支持Python2.x和Python3.x。能在所有主要操作系统上运行,提供基本图像处理功能,比如图像缩放,裁剪,贴图,模糊

包括点操作,过滤以及颜色空间转换。很多时候需要配合Numpy库使用。常见的图像处理库NumPy(NumericalPython)Python语言的一个开源扩展核心库,运行速度快,支持数组结构,提供大量数学函数库进行高维数组与矩阵运算。在计算机中图像表示为点像素的标准NumPy数组,使用NumPy操作修改图像像素值。通常与SciPy(ScientificPython)和Matplotlib(绘图库)一起使用,用于替代MatLab。。常见的图像处理库SciPyPython的另一个核心数据科学模块(如同NumPy),可用于基本的图像处理和处理任务。以NumPy为基础,在子模块scipy.ndimage中提供在n维NumPy数组上运行的函数,大大扩展了后者的运算能力。常见的图像处理库skimage(scikit-imageSciKit)

Python中图像处理的常用库之一,由scipy社区开发和维护,对scipy.ndimage进行扩展,提供更多的图像处理功能,实现用于编写研究、教育和行业应用的算法和实用程序。skimage对scipy.ndimage进行了功能扩展,由多个子模块组成,图像数据由NumPy的多维数组表示,类似与MATLAB软件,可提供图像处理绝大部分功能。常见的图像处理库OpenCV-Python计算机视觉领域使用最广泛的开源库之一,采用C/C++语言,可运行在Linux/Windows/Mac等系统上,并提供Java、Python、MATLAB等接口;拥有丰富的常用图像处理函数,使得图像处理和图像分析更加便利,广泛应用于学术界和产业界的图像识别、运动跟踪、机器视觉等领域。OpenCV-Python是OpenCV的PythonAPI,运行速度快,容易编程和部署,成为执行计算密集型计算机视觉任务的绝佳选择。SimpleCV也是用于构建计算机视觉应用程序的开源框架。它可以访问如OpenCV等高性能计算机视觉库,学习难度远远小于OpenCV。(开源计算机视觉库)常见的图像操作图像文件显示常见的图像操作图像文件保存常见的图像操作图像RGB转灰度方法一:常见的图像操作图像RGB转灰度方法二:常见的图像操作二值图像的转换常见的图像操作RGB转二值常见的图像操作数值矩阵转图像数字图像处理课程内容入门认识第7章图像压缩第8章图像分割基本操作应用第9章图像水印第10章指纹识别第11章深度学习综合案例24.1图像几何变换获取图像变换域的某些性质,对其进行处理;一方面能够更有效地反映图像在空间域难以获取的特征;另一方面也可使能量集中在少量数据上,更有利于图像的存储、传输及处理。图像的变换域分析常用:傅里叶变换、DCT变换、小波变换广泛应用于图像分析、滤波、增强、压缩等应用中。第四章图像变换4.1图像几何变换4.2图像离散傅里叶变换4.3图像余弦变换平移、镜像、缩放、转置、旋转、剪切4.1.1图像的平移P0平移到P1

4.1.1图像的平移4.1.2图像的镜像分为水平镜像和垂直镜像水平镜像:以原图像垂直中轴线为中心,将图像分为左右两部分,进行左右对换,特点:每行像素的处理方式相同,行顺序不发生变化,只是每一行的像素信息顺序是从左到右进行颠倒。

垂直镜像:以原图像水平中轴线为中心轴将图像分为上下两部分,进行上下对换4.1.2图像的镜像垂直镜像:以原图像水平中轴线为中心轴将图像分为上下两部分,进行上下对换

4.1.2图像的镜像4.1.3图像的缩放垂直镜像:将给定的图像在x轴方向按比例缩放fx倍,在y轴方向按比例缩放fy倍fx=fy,为图像的全比例缩放。fx≠fy,图像产生几何畸变。4.1.3图像的缩放图像缩放:将给定的图像在x轴方向按比例缩放fx倍,在y轴方向按比例缩放fy倍fx=fy,为图像的全比例缩放。fx≠fy,图像产生几何畸变。4.1.3图像的缩放等尺寸显示时,请仔细观察缩小后的图像会丢失一部分原图像信息,会出现模糊化放大后的图像,增加了原图像信息,显示更清晰建议采用原图像的纵横比,缩放后能更好地保持图像信息4.1.4图像的转置图像的行列坐标互换,图像的大小会随之改变,即高度和宽度互换。

4.1.5图像的旋转以图像中心为原点,将所有像素都旋转一个相同角度使用cv2.getRotationMatrix2D()函数生成旋转矩阵,返回旋转矩阵,使用cv2.warpAffine()实现图像旋转。实现方法:旋转后图像尺寸与原始相同。缩放比例及旋转程度不同,可能会造成部分信息丢失。避免丢失需要增加计算旋转后图像的外接矩形框尺寸。4.1.6图像的剪切只对部分图像感兴趣切片指定坐标的顺序为[y0:y1,x0:x1]数组切片方式4.1.7图像的插值思考:图像几何变换本质?将像素的坐标通过某种函数映射关系,映射到其他位置。包括:向前映射、向后映射向前映射:由输入图像的坐标计算其在输出图像中的位置。思考:计算可以得到输出图像中非整数点坐标。整数坐标值怎么求?整数点的像素值周围会有很多输入像素点映射过来,将这些像素值叠加,得到输出图像整数点位置的像素值,无法直接得到输出图像某一点的像素值。4.1.7图像的插值向后映射:图像填充映射直接计算输出图像整数点(x’,y’)变换前在输入图像上的位置(x,y)。非整数点坐标:

利用其周围整数点位置的输入图像像素值进行插值,得到该点的像素值。逐个考虑输出图像中的像素,不会产生计算浪费。4.1.7图像的插值常见图像插值:最近邻插值

双线性插值最近邻插值按照四舍五入法找到最相邻的整数点坐标,以其像素值作为插值后的输出P点在A区,f(i,j),P点在B区,f(i+1,j),P点在C区,f(i,j+1),P点在D区,f(i+1,j+1)。图像质量不高,放大有很严重的马赛克,缩小有很严重的失真。如果输出图像该点的像素值根据输入图像中周围四个真实的点按照一定规律计算,能达到更好的效果4.1.7图像的插值常见图像插值:最近邻插值

双线性插值双线性插值输入图像中虚拟点四周的四个真实像素值共同决定输出对应点像素值缺点:计算量较大;具有低通滤波器性质,损失部分高频分量,图像轮廓在一定程度上变模糊。优点:比最近邻插值法输出图像质量高,不会出现像素值不连续的的情况。第四章图像变换4.1图像几何变换4.2图像离散傅里叶变换4.3图像余弦变换平移、镜像、缩放、转置、旋转、剪切4.2图像离散傅里叶变换引入傅里叶变换的作用:1、信号的频域的表示跟时域的表示相比更加简洁明了2、便于从能量的角度看待信号3、简化了信号处理中所需要的计算量s(x)是由多个正弦信号叠加构成的波型函数4.2.1连续傅里叶变换f(x)为实变量x的连续函数,则傅里叶变换定义为:f(x)必须满足:只有有限个间断点、有限个极值和绝对可积的条件实序列傅里叶变换的实部和虚部分别为()偶函数和奇函数奇函数和偶函数奇函数和奇函数偶函数和偶函数ABCD提交单选题1分4.2.1连续傅里叶变换推广到二维函数f(x,y),连续可积的连续函数,则傅里叶变换定义为:4.2.2离散傅里叶变换(DFT)对f(x)进行采样将其离散

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论