版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字图像处理数字图像处理一、模拟图像处理包括光学图像处理和电子图像处理(电子光学处理)光学方法是图像处理发展的起源,1946年法国的Duffienx提出傅立叶光学,1964年美国密执安大学的A.Vanderlugt制成空间滤频器光学处理具有处理速度快(可实时和并行处理,如电视模拟图像处理可达25帧/秒或30帧/秒)、信息量大、分辨率高、经济等优点模拟图像处理的缺点是精度差、灵活性差,器件具有专用性,并且缺乏判断分析能力,不具备非线性处理能力趋势:将光学处理和计算机相结合的方法,如利用光学方法对图像进行傅立叶变换,再用计算机对频谱分析一、模拟图像处理包括光学图像处理和电子图像处理(电子光学处理二、数字图像处理将图像转换成一个数据矩阵存放在图像存储器中,然后再利用数字计算机,或其它的大规模集成数字器件(如DSP),对图像信息进行数字运算或处理,以提高图像的质量或达到人们所预期的其它效果优点:精度高、处理内容丰富、可以进行复杂的非线性处理,处理方式灵活,同样的图像硬件系统,在改变软件之后可以用于其它完全不同的任务缺点:由于目前计算机性能的限制,数字图像处理的速度有限,对于一些有实时性要求的任务,必须利用DSP加速或构建专用系统二、数字图像处理将图像转换成一个数据矩阵存放在图像存储器中,广义的数字图像处理是指从图像获取到图像信息输出的全过程,即图像处理系统与计算机应用相关的设备图像处理相关的方法有效软件的实现图像处理软件的应用图像信息在计算机中的表示图像数据库及检索图像信息应用等狭义的数字图像处理仅指其中对图像信息进行处理广义的数字图像处理是指从图像获取到图像信息输出的全过程,即图广义图像处理图像信息获取,即获取研究对象的图像,并转换成数字信号,以便于计算机或其它数字设备处理研究重点:图像成像设备和数字化设备图像信息的存储图像存储设备,以及图像存储的格式、图像压缩标准以及图像数据库技术等图像信息的传送,包括内部传送与远距离传送内部传送多采用DMA(DirectMemoryAccess);远距离传送图像压缩技术,减少占用带宽图像信息处理,即狭义的图像处理利用计算机可以实现的算法图像的输出与显示,即为人或计算机提供便于理解以及识别的图像软拷贝与硬拷贝两种形式广义图像处理图像信息获取,即获取研究对象的图像,并转换成数字狭义的计算机图像处理(一)几何处理坐标变换:图像的放大与缩小、旋转、移动图像畸变校正几何特征计算等算术与逻辑运算图像的加减乘除,与或非等运算此类运算既简单有效,又是其它处理的基础图像增强根据任务目标突出图像中感兴趣的信息,消除干扰,改善图像的视觉效果或增强便于机器识别的信息此三项是图像预处理中常涉及的内容狭义的计算机图像处理(一)几何处理狭义的计算机图像处理(二)图像复原根据图像退化模型,消除退化因素,恢复原始的图像。如散焦是造成图像模糊的一个重要的因素,而散焦模型可以通过实验数据和理论分析获得,利用逆滤波就可以消除散焦图像编码研究压缩图像数据的方法,需要研究并利用图像的冗余特征,如统计冗余、生理视觉冗余、知识冗余等图像分割根据图像的某些特征将图像划分为不同的区域,以便于对图像中的物体或目标进行分析与识别。如“机动车视觉系统”中根据图像中的灰度信息分割白色导引线和路面狭义的计算机图像处理(二)图像复原狭义的计算机图像处理(三)图像重建前面六个研究方面输入的是图像,而图像重建输入的是非图像信息,如数据、公式等,输出为图像。主要有卷积反投影法等。常用于医学设备,CT等图像模式识别在图像分割的基础上提取特征,对图像中的内容进行判决分类图像分析与理解在图像模式识别的基础上进一步发展,根据图像局部内容之间的关系,利用有关知识进行推理与联想,对图像中所表现的内容进行理解狭义的计算机图像处理(三)图像重建课程介绍教材
《图像处理和分析基础》,高等教育出版社,2004课程介绍教材课程介绍参考资料李叔梁译.冈萨雷斯.数字图像处理.1981
KennethR.Castleman.DigitalImageProcessing.1998陈彩廷译.罗森菲尔德.数字图像分析.1987吴健康.数字图像分析.1989
R.C.Gonzalez,R.E.Woods.DigitalImageProcessing,Addison-Wesley,ReadingMA,1992课程介绍参考资料课程介绍主要参考资料
ComputerVisionGraphicsandImageProcessing
IEEETrans.PatternAnalysis&MachineIntelligence
PatternRecognition
PatternRecognitionLetter
ImageandVisionComputing模式识别与人工智能、中国图像图形学报计算机学报、自动化学报课程介绍主要参考资料第一章图像技术基础1.1图像和像素1.2图像技术及分类1.3图像表示1.4图像显示1.5图像存储与格式1.6*视觉基础1.7*颜色视觉和色度学第一章图像技术基础1.1图像和像素1.1图像图像(image)
在一般的意义下,可以认为一幅图像就是一个东西的一个表示,它包含了所表示物体的相关描述信息,出现形式多种多样可视的和不可视的;抽象的和实际的;适于和不适于计算机处理的1.1图像图像(image)一、按照图像的存在形式分(1)物理图像
(physicalimages)--物质或能量的实际分布可见的图像(visibleimage):人眼可以看到并接受的图像图片
(picture),包括照片
(photograph)、图
(drawings指用线条画成的)和画
(paintings),图片等价于图像,也就是说picture经常和image一词混用光图像
(opticalimages),即用透镜、光栅和全息术产生的图像,如荧幕、屏幕上出现的影像。光(学)图像是光强度的空间分布不可见的图像:如温度、压力、高度以及人口密度等的分布图一、按照图像的存在形式分(1)物理图像(physical
(2)抽象图像即数学图像,包括连续函数和离散函数离散函数图像就是计算机可以处理的形式物理图像必须要变成离散函数才能被计算机处理(2)抽象图像二、按照图像的色彩特性分彩色图像,又称为多光谱图像图像上的每个点有多于一个的局部特征彩色电视中重现的三基色图像,每个像素点就需要有红、绿、蓝三个基色的三个亮度值表示。遥感图像可以提供多达7个不同通道的信息黑白图像,又称灰度图像、亮度图像、单色图像等每个像素点只有一个亮度值黑白照片黑白电视画面二、按照图像的色彩特性分彩色图像,又称为多光谱图像三、按照图像的光谱特性分可见光图像红外光图像雷达图像声呐图像三、按照图像的光谱特性分可见光图像四、按照图像的时间特性分静止图像不随时间变化的图像,如各类图片动态图像随时间变化的图像,如电视和电影画面四、按照图像的时间特性分静止图像物体objects图像images不可见的物理图像Non-visiblephysicalimage数学函数Mathematicalfunction连续函数continuous离散函数Discrete(digitalimage)可见的图像Visibleimage光图像Opticalimage图片pictures照片photograph图drawing画paintingsTypesofimages图像的类型物体objects图像images不可见的物理图像数学函数M图像信息的分类三类符号信息景物信息情绪信息图像信息的分类三类图像信息——(1)符号信息一般是用文字、符号、图形等表示的具体的或抽象的事物电路图、机械图、打印的文件等,它们中包含有规则、含义明确的符号,这些图像一般用二值图像表示就足够了,因为符号的颜色不提供新的有效信息,对图像的理解没有帮助地图中也包含大量符号,但需要关注颜色信息,因为它们都有确定的物理含义,如蓝色一般表示湿地,绿色的深浅也表明了海拔高度图像信息——(1)符号信息一般是用文字、符号、图形等表示的具图像信息——(2)景物信息是一种能够使人产生主观感觉,但不取决于人本身的客观场景中包含的信息。景物信息内容丰富,较难以表达,只有在明确目标的前提下,才能得到正确处理如卫星云图中蕴含着气旋信息,气旋的位置与强度是一种客观存在图像信息——(2)景物信息是一种能够使人产生主观感觉,但不取图像信息——(3)情绪信息依赖于观察者,如艺术图片的效果就与观看者本身的生理、心理、修养有很大的关系,此类信息无法刻画图像信息——(3)情绪信息依赖于观察者,如艺术图片的效果就与1.2图像技术及分类图像工程图像处理图像分析图像理解采集获取存储重建变换滤波增强恢复编码压缩数字水印信息隐藏边缘检测图像分割目标表达描述测量图像匹配融合3D表示重构场景恢复解释推理图像视频检索颜色形状纹理空间运动分析目标检测提取跟踪识别1.2图像技术及分类图像工程图像处理图像分析图像理解采集变几个学科之间的关系图像处理(低级,像素):图像
图像图像分析(中级,目标):图像数据图像理解(高级,符号):数据、符号场景模式识别:图像符号计算机图形学(ComputerGraphics):数据图像,用计算机将由概念或数学模型表示的物体(不是实物)进行处理,并显示成图像计算机视觉(ComputerVision):图像场景,研究模拟人眼功能的理解自然景物的系统数字成像(DigitalImaging):更广义的一个概念,涵盖任何用计算机来操作(manipulate)与图像有关数据的技术,包括计算机图形学、计算机视觉、数字图像处理与分析几个学科之间的关系图像处理(低级,像素):图像图像不断拓展的应用领域遥感(RemoteSensing)
生物医学(Physic)
文件处理(FileManipulation)科学研究(ScienceResearch)
工业检测(IndustryCheck)
机器人视觉(RobotVision)军事(MilitaryAffairs)公安(PublicSecurity)其他不断拓展的应用领域遥感(RemoteSensing)公安(PublicSecurity)身份辨识监控不开箱检查鉴定公安(PublicSecurity)身份辨识身份的生物识别技术眼睛虹膜、视网膜手掌指纹语音面孔、脸部血管签名基因气味身份的生物识别技术眼睛虹膜、视网膜眼睛:最可靠的身份证虹膜:纤维组织,有250以上的特征点每个虹膜的可识别特征可以得到512字节的资料,称为虹膜代码不同人眼的虹膜的60%左右的纹路是相同的,40%是不同的两人同一只眼虹膜特征相同的概率是十万分之一,两眼相同的概率是一千亿万分之一视网膜:血管构造也具有唯一性和稳定性的特点,可能还更为有效(可获得400个特征点眼睛:最可靠的身份证虹膜:纤维组织,有250以上的特征点人眼虹膜识别系统人眼虹膜识别系统手掌识别一种最为快捷方便的方法识别手掌的几何特征手掌放在录入头表面后,由红外相机获取图像。然后对手掌的整体形状、手指和关节的形状和长度进行测量,从而得到手掌的特征点准确度不是很高,不能对手掌的其它特征,比如掌纹、伤疤进行分析可利用的特征点约20~50个手掌识别一种最为快捷方便的方法指纹:最成熟的识别技术从可靠性说,人与人之间,拥有相同指纹的概率为十亿分之一每个指纹的特征点很多,“节点”,也就是指纹纹路的分叉、终止或打圈处的坐标位置。通常,手指上有70个节点,他们同时具有7种以上的唯一的特征。根据美国联邦调查局的研究,在可以用软件识别的节点中,最多有7个或8个相同点进行指纹识别时,首先用指纹读取设备获得指纹的图像,然后对原始图像进行初步处理,使得更清晰。指纹识别软件在指纹上找到节点,并转换成特定的数据。最后,通过模糊比较的方法,把这些数据与数据库中的指纹数据进行比较,得到匹配结果最新进展,与指纹的深度信息融合,进一步提高了识别的可靠性和数据的独特性指纹:最成熟的识别技术从可靠性说,人与人之间,拥有相同指纹的七年级数学上册第4章直线与角检测卷课件新版沪科版1213人脸识别:最友好、直接的系统人脸检测(FaceDetection)人脸表征(FaceRepresentation)人脸鉴别(FaceIdentification):即人脸识别表情分析(FacialExpressionAnalysis)物理分类(PhysicalClassification)人脸检测与定位特征提取人脸识别输入图像输出结果人脸自动识别系统构成人脸识别:最友好、直接的系统人脸检测(FaceDetec七年级数学上册第4章直线与角检测卷课件新版沪科版1213笔迹识别:友善的生物识别技术专用签名输入板,用户在板上留下自己的签名,识别过程几乎瞬间完成签名力学辨识,建立在其签名时的力度上的。关键在于区分出不同的签名部分,那些是习惯性的,那些是每次签名是都不同的。这个系统主要对每个人签名时笔的移动进行动态分析,如速度的变化、运笔的压力、方向和笔划的长度等,而不是签名的图像本身签名识别的可靠性不是很高笔迹识别:友善的生物识别技术专用签名输入板,用户在板上留下1.3图像表示一、图像的连续模型1.3图像表示1、基本的连续模型图像可以用灰度级G在x,y二维空间的连续变换来描述,即g(x,y)。时间序列图像的描述为:g1(x,y),g2(x,y),…,gt(x,y)}或g(x,y,t)图像处理
f(x,y)=S[g(x,y)] (1)式(1)中S可以是有意施加的某种处理方法,也可以是图像系统中导致图像退化的原因。
G(x,y)=S-1[f(x,y)] (2)式(2)是图像复原的基本模型Sg(x,y)f(x,y)图像处理的基本框图1、基本的连续模型图像可以用灰度级G在x,y二维空间的连续变2、照明反射模型f(x,y)=i(x,y)r(x,y)其中0
i(x,y)Bm,0r(x,y)1i(x,y)照射分量,r(x,y)反射分量,Bm最大光照强度gmin
g
gmax,gmin=iminrmin,gmax=imaxrmax
[gmin,gmax]是图像灰度范围该模型常用于同态滤波,计算机图形:真实感模型2、照明反射模型f(x,y)=i(x,y)r(x,y)噪声的模型噪声的特征噪声的来源噪声模型噪声的模型噪声的特征(1)噪声的特征图像信号f(x,y)噪声n(x,y),随机性的,可以用随机过程来描述。一般常用统计特征来描述,如均值、方差、相关函数等均值E[n(x,y)]反映噪声的直流分量均方值E{n2(x,y)}反映噪声的总功率均方差E{(n(x,y)-E[n(x,y)])2}描述噪声的交流功率均值的平方[E{n(x,y)}]2,表示噪声的直流功率(1)噪声的特征图像信号f(x,y)(2)噪声的来源外部噪声从处理系统外来的影响,如电磁波干扰内部噪声(1)由光和电的基本性质引起的噪声(2)机械运动产生的噪声(3)元器件材料本身的缺陷带来的噪声(4)系统内部电路噪声(2)噪声的来源外部噪声噪声分类从统计观点看平稳噪声凡是统计特征不随时间变化的;非平稳噪声统计特征随时间变化的。从噪声幅度分布的统计来看其密度函数有高斯型、瑞利型等,分别称为高斯噪声和瑞利噪声。按噪声频谱形状命名的,如频谱均匀分布的噪声称为白噪声,频谱与频率成反比的称为1/f噪声,频谱与频率平方成正比的称为三角噪声噪声分类从统计观点看(3)噪声的模型加法性噪声g(x,y)=f(x,y)+n(x,y)乘法噪声g(x,y)=f(x,y)[1+n(x,y)]=f(x,y)+f(x,y)n(x,y)(3)噪声的模型加法性噪声二、离散模型二、离散模型数字图像处理的几个基本术语数字化(digitizing)将一幅图像从其原来的形式转换为数字形式的处理过程,包括“扫描”、“采样”与“量化”三个步骤通常将“扫描”合并到“采样”阶段,合并为两个过程数字图像处理的几个基本术语数字化(digitizing)扫描(scanning)将一个数学虚拟网格覆盖在一幅图像上,图像的平面空间被离散化成一个个的有序的格子(格子的形式可以有多种形式,通常易于物理实现的是矩形,且每个格子完全相同),然后按照格子的排列顺序依次读取图像的信息,此读取过程称为“扫描”。在扫描过程中被读取的小块图像称为图像元素(pictureelement),简称像素(pixel),它的描述包括空间坐标以及图像信息两个部分。不太严格的情况下,扫描也可以用作数字化的等价词。矩形扫描网格常称为光栅(raster)扫描(scanning)将一个数学虚拟网格覆盖在一幅图像上,图像数字化采样列采样行图片像素行间隔采样列间隔灰阶黑灰白0128255物理图像19643灰度像素数字图像物理图像及其对应的数字图像图像数字化采样列采样行图片像素行间隔采样列间隔灰阶黑灰白01采样(sampling)在一幅图像的每个像素位置上测量灰度值。采样通常是由一个图像传感元件完成,它将每个像素处的亮度转换成与其成正比的电压值。采样完成图像空间的数字化,在CCD摄像机中,是由一个个感光单元实现的。图像数字化时必须遵守“采样定理”,才能保证图像可恢复奈奎斯准则:采样频率必须需大于等于被采样信号的最大频率的2倍采样(sampling)在一幅图像的每个像素位置上测量灰度值量化(quantization)将采样时测量的灰度值转化成整数表示由于数字计算机只能处理数字,因此必须将连续的测量值转化为离散的整数。因此在图像传感器后面,经常跟随一个电子线路的模数转换器(ADC),将电压值转化成一个整数经过数字化得到一幅图像的数字表示,即数字图像f(x,y),f(x,y)以及x、y都是整数量化(quantization)将采样时测量的灰度值转化成整几个重要概念1、处理:让某个事物受到一个过程的作用2、过程(process):指能导致某个所期望目标的一系列的动作或操作3、数字图像处理:对一个物体的数字表示施加一系列的操作,以得到所期望的结果4、数字图像的限制性定义:一个被采样和量化后的二维函数(该二维函数由光学方法产生),采用等距离矩形网格采样,对幅度进行等间隔量化一幅数字图像是一个被量化的采样数值的二维矩阵几个重要概念1、处理:让某个事物受到一个过程的作用6、显示(display):由一幅数字图像生成一可见的、直观的图像“回放”、“图像重建”、“硬拷贝”、“图像记录”显示设备有暂时的、永久的两类10、对比度(contrast):一幅图像中灰度反差的大小11、噪声(noise):加性的或乘法性的污染12、采样密度(samplingdensity):图像上单位长度包含的采样点数像素间距(pixelspacing)=1/采样密度6、显示(display):由一幅数字图像生成一可见的、直观13、放大率(magnification):图像中物体与其所对应的景物中物体的比例关系14、运算(operation):注意运算前后图像之间的对应关系(1)全局运算:对整幅图像同时处理(2)点运算:由对应点决定(3)局部运算:由中心像素周围的有关像素决定13、放大率(magnification):图像中物体与其所数字图像,数字化(1)连续画面空间坐标离散化—采样方形、三角形、正六角形点阵等(2)采样点(像素)幅值(实数)取整——量化均匀、非均匀/矢量、标量采样点阵数字图像,数字化(1)连续画面空间坐标离散化—采样采样点阵1、图像的均匀采样
y|
x|
xy1、图像的均匀采样y|x|xy二维采样定理Nyquist采样定理对于二维有限带宽信号fc(x,y),如果其二维傅立叶变换只在|u|
Uc,|v|
Vc的范围内不为零,那么采样间隔必须满足
x1/2Uc,
y1/2Vc这样才能保证信号可以重构二维采样定理Nyquist采样定理对于二维有限带宽信号fc(2、图像的量化量化的准则是:若fi
f
<
fi+1则g=gig1
g0
g2
gN-1
0f0f1f2
fN-1fNfg
量化过程2、图像的量化量化的准则是:若g1g0g2gN-10量化误差量化误差量化失真由量化误差产生的图像失真最优量化器——量化均方误差最小非线性量化误差量化误差非均匀采样和量化非均匀采样灰度级变化大区域精确采样,平滑区域粗采样非均匀量化灰度级变化剧烈处,人眼分辨力差,边界附近较少灰度级;平缓区域较多灰度级,避免假轮廓非均匀采样和量化非均匀采样3、数字图像的表示数字图像,矩阵元素:像元图像元素:像素电视图像:512
512
128一般图像:256
256
643、数字图像的表示数字图像,矩阵元素:像元数字图像举例yOxg(x,y)数字图像举例yOxg(x,y)矩阵上图中g(x,y)既可以表示整幅图像,也可以表示x行y列交点处的图像的像素值,g(x,y)的值都是整数图像的数据量(bit)b=M×N×k图像清晰度(可分辨的细节的程度)取决于N和
k。N小,检测板效应;
k小,假轮廓矩阵上图中g(x,y)既可以表示整幅图像,也可以表示x行y列只改变灰度级:8、16、32、64、128、256只改变灰度级:8、16、32、64、128、256只改变空间分辨率512、256、128、64、32、16只改变空间分辨率512、256、128、64、32、16邻域四邻域对角邻域八邻域邻域四邻域四邻域与八邻域从数字图像中抽取对称邻域半径=
x=y点+的四邻域(a)半径=
x=y点+的八邻域(b)四邻域与八邻域从数字图像中抽取对称邻域半径=x=y点+连通性4-连通8-连通m-连通近邻与通路连通域4-连通域8-连通域连通性4-连通像素间距离 欧氏距离(DE):[(x-s)2+(y-t)2]1/2 城区距离(D4):|x-s|+|y-t| 棋盘距离(D8):max(|x-s|,|y-t|)像素间距离1.4图像显示图像显示图像显示设备:显示器,打印设备等半调输出半调输出示例抖动技术1.4图像显示图像显示1.5图像存储与格式图像存储存储量单位:比特(bit)
字节B(8bit)千字节KB(103B)
兆MB(106B)吉GB(109B)太TB(1012B)1.5图像存储与格式图像存储存储器示例快速存储器联机存储器数据库存储器图像数据存储格式矢量形式光栅形式存储器示例图像文件格式BMP格式GIF格式TIFF格式JPEG格式图像文件格式常见图像存储格式英文名称类型说明Bit-Mappedformat*.BMPMicrosoftWindows标准格式Graphicalinterchangeformat*.GIFCompuSever图形格式Taggedimagefileformat*.TIFDOS,UNIX及Macintosh图像Jointphotographicexpertsgroup*.JPG国际压缩标准,JPEG,JPEG2000EncapsulatedPostScript*.EPS出版业使用格式常见图像存储格式英文名称类型说明Bit-Mappedfo1.6*视觉基础视觉生理/视觉特性/视觉模型视觉基础/视觉应用它们与图像研究的关系见下图1.6*视觉基础视觉生理/视觉特性/视觉模型视觉研究与图像的关系视觉研究基础研究视觉心理现象法则(心理学)视觉信息加工机理(生理学)应用研究视环境的改善和视机能应用(照明工程学、人类工程学)图像改善和评价(图像工程)模拟视觉机能的信息处理(信息工程、人工智能心理测定模拟技术视觉研究与图像的关系视觉研究基础研究视觉心理现象法则视觉信息1、图像质量评价与视觉心理对图像质量的最终评价是由人的感觉器官和心理状态来决定的。与图像内容以及观察者的心理因素有关从图像信息传输角度出发,图像系统评价的真正尺度应该是发出信息者的意图为接收信息者所理解的程度,而不是对发出信息者发出的图像象素信息集合的简单接收1、图像质量评价与视觉心理对图像质量的最终评价是由人的感觉器2、画面组成和视觉心理视野——指眼球不动时所能见到的范围如果把注视点作为中心,可见的范围上方约65°,下方约75°,左右视角约为104°(现在的电视画面约占7°~8°),但视力好的部位仅限于中央2°~3°左右为了适应大的画面和立体景象的机理,眼球必须转动使视线移动中心视力分辨率强,可以进行图像细节的认识周边视力分辨率差,可以将视目标特征部分检出,利用检出的目标图像特征去控制眼球运动另外周边视可以认识图像的全貌,而中心视只能认识图像的一小部分要产生充分的临场感,画面尺寸应该产生30°以上视野,如宽银幕电影2、画面组成和视觉心理视野——指眼球不动时所能见到的范围3、视觉的时空频率分析影响图像锐度的主要因素。视觉神经具有的Mach效应和Roca—Sulzer微分效应,中枢神经的Craik-Obrien积分效应等是视觉信息处理的基础,因此可以将视觉特性和图像处理结合起来研究空间分辨力人眼对空间景物细节的分辨能力有限,对黑白图像约为一度时间分辨力对亮度的响应有时延和残留,因而对景物亮度的变化也有分辨力,过快的变化无法分辨视觉惰性。当离散画面的重复频率不低于24Hz时,可形成连续画面的感觉,即人眼不能分辨相邻两幅画面间的差别,而低于24Hz时,有闪烁感3、视觉的时空频率分析影响图像锐度的主要因素。视觉神经具有的4、视觉的时空频率分析人眼对画面静止部分的分辨率高于活动部分对静止部分减少时间分辨率,而对活动部分减少空间分辨率,可以达到数据压缩的效果。幅度分辨力人眼对景物亮度层次的分辨力也有限,过小的亮度差别无法分辨。对彩色图像的色调和饱和度的分辨力人的视觉对彩色细节的分辨力要比亮度细节差,在国际无线电咨询委员会(ITU-R,原CCIR)601标准中,就利用了这种特性,将色差信号的空间分辨率减半,仍可以得到非常好的图像质量。对立体图像的景深分辨力等4、视觉的时空频率分析人眼对画面静止部分的分辨率高于活动部分5、视觉生理和模型的研究视觉生理指视觉信息的产生部分——视细胞(图像信息感受器)和其它神经细胞以及大脑高级中枢的神经系统的信息产生、传输和处理的机理插入单个细胞的微小电极侧抑制现象、马赫效应等对大脑高级神经中枢的“思考过程”才刚起步5、视觉生理和模型的研究视觉生理人类视觉机制今后的研究方向从基础研究逐步转到和图像相关的视觉综合化、体系化的研究搞清决定图像质量的主观因素,做出其总的结构模型找出人脑真正接收信息的容量,大脑有效接收图像的显示方式弄清图像信源和信宿的结构,建立起包括人的因素在内的信息论研究视觉和其它感觉的相乘作用,即视觉和其它感觉的互相影响开发自组织作用的综合研究,进一步建立发展“思考过程”研究视觉和行为的关系人类视觉机制今后的研究方向从基础研究逐步转到和图像相关的视觉人类视觉感知过程人眼结构眼睛中图像的形成视觉特性人类视觉感知过程人眼结构人眼的结构视觉生理特点对图像处理方法的影响很大人眼的结构视觉生理特点对图像锥状(cone)视觉:白昼视觉,色彩杆状(rod)视觉:夜视觉,低照度敏感视锥细胞和视杆细胞在视网膜上的分布锥状(cone)视觉:白昼视觉,色彩眼睛中图像的形成成像的几何原理视觉信息的产生视觉信息的传递视觉信息的加工处理眼睛中图像的形成成像的几何原理(1)成像的几何原理当晶状体的折射能力由最小变到最大时,晶状体的聚焦中心与视网膜之间的距离由17mm缩小到14mm。当眼睛聚焦到远于3m的物体时,晶状体的折射能力最弱,当聚焦到非常近的物体时,其折射能力最强用眼睛观察树的光学表示法,C点为晶状体的光学中心(1)成像的几何原理当晶状体的折射能力由最小变到最大时,晶状成像尺寸计算观测者看一个距离100m,高15m的树:设x表示视网膜上形成的图像的大小,单位mm,则有15/100=x/17,x=2.55mm成像尺寸计算观测者看一个距离100m,高15m的树:设x表示(2)视觉信息的产生光—化—电过程色觉理论主要有两种三色学三种视色素,对光的影响峰值分别在红、绿、蓝区,综合后形成色觉信息四色学说三对视色素(白-黑,红-绿,黄-蓝),它们的组合响应产生色觉信息(2)视觉信息的产生光—化—电过程人类感光细胞的敏感曲线三种不同频率响应的锥,各对红、绿、蓝具有最强的响应,彩色的识别功能400450500550600650700100806040200蓝绿红波长(nm)光吸收特性%人类感光细胞的敏感曲线三种不同频率响应的锥,各对红、绿、蓝具(3)视觉信息的传递眼球内眼球外(3)视觉信息的传递眼球内(4)视觉信息的加工处理简单型细胞检测图像的明暗边界和线条的位置和方向,复杂型细胞对直线和边界的运动方向敏感,低级超复杂型细胞检测直线和边界的长度、宽度,而高级超复杂型细胞可以检测曲线和边缘曲度等(4)视觉信息的加工处理简单型细胞视觉特性亮度适应与鉴别分辨力对比灵敏度同时对比效应阈值效应和掩盖效应视觉运动特性视觉空间频率特性视觉时间频率特性视觉特性亮度适应与鉴别主观亮度感受特性主观亮度感受特性分辨力在不同的亮度适应级,人眼的分辨力不同,如图所示,I是背景光强,
I是光强的变化,称log(I/I)为韦伯比,表示光强分辨力光强分辨力的典型韦伯比分辨力在不同的亮度适应级,人眼的分辨力不同,如图所示,I是对比灵敏度II+
I
I/I强度I2%具有恒定背景的对比灵敏度对比灵敏度II+II/I强度I2%具有恒定背景的对比灵敏同时对比效应心理学实验表明,人眼感受到的亮度不是光强的简单函数,如马赫带效应和同时对比效应强度I
I/II0I+
II2%具有可变背景的对比灵敏度同时对比效应心理学实验表明,人眼感受到的亮度不是光强的简单函马赫带效应马赫带效应同时对比效应同时对比效应视觉阈值效应和掩盖效应视觉阈值正好可以被看到的刺激(干扰或失真)值,它是一个统计值,在图像质量的主观评价中有广泛的应用掩盖效应视觉阈值随图像内容的变化而变化,在平坦区阈值低,对失真也敏感;在边缘和纹理区,视觉存在掩盖效应,对失真不敏感视觉阈值效应和掩盖效应视觉阈值视觉运动特性周边视力对图像中运动变化部分很灵敏,有特征抽取作用,从而控制眼肌转动视轴,使视力集中对准这些部位,以便看清其细节电视眼球标记摄像机(televisioneye-markercamera)试验视觉运动特性周边视力对图像中运动变化部分很灵敏,有特征抽取作视觉空间频率特性亮暗在空间上作正弦变化的条纹图案,物理对比度和感觉对比度之比随空间频率变化而变化的曲线,称为调制传递函数MTF(ModulationTransferFunction)对比灵敏度100010010110100典型MTF曲线空间频率/cdeg-1视觉空间频率特性亮暗在空间上作正弦变化的条纹图案,物理对比度闪烁对MTF的影响闪烁频率为1HZ闪烁频率为6HZ闪烁频率为16HZ闪烁频率为20HZ对比灵敏度300100301030.3131030空间频率/cdeg-1闪烁对MTF的影响闪烁频率为1HZ对3000.31视觉时间频率特性125102050Hz视觉阈值0.01
0.1时间频率特性时间频率/Hz视觉时间频率特性125视觉的简单数学模型亮度视觉模型彩色视觉模型视觉的简单数学模型亮度视觉模型1、亮度视觉模型
输入图像Ii(x,y)光学系统H(
x,
y)输出图像Io(x,y)线性光学系统光学系统的调制传递函数MTF
1、亮度视觉模型输入图像光学系统输出图像线性光学系统光学系神经信号光接受器对数线性系统黑白视觉对数模型简单的黑白视觉对数模型神经信号光接受器对数线性系统黑白视觉对数模型简单的黑白视觉对号数-2-4侧抑制结构…………LOGa1LOGanLOGa2
网膜信号感受器加权因子LOGa1LOGa0LOGan视觉信息的融合号数-2-4侧抑制结构…………LOGa1LOGanLOGa2inout|H2(Wx,Wy)|
|H1(Wx,Wy)|H1(Wx,Wy)H2(Wx,Wy)H3(Wx,Wy)光感受器线性系统线性系统线性系统非线性网络|H3(Wx,Wy)|黑白视觉扩展模型inout|H2(Wx,Wy)||H1(Wx,Wy)|Thomas—Young三色假说
g3g1g2d3d2d1e3e1e2线性系统-黄绿色视锥感受器蓝色视锥感受器绿色视锥感受器LOGLOGLOG+
-+
H2(Wx,Wy)H1(Wx,Wy)H3(Wx,Wy)神经信号彩色视觉模型2、彩色视觉模型Thomas—Young三色假说g3g1g2d3d2d1e彩色响应在上图模型中,e1、e2、e3代表视网膜三个具有S1(
)、S2(
)、S3(
)谱灵敏度的感受器,其输出分别为C(
)为入射光谱的能量分布函数彩色响应在上图模型中,e1、e2、e3代表视网膜三个具有S1彩色信息融合e1、e2、e3经对数传递后合并为d1、d2、d3并输出:彩色信息融合e1、e2、e3经对数传递后合并为d1、d2、d波长(nm)S1(
)S2(
)S3(
)相对灵敏度1.00.50450500550600650根据Konig数据得到的视网膜锥状细胞的色谱灵敏度曲线色谱灵敏度曲线波长(nm)S1()S2()S3()相1.0450彩色视觉扩展型模型线性系统-++-黄绿色视锥感受器蓝色视锥感受器绿色视锥感受器HE2(Wx,Wy)HE1(Wx,Wy)HE3(Wx,Wy)非线性网络非线性网络非线性网络
HL2(Wx,Wy)HL1(Wx,Wy)HL3(Wx,Wy)神经信号彩色视觉扩展型模型线性系统-++-黄绿色视锥感受器蓝色视锥感1.7*颜色视觉和色度学3个基本颜色——红(R,red)、绿(G,green)和蓝(B,blue)国际照明委员会(CIE),1931年规定3种基本色的波长为R:700nm,G:546.1nm,B:435.8nm1.7*颜色视觉和色度学3个基本颜色——红(R,red)三色系统利用3基色叠加可产生光的3补色:品红(M,magenta,即红加蓝)、蓝绿(C,cyan,即绿加蓝)、黄(Y,yellow,即红加绿)。按一定的比例混合3基色或将1个补色与相对的基色混合就可以产生白色。光的混合满足加色定理彩色加法系统(左)与减法系统(右)三色系统利用3基色叠加可产生光的3补色:品红(M,mage颜色特征区分颜色通常用3种基本特性:辉度(又常用亮度、明度)色调饱和度色调和饱和度合起来称为色度。颜色可以用辉度和色度共同表示颜色特征区分颜色通常用3种基本特性:坐标系颜色还可以用色品值r、g、b(相对色系数)表示,定义如下,为组成某种颜色所需的红、绿、蓝的量称为3个刺激量,分别用R、G、B表示:[C]=r[R]+g[G]+b[B]其中坐标系颜色还可以用色品值r、g、b(相对色系数)表示,定义如彩色匹配规则任何彩色可以用不多于三个基色配成混合色的光亮度等于各分量亮度之和人眼不能分解混合彩色的各个分量在某一亮度等级上的彩色匹配可适用于较宽的亮度范围彩色相加定律:若一彩色C1与彩色C2相匹配(同样彩色感觉),而彩色C’1与彩色C’2相混合的彩色匹配,可以如下表示[C1]=[C2],即C1彩色与C2彩色相匹配
1[C1]+
2
[C2],即一混合色包含1份的[C1]和
2份的[C2]彩色相加定律表示为若
[C1]=[C2],
[C’1]=[C’2]
则
1[C1]+
2
[C2]=
1[C’1]+
2
[C’2]彩色匹配规则任何彩色可以用不多于三个基色配成彩色匹配彩色相减:当C1、C2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年安全培训培训哪些内容实操要点
- 2026年安全培训内容 采购核心技巧
- 2026年车辆安全培训内容实操流程
- 2026年餐饮春季安全培训内容核心要点
- 九江市星子县2025-2026学年第二学期五年级语文第四单元测试卷(部编版含答案)
- 2026年普通企业安全培训内容核心要点
- 2026年安全检测培训内容核心要点
- 临夏回族自治州广河县2025-2026学年第二学期二年级语文第六单元测试卷(部编版含答案)
- 乐山市沙湾区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 平顶山市叶县2025-2026学年第二学期四年级语文期中考试卷(部编版含答案)
- 冷冻储备肉管理制度
- T/CBMCA 007-2019合成树脂瓦
- 医院培训课件:《人文关怀与人文护理》
- 2024届高考专题复习:论述类文本主观题型梳理及方法练习
- 中药与糖尿病
- 瓦斯隧道安全培训
- 老年缓和医疗
- 零星维修工程项目施工方案1
- 超星尔雅学习通《工程伦理》章节测试答案
- 人工智能训练师理论知识考核要素细目表五级
- JBT 14582-2024 分户减压阀(正式版)
评论
0/150
提交评论