版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章DIP基础人眼视觉要素图像感知与获取图像取样和量化数字图像的基本格式象素间的基本关系本章主要介绍几个与数字图像有关的概念、几种基本的图像传感和获取的手段、图像取样和量化的相关概念、图像在计算机中的表现形式(格式)以及图像象素间的最主要关系。人眼视觉基础虽然DIP主要是基于数学和概率等学科的理论体系发展起来的,但人的视觉直觉在选择某个DIP技术时扮演了中心的角色,一切DIP处理的效果可能都由人的视觉来衡量,尽管其带有很大的主观性。因此,对人视觉的基本了解应该作为我们课程的前提。1.人眼构造及视觉图像人眼的平均直径近似为20m虹膜中央开口(瞳孔)的直径在2~8mm之间视网膜上有两类光接受器:锥状体(cones)和杆状体(rods)每只眼睛锥状体数在600~700万之间,其主要位于视网膜的中间部分(中央凹,辨认图像细节,锥状视觉也称白昼视觉或亮视觉。杆状体数约7500到15000万个,分布在视网膜表面,感受总体图像,称夜视觉或暗视觉。中央凹是视网膜上直径约为1.5mm的圆形缺口,可以近似看作1.5×1.5的方形传感器阵列。该区域锥状体的密度大概为150000/mm2,因此大概共有337000个元素。根据原始分辨能力计算,一5mm×5mm大小的中等分辨率的电荷耦合器件(charge-coupleddevice,CCD)大约有这么多敏感元素。人眼的横截面图人眼中的图像焦深:晶状体的中央到视网膜间的距离,大约17mm~14mm,其折射能力最小到最大。像大小计算:15/100=h/172.亮度适应性和辨别力在呈现图像处理结果时,人眼区分不同亮度/强度水平的能力是一个要考虑的重要方面。人视觉系统所能适应的的光强度范围是非常宽的,达1010数量级,主观亮度(subjectivebrightness)是光强的对数函数。但人的视觉不可能同时在整个范围内工作,其能同时辨别的光强度级范围是很小的(brightnessadaptation)。在所观察对象的亮度适应级发生改变时,人眼有一个逐渐适应的过程。在某个特殊适应水平的主观亮度敏感范围亮度鉴别能力和光幻觉实验:a)韦伯比(WeberRatio)ΔIC/I,右边曲线表明当背景亮度增加时,视觉辨别力明显增加,也即韦伯比减少。这与杆状体和锥状体表现的功能是一致的。c)同时对比度实验d)光幻觉(Opticalillusions)光幻觉是人视觉系统所特有的,迄今还没有清楚的解释。由于以上各种特殊现象,在进行图像处理时,应该采取一些特殊的补偿措施。图像感知与获取1.单个传感器模拟电视摄像机扫描原理:单传感器+线性扫描+旋转图像取样和量化产生一副数字图像:a)连续图像;b)从A到B的扫描线;c)采样和量化;d)数字扫描线1.基本过程:其结果产生一副二值或非二值图像2.数字图像表示2.1坐标定义:2.2二值图像:2.3非二值图像2.5空间和灰度/幅度分辨率空间分辨率:一副图像中可分辨的最小细节,或单位距离可分辨的最少数目的线对。灰度分辨率:可察觉的最小灰度变化(主观的)当实际的物理分辨率测量不必要时,通常就称数字图像的大小为空间分辨率,而灰度级数为灰度分辨率。这样,图像的空间分辨率主要由采样决定,而幅度分辨率主要由量化所决定。且一般都将这些量取作2的整数幂。图像空间分辨率产生的结果:注意后5副图像都通过行和列复制的方法重采样到了512×512图像幅度分辨率产生的结果:莫尔效应说明实例图像文件存储格式格式不同,其对图像数据的压缩编码方式不同。BMP图像文件头文件头是一个BITMAP的数据结构。定义为TypedefstructtagBITMAP{WORDbftype;DWORDbfsize;DWORDbfReserved1;DWORDbfReserved2;DWORDbfoffBits;}BITMAP;图像信息头(1)图像信息头(2)图像信息头(3)图像信息头结构定义位图数据表示每个像素索引亮度或色彩的数据。像素间相对位置保持不变,但像素数据的具体存储试依图像尺寸、像素位数、压缩方式等共同决定。对于8位灰度图像或256色彩色图像,每个像素占用一个字节。对于真彩色图像,没有调色板,每个像素数据均为红、绿、篮三色值,每个色值为8位,一个字节,共三个字节。注意:由于windows系统管理存储器要求以4个字节为单位,因此位图每行像素占用的字节总数必须为4的整数倍。如果不是,必须补0.调色板(colorpalette)和图像数据调色板是关于一种数字图像像素色彩描述技术的形象说法。其实质是一种索引存储结构。JPEG文件格式JPEG文件格式的特点静止图像压缩采用有损编码方式是一种变换编码对高频、低频信号区别对待JPEG文件的标记用以区分和识别图像数据及其相关信息
每个标记都是由2个字节组成,其前一个字节是固定值0xFFJPEG文件的组织图像开始SOI(StartofImage)标记
APP0标记(Marker)
(3)APPn标记(Markers),其中n=1~15(任选) APPn长度 详细信息(4)一个或者多个量化表DQT 量化表长度(quantizationtablelength) 量化表数目(quantizationtablenumber) 量化表(quantizationtable)(5)帧图像开始SOF0(StartofFrame)(6)一个或者多个霍夫曼表DHT 霍夫曼表的长度(Huffmantablelength) 类型、AC或者DC(Type,ACorDC) 索引(Index)位表(bitstable) 值表(valuetable)(7)扫描开始SOS(StartofScan) 扫描开始长度(startofscanlength) 颜色分量数(numberofcolorcomponents) 每个颜色分量 ID 交流系数表号(ACtable#) 直流系数表号(DCtable#) 压缩图像数据(Compressimagedata)(8)图像结束EOI(EndofImage)JPEG编码原理JPEG文件结构3.GIF格式GIF文件结构4.TIFF文件格式
图像象素间的基本关系象素间基本关系的描述是基于象素邻域操作的算法的基础。近邻处理方法是许多图像增强和恢复技术的核心内容。同时,由于该方法的计算速度和软硬件实现的简单性,是它成为商业应用领域域最受欢迎的方法之一。1.象素邻域(neigbbors):这些象素称p的4邻域,表示为N4(p).表示为ND(p).并与N4(p)一起称为p的8邻域,表示为N8(p).当p为边界元素时,这些邻域象素可能落在图像的外边2.邻接性(adjacency)、连通性(connectivity)、区域(regions)、边界(boundaries)、边沿(edge)例如:如果两个图像子集s1和s2中的某些象素是相邻的,则称这两个子集相邻。通路的概念:如果R是一个图像子集,且是一个连通集(connectedset),则称R为图像的一个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 审计机关合同审查制度
- 审计检查制度
- 审计稽核管理制度
- 审计组长回避制度
- 审计署工作保密制度
- 审计计件薪酬管理制度
- 2025-2026学年爱丽丝漫游奇境教案
- Project 3教学设计小学英语三年级下册牛津上海版(深圳用)
- 11.4 机械效率(教学设计)2023-2024学年八年级物理下册同步教学(教科版河北专版)
- 2023建筑电工学零基础备考必刷题库带完整答案解析
- 2026年医院年度经济运营分析报告
- 2026广东中山市神湾镇神湾社区居民委员会招聘1人考试参考题库及答案解析
- (新教材)2026年春期教科版二年级下册科学教学计划及进度表
- 2025年贵州省中考物理试题【含答案、解析】
- 阳泉煤业集团兴峪煤业有限责任公司煤炭资源开发利用和矿山环境保护与土地复垦方案
- 周三多《管理学》笔记整理
- 首件确认制度
- 安徽绿沃循环能源科技有限公司12000t-a锂离子电池高值资源化回收利用项目(重新报批)环境影响报告书
- 东方汽轮机高低旁液压油站使用说明书
- 高等学校辅导员管理规定
- 高二心理健康教教育课完整版
评论
0/150
提交评论