版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图像处理与计算机视觉
图像处理与计算机视觉是当前计算机科学的一个热门研究方向,它应用广泛,有良好的发展前景。 伴随着人工智能、模式识别学科的飞速发展,计算机视觉的研究正在不断升温,从日常应用中的光学字符识别(OCR)和汽车自动驾驶,到医学应用中的病灶检测与分析,再到未来人机智能交互领域的人脸识别、情感计算等。而图像处理是计算机视觉研究中必不可少的图像预处理环节。第一章绪论1.1序言1.2图象处理技术的分类 1.2.1模拟图象处理 1.2.2数字图象处理1.3数字图象处理的特点1.4数字图象处理的主要方法及主要内容 1.4.1数字图象处理方法 1.4.2数字图象处理的主要内容1.5数字图象处理的硬件设备1.6数字图象处理的应用1.7数字图象处理领域的发展动向1.1序言概述 人类传递信息的主要媒介是语音和图象。据统计,人类所接受的信息,视觉信息占60%,听觉占20%,其他(味觉、触觉、嗅觉等)占20%。所以,作为传递信息的重要媒体和手段-----图象信息是十分重要的。但图象通信的发展大大落后于语音通信。 数字图象处理技术起源于20世纪20年代。1964年美国喷气推进实验室处理了太空船发回的月球照片,这标志着第三代计算机问世后数字图象处理的概念开始得到应用。其后,数字图象处理技术发展迅速,目前已成为工程学、计算机科学、信息科学、统计学、物理学、化学、医学甚至社会科学等领域各学科之间学习和研究的对象。并且已给人类带来了巨大的经济和社会效益。1.2图象处理技术的分类
图象处理技术基本可分为两大类:模拟图象处理和数字图象处理。1.2.1模拟图象处理 模拟图象处理包括:光学处理(利用透镜)和电子处理。如:照相、遥感图象处理、电视信号处理等。 模拟图象处理的特点是:速度快,多为实时处理,理论上可达到光的速度,并可同时并行处理。电视图象信号是模拟图象处理的典型例子,它处理的是活动图象,25帧/秒。 模拟图象处理的缺点是:精度较差,灵活性差,很难有判断能力和非线性处理能力。1.2.2数字图象处理 数字图象处理一般都用计算机或实时的硬件进行处理,因此也称为计算机图象处理。
数字图象处理的优点是:处理精度高,处理内容丰富,可进行复杂的非线性处理,有灵活的变通能力,一般来说只要改变软件就可改变处理内容。
其缺点是:处理速度较慢,特别是进行复杂的处理时更是如此。一般用它处理静止画面居多,如果实时处理常规精度的数字图象需要具有100Mips的处理能力;其次是分辨率及精度尚有一定限制。如:常规精度图象为512X512X8bit,分辨率高的可达2048X2048X12bit,如果精度及分辨率再高,所需处理时间将显著增加。 广义上说,一般的数字图象很难为人所理解,因此,数字图象处理也离不开模拟技术,为实现人机对话和自然的人机接口,特别需要人去参与观察和判断的情况下,模拟图象处理技术是必不可少的。1.3数字图象处理的特点
数字图象处理的特点:
(1)图象数据量大 一幅单色512X512(256级灰度)图象数据量达256kB; 一幅彩色640X480(24位真彩色)数据量达900kB; X射线照片一般有64—256kB的数据量; 而一幅遥感图象的数据量可达数十MB。
(2)图象处理技术综合性强 图象处理技术涉及通信技术、计算机技术、电子技术、电视技术,以及数学物理等方面的基础知识。
(3)图象信息理论与通信理论密切相关 将通信中的一维时间问题,推广到了图象中的二维空间问题。
1.4数字图象处理的主要方法及内容1.4.1数字图象处理方法数字图象处理方法大致可分为两大类:空域法和变换域法。
1、空域法把图象看作是平面中各个象素组成的集合,直接对这一二维函数进行相应的处理。空域处理法主要有以下两种:(1)邻域处理法包括:梯度运算,拉普拉斯算子,平滑算子和卷积运算等。(2)点处理法灰度处理,面积、周长、体积、重心、中心计算等。
2、变换域法变换域法首先对图象进行正交变换,得到变换域系数阵列,然后再实施各种处理,处理后再反变换到空间域,得到处理结果。包括:滤波、数据压缩、特征提取等处理。1.4.2数字图象处理的主要内容 包括:图象信息的获取、存储、传送、处理、输出和显示。
1、图象信息的获取(Imageinformationacquisition) 这一过程主要包括摄取图象、光电转换及数字化等几个步骤。主要是把一幅图象转换成适合输入计算机或数字设备的数字信号。获取图象的主要方法有:电视摄象机、飞点扫描器、扫描鼓、扫描仪、显微光密度计、及红外摄象仪、多光谱象机等。
2、图象信息的存储(Imageinformationstorage) 图象信息的特点是数据量大。一般作档案存储主要采用磁带、磁盘或光盘。为解决海量存储问题主要研究数据压缩、图象格式及图象数据库技术等。
3、图象信息的传送(Imageinformationtransmission) 图象信息的传送可分为系统内部传送与远距离传送。内部传送多采用DMA技术以解决速度问题,外部远距离传送主要解决占用带宽问题。目前,已有多种国际压缩标准来解决这一问题,图象通信网正在逐步建立。
4、数字图象处理(Digitalimageprocessing) 数字图象处理主要包括以下内容:几何处理、算术处理、图象增强、图象复原、图象重建、图象编码、图象识别、图象理解等。
(1)几何处理 几何处理主要包括:坐标变换,图象的放大、缩小、旋转、移动,多个图象配准,全景畸变校正,周长、面积、体积计算等。
(2)算术处理 算术处理主要对图象施以加、减、乘、除等运算,该处理主要针对象素点进行,非常有用,如医学图象的减影处理就有显著的效果。
(3)图象增强 图象增强处理主要是突出图象中感兴趣的信息,而减弱或去除不需要的信息,从而使有用信息得到加强,便于区分或解释。主要方法有:直方图增强、伪彩色增强法、灰度窗口等技术。
(4)图象复原 图象复原处理的主要目的是去除干扰和模糊,恢复图象的本来面目。如去噪就属于复原处理。图象噪声包括随机噪声和相干噪声,随机噪声干扰表现为麻点干扰,相干噪声表现为网纹干扰。去模糊也是复原处理的任务,这些模糊来自透镜散焦,相对运动,大气湍流,及云层遮挡等。这些干扰可用维纳滤波、逆滤波、同态滤波等方法加以去除。
(5)图象重建 几何处理、图象增强、图象复原都是从图象到图象的处理,而重建处理则是从数据到图象的处理。该处理的典型应用就是CT技术。图象重建的主要算法有代数法、迭代法、傅立叶反投影法、卷积反投影法等,其中以卷积反投影法运用最为广泛,因为它的运算量小、速度快。值得注意的是三维重建算法发展很快,而且由于与计算机图形学相结合,把多个二维图象合成三维图象,并加以光照模型和各种渲染技术,能生成各种具有强烈真实感及纯净的高质量图象。三维重建技术也是当今颇为热门的虚拟现实和科学可视化技术的基础。
(6)图象编码 图象编码研究属于信息论中信源编码范畴,其主要宗旨是利用图象信号的统计特性及人类视觉的生理学及心理学特性对图象信号进行高效编码,即研究数据压缩技术,以解决数据量大的矛盾。一般,图象编码的目的有:减少数据存储量;降低数据率以减少传输带宽;压缩信息量,便于特征提取,为识别作准备。 按年代划分,图象编码方法可大致分为两类:第一代和第二代编码法。以去除冗余为基础的编码方法(1948—1988)称为第一代编码。如:PCM、DPCM、ΔM、亚取样编码法;变换编码中的DFT、DCT、Walsh-Hadamard变换等方法及以此为基础的混合编码法均属于经典的第一代编码法。而第二代编码法多是1980年代以后提出的新的编码方法,如:金字塔编码法、Fractal编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等。现代编码法的特点是:充分考虑人的视觉特性;恰当地考虑对图象信号的分解与表述;采用图象的合成与识别方案压缩数据率。
在多媒体应用中,常用编码标准有:JPEG、H.261、H.263、MPEG等。
(7)模式识别 模式识别是数字图象处理的又一研究领域。模式识别方法大致有三种:统计识别法、句法结构模式识别法、模糊识别法。 统计识别法侧重于特征;句法结构识别侧重于结构和基元;模糊识别法是把模糊数学的一些概念和理论用于识别处理。在模糊识别处理中充分考虑人的经验,同时也考虑了人的非逻辑思维方法及人的生理、心理反映,该方法目前尚处于研究阶段,方法还不成熟。
(8)图象理解 图象理解是由模式识别发展起来的方法。该处理输入的是图象,输出的是一种描述。这种描述并不仅是单纯的用符号作出详细的描绘,而且要利用客观世界的知识使计算机进行联想、思考及推论,从而理解图象所表现的内容。图象理解也叫景物理解。在这一领域还有许多问题需要深入研究。 以上8项任务就是图象处理所涉及的主要内容。
5、图象的输出与显示 图象处理的最终目的是为人或机器提供一幅便于解释和识别的图象,因此,图象输出也是图象处理的重要内容之一。图象输出的方式有硬拷贝和软拷贝两种。 硬拷贝方法常用的有:打印、照相等。 软拷贝方法主要有以下几种。 (1)CRT显示 (2)液晶显示器 (3)场致发光显示器1.5数字图象处理的硬件设备
数字图象处理的硬件构成如下图所示。早期的数字图象处理系统为提高处理速度,增加容量,都采用大型机。后来发展成以小型机为主的系统,如:VAX/750等机型。现在的图象处理系统向着两个方向发展,一是微型图象处理系统,主机为PC机,配以图象卡及显示设备就构成了最基本的微型图象处理系统。另一发展方向是向大型机方向发展,以解决大数据量与处理能力之间的矛盾。 当前,要从根本上解决处理能力、速度与数据量巨大的问题,还应发展阵列机和并行处理技术。因此,并行处理技术不仅是计算机科学中的重要研究对象,在实时图象处理中也是很重要的。图象输入设备A/D主计算机D/A监视器键盘/显示器1.6数字图象处理的应用学科应用内容物理、化学结晶分析、谱分析生物、医学细胞分析、染色体分类、血球分类、X射线照片分析、CT环境保护水质及大气污染调查地质资源勘探、地图绘制、GIS农林植被分布调查、农作物估产海洋鱼群探查、海洋污染监测水利河流分布、水利及水害调查气象云图分析等通信传真、电视、多媒体通信工业、交通工业探伤、铁路选线、机器人、产品质量监测经济电子商务、身份认证、防伪军事军事侦察、导弹制导、电子沙盘、军事训练等法律指纹识别、虹膜识别等
应用示例: (1)遥感 (2)医学应用 (3)在通信中的应用 (4)工业生产的质量控制 (5)安全保障、公安等方面的应用 (6)教学和科研领域 (7)电子商务 (8)在电力系统中的应用图象质量自动调整多模态生物特征融合音视频特征关联模型多模态生物特征数据库多层级融合策略与框架生物特征鉴别平台BiometricRecognition指纹识别人脸识别北京颐和园高分辨率卫星影像。水体界线的确定在近红外图像上,水体呈黑色;图像理解的困难基于数字图象处理的炉膛火焰检测技术1、传统火焰检测方法的主要缺点:视场小。当煤种变化或负荷变化引起着火位置漂移时,将严重影响检测效果。只能给出有无火焰的开关量信号。抗干扰能力差。2、基于数字图象处理火焰检测技术的功能:视场大(传像光纤的视角可达80°)。应用边缘检测和图象分割技术,对火焰图像进行处理,可进一步分析炉膛火焰的燃烧状况,估算出有关参数。火焰温度场锅炉空气动力场试验应用指针式仪表显示值的自动判读算法判断指针是否移动如移动则进行指针定位提取图象边缘,得二值边缘图象用Hough变换提取直线段定位指针与刻度线的位置读数分辨率可达0.05%基于该算法可实现指针式压力表的全自动检定等
SF6泄露激光成像仪
SF6是一种无色、无毒的惰性气体,具有很强的绝缘特性和灭弧能力,被广泛用在高压开关设备和断路器中。但是SF6泄漏会降低GIS(封闭式组合电器)的绝缘能力,影响设备正常运行,甚至会引发故障;另一方面SF6属于一种温室效应气体,泄漏必将潜在地威胁地球环境。所以检测SF6泄漏具有极其重要的意义。
光学成像技术利用激光经过SF6泄漏气体时发生散射、折射和衍射,使返回到摄像机的激光图像在视频上发生变化,来检测气体泄漏。该技术使操作者能够从远处检测SF6气体泄漏,在视域内能够立刻识别出泄漏部位。光学成像技术的远距离识别和瞬时检测能力使操作者能够同时扫描变电站GIS设备的多处泄漏(包括几十到几百处),泄漏能被立即识别,以便尽快修理。不再需要人亲自测量所有的泄漏站,通过测量泄漏气体的浓度来检测泄漏,并能看到泄漏气体的清晰图像,为检测人员提供一种快速识别泄漏源的技术。1.7数字图象处理技术的发展
随着计算机技术的发展,数字图象处理技术得到了空前的进步,目前在该领域需进一步研究的热点问题有以下几个方面: 1、在进一步提高精度的同时着重解决处理速度问题。如:在航天遥感、气象云图处理方面,巨大的数据量和处理速度仍是主要矛盾之一。 2、加强软件研究、开发新的处理方法,特别要注意移植和借鉴其他学科的技术和研究成果,创造新的处理方法。 3、加强边缘学科的研究工作,促进图象处理技术的发展。如:人的视觉特性、心理学特性等的研究。 4、加强理论研究,逐步形成图象处理科学自身的理论体系。 5、时刻注意图象处理领域的标准化问题。图象信息量大、数据量大,因而图象信息的建库、检索和交流是一个极为重要的问题。就现有的情况看,软件、硬件种类繁多,交流和使用极为不便,这成了资源共享的严重障碍。应及早建立图象信息库,统一存放格式,建立标准子程序,统一检索方法。
图象处理技术的发展动向主要有以下几点: (1)图象处理的发展将向着高速、高分辨率、立体化、多媒体化、智能化和标准化方向发展。围绕着HDTV的研制将开展实时图象处理的理论及技术研究。 (2)图象、图形相结合朝着三维成象或多维成象方向发展。 (3)硬件芯片的研究。 (4)新理论与新算法的研究。如:Wavelet、Fractal、Morphology、遗传算法、神经网络等。其中Fractal广泛用于图象处理、图形处理、纹理分析,同时还可用于数学、物理、生物、神经和音乐等方面,有人认为Fractal把杂乱无章、随意性很强的事物能用数学方法加以规范和描述,在分析和描绘自然现象上具有独到之处。这些理论在未来图象处理理论与技术上的作用应给予充分的注意,并积极地加以研究。 图象处理特别是数字图象处理经初创期、发展期、普及期及广泛应用几个阶段,目前已是各个学科竞相研究并在各个领域广泛应用的一门科学。应用是一个学科发展的动力和源泉,随着多学科交叉以及多方面的应用,图象处理科学无论在理论上还是在实践上都存在着巨大的潜力。与本学科有关的国内、国际会议及期刊1、国际会议 (1)InternationalConferenceonComputerVisionandPatternRecognition.CVPR (2)InternationalConferenceonCo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Karanjachromene-生命科学试剂-MCE
- 2026年pisa阅读理解测试题及答案
- 2026年新增口语测试题及答案
- 2026年锐角直角判断测试题及答案
- 2026年泸高招生考试测试题及答案
- 减负自查报告(2篇)
- 2026年三基体温测试题及答案
- 2026年基建狂魔测试题及答案
- 2026年物理试电笔测试题及答案
- 《2026版防范电信网络诈骗宣传手册》(全文)
- 中外航海文化知到课后答案智慧树章节测试答案2025年春中国人民解放军海军大连舰艇学院
- 商标使用申请书
- 《SPIN销售法精髓》课件
- 电信生产安全事故案例分析(新版.)
- 旁站监理记录表(塔吊拆除)
- 2024-2025年LAWINN法律行业薪酬福利报告-LAWINN罗英人律职
- DL∕T 5501-2015 冻土地区架空输电线路基础设计技术规程
- 人教版《道德与法治》五年级下册第6课《我参与 我奉献》精美课件
- 全国学校共青团研究课题
- 2023年中国热带农业科学院热带生物技术研究所硕士研究生招考聘用笔试题库含答案解析
- 2022课标词汇梳理
评论
0/150
提交评论