(管理科学与工程专业论文)基于神经网络分类的多分辨率的NURBS曲面地形重建.pdf_第1页
(管理科学与工程专业论文)基于神经网络分类的多分辨率的NURBS曲面地形重建.pdf_第2页
(管理科学与工程专业论文)基于神经网络分类的多分辨率的NURBS曲面地形重建.pdf_第3页
(管理科学与工程专业论文)基于神经网络分类的多分辨率的NURBS曲面地形重建.pdf_第4页
(管理科学与工程专业论文)基于神经网络分类的多分辨率的NURBS曲面地形重建.pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东师范火学硕士学位论文 摘要 地表模型在虚拟现实中有着广泛而重要的应用,大范围的三维地形建模及其 可视化是一个极富挑战性的课题。表面重建在三维地理信息系统、计算机辅助设 计与图形学、计算机造型、逆向工程、虚拟仿真等应用领域有着广阔的应用前景。 地形表面重建也一直是一个热点问题。 目前对于具有海量数据特征的地形图像来说,需要建立对应的三维模型,基 于当前计算机的发展现状,需要靠人工识别图像的坡形来建立模型:是非常困难 的。所以在一般虚拟场景中提高创建速度的方法要从人工智能方面着手,通过计 算机的智能识别算法对地形分析,并最终创建相似的地形面是目前解决这个问题 的重要方法。 本文的主题是在虚拟现实环境中地面生成的研究,结合对航拍图片的处理和 分类识别技术,通过高度图和n u r b s 曲面的生成,使地表起伏情况重现在屏幕 上。在基于b p 神经网络和曲面重建技术的基础上,以m i c r o s o rv i s u a l s t u d i o n e t2 0 0 3 为平台,结合h o o p s 三维图形库进行编程,以二者的有机结 合对地表模型重建进行了实验研究,通过结果证实了该方法的有效性和实用性, 满足了地形重建的需要。 关键词:地形可视化;多分辨率地形模型;虚拟实现;b p 神经网络;非均匀有理b 样 条曲面 中图分类号:t p1 8 3 山东师范人学硕j :学位论文 a b s t r a c t t e r r a i ns u r f a c em o d e lh a si t si m p o r t a n ta n dw i d e r a n g e d 印p l i c a t i o nb a c k 掣。o u n d i nv i r m a lr e a l i t y t e r r a i ns l l r f a c er e c o n s t m c t i o nh a sw i d ea p p l i c a t i o np r o s p e c ti nt l l e g e o 伊印h i ci n f o m a t i o ns y s t 锄s ,c o m p u t 小a i d e dd e s i 朗a i l d 伊a p h i c s ,c o m p u t e r m o d e l i n g ,r e v e r s ee n 昏n e 嘶n g ,v i r t u a ls i m u l a t i o na 1 1 do m e ra p p l i c a t i o n s t e 盯a i n s u r f a c er e c o n s 缸u c t i o na l s oh a sb e e nah o ti s s u e a tp r e s e n t ,i ti sv e r yd i f 矗c u l tt ob u i l dac o r r e s p o n d i n gt h r e e - d i m e n s i o n a lm o d e l 丘- o mat e r r a i l li m a g ew i t hm a s so fc h a r a c t e r i s t i c s ,b ym a n u a l l yi d c i l t i 匆t h es l o p e s h a p eo fi m a g e st oc r e a t et h em o d e lb a s e do nm ec u r r e n ts t 咖so ft l l ec o m p u t e r s d e v e l o p m e n t s oi ng e n e r a lm ei n c r e a s es p e e dm e t h o d 行o ma r t i f i c i a l i n t e l l i g e n c e a s p e c t s ,b yc o m p u t e ra l g o r i t h i i l st oi d e i l t i 矽m ei n t e l l i g e n tt e m i na l l a l y s i sa n d u l t i m a t e l yc r e a t eas u r f a c et o p o 黟印h ya r ea ni m p o r t a n tm e t h o dt ot l l i sp r o b l e m 1 1 1m i sd i s s e r t a t i o n ,f o c u s e do nt h er e s e a r c ho ft h es u r f a c em o d e lr e b u i l d i n gi n t l l ev i n l l a lr e a l i s t i ce n v i r o m n e n t ,c o m b i n et h ep i c t u r ep r o c e s s i n ga n dc l a s s m c a t i o n t e c h n i q u e ,t h r o u 曲ah i 曲d e g r e eo f m a pa l l dt h eg e n e r a t i o no f n u r b ss u 血c e ,m a l 【e t h en u c t u a t i o n sr e s u r f a c eo nm es c r e e n t h et e l t a i nr c c o n s t m c t i o ns y s t e m e s t a b l i s h e db a s e do nt h et h e o d ro fb pn e u r a ln e 觚o r ka 1 1 dr e c o n s t m c t i n gb s p l i n e s u r f a c e t h er e s u l t sm a k eg u r em a tt h i sm e t h o dc a nm e e tt h ec o n s n l l c t i o no fv i r t l l a l s c e s ,s od oi t sv a l i d i t ya n dp r a c t i c a b i l i t y k e yw o r d s :t e l l r a j nv i s u a l i z a t i o n ;m u l t i r e s 0 1 u t i o nt e r r a i nm o d e l ;v i n i j a lr e a l i t y ;b p n e u i a ln e t 、) l ,o r k ;n o n u n i f o mr a t i o n a lb - s p l i n es l l r f a c e s c l a s s i f i c a t i o n :t p1 8 3 2 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得( 注:如没 有其他需要特别声明的,本栏可空) 或其他教育机构的学位或证书使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并 表示谢意。 学位论文作者签名: 刹誓 导师签 学位论文版权使用授权书 本学位论文作者完全了解邋有关保留、使用学位论文的规定,有权保留 并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本 人授权遨可以将学位论文的全部或部分内容编入有关数据库进行检索,可以 采用影印、缩印或扫描等复制手段保存、汇编学位论文。( 保密的学位论文在解 密后适用本授权书) 学位论文作者签名: 签字同期:2 0 0 罗年6 月中同 刻争 导师签字 签字同期:2 0 07 年6 月夕同 山东师范大学硕十学位论文 1 1 引言 第一章绪论 地球表面是人类社会赖以生存并从事一切实践活动的根基,人们与其发生着 紧密的联系:测绘人员对地形进行各种测量:水利人员研究水体在地表的变化;建 筑工程人员在地表设计建造各种建筑物,尽管是不同的专业领域,研究的侧重点 也各有不同,但所有这些工作都需要一种方便、可靠的方法来准确表达地表信息。 地图是表达地表信息的一种古老而有效的手段,在人类社会发展中发挥了巨大作 用,是记录、传达关于自然界、社会属性与空间特征信息的卓越工具。 2 0 世纪中叶后,得益于计算机科学、计算机图形学以及数学的发展,各种 数字化的地形表达方式得到快速发展,这些技术在很大程度上改变了地图制图的 面貌,也改变着地图产品的样式。这期间,地理信息系统( g i s ) 应运而生,它将 数字制图与空间分析功能以及数据库操作( 查询、统计) 集合在一起,可对地理信 息进行综合分析和处理,可以说,这是人类在地形表达方式上的一次革命【。 早期的地理信息系统主要处理数字式的基于二维空间的静态地图。随着数据 库和空间遥感技术的发展,基于三维空间信息的数字地形模型开始成为空间数据 库的重要组成部分,与地理信息系统紧密的结合,具有高度真实性和可测量性的 三维地形模型,能够实现三维地形表面的逼真还原【2 1 。在许多实际应用,诸如: 环境仿真、设施管理、洪水淹没分析和辅助决策,用户需要三维、交互的地理信 息系统支持,以便动态交互地处理、分析、显示地理相关数据。因此,研究建立 基于三维空间信息的地理信息系统,更准确的描述地形,就具有了相当现实的意 义。 3 山东师范大学硕l j 学位论文 1 2 技术背景 1 2 1 科学计算可视化 v i s c - v i s u a l i z a t i o ni ns c i e i l t i f i cc o m p u t a t i o n s ,是指运用计算机图形学和图像 处理技术,将科学计算过程产生的数据及计算结果转换为图形或图像在屏幕上 显示出来,并进行交互处理的理论、方法和技术【3 】。 可视化作为一种计算方法,抽象的数据符号变为具体的几何形体,使研究者 得以观察其仿真或计算结果,其意义在于: ( 1 ) 人类的视觉在人类科学发现中发挥过杰出的作用; ( 2 ) 海量的数据只有通过可视化变成具体的几何形体,才能激发人的形象思维; ( 3 ) 可以大大加快数据的处理速度,使得时刻都在产生海量数据得到有效的利用; ( 4 ) 可以在人与数据、人与人之间实现图像通信,从而使人们能够观察到数据中 隐含的现象,为发现和理解科学规律提供有力工具; ( 5 ) 可以实现对计算机和编成过程的引导和控制,通过交互手段改变过程所依据 的条件,观察其影响; 将可视化技术应用于地理信息系统中,使这种地理信息以三维的形式直观显 示出来,是当前地利信息系统研究的一大热点。 1 2 2 虚拟实现技术 在可视化技术基础上发展起来的虚拟实现( v r ) 近几年来一直是国内外科技 界关注的一个热点,其发展也是同新月异。简单地况,v r 技术就是借助于计算 机技术及硬件设备,实现一种人们可以通过视听触嗅等手段所感受到的虚拟幻 境,故v r 技术又称幻境技术。1 9 2 2 年,在法国召开了与v r 技术相关的名为” 真实与虚拟世界的界面”的国际会议,同年在美国的s a i ld i e g o ( 圣地戈) ,一批 以医学专家埃为主的科学家组织召开了名为”医学中的虚拟实现技术”的学术会 议。1 9 9 3 年,i e e e 在s e a t t l e ( 西雅图) 召开了第一届虚拟实现国际学术会议, 会议吸引了大批科技工作者,发表了大量有价值的论文。不久,i e e e 的刊物 s p e c t r u m 也组织了有关专集。 4 山东师范人学硕一j 二学位论文 虚拟实现的技术特点是能利用计算机生成一个具有三维视觉、立体听觉、和 触觉效果的逼真世界;用户可以通过各种感官同虚拟对象进行交互,操纵由计算 机生成的虚拟对象时,能产生符合现实世界客观规律的行为和动作;具有从外到 内或从内到外观察数据空间的特性,在不同空间漫游;借助三维传感技术( 如数 据头盔、手套等) ,用户可以产生身临其境的感型6 1 。虚拟显示技术所支持的多 维信息空间,能提供一种使人沉浸其中、超越其上、进出自如、交互作用的环境, 为人类认识世界和改造世界提供了一种新的强大的工具。 1 2 3 地表模型重建相关研究进展 地表模型是一个有着一般多边形网格特点而又有其自身特点的复杂几何模 型。地表模型一般用d e n 或t 烈表示。数据庞大和高度冗余。 数字地面模型是对地形表面再地形采样数据基础上的表面重构9 】【10 1 。地表的 采样数据是一个无序的数据,为便于计算机的管理及应用,需要对该数据建立结 构化的表达式,即隐式的或者显式的表达之间的拓扑关系【】。目前主要以网格结 构的形式表达。根据往各结构的不同,分为规则网格( 矩形、正三角形、正六边 形等) 和非规则网格( 三角形,四边形等) 渺1 5 1 。 数字高程模型( d i 西t a le 1 e v a t i o nm o d e l ,简称d e m ) 【3 3 l d e m 表示方法 ( 1 ) 数学方法 数学方法表达数字高程模型,可以分为整体拟合方法和局部拟合方法。前者 即根据区域所有的高程点数据,用傅立叶级数和高次多项式拟合统一的地面高程 曲面,后者是将地表复杂表面分成正方形规则区域和面积大致相等的不规则区域 进行分块搜索,根据有限的点进行拟合形成高程曲面。 ( 2 ) 图形方法 图形方法也是表达地形最常见的方法。如可以用等高线表示d e m ,也可用 其他的地形特征线来表达地面高程的重要信息,如山脊线、谷底线、海岸线及坡 度变换线等。 ( 3 ) 图像方法 图像方式主要足指各种影像数据和绘图方式对地形的描述,如航空影像、遥 感影像、地貌晕渲图、透视图等。 5 山东帅范大学硕j j 学位论义 d e m 主要有三种表示模型:等高线模型、三角网模型和格网模型。 在规则网格中,矩形网格平面位置隐含于行列号中,称为网格d t m 或例d , 因网格结构简单而被普遍采用。 ( 1 ) 等高线模型 等高线模型根据已知点的高程值的集合来表示整个区域的高程状况,因为每 一条等高线对应一个己知的高程值,所以一系列等高线的集合和他们的高程值一 起构成了一种地面高程模型。 等高线通常被存成一个有序的坐标点对序列,可以认为是一条带有高程值属 性的简单多边形或多边形弧段。等高线模型中不同的等高线是离散的,只表达了 区域的部分高程值,无论等高距有多小,都不可能表达整个地形。因此,往往需 要一种插值方法来计算落在等高线外的其他点的高程值。 等高线方法是用二维坐标表示三维物体的常用方法,但是直接用等高线来模 拟地形的缺点就是有明显的等高线的痕迹,地形不光滑。 ( 2 ) 不规则三角网( t i n ) 模型 三角形是平面图形中最简单的几何图形,因而在不规则的网格中经常使 用,一般称为不规则三角网d t m 或t i n ( t r i a n g u l a t i o no fi n e g u l a rn e t 、o r l ( ) 。 t i n 就是一系列不交叉,不重叠的连接在一起的三角形来表示地形表面。 t i n 中队三角形的几何形状有严格要求。一般有三条原则:1 ) 尽量接近正三角形; 2 ) 保证最近的点形成三角形;3 ) 三角形网络唯一。 不规则三角网t i n 的优缺点 优点缺点 较少的点获取较高的精度;表面分析能力较差; 可分辨的分辨率;构建起来比较费时; 有良好的拓扑结构;算法设计复杂 ( 3 ) 规则网格模型( g r i d ) 地形的规则网格( r e g u l a rs q u a r eg r i d :r s g ) 模型是地形表示的主要方法之 一。它利用一系列在x ,y 方向上都是等间隔排列的地形点的高程z 来表示地形, 形成一个矩形网格的数字高程模型。 6 山东师范人学硕l j 学位论文 这种方式下地形可以表示成一组规则存放的高程值,在计算机中他就是一个 二维数组或者数学上的一个二维矩阵 规则格网d e m 的优点: 优点缺点 有简单的数据存储结构计算效率低 能与遥感影像数据复合数据有冗余 良好的表面分析功能格网结构的限制 地形r s g 模型由于存储量小,非常便于使用和管理,同时由于模型顶点的 等问距均匀分布特性,使得对地形的各种分析、计算、查询等操作非常容易实现。 因此这种方式是目前应用最广泛的形式。 地形r s g 模型结构简单,管理方便但是在平坦地形时会出现大量地形信息 的冗余。自然的带来了模型的简化。地形r s g 模型进行简化直接的方法是顶点 抽取方式,即在显示时隔行隔列显示,但是这样可能会删除一些地形关键信息点。 1 2 4 模式识别技术与神经网络 模式识别是指用计算机代替人类或帮助人类感知模式,是人类感知外界功能 的模拟,也就是使计算机系统具有模拟人类通过感官接受外界信息、识别和理解 周围环境的感知能力1 9 之1 1 。遥感图像的模式识别技术是对人们目视解释的模拟, 它根据遥感图像中目标体的各种影像特征( 颜色、形状、纹理与空间位置) ,结合 专家知识库中目标物的解释经验和成像规律等知识进行分析和推理,实现图像的 理解。 在遥感图像处理中,一般习惯以像元作为处理对象的称之为分类,以区域为 处理对象的称之为分割。 神经网络又称人工神经网络( a r t m c i a l n e u r a l n e 觚o r k 简称a n n ) ,它是一种 模拟人脑神经元细胞的网络结构。神经网络的研究已有近4 0 年的历史,其发展 过程经过了一段曲折的历程,随着各种神经网络模型的不断完善,以及计算机性 能的不断提高。目前,神经网络理论的应用己渗透到各个领域,在智能控制、模 式识5 j 0 、计锋机视觉、自适应滤波和信息处理、非线性优化、自动日标识别、连 7 山东师范大学硕上学位论文 续语音识别、声纳信号处理、知识处理、传感技术与机器人、生物医学工程等方 面均取得了令人鼓舞的进展,因而为神经网络的应用创造了更有利的条件。 近年来,利用神经网络进行遥感影像分类的研究掀起了一个高潮,出现了很 多这方面的文献。这些研究结果表明神经网络与传统分类方法的最大区别在于: 在处理模式分类问题时,人工神经网络并不基于某个假定的概率分布;在监督分 类中,网络通过对训练样本的学习,获得网络的权值,形成分类器;在非监督分 类中,从特征空间到模式空间的映射是通过网络的自组织来完成的,是一种聚类 过程。另外,神经网络通常具有较好的容错特性。利用非参数的神经网络分类器 比传统的参量统计分类器在克服噪声影响,分类自适应性等方面具有一定优势。 本文除了简单介绍神经网络的基本特点外,重点介绍典型的b p 神经网络并进行 图像的分类识别。 1 2 5h o o p s a c i s 简介 a c i s 是s p a t i a lt e c l l i l o l o g ) ,公司开发的三维几何造型引擎,它集线框、曲面 和实体造型于一体,并允许这三种表示共存于统一的数据结构中,为3 d 造型应 用的开发提供了几何造型平台。s p a t i a lt e c h n 0 1 0 9 y 公司在1 9 8 6 年成立,目前 a c i s3 dt 0 0 l k i t 在世界上已有3 8 0 多个基于它的开发商,许多著名的大型系统 都是以a c i s 作为造型内核。a c i s 是一个完整的3 d 造型的内核,是一套用c + + 写的3 d 造型的类库,可以利用这个类库完成几乎所有的建模工作( 基本上所有 3 d 造型软件的功能) 【5 】【8 1 。 建立一个模型后不仅要存取一个数据文件,还需要把这个模型显示在计算机 屏幕上,并实时对它进行操作,这就需要一个图形显示引擎。h o o p s3 d a p p l i c a t i o nf r a m e w o r k 0 0 p s 3 d a f ) 是由t e c hs o j f ia m 嘶c a 公司开发并由 s p a t i a l 再次销售的产品,该产品为当今世界上领先的3 d 应用程序提供了核心的 图形架构和图形功能,这些3 d 应用程序涉及c a d c a m c a e 、工程、可视化 和仿真等领域。有了h o o p s 3 d a f ,用户就站在一个高起点上,能够快速和有效 地开发和维护高性能的用户应用程序。用户通过将h o o p s 3 d a f 集成到相应的 软件开发中,可以更好地管珲开发成本、优化资源和缩短产品上市时间。 h o o p s 是在底层图肜驱动丛础上开发的一个显示类库,它不是一个单独的 图形显示引擎,而是对o p e n g l 、d i r e c t x 这些图形引擎进行封装和扩展的结果。 r 山东师范大学硕一i :学位论文 灵活地对0 p 饥g l 和d i r e c t x 的支持也是其卖点,h o o p s 保证自己能同步跟上 o p e l l g l 和d i r e c t x 的发展步伐,并在其上做有益的改进。 1 3 本文的主要工作 通过查阅资料显示目前地形模型重建主要是通过使用直线连接成面的方法 建模,主要考虑的是模型的精确程度以及多分辨率的数据存储。实现起来较为复 杂,可操作性不是特别理想。本文基于以上结论提出了利用特定曲面来拟合地形 的思路,只需要存储这种特定曲面的信息,既可以对曲面进行重建,操作,修改 也较为容易。显示时的精细程度则可以利用曲面显示时计算的步长的大小进行优 化,而不需要另建立数据结构存储多分辨率存储信息。在不需要特别精准要求的 显示情况下,这种特定曲面模拟地形的方式,可以获得较为满意的效果。 基于n u r b s 曲面的地形模型是属于地形r s g 的模型重建,利用n u r b s 曲面自身的连续性结合已有的地形r s g 相关成果实现地形模型的构建。 r s g 模型最大的优势在于顶点分布的规则性,等间距分布的特点在地形数 据提取时只需要通过顶点在两个方向上搜索就可以得到顶点相关信息,结合 n 1 瓜b s 顶点间的平滑过渡的性质可以利用较少的顶点绘制出较为相似的地形模 型,尤其是在一些有着平滑过渡特点的地形模型重建上效果应该是较为明显。 本文通过神经网络对遥感图片的灰度分析识别【3 2 。7 1 ,计算出一系列关键点的 相对高度,对于光线照射不到阴影无灰度值的区域可以利用识别出来的坡形信息 填补,再通过高度图建立n u r b s 曲面顶点。最终可以较为容易的实现地形曲面 的建立并且让曲面完整无裂痕。 主要实现了图像到坡形的采样、训练、识别,图像的处理,以及曲面生成等 功能。并最终完成了程序的设计与实现。实验结果表明生成的地形曲面与图像较 为相似具有一定的实用价值。 9 山东师范大学硕十学位论文 2 1 神经网络简介 第二章神经网络 2 1 1 神经元模型的提出和发展 “人工神经网络 ( a r t i f i c i a l n e u r a l n e t w o r k ,简称a n n ) 是在对 人脑组织结构和运行机智的认识理解基础之上模拟其结构和智能行为的一种工 程系统。人工神经网络以对大脑的生理研究成果为基础的,其目的在于模拟大脑 的某些机理与机制,实现某个方面的功能。国际著名的神经网络研究专家,第一 家神经计算机公司的创立者与领导人h e c h t n i e l s e n 给人工神经网络下的定义 就是:“人工神经网络是由人工建立的以有向图为拓扑结构的动念系统,它通过 对连续或断续的输入作状态相应而进行信息处理。”这一定义是恰当的。早在本 世纪4 0 年代初期,心理学家m c c u l l o c h 、数学家p i t t s 就提出了人工神经网络的 第一个数学模型,从此开创了神经科学理论的研究时代。其后,f r o s e n b l a t t 、 w i d r o w 和h o p f 、j j h o p f i e l d 等学者又先后提出t 感知模型,使得人工神经网络 技术得以蓬勃发展。 神经网络的发展历程经过三个时期: ( 1 ) 第一次研究高潮:五十至六十年代。1 9 4 3 年心理学家w 5 m c c u l l o c h 和数学 家w p i t t s 提出m p 模型。1 9 4 9 年d 0 h e b b 从心理学的角度提出了至今仍 对神经网络理论有着重要影响的h e b b 学习法则。1 9 6 1 年e r o s e l l b l a 仕提出 了著名的感知机模型( p e r c 印t r o n ) 。1 9 6 2 年w i d r o w 提出了主要适用于自适应 系统的自适广线性元件a d a l i n e 网络。 ( 2 ) 低潮时期:六十年代末至七十年代。由于受当时神经网络的理论研究水平所限 及应用前景不明朗,加之受到冯诺依曼式计算机大发展的冲击等因素的影 响,对神经网络的研究陷入低谷。但是,在美、日等国仍有少数学者在扎扎 实实地继续着网络模型和学习算法的研究,提出了许多有意义的理论和方法: 如r b i b 的竞争模型、1 9 7 7 年k o h o n e i l 提出的自组织映射模型、g 胁s s b e r g 的 自适谐振模型、f u k u s h i m a 的新认知机等。有的学者还提出了连接机制 ( c o 衄e c t i o n i s m ) 和并行分布处理概念( p a r a l l e ld i s t r i b u t e dp r o c e s s i n g ) 。 i o 山东师范人学硕士学位论文 ( 3 ) 第二次研究高潮:八十年代初至现在。1 9 8 2 年生物物理学家j h o p p i e l d 授提 出了h o p p i e l d 神经网络模型,引入了能量函数概念,这一成果的取得使神经 网络的研究取得了突破性进展。8 4 年他用此模型成功地解决了复杂度为n p 的旅行商问题( t s p ) 。1 9 8 7 年6 月在美国加州举行了第一届神经网络国际会 议。一千多名学者参加,并成立了国际神网络学会。后确定为每年召开两次 国际联神经网络大会。1 9 9 0 年我国的8 6 3 高技术研究计划,批准了关于人工 神经网的三项课题,自然科学基金与国防科技预研基金也都把神经网络的研 究列入选指南,对中选的课题提供研究上的资助。 2 1 2 神经网络的结构 神经系统的基本构造是神经元( 神经细胞) ,它是人体内各部分之间相互信息 递的基本单元。神经由细胞体,树突( 输入端) ,轴突( 输出端) 组成,如图l 所示。 图l 生物神经元结构 苣接权( 后者 对前者输出的度) 是可以接受外界刺激而改变的,这构成了学习能的基础每个神 经元都由一个细胞体,一个连接其他神经元的轴突和一些向外伸出的其它较短分 支一树突组成。轴突的功能是将本神经元的输出信号( 兴奋) 传递给别的神经元。 其末端的许多神经末梢使得兴奋可以同时传送给多个神经元。树突的功能是接受 来自其它神经元的兴奋。神经元细胞体将接受到的所有信号进行简单地处理( 如: 加权求和,即对所有的输入信号都加以考虑且对每个信号的重视程度一体现在权 值上一有所不同) 后由轴突输出。神经元的树突与另外的神经元的神经末梢相连 的部分称为突触。 神经网络的关键,就在于每个处理单元之间建立适当的连结,这就像脑神经 细胞i 、i | j 彼此用突触做沟通的渠道样。我们叫用一般的电脑米模拟人工的神经 山东师范人学硕 :学位论文 元,每个神经元都可同时接受许多输入讯号,根据内部简单的运算,送出一个单 一的讯号,作为另一神经元的输入讯号。图2 表示了模拟的人工神经元单元。 输h ,l i ,。 输出 图2 人工神经元的结构 这些神经元的连结并不像想像的那样杂乱无章,是通常被组织成层次分明的 神经元,每一层内的神经元并不相互连结,它们只接受下层神经元的讯号,并向 上送出结果。其中,输入层负责接收资料,而输出层则送出最终的结果,通常它 们之间还存在着隐藏层,夹杂在两者之间,因此,这种结构使我们无法预测输入 的资料将怎样在这些神经元之间流动。 每个神经元都收到由前一层发出的讯号,然后,将各个讯号经过加权处理, 归纳出最后的结果,再传给上一层的神经元。于是,神经网络的关键就在于如何 决定每一神经元的权值。 神经网络都需要经过训练来调整这个比值,在训练开始前,每一比值都用随 机方法决定,这种神经网络可被解读为人脑最初的浑沌状态。然后可以有两种训 练方法:第一种方法是自我组织神经网络,它通常是处理极大量资料,并且要从 资料里自动归纳出特定的模式和资料彼此间的关联,这种方法常被研究者用来分 析研究资料。相对地,第二种方法是逆向传播类神经网络,它需要操作者介入训 练,在输入每笔资料的过程中,操作者观察类神经网络的输出结果是否正确,如 果j 下确,那么就加强产生这个结果的权重比值,反之,则降低那些权重的比值, 这种神经网络通常被用于认知学习的研究以及处理特定问题。 神经网络已被证明对处理真实世界的问题非常管用,这类问题的特性是拥有 非常复杂而不完整的资料,它最初被应用在视觉辨认及语音辨识等问题上,此外, 近来还有人用神经网络来进行文字转语音的研究。 2 1 3 人工神经刚络的特点 1 2 山东师范人学硕i :学位论义 人工神经网络是由大量的神经元广泛互连而成的系统,它的这一结构特点决 定着人工神经网络具有高速信息处理的能力。人脑的每个神经元大约有1 0 3 一1 0 4 个树突及相应的突触,一个人的大脑总计约形成1 0 1 4 一1 0 1 5 个突触。用神经网络 的术语来说,即是人脑具有1 0 1 4 1 0 1 5 个互相连接的存储潜力。虽然每个神经元 的运算功能十分简单,且信号传输速率也较低( 大约1 0 0 次秒) ,但由于各神经元 之间的极度并行互连功能,最终使得一个普通人的大脑在约1 秒内就能完成现行 计算机至少需要数l o 亿次处理步骤才能完成的任务。 人工神经网络的知识存储容量很大。在神经网络中,知识与信息的存储表现 为神经元之间分布式的物理联系。由于人工神经网络中神经元个数众多以及整个 网络存储信息容量的巨大,使得它具有很强的不确定性信息处理能力。正是因为 人工神经网络的结构特点和其信息存储的分布式特点,使得它相对于其它的判断 识别系统,如:专家系统等,具有另一个显著的优点:健壮性。生物神经网络不会 因为个别神经元的损失而失去对原有模式的记忆。 人工神经网络同现行的计算机不同,是一种非线性的处理单元。只有当神经 元对所有的输入信号的综合处理结果超过某一门限值后才输出一个信号。因此神 经网络是一种具有高度非线性的超大规模连续时间动力学系统。它突破了传统的 以线性处理为基础的数字电子计算机的局限,标志着人们智能信息处理能力和模 拟人脑智能行为能力的一大飞跃。 人工神经网络的特点和优越性,主要表现在三个方面: ( 1 ) 具有自学习功能。例如实现图像识别时,在先把许多不同的图像样板和对应 的应识别的结果输入人工神经网络,网络就会通过自学习功能,慢慢学会识 别类似的图像。自学习功能对于预测有特别重要的意义。预期未来的人工神 经网络计算机将为人类提供经济预测、市场预测、效益预测,其应用前途是 很远大的。 ( 2 ) 具有联想存储功能。用人工神经网络的反馈网络就可以实现这种联想。 ( 3 ) 具有高速寻找优化解的能力。寻找一个复杂问题的优化解,往往需要很大的 计算量,利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的 高速运算能力,可能很快找到优化解。 1 3 山东师范人学顾 :学位论文 2 2b p 神经网络 2 2 1b p 神经网络及其算法 单层神经网络只能解决线型可分的分类问题。多层神经网络可以用于非线性 分类问题,但需要寻找训练多层网络的学习算法。 1 9 7 4 年p w e r b o s 在其博士论文中提出了第一个适合多层网络的学习算法, 但未受到足够的重视和广泛的应用,指导2 0 世纪8 0 年代中期,美国加利福尼亚 的p d p ( p a m l l e ld i s t r i b u t e dp r o c e s s i o n ) 小组于1 9 8 6 年发表了p a r a l l e ld i s t m u t e d p r o c e s s i o n 一书,将该算法应用于神经网络的研究,才使之称为迄今为止最著名 的多层网络学习算法一b p 算法,由此算法训练的神经网络,称之为b p 神经网 络。在人工神经网络的实际应用中,b p 网络广泛应用于函数逼近、模式识别及 分类、数据压缩等,8 0 一9 0 的人工神经网络模型采用b p 网络或它的变化形 式,它也是前馈网络的核心部分,体现了人工神经网络最精华的部分【2 引。 传统的b p 学习算法是一种有监督学习算法,其基本思想是最小二乘算法【4 5 1 。 当网络神经元的激活函数为线性函数时,可以采用最小二乘法。它采用梯度搜索 技术,使网络的期望输出与实际输出的误差均方值达到最小。 网络的学习过程包含输出值的前向传递和误差值的反向传播两个阶段,在正 向传播过程中,输入信号从输入层经隐含层单元传向输出层,每一层神经元的状 态只影响下一层神经元状态。如果输出层上不能得到期望结果,则转入反向传播, 通过修改各层神经元的连接权值和闭值,将误差信号反向由输出层传向输入层, 使得误差信号最小。该算法实际上是求误差函数的极小值,它通过大量样本的反 复训练,并采用最快下降法使权值沿着误差函数负梯度方向修正,使其对样本有 j 下确的识别结果,并收敛于最小点。神经网络的样本学习就像人记数字一样,网 络中的神经元相当于人脑细胞,网络权值相当于数字在人脑中的记忆,学习样本 时权值的改变就像是人脑细胞的相互作用,网络的学习阶段就像人由不认识数字 到认识数字的反复学习过程一样【3 8 删。 1 4 东帅范大学俩学位论空 输入: 期望输出 图3 b p 神经网络 4 = ( ,砖一,) 五;饼,戎,止) 中间层神经元输入:s = 饼,霹,) 中间层神经元输出:b = ( 舛,聪,呓) 输出层神经元输入:= 时,譬,芒) 输出层神经元实际输出:c i ;( 矸,畦,t ) 中间层神经元阈值:只= o = l ,2 ,西 输出层神经元阚值:i = ( ,= 1 ,2 ,q ) s 型函数: ,( 砷= 1 ( 1 + 矿。x ,( 砷= “曲【l 一,( 对】( 2 1 ) ( 中间层两端可取不同函数,但此处相同。) 输入层与中间层连接权值:= “= l ,2 川,h ,= l ,2 ,p ) 中间层与输出层连接权值:= ( ,= l ,2 ,a r = l ,2 ,g ) ( 2 ) 稿式顺传播过程: 中间层神经元输入:s = q q ( ,= 1 ,2 ,p ) ( 2 2 ) i i 中【e i i 层神经元输出: q = 五( s j ) o = i ,2 ,p ) ( 2 3 ) 山东师范人学硕上学位论文 p 输出层神经元输入: 厶= 岛一只( f = l ,2 ,g ) ( 2 4 ) = i 输出层神经元实际输出:q = 五( 厶) ( f = l ,2 ,g ) ( 2 5 ) 误差函数: 巨= 圭喜( 一t ) 2 ( 2 6 ) 权值调整: 嚣善= 一口嚣鼍象= 口( 一引爿( 厶脓2 7 )8 c t 跏qa c t 乩t 乱q v l 1 “h 卜、 。 ( 按负梯度方向变化或梯度下降原则,应使与象的负值成正比例变化, 优化算法中得到。) 1 6 帅一一等 一 等筹+ 鲁筹+ + 等筹 ( 2 9 ) = 一霉。 鲁筹卜霉 等筹别 一考l 鲁筹筹等f 一甜等筹等筹鲁 = 芝 ( y ? 一c ? ) 。( :) v p 厂i 。( s :) 口, ( 嘞对所有输出都有影响,与不同。) 令= ( 一t ) 爿( 霉) = 爿( 输出层广义误差,= 鲁) 则= 口嘭一h e b b 规则( 口一学习率,z 广义误差,哆一输入) w 玎:芝 d 广y ,f 六( s ;) 口? ( 2 1 0 ) 令p ;三芝 d ,iy , ( s ;) ( 广义误差) 则w ,= p ;口? ( h e b b 学习规则,学习率) 山东师范人学硕i j 学位论文 后层误差加权后传向前层误差j 广一屿p ; 阂值修正值: 厶yt = 晓d : 厶9j = p e : 2 2 2b p 网络学习算法流程 ( 1 ) 初始化 w ) v 秒,) y , 赋予 一1 ,+ 1 】间随机值 ( 2 ) 随机选取一模式对( 彳。,y 。) 提供给网络 ( 3 ) 计算中间层单元的输入与输出 孓= q 一嘭( f = l ,2 ,p ) ( 2 1 1 ) 扭i 岛= 彳( s ) ( = 1 ,2 ,p ) ( 2 1 2 ) ( 4 ) 计算输出层单元的输入及输出 口 厶= 岛一只( f = 1 ,2 ,g ) ( 2 1 3 ) = i e = 六( 厶) ( f = 1 ,2 ,g ) ( 2 1 4 ) ( 5 ) 计算输出层一般误差 影= ( 力一t ) 爿( 霉) ( f = l ,2 ,g ) ( 2 1 5 ) ( 6 ) 计算中间层各单元一般化误差 p ;= d 广v , 一( j ;) ( 2 1 6 ) ( 7 ) 权值修正 矿,( + 1 ) = 矿,( ) + 口d 广6j ( = l ,2 ,p ) y ,( + 1 ) = y ,( ) + 口d j ( f = 1 ,2 ,g ) 形玎( + 1 ) = 矽玎( ) + e j 口? 口,( + 1 ) = 秒,( ) + p ; ( 8 ) 随机选取一个学习模式提供给网络,返回( 3 ) ,直到m 个模式样 本训练完毕 1 7 山东师范人学硕+ i :学位论文 ( 9 ) 重新从m 个模式对中随机选取一个模式对重返( 3 ) ,直到全局误 差 e = e t 、7 i r r w b 时,所产生的灰度图像 更符合人眼的视觉感受。通常、舻o 3 , w g = 0 5 9 ,、b = o 1 1 ,图像的灰度最合 理。 3 1 2 二值化 利用大津阈值法对图像进行二值化处理。大津法由大津于1 9 7 9 年提出,大 津法可以说是自适应计算单阈值( 用来转换灰度图像为二值图像) 的简单高效方 法。对于图像h l l a g e ,记f 为前景与背景的分割阈值,前景点数占图像比例为w 。, 平均灰度为”。;背景点数占图像比例为w ,平均灰度为材。图像的总平均灰 度为:“= w 。“。+ w ,“。从最小灰度值到最大灰度值遍历f ,当f 使得 值g = w 。( “。一材) 2 + w 。( “。一“) 2 最大时f 即为分割的最佳阈值。该 式实际上就是类问方差值,阈值f 分割出的前景和背景两部分构成了整幅图像, 而前景取值“。,概率为w 。 背景取值“。,概率为w 。,总均值为“,根据 方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构 成图像的两部分差别越大。当部分目标错分为背景或部分背景错分为目标都会 导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小。 直接应用大津法计算量较大,因此我们在实现时采用了等价的公式 g = w 。w x ( “。一“) 2 。应用算法时先对输入的灰度图像计算直方图, 通过前面的公式进行分析,将直方图分成两个部分,求得使两部分之间的距离最 大的灰度值。这个划分点就是求得的阈值。 我们在测试中发现:大津法选取出来的阈值非常理想,对各种情况的表现都 较为良好。虽然它在很多情况下都不是最佳的分割,但分割质量通常都有一定的 保障,可以说是最稳定的分割。 3 1 3 模糊处理 图像模糊处理也被称为图像的甲滑,这里我们使用局部平均法。局部平均法 是一种直接在空域上进行平滑处理的技术。认为图像是由许多灰度恒定的小块组 2 l 山东师范人学硕l :学位论文 成,相邻像素间存在很高的空间相关性,而噪声则是统计独立的。因此,可用像 素邻域内的像素的平均灰度值代替该像素原来的灰度值,实现图像的平滑。 最简单的局部平均法就是非加权邻域平均,它均等地对待邻域中的每个像 素。该算法简单,在降低噪声的同时使图像模糊。下面我们介绍一个种快速求和 法【2 锄7 】并运用到图像模糊处理的求均值问题上。 快速求和 思想是对求和区域的小块进行求和,这样在计算大的分区时尽可能的重用以 求出的小块区域的结果。当计算分区r 内的点定义的值7 ,的和时,我们就可以重 复的利用这些小块区域进行相加,以此达到快速求和的目的,这种方法是以占用 了额外的空间为代价来提高计算速度。 ! i j 芗爹爹 j 爹爹爹 夏一j 一一多 图4 把平面区域分解成小的子区域,w = 1 简单方格 快速求和的主要思想可以简单的表示为对一个方形区域内点的计算。在区域 r 宽为2 w ,内部的点用,= 砂来表示,包含了点数量为( 2 w + 1 ) ( 2 w + 1 ) 个点的 区域。如图4 是一个3 3 的区域。 求和公式可以写成下面的式子 + w上+ wy + _ h ,工+ w、 s 洲,= 屹= i 屹i ,= ,一w = 工一w_ ,= ,一w 、= x w ( 3 1 ) 内部的求和可以被分散为小的区域并在计算各分区的时候重复使用。我们可 以把一直计算到结果的过程分为两步完成: b = js ,= 蜀 l = j w ,= y w 、_ v ,_ ,、- 。一, 以x 为轴求子区域和 以z 为轴采分区和 ( 3 2 ) 线性时间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论