(生物医学工程专业论文)基于内容的医学图像检索(2).pdf_第1页
(生物医学工程专业论文)基于内容的医学图像检索(2).pdf_第2页
(生物医学工程专业论文)基于内容的医学图像检索(2).pdf_第3页
(生物医学工程专业论文)基于内容的医学图像检索(2).pdf_第4页
(生物医学工程专业论文)基于内容的医学图像检索(2).pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(生物医学工程专业论文)基于内容的医学图像检索(2).pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东 南 大 学 学 位 论 文 独 创 性 声 明 本人声明 所呈交的学 位论 文是我个人在导 师指导 下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人 己 经发 表或撰写过的 研究成果, 也不包 含为 获得东 南大学 或其它教育机构的学 位或 二 证书而 使用过的材料。 与我一同 工作的同志 对本 研究 所做的 任何贡献均已 在论文中 作了明确的说明并表示了谢意. ff 5z 生 狐一鱼车日 期 : 一 东 南 大 学 学 位 论 文 使 用 授 权 声 明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论 文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子 文 档的内 容和 纸质论文的内 容 相一致.除 在保密期内 的保密 论文外, 允许论文被查 阅和 借阅, 可以 公布 ( 包括刊登)论文的 全部 或部分内容。论文的公布 ( 包括刊 登)授权东南大学研究生院办理. 研 究 生 签 名 : 6 4 4 签 冬 冬 仁 日 期 : 0 卫 _y4 第一章前言 第一章前言 在 过 去 的 三 十 年 中 , 医 学 成 像技 术 经 历 了 巨 大 的 发 展, 医 学 图 像 变 得 越 来 越 数 字化和多样化。 新出 现的技术包括 诊断 超声、x射线计算 机断 层摄影 ( c t )、核 磁共振成像 ( mr i )、核磁共振波谱 ( m r s )、功能核磁共振成像 ( f mr i )、数 字血竹剪影 ( d s a ) 、正电 子断 层摄影 ( p e t ) 等等。 虽然传统的x 射线和计算机 放射线照相 ( c r )仍被广泛用来检查颅骨和胸部等处骨骼,但这些无格式的 x 线 胶卷现在也可以通过多种胶片数字化方法,如激光胶卷扫描仪、电晶体照相机和视 频照相机等转化为 数字格式以便 处理和归档 h l随着医学上这 些数据的大量产生, 如何有效地组 织、 管理 和检索大规模的图 像数 据库,已 成为当前研究的 一个热点课 题 。 传统图像检索技术的弊端 早 期的图像 检索借用了文 本索引技 术. 互 联网 上的文 本搜索引擎是 将网 站、网 页的内容索引为一系列关键字,当用户输入关键字后,系统可以根据数据库中的索 引文件将关键字映射为网站或网页的地址。对于图像文件,一样可以根据其内容手 工将其标注为一 系列 关键字, 并对关 键字建立 索引, 这样,图 像检索就转化为文 本 检索的问题。但是,这种方法很不实用,其弊端主要体现在如下两个方面: 第 一, 人 工 抽 取 特 征 速 度 慢, 工 作 f巨 大 : 人 工 完 整 地 标 注 所 有 图 像, 对 于 小 图像集 合也许问 题不 大, 但随 着图 像数目 的 增加, 这种方法 显然不可行; 第二,由于图像所包含的信息t庞大, 不同用户对于相同图像的看法不尽相 同, 这就导 致对留像的标 住没有一个统 一的标准, 检索的结果不能很好地符合用 户的需求: 为了 解决 传统图 像检索技术的不 足,一 些科学工 作者开始 探索 新的图 像检索方 法,基于内容的 图像检索技 术由此诞 生. 东南大学硕士学位论文 1 . 2 基于内容的图 像检索 基于内容的图 像检索技术 c o n t e n t- b a s e d im a g e re tr ie v a l ( c b ir ) 是指利用 图 像自 身包含的 特征属性, 如颜色、形 状、 纹理 及其空间关 系等建立图像的索引, 然后利用这些特征进行检索 ( 也就是在数据库中进行特征相似性匹配),该方法可 以在更高层次上更有效地利用所存储图像的信息。c b i r技术的核心是表征包含图 像内容的可视特征,它融合了图像处理、图像分析和图像理解等技术,较之传统的 检索方法有较大的优越性。 1 . 3 c b 工 r 系统的构成 c b i r系统的基本结构如图 1 - 1 所示: 下日日日日目日上一.洲月州州. 厂- 一 一 - 一 一奋询方式压 人机接口粉 获 衬 翔 蕊a r - -r o m ia - 1 r - - - - - - 盯胜教蘸肺断 特征值设定 特征1 特征2 图像特征库 征较 特比 俐川招圳. 特征n * 19 # 飞 特征提取 且 上 .!.。;。. r一 二二 二 二二 : 二 二 二 二 一 一一 , 尸 - 一 , , 户于 , 护 , i_ 一一月j 反饭值息 特征提取 位索结果 圈像教据库 i - 一 一 ._ - i 11 i 一结 果物出 反 镇机 刹一 jl 一 一 一 一 一 一 - 一 狱 胭 库, 理 1.1.111|、l 图 1 - t c b ir 系统结构图 在图像入库阶段,首先对图像进行特征提取,然后由相应程序负责将所得到的 第 一 章前言 各特征值存入图像特征库中;图像数据库和图像特征库通过特定的标识相关联。在 图像检索阶段,用户可以通过预先设定各特征值进行检索,也可以先输入检索样 图,通过程序自 动提取样图对应的图像特征进行检索:无论采取何种方式,其结果 总 是 得 到 一 个 关 于图 像 描 述 的 特 征向 量 , 系 统 将 这 个 特 征 向 量 和图 像 特 征 库 中 存 储 的 各特征向 量相比 较 ( 计算两 个特征向 量之间 的距离), 将与 样图间 距离小的特征 向量所对应的图像返回给用户。为了使检索的结果更加符合检索者的要求, c b i r 系统一般还包括检索反馈部分。用户根据 自己的需要对初次检索的结果进行评价, 评价的结果反馈 给系统用以调 整特征空间中 各个特征的 权重, 使特征空间中 各特征 的相对重要性更加符合用户的要求。 4 国内 外 c b i r 技术发展情况 图像数据库研究的核心技术是图像检索,图像检索同时也是近年来海it信息处 理方面面临的一个“ 瓶颈” 。 基于内 容的图 像检索技 术近年来发 展迅速,已 成为当 前研究的一个热点课题。下面我们简要介绍一下国内外c b i r技术的发展近况。 4 . 1 国 外c b i r 技术 现状 目 前为止,国际上已有一些著名的研究机构和商业公司研制出了自己的 c b i r 系统, 如: i b m公司的q b ic , u n iv e r s ity o f c a l ifo r n ia , b e r k e le y 的b lo b w o rl d 等。 q bi c q b ic ( q u e r y b y im a g e c o n te n t) x2 1图 像 检 索 系 统 是i b m公 司9 0 年 代 研 制 和开 发 的图像和影像检索系统,它主要为 i b m 的d b 2大型数据库提供图像检索功能,并 支持基于 w e b 的圈像检 索服务。 它是 标准的 c b ir系统, 用户无需提供文字 检索 词,只要输入以图像形式表达的检索要求即可撞索出一系列相似的图像。它提供多 个数据库提供检索实脸,例如关国 1 9 9 5年以前发行的邮票图案、世界著名商标、 旧金山美术博物馆图像数据库等。它的网 址是 加g a/w v w n b ic j lm a d e n .ib m .c o 叹, q b ic提供了多 种查询 方式, 包括:利 用系 统提供的标准范图 检索,用户绘制简图 或输入图 像进行检索等. 在用户输入图 像或简图时,q b i c系 统对输入的图像进行 颜色、 纹理等特征的 提取, 然后 根据用户选 择的查询方式分 别作不同的处 理:系 统 也提供各种标准范图,代表不同的颜色、纹理和轮廓结构。用户可选择与要检索对 东南大学硕士学位论文 第二章固定分割模式下的图像特征提取 本 论文的 第一部分工 作是基于固 定分割 模式下的图 像特征提取。 这里提到的固 定分割是指将图像行列均匀地分为nxn个矩形小块。我们对图像作如此方式分割 的 原因是因为 我们通常 提取的 一些图 像的统 计类特征 ( 如: 直方图 、纹理等) ,是 对整幅图 像进行运算处 理的, 这些 特征只反映了图 像的 某些整体 特性, 而不能反映 这些特 性在图 像中的空间 分布。因 此, 我们首 先对图 像进行分 割, 然后在每个图 像 了 块上提取那些统计类 特征的 特征值.以此,我们部分克服了那些全局特征缺乏 “ 空间分 辨能力” 的缺点。 在 本章的以 下 几节中 ,我 们将分别 讨论在固定分割 模式 下各相 应图 像特征的 提取 ( 当 然还有一些 特征的提取 不需要 对图像进行分割, 我们 也在本章一并讨论)。 为了 后续讨论方 便, 我们 在此先定 义一些符号: 我们 用x = ( x a x s,x s. .,x iv (n为 图像数据库中图像的 数目 ) 表示一图 像集合 ( 相当于一 个图 像数据库), x , 表示图 像集合中的一幅图,在特征选定的 条件下,每幅图像 x , 对应一个特征向盘万. c b i r 系 统的任务之一 就是要找到 一个函数t 将图 像映 射到 特征空间, 即:确定t: x ;4 f 。 我 们 用 符 号哪动 表 示 两 幅 图 像 间 的 距 离( 或 相 似 度) , 距 离 越小 则 表 示 两 幅 图 像 越 相 似 . 另 外, 我 们 将 检 索 样 图 用 符 号9 表 示 ,其 对 应 特 征 向 量 为 t (q ) ,对 于 图 像 集 合 中 的 某 一图 像x d ( 7 j x ,) ,t t 9 ) ) 便 表 示 了 图 像x , 和 检 索 样图 之 间 的 距 离 . 对 于 我 们 预 先 给 定 的 一 个 阂 值t , 图 像 集 合 r = (x , : d ( t (x r) ,t ( 4 ) 4 便 是 我 们 检 索 返 回 的结果。 2 . 1 图 像格式的转化 本 课题中 所涉及的图 像主要是 来自 医院的 c t , m r 图,由 于图 像来源广泛, 其 格式也稍有差 别,为了 便于数据 库管理,我 们首先将 这些图 像作了 格式转化。对 于提取图像特征而言,我们关心的是图像本身的 象素值、图 像的宽 和高等基本信 息。因而我们定义如下文件头格式: r a w f ile h e a d e r / /r a w数 据文件文 件头 w o r d w l m a g e w id th ; / 图 像的 宽 第二章固定分割模式下的图像特征提取 我们用符号d h ;. : ( x , q ) 表示图像x 和样图r 的第i 个图 像子块间的直方图距离, d fr;, _ i.( x , 9 ) = 艺1 侧( n ) 一 h , ( n ) i ( 2 . 1 0 ) 其 中h , ( n ) 和川( n ) 分 别 表 示 图 像x 和 样 图 9 对 应 第 i 个 图 像 子 块 的 归 一 化 直 方 图 。 图像x 和9 关 于分块直方图 之间的距 离我们 可以 表示为: d , , . ( x , q ) = ( x , 4 )( 2 . 1 1 ) 喘 呱 4x4甲白间 这 里的弓iv * 是对每 个图 像子块赋予的 权重, 根据人的视觉 特点, 我们可以 将位于 图像中心的子块赋予较大的权重,对图像四周的子块赋予较小的权重。 另外我们还根据各图像子块的直方图信息,计算下列统计特征: 均 值 ;n 一 艺n h ( n ) ( 2 . 1 2 ) 反映直方图的平均灰度值 2方 差 :。 , = 艺( n 一 n ) h (n ) 反映直方图灰度分布的离散情况 ( 2 - 1 3 ) 3 . 歪 斜 度 : 。 , = 去又 ( 。 一 句 h ( n ) 仃面 ( 2 . 1 4 j 反映直方图分布的不对称程度 4 峭 度 : n k “ 访 燕 。 一 n ) h (n ) 一 ( 2 . 1 5 ) 反映灰度分布在接近灰度均值时的大致状态,判断灰度分布是否非常集中于平 均灰度附近,其值越小表示越集中。 5 . r g r: n , = 艺h (n ) 图像的灰度分布较均匀时能量较大,反之,则较小。 ( 2 . 1 6 ) 东南大学硕士学位论文 6 . 墒 : n : 二 一 艺h ( n ) 10 9 2 h (n ) 当直方图灰度分布均匀时,嫡最大;反之,灰度值差别很大时, 这样, 对于图像x 和样图q 对应以 上统 计特征 ( 我 们以 后称之为 特征”)的距离我们用以下公式来表示: ( 2 . 1 7 ) 嫡较小。 “ 直方图其它 d ;,;, _ ,. ( x , q ) = w ,- n o r m ( n ( x ) , n ( q ) ) + w , , n o r m ( a 2 ( x ) ,a 2 (q ) ) + w, n o r m ( n , , ( x ) ,n w (q ) ) + u w, n o r m ( n . ( x ) ,n ,e ( q ) ) (2 .1 8 ) + w ., n o r m ( ” 二 (x ) , n , ( q ) ) + - ,e n o r m ( n , ( x ) , ” 二 ( q ) ) 这 里 的 w - , w o , 、 w w , w f 、 w , 、 w : 分 别 为 直 方 图 的 均 值 、 方 差 、 歪 斜 度 、 峭 度 、 能 量 和 嫡 等 特 征的 权 重, 课 题 中 我 们 取w - = v =w w =w w. = w . = w 。 一 ! /6 . 这样, 图像x 和q 对 应在 “ 直 方图 其它特征” 上的 距离我 们可以 表示为: d , ;. _ 二 ( x , q ) = 艺% /m ,., _ f d h ,. _ 二 (x , q ) ( 2 . 1 9 ) 同 样, 这里的w l i, 二 也 是对每 个子 块赋予的 权重, 权重的 确定与式2 . 1 1 类似。 2 . 5 纹理特征 当 人 们讨论图 像的 纹理时, 指的是图像 象素灰度或 颜色的某种 变化, 这种变化 是统计相关的。虽然至今尚无关于纹理的定义描述,但是图像或物体的纹理特征是 客观存在的,它反映了图像或物体本身的属性。纹理基元是构成纹理的基本单位, 它是一种或多种图像基元的组合。纹理基元的适当排列组合就形成了纹理。图像纹 理是图像的重要特征,特别是对灰度呈梯度变化的图像。纹理分析中的纹理分类就 是通过图像处理技术提取纹理特征,研究这些纹理在图像中反复出现的局部模式和 它们的排列规则, 获得 对纹理的定 量描述, 进 而对图 像和物体 进行正确分类2 3 1 己 有的纹理 分析方法大 致可以 分为 统计方法和结 构方法12 4 -2 61 :统计方 法是根据 象素灰度的统计特性确定纹理特征,如直方图统计特征法、自相关函数法等.这种 方法被用于分析象木纹、沙地及草坪等纹理细而又不规则的物体:结构方法是将复 第二章固定分割模式下的图像特征提取 杂的纹理图像通过特征提取和分割得到局部基元和它们的属性及其相互关系,对纹 理基元及其排列规则进行描述、分析和解释。这种方法适用于分析布料图案或砖的 花样等 一类由 规则 基元 组成的 纹理。 除统 计方法和结 构方法 外, 还有谱分析 方法27 等。大多数方法有一共同点,就是提取了那些在特定纹理描述中最重要的特征,突 出纹理的不同方面。 在 本课题中, 我们采用空间 灰度相 关法 ( s g l d m ) 28 . s g l d m法根据数字 化图像数据计算一个共生矩阵的函数。已知一个图像具有一个离散灰度集合 介 八 x y ) , 按下 述方 法对每一组 离散值d 和b 定义一 个共生 矩阵欲 试仍 : 矩阵中 每一 项s ( i, .i , d , 0 ) ,是相 距 d 互成 角度0 的灰度 对1 和j 出 现的 次数。另 外, 如果图 像 的灰度 级为n , 则 共生矩阵大 小为n x n . 通常计算时,我们限制 0 的取值为 二 / 4 的整数倍,也就是图2 - 3中各箭头所 不的方向。 对于粗纹理,当 d 相对较小时,在矩阵的 对角线附近,其矩阵的元素值较大。而对于细 纹理,当 d与纹理基元可比时,以距离d 分开 的点对灰度变化较大,相应在共生矩阵中元素 值分布较为均匀。当纹理具有方向 性时,则在 对应方向( 0 ) 的共生矩阵中,s 有较大的值。 给定一幅图像,我们能够得到对应的四个 共生矩阵。我们将每个方向对应的共生矩阵归 一化后计算共生矩阵的嫡、对比度、能量这三 个 纹理参数2 9 1,它 们分别表示如下: ( 我 们用 p ( 4j ) 表示归 一化共生矩阵中 的元素 值) 1 3 伙、 图 2 一 3 ! . 共 生 矩 阵 的 嫡: e n t = 艺艺p ( i, j ) 1o g p ( 1,! ) i j 当矩阵中的数值均相等时,嫡最大;反之,若数值差别很大,则嫡较小。 2 . 共 生 矩 阵 的 对 比 度 :c o n = 艺艺( i 一 .l ) 2 p ( i, 力 户j ( 2 . 2 0 ) ( 2 .2 1 ) 对于粗 纹理,元素 较集中 于矩阵的 对角线附 近,此时 ( 叻的 值较小, 相应的对 比度也较小;相反,对于细纹理,则具有较大的对比度。 东南大学硕士学位论文 :3 . 共 生 矩 阵 的 能 量 :a s m = 艺艺p ( i, j ) ( 2 .2 2 ) 如果 共生矩阵中 元素分布 较均匀则 能量较大, 反之,则能 量值较小。 对 于 图 像x 和q 对 应 第i 个 子 块岁 和了 , 我 们 计 算 其 四 个 方向 .d n ( d r= o , d : = 二 / 4 , d 3 = 二 / 2 , d ,= 3 二 / 4 ) 上的 距离 : d is 之 ( x , q ) = w 爵n o r m ( e n t 0 ( x ) , e n t 0 (q ) ) + w ,0.r;n n o - ( c o n ( x ) , c o n (q ) )、(2 .2 3 ) + w smn o r m ( a s m 0 ( x ) , a s m0 仔) 公 式中w 备、m iw f n t , w (漏、w n w a u 1! 分 别 表 示 在d n 方 向 上 , 嫡、 对 比 度、 能 量 这三 个 特 征 对 应 的 权 重 , 本 课 题中 w 爵= 恻 岛,二 w a , = i / 3 , ( n = 1 ,2 ,3 ,4 ) . 我们用符号d t ex (x ,q ) 表 示图 像x 和q 对应纹理特征的 距离,则: d , ( x , q ) 二 艺w t. 艺d is a (x , q ) (2 .2 4 ) 其中w r是第i 个图像子块对应纹理特征的权重,在本课题中,我们取 w , =1 / 1 6 ( i 二 1 , 2 , 二 , 1 6 ) . 2 . 6 形状特征 形状是刻画物体的本质特征之一,在基于内容的图像检索中有重要作用。形状 特征的表达.最成功的是傅立叶描述子30 1和矩不变量13 4-3 21 .傅立叶描述子是 用傅 立叶变换后的边界作为形状特征,矩不变量是使用基于区域的矩作为形状特征。这 两种方式的形状描述都是以图像目标被很好地从背景中分割出来为前提的.但是, 通常图像中包含的物体数目很多,要想很好地实现对物体的分割,目前而言还比较 困难。但我们也并非无能为力,在图像处理领域现已有很多边缘检测算子,我们试 图 运用 边缘检测算子 得到图像的大 致边 缘信息,通过统 计图像中 物体边缘的角 度直 方图来表征图像中物体的形状信息.当 然,我们的方法不可能实现对物体形状的精 确描述,但却能使我们避开对图像进行精确分割这一棘手问题。 第二章固定分割模式下的图像特征提取 征、分块直方图特征、直方图其它特征、纹理特征和形状特征对应的权重,这些权 重的具体数值是根据各特征的检索效果确定的,我们将在后续章节作进一步讨论; d ,;,(x ,9 ) d h fs c (x ,9 ) , d h ls , 凡: ( 1 ) ur , = r ; (2 ) 对 所 有 的i 和j , i * j , 有尺n r j = 价 (3 ) 对i = 1,2 ,二 , n , 有p ( r i ) = t r u e: (4 ) 对i x j , 有p ( r , v r , ) = f a l s e ; (5 ) 对i = 1,2 ,., n ,尺是 连通的 区域. 其中p ( r , ) 是对所 有在集合尺中元 素的逻辑谓 词, 沪 是空集. 上述条件 ( 1 ) 指出分割所得到的全部子区域的总和 ( 并集)应能包括图像中所 有的像素,或者说分割应将图像中的每个像素都分进某一个子区域中。条件( 2 ) 指 出各个子区域是互不重叠的,或者说一个像素不能同时属于两个区域。条件( 3 ) 指 出在分割后得到的属于同一个区域中的像素应该具有某些相同特性。条件( 4 ) 指出 在分割后得到的属于不同区域中的像素应该具有一些不同的特性。条件( 5 ) 要求同 一个子区域内的像素应当是连通的。对图像的分割总是根据一些分割的准则进行 第三章自 动分割模式下的图像特征提取 的。条件( 1 ) 与( 2 ) 说明分割准则应可适用于所有的区域和所有的像素,而条件( 3 ) 与( 4 ) 说明分割准则应能帮助确定各区域像素有代表性的特性. 现有的图 像分割方 法很多 ,我 们可以 大致 将之分为 三类36 1. 1 .基于边缘检测的图像分割技术; 2 .基于区域增长的图像分割技术: 3 .结合特定理论工具的分割技术; 基于 边缘检测的图 像分割方法 37 .39 1适合于图 像质量 好且图 像边缘明显的场合, 对于噪声含量高,边缘模糊的图像则效果比较差;大多数边缘检测算子对于噪声比 较 敏感, 如果图 像内容比 较复杂或 含有较强的 噪声, 我 们通过边 缘检测后得到的图 像边缘通常是不连续的,而且还时常包含一些多余的 “ 假边缘”:基于区域增长的 图像分割 方法【40. 42 1虽然 可以 保证图 像区 域的闭 合, 但该方 法也存 在不少的弊端:例 如对于视觉上相似但空间上不相连的两个区域,利用简单的区域增长算法,我们通 常 无法使之相关,因而 使得区域的 识别 变得复杂;另 外, 关于区 域增长何时结束也 是个很棘手的问题,因此时常会导致图像的 “ 欠分割”和 “ 过分割” :目前为 止,图像分割尚无通用的自身理论,随着数学、计算机科学、心理学等相关学科许 多新理论和新方法的提出,人们也提出了一些结合特定理论、方法和工具的分割技 术,比较典型的有: 基于数学形态学的 分割技术 4 31 、 借助统计模式识别方法的分 割 技术(4 4 1、利用神经网络的分割技术4 5 .4 61 基于 信息论的 分割技术47 1 、 借助模糊 集合和逻辑的分割技术48 -49 1基于小波分析和变换的 分割技术50 1 、 利用遗传算法 的 分 割 技 术 15 11等 。 在本课硬中,我们采用人工神经网络来实现对图像的自 动分割,采用该方法的 原因一方面是由于我们试验了基于边界检测和区域增长的方法,发现其效果不能满 足我们的要求;另一方面是由于影像实验室硕士研究生刘正云同学已 经在此领域做 了大量研究并 取得了 不错的 成果。 刘的 硕士课题 5 21 实现了 用神经网络对细胞图像 的模糊分割,本课题借鉴了他的部分研究成果, 并在此基础上根据本课题的要求作 了相应改进。下面我们对我们的方法作具体介绍,我们首先简要介绍一下人工神经 网络。 东南大学硕士学位论文 3 . 1 人工神经网络介绍 人工神经网络( a r t i f i c a l n e u r a l n e t w o r k ) 是运用生物神经网络的机理,即通 过大量相对简单的非线性神经元之间复杂而又灵活的联接关系来模仿人脑的智能化 信 息 处 理 过 程, 通 常 简 称 神 经 网 络 , 它 的 主 要 特 征 有以 下 几 点 15 31 . . 1 、并行处理性 传统的v o n n e u m a n n 型 计算机是 按串 行 方式处理 信息的, 若要在几百 个串 行步 骤内完成复杂的推理或计算任务,需要等待很长时间。而在神经网络中,巨量的神 经元借助相互之间的连接权可同时进行同样的处理,因而是大规模的并行处理。虽 然在普 通 p c机上用软 件进行神经网 络的仿 真运算时仍 不得不采 用串 行计算,但如 果用硬件或 在并行机上实现, 神经网 络将充 分体现出并 行性这一无 与伦比 的优势。 2 、分布式存贮与容错性 信息在神经网络的存贮是将内容分布于大量的神经细胞之中,而且每个神经细 胞实际上存贮着多种不同信息的部分内容。信息的记忆反映在神经元之间的连接权 上。网络的各个部分对学习和记忆具有等势作用,即使个别单元出错,部分信息丢 失, 但大部 分信息仍存在,因 而可以 恢复出 完整的 信息。 3 、信息处理与存贮的合二为一性 神经网络对信息的分布存贮与并行处理并不是相互独立的,而是相互融合的, 即每个神经元都兼有信息处理和存贮功能.神经元之间的连接权既是对信息的记 忆,同时在神经元受到激励时又作为参数参与运算,得到神经元的输出值. 4 、自组织性 神经网络的信息存贮不是通过人为的加工移植,而是通过特定的学习算法对样 本学习并不断修改网络各神经元之间的连接权而达到的。我们无需关心为什么会得 到这样的权值,因为这完全是网络自组织化的结果。 5 、实时性 从以上的特点可以看出,当训练好的神经网络投入应用时,各连接权都有一个 确定的数值,所有神经元对激励立刻就能产生响应,输出计算结果。 神经网络具有的巨量并行性,存储分布性,结构可变性,高度非线性,自学习 性及自组织性等特点,使神经网络能够处理不完整的信息,并能通过学习从给定的 第三章自动分割模式下的图像特征提取 经验训练中生成映射规则,但是还存在着不同网络中映射规则是不可见的和难以理 解的缺陷,另外神经网络也不适合于表达基于规则的知识,使得在对神经网络进行 训练时常常只能将初始权值取为零或随机数。这些都是神经网络用来解决问题的不 足之处。 目前的神经网络模型不下十种,如果就结构来分类的话,主要有三大类型 5 31:前向神 经网络;反 馈神经网 络和自 组 织神经网络。 常见的前向 神经网 络有b p 神经网络和 of 径向基神经网络,常见的反馈神经网络是 h o p f i e l d网络,常见的 自组织神经网络是 k o h o n e n 网络。 如果就神经网络的学习算法来分类的话,只需要分为两类,即有监督的和无监 督的两类神经网络。监督和无监督算法是神经网络的两大学习算法。对于有监督学 习,神经网 络通过对网 络实际输出 和预先希望的 输出进 行比 较, 根据 两者之差的函 数 如差的平方和)来调整网络的权值,最终使其函数达到最小。对于无监督学 习,当输入的样本模式进入神经网络后,网络按照预先设定的规则 ( 如竟争规则) 自动调整权值,使网络最终具有模式分类的功能。 下面我们介绍一下人工神经网络的组成。 3 . 1 . 1 人工神经网络的组成 人工神经网络的最基本的组成单位是人工神经元。一个简化的人工神经元结构 如图 3 - 1 ,该人工神经元 ( 以下简称为神经元)是一个多输入单输出的非线性系 统,其输入输出关系可以描述为: 、.,! 拭 l ( 3 . 1 ) 气-i 图3 一 t人工神经元 东 南 大 学 硕 士 学位 论 文 式 中x i 是 从 其 他 细 胞 传 来的 输 入 信 号 :b ,是闭 值 ; w i i 表 示 细 胞 从j 到 细 胞i 的 连接权; f为 传递函数. 常用的传递函 数有阶跃函数、 s lg n l o ld函 数、高斯函数 ( 图 3 - 2 ) 0 阶越函数 高斯 函 一 t ;0 l-5 图 3 - 2神经网络中常用的三种传递函数 3 . 2 本课题中 用到的神经网 络竞争h o p f i e l d神经网络介绍 1 9 8 6 年美国 物理学家j .j .h o p fi e ld 陆续发 表几篇论文, 提出了h o p f ie ld 神经网 络( h n n ) 。他利用非 线性动力 学系 统理论中的能 量函 数方法研究 反馈人工 神经网 络 的稳定性,并利用此方法建立求解优化计算问题的系统方程式.h n n是目前得到 最充分 研究和广 泛应 用的 反馈式神经网 络模型. h o p f ie ld将 “ 能量函数” ( l y a p u n o v 一李雅普诺夫函数54 1 )的概念引入分析一类人工神经网络的稳定过 程, 使网 络运行的 稳定 性判断 有了 可靠和简 便的 依据,开 辟了 人工神经网 络应用于 联想记 忆和优化计算 等领域的范围。 另外,h o p f ie ld网 络与电 子电路存 在明 显的对 应关系,所以使得这种网络易于理解和便于实现。 下面我们首先简单介绍一下这种网络的结构和原理。 3 . 2 . 1 h o p f i e l d神经网络的结构和原理 基本的 h o p fie ld神经网络是一个由非线性元件构成的全连接型单层反馈系 统。h o p f i e l d网络中的 每一个神经元都将自己 的输出 通过连接权传送 给所有其它 神经元,同时又都接收所有其它神经元传递过来的信息。即:网络中的神经元 t 时 刻的输出状态实际上间接地与自己的t - 1 时刻的输出状态有关( 如图 3 - 3 ) . 第三章自动分割模式下的图像特征提取 图3 - 3 h o p f i e l d 网络的结 构 在图3 - 3 中, x - (x l,x z , .,x ) , x f 0 ,+ 1 为网 络的 输入; y = ( y ,y 2. . ,v ) , y +e 0 , + 1 为网 络的 输出; v ( 1卜 ( v i (t) ,1t 1 (t ), . .v . (t ) ,v ic j o ,+ l 为网 络在 时 , 的 状态, 其中 。 0 , 1 ,2 ,. . 为 离 散 时 间 变 量 ; 与 图3 - 1 中 类 似, 我 们 用 符 合w y 表 征 从n i 到n j 的 连 接 权值, e ; 为门限值, f为状态转移函数。为方便起见,一般 醉取零值, 离散 h 叩f ie ld 网 络中, 各节点一 般选相同的 状态转移函 数关 ,且 为符号函 数,即 有: .f ( x ) = .f = (x ) = = f (x ) 二 s g n ( x ) ( 3 .2 ) 对于网络中第 i 个神经元,它在 t 时刻的输出为: v i( t) = s g n ( 拭) h , = 艺 w ijv , 一 9 , (3 .3 ) 这表明,当所有其它神经元的输出的加权总和超过第 i 个神经元的输出闽值时,该 神经元被 “ 激活”,否则将受到 “ 抑制”。这里特别应该注意的是,按式 3 . 3改变 状态的神经元 i ,并不是按顺序进行的,而是按随机的方式选取的。下面将 h o p f ie ld 工作运 行规则总结如 下: 1 )从网络中随机选取一个神经元i ; 2 ) 按式 3 . 3 计算神经元i 的第 t + 1 时刻的输出值,即: i f 城( ! ) k 0 t h e n v , ( t + l ) =l 东南大学硕士学位论文 e l s e v ; ( t + 1 ) = 0 3 ) 第i 个 神 经 元 以 外 的 所 有 神 经 元 输出 保 持 不 变 : v j ( t + 1 ) = v j (t ) , .l =1 , 2 , . . .n ,j $i o 4 ) 返回第 一步, 直 至网 络 进入稳定状 态。 h o p f i e l d神 经网 络是一 个反馈型的网 络。 给定 初始输入x时, 网 络处于 特定 的初始状态,由此初始状态开始运行,得到网络的下一状态。然后,这个输出状态 通过反馈再回送到网络的输入端,作为网络下一阶段运行的输入信号 ( 该输入信号 可能与初始输入信号 x不同),这个新的输入又可以生成下一步的输出。网络的 整个运行过程就是上述反馈过程的重复。反馈型 h o p f i e l d网络的一个重要特点就 是它具有稳定状态。当网络达到稳定状态的时候,也就是它的能t函数达到最小的 时候。这里的能量函数不是物理意义上的能量函数,而是在表达形式上与物理意义 上 的 能 量 概 念 一 致 , , 表 征 网 络 状 态 的 变 化 趋势 的 目 标 函 数。 一 般 我 们 定 义 简 化 的 理 想系统的能量函数为网络状态的二次函数: 艺 艺 w y v ,v i + 艺 b ,v , ( 3 .4 ) 介加 在特定的优化计算中,对于某一特定问题,我们首先将问题的目标函数转化为 网络的能量函数 ( 并将问题的变量对应为网络的状态),再将其与标准的能量方程 对比,从而决定网络的结构。只要随着时间的增长,随着状态的变化,网络的能量 是不断降低的,那么可以判定网络收效。当且仅当网络中所有的节点状态不再改变 时,能量 不再 变化, 此时 达到能f的极小 点。 也这 就是 说网络的 稳定 点就是能量方 程式 3 .4的极小点。由此我们可以得到用 h o p f i e l d网络去解决具体优化问题的一 般过程 : i )对于待定的问题,选 择一种合适的 表示 方法, 使得神经网络的输出 与问 题 的解对应起来; 2 ) 构造神经网络的能量函数,使其最小值对应于问题的最佳解: 3 ) 由能量函数倒过来推出神经网络的结构,即神经元之间的连接权: 4 ) 由网络结构建立起网络,令其运行,那么稳定状态就是在一定条件下问题 的解答 。 下面我们来证明按照 h o p f i e l d工作运行规则改变网络状态,能量函 数式 3 .4 第三章自动分创模式下的图像特征提取 的值将逐渐下降: 由式 3 .4 可知,对于第 i 个神经元的能量函数为: e ; = 一 合 郭v;vi + b;v, ( 3 . 5 ) 则由时刻 t 至时刻t + 1 能量各的变化量a e 为: a e = “ “ 十 1)一 “ (t) = 一 告 v,“ 十 1)一 、 (t)1喀 w w j (t) + b, ( 3 . 6 ) 二 一 告 v,(t+ l)一 、 (t)1h , (t) 由 h o p fie ld 工作运行规则 可知:当 h a t) z o时, 有 v ;(t+ l )- v x t) 2 0 ,此时 e 5 0 :当 h x t) 5 0 时, 有【v x t + l ) -v x t ) 5 0 ,此时同 样有 e 5 0 。所以 有: e ( t+ l ) 5 e ( t) , 也 就是说随着网络状态的更新,网络能量函数是递减的。 3 . 2 . 2 竟争h o p f i e l d 神经网络 为了能 使 h o p f i e l d神经网络的 能量方 程以 更快的 速度收敛, 我们在 传统的 神 经网络中引入竞争机制,我们称之为竞争 h o p f i e l d神经网络 ( c o m p e t i t i v e h o p f i e l d n e u r a l n e t w o r k ,简称c h n n )。 我们通过一个实例来说明竞争 h o p f i e l d网络,在这个例子中,假设要把 n级 灰度归到c 类中去。 首先我们构建一个n x c 个神经元完全相互连接的h o p f i e l d 网络,我们设由这 n x c 个神经元 构成的矩阵为v = i v , , , 其中1 x.i 要 满足: v i i e ( 0 , 1 ) 艺 v ,. , ” t 0 艺v x n l y v x , 二 。 1 _x _n ,l i sc 1 _x_n 1_i _c ( 3 . 7 ) 十,1月esj ,a.万、cd j口.、了.、了.、了r、 这里 y s . 表示第 (x ,r 个神经元的 状态:w = .r:, j 为第 (x ,r) 个 神经元与 第( y -j ) 个 神经元 东南 大 学 硕 士 学 位 论文 间的连 接权: i ,, 为第 (x , i) 个神经元的 阐值, 则 神经元(x ,eo 的总 输入可用下式 计算: n e t ., = 艺 艺、 , , , ,二 , , + l .( 3 . 8 ) 二维h o p f i e l d 神经网 络的l y a p u n o v (54 1能量方 程为: “ = 一 2 vx,nv .:r. r-i ra, s , 。 一 e e l n ( 3 .9 ) 一 ” “ “ 一 “ 一 所 以 = 一 2 xai r., 1.1 jai 当e达到极小时,网络 将达到稳定状态。此时,如果神经元v , , 为兴奋状态 ( 即取值为 1 ), 度x 属于第i 类。 另一方面,我们如果以类成员间的距离平方值为依据来分类的话, 建目标函数: 则意味着灰 我们可以构 : 一 普 艺 艺 之 一李 塑 一 v ,威 , 十 粤 玄 乞 玄 、 一 , 十 冬 这 之 * ,) 一 2 (3 .10) 一 , 夕 “ “ y h r v r , i - a ., j x r 其中心 表示灰度 级为x 和y 之间e u c l id e a n 距离的平 方项, 即定义为: 丛, = d ( x , y ) = ( x 一 y ) 2 (3 . 1 1 ) h x 表示灰度级为x 的 像素的个 数。 等式右边第 一项的物理 意义为各灰度级 到同 一类内 其它灰度级的均方 距离之和;第二 项由 式 3 .7 ( b ) 推导 得出, 用以 保证没 有一 个灰度级x 会同 时属于分割图像中的 两类:第三 项由 式 3 .7 (d ) *导得出,是为了 保 证所有的灰度级都被分配到各自的类中。很明显,第一项是用来描述每一像素与类 中 心的 距离, 而后两项是惩罚项( 意思 是: 不满足约束条件,这 些项就 不为零,网 络能量也就不可能达到极小值) .文献 5 5 1 中指出,最后获得的解对权重 a , b , c 的值非常敏感,而要找到这些权重的最优值是非常耗时的。解决这个问题,可以通 过引入竞争学习算 法来实现. 生物学实验己经证明:生物视网膜中有许多特定细胞对特定的图形例如直线和 圆等比较敏感。当视网膜中有若千接受单元受特定模式刺激时,就使大脑皮层中的 特定神经元产生兴奋。这种由特定刺激引起局部兴奋的反射功能是受后天环境影响 而形成的一种生理现象。受此启发,我们将神经网络输入端看作为视网膜的接受装 第三章自动分割模式下的图像特征提取 置,当环境信息进入网络时,将会对输出层的节点产生刺激,而输出层的不同节点 将对输入模式作出不同的反应。作出最大反应的节点被激活,那么该节点表征了这 类模式,即网络确认了模式所属的类别.这种特定输入模式产生特定激活节点的过 程, 称为 竞争过程。 这种竞争过 程按照 “ 胜 者为 王” ( t h e w i n n e r t a k e s a l l , 简 称w t a ) 的 方 法 组 织, 在 我 们 这 里“ 胜 者为 王” 是 指 一 行 中 获 胜节 点 的 输 出 为 1 , 相应的权值进行调整,这一行中其余所有未获胜的节点输出为 0 ,权向量不作任何 变动。用公式表示如下: n e t . # = m a x v e - -, n e t . . ) 口 功e r w乙 s e ( 3 . 1 2 ) 目.且n rl盆、 一一 认 w t a 的学习机制保证了每一个灰度级都被分配到相应各类中,因而竞争 h o p f i e l d 网 络的目 标函数简 化为: : = 粤 艺 文 艺 二 上 一 v .4 a vy , , *、 艺h y v y ., ( 3 . 1 3 ) 上式己不存在惩罚项,因而避免了决定最优加权系数的问题,将上式与能量方 程 : 一粤 夕 夕 夕 w. w is y . w r ., 相 比 较 可 得 到 . i:y .+ = 一 二 卫 一 , 卉 。 2 忆了 气 二 丫 气 了 傀 罗f, 乙 n y v y , i 从而可以 得到神经元(z ,0 的 总输入: n et. s = - . t 一 全 d .、一 艺 h yw , o , 。 ( 3 . 1 4 ) 网 络的收敛过 程就是 不断地用式 3 .1 4 计算神经元 ( z ,r) 的总输入 n e t,;, 然后应 用 wt a的学习规则计算每一神经元的愉出,直到没有神经元的输出状态发生变化 的过程 。 3 . 3 竞争 h o p f i e l d 神经网 络用于图 像自 动分割 c h e n g 等 5 61 曾 给出 了 一种 利 用 竟 争 h o p fi e ld 神 经 网 络 进 行 聚 类 图 像 分 割 的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论