数字图书馆图像资源检索框架的构建与实现_第1页
数字图书馆图像资源检索框架的构建与实现_第2页
数字图书馆图像资源检索框架的构建与实现_第3页
数字图书馆图像资源检索框架的构建与实现_第4页
数字图书馆图像资源检索框架的构建与实现_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-精选财经经济类资料- -最新财经经济资料-感谢阅读- 1 数字图书馆图像资源检索框架的构 建与实现 摘要图像检索为数字图书馆的 发展提供了技术支持,图书馆应重视数 字化发展以提升服务质量。本文提出一 种数字图书馆图像资源检索框架,并对 系统的实现过程做了详细的分析。同时, 在提取图像特征时提出了一种基于非下 采样的 con.toudet 变换图像检索算法 (NSCT) ,能够在大量图像数据中挖掘 有效的特征信息。该算法首先对图像进 行多尺度、多方向分解,然后计算低频 和高频中不同方向的子带系数的标准差 和均值作为图像的纹理特征。实验结果 显示,本文提出的图像检索框架具有可 行性,能够为用户提供更优质的搜索服 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 2 务,并且与同类特征提取算法进行比较, 该算法具有良好的检索性能和较高的查 准率、查全率。 中国论文网 /4/view-12965802.htm 关键词 数字图书馆;图像检索; 框架构建;非下采样 conlourIet DOI:10.3969/j.issn.10080821.2017.06.0 09 中图分类号C250.76 文献标识 码A 文章编号10080821(2017) 06005506 随着计算机技术、网络技术及多 媒体技术的快速发展,人们进入了“读 图时代”,大量图像源源不断的产生, 而且图像本身具有生动性、直观性和易 懂性的特点,满足了人们对信息的需求, 成为信息处理领域中的主要处理对象。 尽管数字图书馆图像采集技术以及存储 技术也在不断地进步,但如何从大量的 图像数据中分析出有价值的内容并对这 些海量的图像进行有效的组织,使用户 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 3 能快速、准确地找到他们感兴趣的信息, 成为研究者们研究的热点之一。同时, 在大数据时代,用户的信息素养越来越 高,对信息的质量要求也不断提高,也 对图书馆产生了更新、更高的要求。而 图像检索技术的发展,能够更好地满足 用户对图像检索匹配的精准度要求,改 善用户在图像检索过程中的信息检索体 验。总之,对图像检索领域的深入研究 将决定大数据时代数字图书馆能否抓住 机遇提升自己的发展水平。 近年来,对图像检索需求和检索 行为等方面的研究已经取得了丰富的成 果,但在如何提高用户图像检索效率的 问题上并没有统一合理的解决措施,而 图像检索技术恰恰能够弥补这一缺失, 现阶段的图像检索技术主要分为基于文 本的图像检索和基于内容的图像检索两 大类。传统的基于文本的图像检索系统 是先对图片信息用关键字进行描述和注 释,该技术虽然已经在数字图书馆图像 检索领域中有了比较成熟的研究经验, -精选财经经济类资料- -最新财经经济资料-感谢阅读- 4 但依靠手工标注会浪费大量的精力并且 人为的主观性理解不能充分表达图片的 内涵,使得图像检索的结果并不尽如人 意。图像文本包含更多的内容,这些丰 富的信息需要使用一定的方法和技术进 行挖据,采用内容的检索方法不仅可以 对图像信息进行客观合理的描述,而且 采用相似性度量的手段有效地提高了检 索效率,满足了信息时代发展的需求, 于是基于内容的图像检索(CBIR)成 为数字图书馆研究的主要方向。 本文通过构建一种基于内容的数 字图书馆图像资源检索框架,并利用非 下采样的 Contourlet 变换方法对图像资 源进行特征提取,提高了图像检索精准 度,有效地实现了数字图像资源检索方 案,为数字图书馆图像资源的搜索提供 了参考价值。 1 基于内容的图像检索研究现状 CBIR 结合人工智能、认知心理 学、面向数据库等方面的学科知识,利 用计算机视觉等方面的理论对图像进行 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 5 自动检索,它不再依赖人工注释,具有 节省人力、客观、可建立复杂描述和应 用前景广阔等诸多优点,因而该技术被 广泛研究。现阶段 CBIR 主要从以下两 个方面进行研究: 1)图像特征提取。图像特征提 取就是通过映射或变换将高维信息转换 成计算机识别的底层特征的过程,常用 的特征包括颜色特征、形状特征、纹理 特征等,这些特征要尽可能维数小、 立性好才能对图像的描述具有更好的 相似性。 2)相似匹配和图像特征索引。 提取图像特征后,如何采用合理的方法 对特征集进行匹配和索引以提高图像检 索的精度成为该阶段的主要研究方向, 图像匹配和索引大致分为 3 类技术:相 似性测量、聚类分析、相关反馈技术。 主要框架概念图如图 1 所示。 1.1 特征提取 特征是图像的一种固有属性。在 CBIR 检索模型中,对特征向量的提取 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 6 是实现图像检索的关键步骤之一,也是 数字图书馆图像检索领域研究的重点和 难点。特征提取的内容主要有基于低层 的特征提取和基于高层语义的特征提取 两个方面。尽管高层语义特征能够更好 地反映图像特征。目前也出现了有关高 层语义特征提取的相关研究,但图像低 层特征与高层语义特征之间存在着巨大 的“鸿沟”,如何从低层特征中提取语义 信息并将它们融合在一起仍然处于瓶颈 期,所以近几年对图像特征提取的研究 主要还是从颜色、形状、纹理等低层特 征来进行的。 颜色作为图像内容的底层特征之 一,在图像检索领域的研究中得到广泛 应用。颜色特征易于从图像中提取,它 对图像的变化依赖性较小,可以有效地 减少旋转、尺度不一所带来的干扰。除 了采用颜色直方图对颜色特征进行提取 以外,还可以采用颜色聚合向量、颜色 协方差和颜色矩等方式提取。 形状特征是图像的另一个重要特 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 7 征,包括了部分图像语义信息,形状特 征的优点是可以通过算法提取将图像低 层特征和高层特征很好地融合在一起, 这样就可以得到图像中的检索目标。但 形状特征受图像的平移、缩放、旋转等 变换的影响,有一定的局限性。有关形 状特征的图像检索,可以通过基于边界 特征的或基于区域特征这两种方法来提 取。 纹理是绝大多数物体表面的固有 属性,不同物体表面的组织结构之间的 排列规则不相同,人们通过感官视觉可 以轻易地分辨不同的纹理。纹理特征能 够反映像素在领域空间的灰度分布规律, 是对像素在局部区域之间关系的一种度 量。针对纹理特征的提取算法已经有了 很多研究成果,目前纹理分析的方法基 本分为统计法、结构法、模型法和空间/ 频率域联合分析法这 4 类方法。 1.2 特征的索引与匹配 对数字图书馆图像资源特征提取 后,如何将图像数据集进行索引和匹配 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 8 成为主要的问题,如何解决语义鸿沟问 题是这一过程的主要研究难点。相似性 度量是图像特征匹配非常重要的组成部 分,其承担着判断图像是否相关的重要 作用,常用的相似性度量算法有曼哈顿 距离、夹角余弦、兰式距离、欧式距离 和编辑距离等。每一种相似性度量算法 都有其优点也有其应用的局限,对于不 同的应用和不同的图像特征,在设计图 像检索系统时,相似性度量算法的选择 和设计是不可忽视的一步。同时,单一 地通过一种相似度测量方法难以产生健 壮的、符合人类感知的图像序列,来解 决这一问题,研究人员还需要从图像聚 类、分类和相关反馈技术进行改进。 聚类和分类适用于处理大规模、非结构 化的图像数据。Murthy 在对图像检索时 提出了 K-means 聚类并结合分层的方法, 首先根据图像颜色特征将其分为不同类 别,再利用 K-Means 算法进行进一步的 聚类,分层聚类能够有效忒搞检索速度, K-Means 算法通过对向量与其聚类中心 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 9 之间的距离进行评价,高校准确地获得 聚类结果。张永库等人在利用改进颜色 聚合向量提取图像颜色特征的基础上, 找到服务条件的特征向量作为初始聚类 中心,利用分散度与贡献度进行聚类并 建立特征索引库,提高了检索的效率。 相关反馈为人们提供了与系统交 互的机会,通过反馈检索结果,可以不 断提高检索效率。芮勇等人最早提出了 相关反馈技术,并将其应用于基于内容 的图像检索中。现阶段有关图像检索的 相关反馈技术研究方向为减少系统与用 户的交互次数,满足用户的检索需求从 而提高检索的效率和精度。 2 数字图书馆图像资源检索框架 构建 本文构建的基于内容的数字图书 馆图像检索框架主要由特征提取、相似 匹配、反馈输出这 3 个模块组成。其中 对图像资源特征提取,建立特征数据库 是构建数字图书馆检索系统的核心,也 是本文研究的重点。具体模型框架如图 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 10 2 所示。 系统首先对存储在数字图书馆数 据库中的图像进行自动提取特征,然后 用多维的特征向量来表示,存入到图像 特征数据库。而用户根据自己的检索需 要,选择一张或几张样本图像,同样用 相同特征提取方法提取特征向量。最后, 系统计算出特征数据库中特征向量和提 取的样本图像的多维特征相向量的相似 距离,根据距离进行排序,再结合相应 的索引信息,最终就能获得一定程度上 相似的图像。 2.1 图像预处理 由于生成图像数据的工具、手段 以及图像在传输时会引入噪声,导致图 像质量下降。因此,为了提高图像检索 效果,在收集图像数据集后,不能直接 作为检索图像,本文首先对原始图像灰 度处理,然后采用中值滤波的方法对图 像进行去噪以减少图像检索的干扰因素。 2.2 图像数据库特征提取 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 11 特征提取是数字图书馆图像检索 系统实现的重要环节,信息提取的完整 性直接影响数字图书馆图像检索的效果, 纹理特征反映图像本质信息,是近年来 较为常用的提取图像信息的方式,本文 提出了一种 NSCT 纹理算法提取图像特 征,并通过实验并与同类算法比较分析, 该算法具有较好的检索效果,可以为数 字图书馆图像检索系统的实现提供参考 方案。 2.2.1 NSCT 算法 NSCT 算法是由 Contourlet 变换 发展而来的,Contourlet 变换的基本思 想是用近似的“ 线段” 来逼近原始图像, 相比小波采用“ 点” 来逼近,可以利用更 少的系数来近似原始图像,因而具有良 好的各异性和方向性。它很好的解决了 二维或更高维奇异性,可以获得更多的 高频中各个方向的细节信息。但是,采 用 Contourlet 变换对图形进行分解时, 必须对图像信号频繁地进行采样操作, 导致分解的过程中不仅缺乏平移不变性 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 12 还容易信息失真,为此 Cunha 等人针对 Contourlet 变换的一些局限性进行改进, 提出非下采样的 Contourlet 变换,在分 解和重构过程中,取消了上、下采样操 作,具有较好的平移不变性。 NSCT 由非下采样的金字塔滤波 器 NSP 和非下采样的方向滤波器组 NSDFB 实现。如图 3 所示,图像首先 经 NSP 分解为低通部分和带通部分, 然后带通部分通过 DFB 进行多方向分 解,类似的分解步骤可以对低频子带继 续迭代滤波,实现对信号的多尺度、多 方向分析。因为多尺度分解和多方向分 解是相互独立的,所以各高频子带上的 方向分解数都可以是 2 的任意正整数次 幂。与 Contourlet 变换相比,由于剔除 了下采样环节,经 NSCT 分解后的图像 与原始图像尺寸一致,在保持平移不变 性的同时也保留了更多的图像细节。 3.2 结果分析 通过实验结果看出,相比同类算 法,本文提出的算法在检索目标图像后, -精选财经经济类资料- -最新财经经济资料-感谢阅读- 13 返回前 7、10、20、30 幅图像的平均查 准率要明显高于其它类方法,同时该算 法检索五幅图像的平均查全率达到 80%,优于 Harr 小波变换检索 40%和文 献16提出的检索算法 59%,不仅使数 字图书馆图像检索框架得以有效实现, 而且具有较高的检索准确率。 4 结语 大数据时代,图书馆新兴的数据 分析、知识挖掘、信息处理等服务为数 字图书馆带来了历史性的发展机遇,图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论