毕业论文外文翻译-基于视觉词汇模型近重复图像检测算法.doc_第1页
毕业论文外文翻译-基于视觉词汇模型近重复图像检测算法.doc_第2页
毕业论文外文翻译-基于视觉词汇模型近重复图像检测算法.doc_第3页
毕业论文外文翻译-基于视觉词汇模型近重复图像检测算法.doc_第4页
毕业论文外文翻译-基于视觉词汇模型近重复图像检测算法.doc_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业设计(论文)外文资料翻译题 目: 基于图像检测技术的粮仓害虫检测系统设计 院系名称: 电气工程 专业班级: 测控1001 学生姓名: 学 号: 201048770108 指导教师: 兰 教师职称: 副教授 起止日期: 2014/2/162014/2/24 地 点: 31329 附 件: 1.外文资料翻译译文;2.外文原文。 指导教师评语: 签名: 年 月 日附件1:外文资料翻译译文 基于视觉词汇模型近重复图像检测算法 李兆丰和冯小燕,河南科技学院信息工程学院,河南新乡,中国 摘要 近年来,近似重复图像检测成为在图像检索中的最重要的问题之一,并且被广泛地使用在许多应用领域,如版权侵犯,并检测伪造的图像。因此,在本文中,我们提出了一种新的方法来基于视觉词汇模型近似重复图像的自动检测。 SIFT描述符是用来表示图像的视觉内容这是一种有效的方法在计算机视觉研究领域来检测图像的局部特征。此后,我们将在K-均值聚类算法给定图像的SIFT特征分成若干簇。每个簇的质心被视为一个视觉词,并且所有的质心被用来构建成视觉词的词汇量。减少近重复图像检测处理的时间成本,局部性敏感散列被用于高维视觉特征映射到低维哈希桶的空间,然后该图像的视觉特征被转换为一个直方图。接着,关于图像,提出了一种基于局部特征的图像相似性计算直方图距离的估算方法,然后近重复图像可以被检测到。最后,通过一系列的实验,构造成性能评价,并也给出了了解实验结果相关的分析。指数条款指数条款近重复图像,视觉词汇模型,SIFT,哈希函数,局部敏感哈希 I.引言 随着互联网的飞速发展,图像捕获设备,如数码相机,图像扫描仪的可用性,数字图像的数量正在迅速增加。高效的图像检索,浏览和检索工具都要求用户从各种领域,包括遥感,时尚,预防犯罪,出版,医药,建筑等。为此,许多通用的图像检索系统已被开发。有两种主要类型:基于文本的图像检索和基于内容的图像检索。基于文本的方法可以追溯到20世纪70年代。在这样的系统中,图像标注的文字描述,然后利用数据库管理系统来实现图像检索。随着互联网的飞速发展,图像捕获设备,如数码相机,图像扫描仪的可用性,数字图像集的大小迅速增加。高效的图像检索,浏览和检索工具都需要来自不同领域,包括遥感,时尚,预防犯罪,出版,医药,建筑等用户。为了这个目的,许多通用的图像检索系统已被开发。有两种主要类型:基于文本的图像检索和基于内容的图像检索。基于文本的方法可以追溯到20世纪70年代到。在这种系统中,图像是由文本描述符,然后由一个数据库管理系统中用于实现图像检索手动标记。然而,随着万维网上的图像的迅速增长,有近重复图像近年来大量与这些图像降低基于内容的图像检索的效率。一个近似重复图像的清晰度取决于什么光度和几何变化被认为是可接受的。该应用程序从确切的重复检测,其中没有允许更改到需要的图像是同一场景的更为普遍的定义范围,但可能使用不同的观点和照明。近重复图像的几个样品中给出。附近检测在大型数据库中重复的图像应满足两个具有挑战性的限制。首先,对于给定的图像中,只有少量的数据可以被存储在计算机存储器中。其次,查询必须是很便宜的评估。理想情况下,列举的图像的所有副本应该有密切的复杂性在返回的重复数为线性。近年来,近重复图像检测的研究领域是一个热门话题,图像的视觉和机器学习。在下面的部分,我们将分析近重复图像检测研究的相关工作。郑等人在视觉显着黎曼空间呈现为近重复图像检测的框架。甲视觉显示性模型首先被用来识别图像的显着区域,然后各种图像特征的显着区域的协方差矩阵的计算。显着区域的协方差矩阵,它坐落在一个黎曼流形,作为一个强大的和紧凑的图像内容描述符。在文章中,作者总结了Web图像标注的大量工作,利用现有的网络上大型的元数据和社会信息化,并推出了一个名为阿里斯塔制度体系,这是于两个十亿网页中的图像建立了非参数图像标注的平台。之后,作者提出了一个高效的,可扩展的重复的搜索技术,以便在阿里斯塔系统可以部署在几个服务器上。一些有趣的应用程序,如建设大型明星脸数据库和文本到图像的平移也列在本文中。Sinjur提出了一种新颖,快速算法生成的网格点的凸层,线性时间复杂度。凸层提取二进制图像。所得到的凸壳的特征在于其顶点的数目,并作为代表图像特征。因此,一个计算几何的方法来近重复图像检测源于这些功能。为了解决传统附近重复的图像搜索系统的问题大多是建立在袋局部的特征表示,谢等人通过使用图形处理单元提出了一种新的框架。他们的方法在于以下几个方面的主要贡献: ( 1 )创造哈里斯黑森州一个新的快速局部特征检测器根据GPU的特性,旨在加速局部特征检测。 ( 2 )在每个局部特征的空间信息结合,以提高其鉴别力,提供半局部空间相干验证。 ( 3 )新的配对弱几何一致性约束算法来改进搜索结果。曹等人呈现同心圆基于图像的签名,这使得它能够靠近重复检测快速,准确的图像是通过从图像特征值的中心半径和角度的水平分区所使用的平均或变化的分区的子区域之间的计算分布于序列中的特征值是由哈希生成形成为图像签名的散列便于存储空间减少和快速匹配。周等人提出了一种新的几何编码算法中的局部特征的空间环境进行大规模的局部重复的Web图像检索编码。建议的几何编码是由几何方形编码和几何风扇编码,描述SIFT的空间关系特征为三个地理地图,全球核查消除几何不一致的SIFT匹配。本文在于以下几个方面的主要创新点:(1) SIFT描述符和视觉字模型用于表示图像的视觉特征。(2)为了减少整个计算过程的时间成本,局部性敏感散列被用于高维视觉特征映射到低维哈希桶空间。(3)图象的视觉相似性计算的任务转换为直方图的距离估计。(4)直方图距离是由求两个集合之间对分配的最小差值解决。尤其是,这一过程是通过确定两个集合,使得在成对的两个个体单元之间的所有差的和最小化之间最好1到1的分配来实现。II.提出的方案A. 视觉世界的模型概述视觉词汇模型已被广泛用于在计算机视觉领域。特别是,该模型有三个主要阶段: 1)提取局部特征描述符(如SIFT ),2)的量化的局部描述符到一个码本,3)的图像转换为一组视觉词。视觉词汇模型的结构包括四个部分: 1)构建图像训练集,2)构建视觉词词典,3)选择图像的视觉词和4 )获得的图像的视觉字频向量。我们提出的视觉词汇模型的核心思想是将图像特征的连续高维空间(如SIFT特征)量化为视觉词汇的特定词汇。这个过程是通过聚类是从大型图像数据集选择成多个簇的K-means算法的SIFT特征实现的。特别地,每个群集的质心被用作视觉词在给定的词汇。事后,当地的特征提取,然后分配到视觉上最接近的单词。下一个基于视觉词的每个类的数目的图像可以被表示为视觉词的直方图。B.算法描述通过在目标识别的最新进展后,我们可以通过尺度不变特征变换,这是一种有效的方法在计算机视觉研究领域,以检测图像的局部特征局部利益点描述符所代表的图像。 SIFT描述符可以产生成百上千的特征点。各关键点的SIFT特征是由一个128维向量组成。然而,随着维数灾难,更有效的方法是减少原始数据的维数。为了解决维数灾难的问题,我们利用当地敏感的散列算法是一种近似KNN算法对指数的局部描述符。想法是散列的输入项,这样类似的项目被映射到以高概率相同的桶。这个过程是由传统的散列函数,如那些在密码学中使用的不同作为这种情况下的目标是最大化类似的物品的“冲突”的可能性,而不是避免冲突。特别地,本地的敏感散列的结构示于图如图3所示,数据样本都通过局部性敏感散列算法映射到桶中。其次,地方敏感散列的定义给出在第一。用于设置与距离度量D中的项目域S,一个地方敏感散列家族被定义为:一个家庭H = H :S U】被称为( R, R,P, P2)为D-敏感的,如果对任意V, QE s如果已经B( Q,则P “ H ( Q) = H (五) 如果像素B( Q, R2 ),则PH值并h (Q) = H (V) P2和r R 。散列函数公顷, B( V) :路 - N的映射一维向量V到一个整数集系列中的每个哈希函数是由随机的a和b ,选择索引,其中一个是广告维随机向量自自主选择的条目。高斯分布和b是从0, R R定义的特征的量化和V是原始特征向量。散列过程之后,从一个高维向量空间中的初始向量可以是均匀的范围选择的实数映射到较低维数的离散子空间。我们的局部特征的基于图像相似性的测量方法可以归纳为以下五个步骤。步骤1:从I中提取的SIFT描述符和I ,并利用了视觉词模型来表示SIFT给定图像的描述。步骤2 :构建L LSH哈希表,每一个哈希表对应于一组的散列函数是在公式(1) ,这是非常简单的实现所定义。步骤3 :对于每一个哈希表中,k的散列函数,其中被表示为GL = , HL2 ,., HLK 。第4步:从步骤2中生成一个哈希表,SIFT描述符由这都与哈希表哈希函数映射到桶。步骤5 :在步骤4中,哈希表,由每个容器对应于哈希表的桶,该方法得到的直方图。执行上述步骤后,每个图像可被表示以L直方图。此外,基于视觉的一对图像的相似性的局部特征是通过估算直方图之间的距离计算。具体地讲,我们表示直方图集合图像I为HG ( )= T(I) ! | 1 L px if B(q,r2) then PHh(q) = h(v) p2 and r r .The hash function ha,b (V): Rd N maps a dimensional vector V onto a set of integers. Each hash function in the family is indexed by a choice of random a and b , where a is a d -dimensional random vector with entries chosen independently from a Gaussian distribution and b is a real number chosen uniformly from the range 0, r . r defines the quantization of the features and V is the original feature vector. After the hashing process, initial vectors from a higher dimensional vector space could be mapped to a discrete subspace of lower dimension. our local feature based image similarity measuring method can be summarized as the followin

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论