信息检索 图片相似搜索.pptx_第1页
信息检索 图片相似搜索.pptx_第2页
信息检索 图片相似搜索.pptx_第3页
信息检索 图片相似搜索.pptx_第4页
信息检索 图片相似搜索.pptx_第5页
免费预览已结束,剩余19页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图片相似搜索 相似搜索实例 百度识图Google图片淘宝找相似tineye识图 图像搜索的算法 一般是三个步骤 将目标图片进行特征提取 描述图像的算法很多 用的比较多的是 SIFT描述子 指纹算法函数 bundlingfeatures算法 hashfunction 散列函数 等 也可以根据不同的图像 设计不同的算法 比如图像局部N阶矩的方法提取图像特征 将图像特征信息进行编码 并将海量图像编码做查找表 对于目标图像 可以对分辨率较大的图像进行降采样 减少运算量后在进行图像特征提取和编码处理 相似度匹配运算 利用目标图像的编码值 在图像搜索引擎中的图像数据库进行全局或是局部的相似度计算 根据所需要的鲁棒性 设定阈值 然后将相似度高的图片预保留下来 最后应该还有一步筛选最佳匹配图片 这个应该还是用到特征检测算法 相似图片搜索的简单原理 这种技术的原理是什么 计算机怎么知道两张图片相似呢 博士的解释 原理非常简单易懂 我们可以用一个快速算法 就达到基本的效果 这里的关键技术叫做 感知哈希算法 Perceptualhashalgorithm 它的作用是对每张图片生成一个 指纹 fingerprint 字符串 然后比较不同图片的指纹 结果越接近 就说明图片越相似 下面是一个最简单的实现 第一步 缩小尺寸 将图片缩小到8x8的尺寸 总共64个像素 这一步的作用是去除图片的细节 只保留结构 明暗等基本信息 摒弃不同尺寸 比例带来的图片差异 第二步 简化色彩 将缩小后的图片 转为64级灰度 也就是说 所有像素点总共只有64种颜色 第三步 计算平均值 计算所有64个像素的灰度平均值 第四步 比较像素的灰度 将每个像素的灰度 与平均值进行比较 大于或等于平均值 记为1 小于平均值 记为0 第五步 计算哈希值 将上一步的比较结果 组合在一起 就构成了一个64位的整数 这就是这张图片的指纹 组合的次序并不重要 只要保证所有图片都采用同样次序就行了 将上一步的比较结果 组合在一起 就构成了一个64位的整数 这就是这张图片的指纹 组合的次序并不重要 只要保证所有图片都采用同样次序就行了 8f373714acfcf4d0得到指纹以后 就可以对比不同的图片 看看64位中有多少位是不一样的 在理论上 这等同于计算 汉明距离 Hammingdistance 如果不相同的数据位不超过5 就说明两张图片很相似 如果大于10 就说明这是两张不同的图片 具体的代码实现 可以参见Wote用python语言写的imgHash py 代码很短 只有53行 使用的时候 第一个参数是基准图片 第二个参数是用来比较的其他图片所在的目录 返回结果是两张图片之间不相同的数据位数量 汉明距离 这种算法的优点是简单快速 不受图片大小缩放的影响 缺点是图片的内容不能变更 如果在图片上加几个文字 它就认不出来了 所以 它的最佳用途是根据缩略图 找出原图 实际应用中 往往采用更强大的pHash算法和SIFT算法 它们能够识别图片的变形 只要变形程度不超过25 它们就能匹配原图 这些算法虽然更复杂 但是原理与上面的简便算法是一样的 就是先将图片转化成Hash字符串 然后再进行比较 百度识图 百度识图是 一款基于内容的图像搜索 content basedimageretrieval a k a CBIR 引擎 不同于传统图像搜索引擎依靠用户输入关键字匹配图片周边文本进行搜索 百度识图允许用户上传本地图片或输入网络图片的URL地址 通过对相应图片进行图像特征抽取并进行检索 找到互联网上与这张图片相同或相似的其它图片资源 同时为用户找到这张图片背后的相关的信息 2010年12月13日 百度识图测试版上线 到今天已经可以为用户提供以下功能 相同图像搜索通过图像底层局部特征的比对 百度识图具备寻找相同或近似相同图像的能力 并能根据互联网上存在的相同图片资源猜测用户上传图片的对应文本内容 从而满足用户寻找图片来源 去伪存真 小图换大图 模糊图换清晰图 遮挡图换全貌图等需求 全网人脸搜索在第一版推出后的两年 百度识图进行了第一次重大升级 据统计 互联网上约15 的图片包含人脸 为了优化人脸图片的搜索效果 百度识图引入自主研发的人脸识别技术 推出了全球第一个全网人脸搜索功能 该功能可以自动检测用户上传图片中出现的人脸 并将其与数据库中索引的全网数亿人脸比对并按照人脸相似度排序展现 帮你找到更多相似的TA 该功能上线后获得了新浪科技 搜狐IT 36氪等多家科技媒体的第一时间热烈报道 解放日报甚至进行了专访并开辟了相关专栏报道 基于人脸搜索技术的百度魔图 PK大咖 功能 以单日最高访问量9000万次创造了人脸识别技术使用的纪录 并斩获2013年艾菲奖大中华区金奖 成为技术与产品结合的典范 相似图像搜索基于百度领先的深度学习算法 百度识图拥有超越传统底层特征的图像识别和高层语义特征表达能力 2013年 百度识图继续加快功能升级与新增的步伐 推出了一般图像的相似搜索功能 能够对数十亿图片进行准确识别和高效索引 从而在搜索结果的语义和视觉相似上都得到很好的统一 从相同图像搜索 nearduplicateimagesearch 到相似图像搜索 similarimagesearch 百度识图首次突破了长期以来CBIR问题的困境 在解决图像的语义鸿沟这个学术界和工业界公认的难题上迈出了一大步 该技术极大优化了识图产品的用户体验 借由相似图像搜索 用户可以轻松找到风格相似的素材 同一场景的套图 类似意境的照片等等 这些都是相同图像搜索无法完成的任务 图片知识图谱知识图谱是下一代搜索引擎的趋势 通过对query更精确的分析和结构化的结果展示 更智能的给出用户想要的结果 百度识图除了返回给用户相同 相似搜索结果 也在图片知识图谱方面做出了相应的尝试 2013年百度识图相继上线了美女和花卉两个垂直类图片搜索功能 通过细粒度分类技术 fine grainedclassification 在相应的垂直类别中进行更精准的子类别识别 比如告诉用户上传的美女是什么风格并推荐相似风格的美女写真 或识别花卉的具体种类 给出相应百科信息并把互联网上相似的花卉图片按类别排序展现 这些尝试都是为了帮助用户更直观了解图片背后蕴藏的知识和含义 Google图片 Google图片搜索引擎最近有了新的动作 搜索不但可以按照尺寸来区分 同时还提供了类型 脸部特写 照片 剪贴画 素描画 所有颜色 全彩图片 黑白图片 特定颜色 可以自己选的 共计12中色彩 看来Google图片搜索不仅仅是图片描述文字的搜索 还可以从图片色彩来搜索 是一个蛮大的进步 这些过滤器功能曾经大部分隐藏在高级图片搜索 但现在这些选项直接显示在搜索框下 不过有一项图片使用权限的过滤器仍旧隐藏在高级图片搜索虽然Yahoo和Bing斗有类似的颜色过滤器选项 然而Google显然高级得多 Google允许你搜索十二种不同颜色的图片 Bing和Yahoo却只能让你搜索黑白或者彩色的图片 Google此次行动可能是对Yahoo为图片搜素增加观光功能的回应 谷歌的图片搜索是基于图片名称 指向图片的锚文本内容 以及紧邻图片的说明等文字关键字搜索 当用户搜索图片时 页面会返回一系列符合关键字的图片缩略图 在点击缩略图后 该图片会突出显示在以出处网页为背景的一个页面上 用户可以关闭该图片 直接访问来源网站 也可以查看全尺寸的搜索结果图片 1如何找到Google图像搜索 在Google的高级搜索页上以及搜索首页中都可以找到图像搜索 要访问它 必须在使用偏好页上将界面语言设置为英语 2图像是否有相关的版权限制 由Google图像搜索服务提供的图像可能受版权保护 虽然您可以从Google找到这些图像 但除了可以在网页上查看之外 Google并未授权您将这些图像用于其它任何用途 因此 如果您需要使用通过Google找到的任何图像 我们建议您先与原作者联系并征求同意 3为什么Google将图像显示在框架中 使用顶部框架 用户可以看到比缩略图稍微放大的图像 并且显示图像的URL 单击顶部框架中的图像即可链接到实际的 jpg或 gif文件 底部的框架则显示图像的原始环境 谷歌图片搜索常见问题解答 4如何使用图像搜索 要使用图像搜索 只需在图像搜索框内键入您的查询 然后按 搜索 按钮或点击键盘上的回车键即可 看到搜索结果页后 单击要查看的图片的缩略图 这样就会看到放大的图像 还可以看到原始图像所在的页面 5怎样避免看到不当的儿童不宜的内容 在您第一次进行搜索时 缺省情况下 Google图像搜索就会使用一个儿童不宜内容过滤器 这个过滤器能够去除许多儿童不宜的图像 但不保证能够完全过滤掉这样的内容 要关闭此过滤器 单击显示 启用儿童不宜内容过滤器 的链接即可 我们无法100 地确保只要使用过滤器就能够在图像搜索的结果中去除所有儿童不宜的内容 6Google的儿童不宜内容过滤器是否对所有语言都有效 不是 目前Google的儿童不宜过滤器只对英语内容有效 7如何关闭儿童不宜内容过滤器 在搜索结果页上的图像搜索框下方 有一个链接可用于关闭儿童不宜内容过滤器 单击该链接 用户就可以在打开或关闭此过滤器 一旦关闭儿童不宜内容过滤器 在这次搜索的其余部分乃至下一次访问Google图像搜索时 该过滤器都会保持关闭状态 8图像搜索的工作原理是什么 Google分析页面上图像附近的文字 图像标题以及许多其它元素来确定图像的内容 Google还使用复杂的算法来删除重复的内容 并确保在搜索结果中首先显示质量最好的图像 9如何去除不想看到的版权图像 要从Google图像搜索中去除版权图像 请转到相关页面 1 这一页上有相关的指导信息 告诉您如何通知我们要去除的版权图像 10单击图像后 Google为什么将它显示在框架中 Google将图像显示在框架中的目的是让用户可以同时看到图像及其相关页面 这样用户就可以看到图像在它原来所在页面上的环境了 11如何搜索具有特定文件类型扩展名的图像 在高级搜索框中 您可以通过在查询中使用 filetype 来指定文件类型扩展名 例如 如果要查看格式为 jpg的花朵 flower 的图像 则在搜索框中输入 flowerfiletype jpg 12我知道网上有一个图像 但搜索时却找不到 为什么 使用Google图像搜索您可以搜索超过几十亿个图像 但是 Internet上仍然还有很多图像尚未添加到Google的索引中 Google一直尽力漫游到更多的图像 从而使您能够在搜索结果中看到质量更好 数量更多的图像 因此您要找的图像很可能很快就会添加进来 Google图片搜索的10条技巧1 如果你想知道一个人是哥们还是姐们 从名字上是看不出来的 图片搜索一下就可以弄清楚了 2 如果一个单词的意思你不知道 看看图片可能就会理解 3 搜索Flickr相册更好的工具 Google正是利用其他网站链接到lickr相册的信息才显得更强大 4 看看上面贴的图片就可以知道一个网站是不是有劲了 你可以用这款小工具来自动检测 5 要给自己的桌面找壁纸只要把搜索先定为大图片就可以了 利用这一工具你根本不用自己动手 6 利用数码相机的标准名称搜索随机的私人图片 7 输入一个画家的名字你就上了一堂美术课 8 安装这款greasemonkey脚本 点击一下缩略图就可以查看一张图片的原始文件了 9 找出一个词的颜色 词的颜色是一款Windows软件 它使用Google的图片搜索来确定一个或者一组单词的颜色 它先把搜索结果的前9张图片提取出来 然后分析每一个像素 计算每种色调的比率 然后转化为颜色 10 如果你打算把搜索结果都抓下来 GoogleGrab正是一款可以从Google图片搜索里下载图片的工具 甚至还支持批量搜索 第一种 找相似 当我们搜索一个关键词 T恤 时 鼠标放某款商品图片上 会出现这样的画面 淘宝找相似 同款 点击 找相似 后 出来的都是相似的商品 如下图 这个 找相似 跟商品标题 以及商品填写的属性有关 找相似 会按照宝贝的属性及标题里的属性关键词来匹配相似度高的商品 录入到 找相似 页面的 并在里面做相关展示 所以商家在发布商品时 最好尽量填写完整商品属性 这样有利于录入到找相似或找同款里 有利于搜索 这个找相似是按照什么匹配的呢 其实也很简单 看下面的对比图 产品参数和宝贝标题 第二种 找同款 其实 找同款 跟 找相似 的道理类似 搜索某个关键词后 出现图片点击 找同款 后 看下文 为什么有的商品搜索页面点击找同款上面的字是灰色的 用不了找同款功能 贴士 相同的商品 系统参考最多的是商品的主图 商品标题及商品属性 其中主

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论