搜索引擎语义排序的研究与实现-演示文稿_第1页
搜索引擎语义排序的研究与实现-演示文稿_第2页
搜索引擎语义排序的研究与实现-演示文稿_第3页
搜索引擎语义排序的研究与实现-演示文稿_第4页
搜索引擎语义排序的研究与实现-演示文稿_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

搜索引擎语义排序的研究与实现,研究背景和意义,互联网计算机技术飞速发展信息定位PageRank Google公司的最核心算法,搜索引擎介绍,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。,研究现状,基于网页内容分析的排序基于超链接结构分析进行排序 Pagerank算法是目前被认为最为成功的一种链接分析方法,Pagerank的介绍,互联网发展早期的搜索引擎, 对Web页面的排序, 是根据搜索的词组(短语)在页面中的出现次数(Occurence) ,并用页面长度和HTML标签的重要性提示等进行权重修订。链接名气(Link Popularity) 技术通过其它文档链接到当前页面(InboundLinks)的链接数量来决定当前页的重要性, 这样可以有效地抵制被人为加工的页面欺骗搜索引擎的手法。PageRank算法是通过对互联网络超链接拓扑结构的挖掘,获取互联网络中的权威网页, 在用户查询时将相关领域内的权威网页作为查询结果推荐给用户, 提高用户查询的质量。,Pagerank算法过程步骤,基本原理 PageRank有效地利用了Web所拥有的庞大链接构造的特性。PageRank算法简单模型 Bu = 所有链接到页面u的页面 |u| = 页面u的超链接总数 其中R(u)为网页u的PageRank值。,Pagerank算法过程步骤,PageRank算法模型,计算PageRank值,矩阵模型 aij = 1 if (从页面i 向页面j有链接的情况) 0 if (从页面i 向页面j没有链接的情况)PageRank矩阵矩阵的转置(被多少外链引入)R = C MT R + CE = C( MT R + E )(R的范数为1)R = C( MT + E * 1 ) R 求以R为特征根的矩阵方程,举例说明,举例说明,举例说明,文献检索系统,文献检索系统,文献检索系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论