会员注册 | 登录 | 微信快捷登录 支付宝快捷登录 QQ登录 微博登录 | 帮助中心 人人文库renrendoc.com美如初恋!
站内搜索 百度文库

热门搜索: 直缝焊接机 矿井提升机 循环球式转向器图纸 机器人手爪发展史 管道机器人dwg 动平衡试验台设计

   首页 人人文库网 > 资源分类 > PDF文档下载

基于后缀树的互联网信息检索系统的实现.pdf

  • 资源星级:
  • 资源大小:236.68KB   全文页数:20页
  • 资源格式: PDF        下载权限:注册会员/VIP会员
您还没有登陆,请先登录。登陆后即可下载此文档。
  合作网站登录: 微信快捷登录 支付宝快捷登录   QQ登录   微博登录
友情提示
2:本站资源不支持迅雷下载,请使用浏览器直接下载(不支持QQ浏览器)
3:本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

基于后缀树的互联网信息检索系统的实现.pdf

基于后缀树的互联网信息检索基于后缀树的互联网信息检索福建福建师大师大附中附中吴连龙吴连龙wllwll.namehttp//www.mydrs.org提提纲纲互联网信息服务现状互联网信息服务现状信息查询系统的设计信息查询系统的设计后缀树与后缀数组算法后缀树与后缀数组算法信息检索系统的实现信息检索系统的实现对等网信息查询系统对等网信息查询系统结束语结束语互联网信息服务现状互联网信息服务现状互联网信息飞速增长互联网信息飞速增长z中国www站点数超过62万个z上网用户总数达8700万人(CNNIC,2004)网络信息服务面临挑战网络信息服务面临挑战z挑战挑战1反应速度z迅速从海量信息中获得指定信息z及时跟踪信息的动态变化z挑战挑战2用户需求z查找特定的主页或网页点z获得同主题的相关站点面z挑战挑战3自主个性z主动向用户推送信息z提供个性化信息服务搜索引擎技术搜索引擎技术网络信息网络信息搜索技术搜索技术z国际国际在ACM学报和论文集中有许多这方面的文章,Arasu等发表在ACMTransactionsonInternetTechnology2001,v1,No1上题为SearchingtheWeb的论文提出搜索引擎的主要技术主要技术网页抓取技术,web信息挖掘技术,存储与索引技术,搜索与查询技术,查询结果评价技术等。z国内国内北大天网、华工木棉百度、中搜、一搜、搜狗倒排文件机制倒排文件机制z面向单词,建立在语言词库词库的基础上z拆分短语,进行复杂的集合集合运算z查询结果的准确性和完整性依赖于中文分词分词的效果信息查询系统的设计框架信息查询系统的设计框架信息需求查询Web信息索引排序策略结果集合单一搜索引擎单一搜索引擎查询数据源1融合策略结果集合数据源2数据源n复合搜索系统复合搜索系统倒排倒排文件文件后缀树后缀树并行分布并行分布散列分配散列分配对等网对等网兴趣组兴趣组后缀树的研究与应用后缀树的研究与应用后缀树的出现后缀树的出现zWeiner于1973年提出,McCreight在1976年和Ukkonen在1992,1995年进一步完善算法。zE.M.McCreight.ASpaceeconomicalSuffixTreeConstructionAlgorithm.J.ACM,232262272,1976后缀树的应用后缀树的应用z字符串处理zDNA序列比对z文本聚类zXML结构索引后缀树的实例后缀树的实例字符串science的7个后缀字符串分别是Suffix1scienceSuffix2cienceSuffix3ienceSuffix4enceSuffix5nceSuffix6ceSuffix7e对字符串science建立的后缀树如下|1science||3ience|2,6c|||7eRoot||3ience|4ence|5nce后缀字符串按字典顺序排序后的结果是Suffix6ceSuffix2cienceSuffix7eSuffix4enceSuffix3ienceSuffix5nceSuffix1science后缀树构建后,不仅使字符串更加紧凑,还可以高效地实现比如子串查找、最长重复子串、最长公共子串、回文子串等众多功能。

注意事项

本文(基于后缀树的互联网信息检索系统的实现.pdf)为本站会员(abaodong)主动上传,人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知人人文库网([email protected]),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。

copyright@ 2015-2017 人人文库网网站版权所有
苏ICP备12009002号-5