基于后缀树的互联网信息检索系统的实现.pdf基于后缀树的互联网信息检索系统的实现.pdf

收藏 分享

资源预览需要最新版本的Flash Player支持。
您尚未安装或版本过低,建议您

基于后缀树的互联网信息检索基于后缀树的互联网信息检索福建福建师大师大附中附中吴连龙吴连龙WLLWLLNAMEHTTP//WWWMYDRSORG提提纲纲互联网信息服务现状互联网信息服务现状信息查询系统的设计信息查询系统的设计后缀树与后缀数组算法后缀树与后缀数组算法信息检索系统的实现信息检索系统的实现对等网信息查询系统对等网信息查询系统结束语结束语互联网信息服务现状互联网信息服务现状互联网信息飞速增长互联网信息飞速增长Z中国WWW站点数超过62万个Z上网用户总数达8700万人(CNNIC,2004)网络信息服务面临挑战网络信息服务面临挑战Z挑战挑战1反应速度Z迅速从海量信息中获得指定信息Z及时跟踪信息的动态变化Z挑战挑战2用户需求Z查找特定的主页或网页点Z获得同主题的相关站点面Z挑战挑战3自主个性Z主动向用户推送信息Z提供个性化信息服务搜索引擎技术搜索引擎技术网络信息网络信息搜索技术搜索技术Z国际国际在ACM学报和论文集中有许多这方面的文章,ARASU等发表在ACMTRANSACTIONSONINTERNETTECHNOLOGY2001,V1,NO1上题为“SEARCHINGTHEWEB”的论文提出搜索引擎的主要技术主要技术网页抓取技术,WEB信息挖掘技术,存储与索引技术,搜索与查询技术,查询结果评价技术等。Z国内国内北大天网、华工木棉;百度、中搜、一搜、搜狗倒排文件机制倒排文件机制Z面向单词,建立在语言词库词库的基础上Z拆分短语,进行复杂的集合集合运算Z查询结果的准确性和完整性依赖于中文分词分词的效果信息查询系统的设计框架信息查询系统的设计框架信息需求查询WEB信息索引排序策略结果集合单一搜索引擎单一搜索引擎查询数据源1融合策略结果集合数据源2数据源N复合搜索系统复合搜索系统倒排倒排文件文件后缀树后缀树并行分布并行分布散列分配散列分配对等网对等网兴趣组兴趣组后缀树的研究与应用后缀树的研究与应用后缀树的出现后缀树的出现ZWEINER于1973年提出,MCCREIGHT在1976年和UKKONEN在1992,1995年进一步完善算法。ZEMMCCREIGHTASPACEECONOMICALSUFFIXTREECONSTRUCTIONALGORITHMJACM,232262272,1976后缀树的应用后缀树的应用Z字符串处理ZDNA序列比对Z文本聚类ZXML结构索引后缀树的实例后缀树的实例字符串“SCIENCE”的7个后缀字符串分别是SUFFIX1SCIENCESUFFIX2CIENCESUFFIX3IENCESUFFIX4ENCESUFFIX5NCESUFFIX6CESUFFIX7E对字符串“SCIENCE”建立的后缀树如下|1SCIENCE||3IENCE|2,6C|||7EROOT||3IENCE|4ENCE|5NCE后缀字符串按字典顺序排序后的结果是SUFFIX6CESUFFIX2CIENCESUFFIX7ESUFFIX4ENCESUFFIX3IENCESUFFIX5NCESUFFIX1SCIENCE后缀树构建后,不仅使字符串更加紧凑,还可以高效地实现比如子串查找、最长重复子串、最长公共子串、回文子串等众多功能。
编号:201311221636143624    类型:共享资源    大小:236.68KB    格式:PDF    上传时间:2013-11-22
  
8
关 键 词:
管理 组织 经营
  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:基于后缀树的互联网信息检索系统的实现.pdf
链接地址:http://www.renrendoc.com/p-113624.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

网站客服QQ:2846424093    人人文库上传用户QQ群:460291265   

[email protected] 2016-2018  renrendoc.com 网站版权所有   南天在线技术支持

经营许可证编号:苏ICP备12009002号-5