网络信息重组与知识挖掘_第1页
网络信息重组与知识挖掘_第2页
网络信息重组与知识挖掘_第3页
网络信息重组与知识挖掘_第4页
网络信息重组与知识挖掘_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,网络信息重组与知识挖掘,主要内容,网络信息重组,网络知识挖掘,黄如花理想的网络信息组织模式应该以用户为中心,遵循实用性和易用性原则,综合运用自然语言和人工语言(分类语言、主题语言),充分利用新兴技术和人类经验的积累,朝着更符合用户需要的方向发展。,信息重组,所谓信息重组,是在根据对源信息所含知识内容进行分析解构的基础上,运用一定的科学方法将源信息或解构所得信素进行重新组合,从而得到新的信息产品,实现信息增值的过程。,信息重组的含义,信息重组的分类,时间跨度大,时间跨度小,空间跨度大,空间跨度小,信息重组的途径,指引库也称为导航库,是指所建立的信息库,从物理上讲并不存储各种实际的信息资源,它存放的是有关主题的数据库或服务器的地址等信息,可指引用户到特定的地址获取所需的信息。,虚拟图书馆虚拟图书馆是一种网络信息利用工具。它针对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。,网络知识挖掘,网络知识挖掘挖掘是指从大量的万维网文档集合中发现蕴涵的、未知的、有潜在应用价值的、非平凡的模式。它所处理的对象包括:静态网页(文字、多媒体信息等)、Web数据库、Web页面的内部结构、Web结构、用户使用记录等信息。通过对这些信息的挖掘,可以得到仅通过文字检索所不能得到的信息。,网络知识挖掘的分类,内容挖掘,Web内容挖掘(WebContentMining,WebCM)是指对Web上大量文档集合的“内容”进行总结、分类、聚类、关联分析以及利用万维网文档进行趋势预测等,是从Web文档内容或其描述中抽取知识的过程。可分为内容挖掘和多媒体挖掘两部分。,结构挖掘,Web结构挖掘(WebStructureMining,WebSM)主要是从Web组织结构和链接关系中推导信息、知识。挖掘页面的结构和Web结构,可以用来指导对页面进行分类和聚类,找到权威页面、中心页面,从而提高检索的性能:同时还可以用来指导网页采集工作,提高采集效率。可分为文档间挖掘和内容结构挖掘。,用户使用记录挖掘,Web用户使用记录挖掘(WebUsageMining,WebUM)主要是想从用户的访问日志中抽取感兴趣的模式。分析这些日志数据可以帮助理解用户的行为,从而改进站点的结构或为用户提供个性化的服务。这方面的研究主要有两个方向:一般的用户访问模式跟踪(GeneralAccessPatternTracking)和个性化的使用记录跟踪(CustomizedUsageTracking)。,Web日志分析流程,信息推送技术,信息推送技术(Push技术),即个性化信息服务,是网络信息组织和检索一个非常重要的发展模式。从技术上看,Push技术是一个基于Internet/Intranet网络环境的高度专业化、智能化的网络专题信息服务系统。基于Push技术的系统不仅能够了解、发现用户的兴趣(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论