数据挖掘在图书馆个性化服务中的应用_第1页
数据挖掘在图书馆个性化服务中的应用_第2页
数据挖掘在图书馆个性化服务中的应用_第3页
数据挖掘在图书馆个性化服务中的应用_第4页
数据挖掘在图书馆个性化服务中的应用_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/7数据挖掘在图书馆个性化服务中的应用【摘要】随着信息技术的发展,数据挖掘技术在信息的利用和提取中发挥着日益重要的作用。本文通过对数据挖掘技术以及图书馆个性化服务相关内容的介绍,探讨了数据挖掘在数字化图书馆中的应用,说明数据挖掘技术在数字图书馆应用的必要性,以及在提升图书馆服务质量和服务水平方面的发挥的重要作用。【关键词】数据挖掘个性化服务数字图书馆一、数据挖掘技术概述数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、新颖的、可被人理解的、但又是潜在有用的模式的过程。其主要特点是对数据库中的大量数据进行抽取、转换、分析和其他模型化处理,从中提取辅助决策的关键性数据。数据挖掘根据其主要研究对象的数据结构形式的不同,一般分为数据挖掘、文本数据挖掘、WEB数据挖掘三类。1数值数据挖掘,通常称为数据挖掘,它的任务一般可以分为描述和预测两类,具体地说,挖掘功能包括发现概念/类描述、关联、分类、预测、聚类、趋势分析、偏差分析和类似性分析。常见的数据挖掘方法主要有归纳学2/7习方法、仿生物技术、公式发现、统计分析方法、模糊数学方法、决策树、遗传算法、贝叶斯信念网络、粗糙集及可视化技术等,由于各种方法都有自身的功能特点以及应用领域。文本数据挖掘是面向文本信息的数据挖掘。当数据挖掘的对象完全由文本类型组成时,结合使用数据挖掘算法与信息检索算法对巨量文本信息进行自动化信息处理与分析的过程叫文本数据挖掘。它包括特征提取、文本摘要、文本分类与聚类、概念操作以及探索性数据分析等工作。LOCALHOST文本数据挖掘所应用的技术包含用于表示文档的词频反文献频率向量表示法、词串表示法,用于文本分类的贝叶斯分类算法、词集合算法,基于概念的文本聚类算法以及K最近邻参照分类算法等。基于WEB的数据挖掘。WEB数据挖掘的定义是针对包括WEB页面内容、页面之间的结构、用户访问信息、电子商务信息等在内的各种WEB数据,应用数据挖掘方法以发现有用的知识来帮助人们从WWW中提取知识,改进站点设计,更好地开展电子商务。通过WEB数据挖掘,我们可以从数以亿计存储大量多种多样信息的WEB页面中提取出我们需要的有用的知识,包括用户访问行为、频度、内容等内容,根据这些内容和知识,来改进站点设计,优化我们的WEB页面,包括页面3/7内容安排、页面间关联结构优化以及开展有针对性活动和特色服务内容等,使更多用户能够更方便、更快捷的找到所需要的信息和享受到所提供的服务。WEB数据挖掘在数字图书馆的开发和利用将发挥越来越重要的作用。根据WEB数据挖掘对象的不同可分为WEB结构挖掘、WEB内容挖掘和WEB日志。二、图书馆的个性化服务概述所谓个性化服务,就是服务要体现个性,同时具有主动性的特点,实现个性化服务的关键是在“信息找人”过程中什么信息找什么人。其本质就是对于不同的人、不同的要求提供不同的服务,以满足不同用户的特定需求。常见的服务方式有个性化推荐、个性化检索、个性化网站。个性化推荐服务如信息推送服务,一种按用户指定时间或发生的事件把用户选定的数据自动发送给用户的技术,其本质就是主动性服务,几乎不需要用户做什么事,系统自动按照用户的信息需求提供相应的服务。个性化主动服务将使用户通过尽可能小的努力获得尽可能好的服务。数字图书馆的个性化信息服务首先就是要为用户创建个性化的信息资源库,即个人数据库。通过图书馆网络,用户向图书馆系统提交所定制的个性化信息,用于构建个人信息数4/7据库,建立个性化网站。针对不同的个人信息,即对不同的用户采用不同的服务策略,提供不同的服务内容,如提供个人书架和信息检索服务等,不同人的个人书架内容是不完全相同的;对于相同的检索提问,系统反馈给专家的以及普通用户的内容应该有所区别的。三、数据挖掘在图书馆个性化服务中应用1优化馆藏资源配置,提高资源利用率传统图书馆资源的配置、服务的提供,由于受人工采集信息的影响,因此不可避免的受到采集者的知识层次、知识结构以及个人爱好等因素的影响,而带有主观性。采用数据挖掘技术则可以较好的解决这一问题。1利用数据挖掘技术,对流通记录、检索请求等日志数据进行分析,就可以得到各类文献流通借阅情况,了解读者的借阅行为和爱好。根据这些信息,有针对性的补充和丰富文献资源,剔除过时文献资源,或减少文献信息资源的副本数,甚至可以根据这些挖掘信息,调整图书馆的人力、物力资源的分配,从而达到资源优化配置,合理布局目的。2对数字图书馆的结构进行挖掘,目的是发现数字图书馆页面的结构和结构模式,在此基础上对页面进行分类和聚类,或对相关网页进行分析,从而可以评价网页的质量,优化检索方式,指导网站建设,便利用户对数字图书馆使用,提高5/7数字图书馆的利用率。完善信息资源建设,提升个性化服务质量通过对流通记录、检索请求等日志信息的挖掘,所得到的信息,可以对图书馆的读者群有一定的了解,但对于完善信息资源建设,提升个性化服务质量,还是不够的。完善信息资源建设,需要多方面的收集信息资源,提升个性化服务质量,就需要对读者有一个比较准确和全面的了解,在前面提到的数据挖掘的基础上,还要从以下几个方面进行挖掘1对数字图书馆的内容进行挖掘。基于数字图书馆的内容的挖掘是通过对数字图书馆信息的模式识别和分析理解,从中发现有意义的知识。根据某一领域的信息需求,自动捕捉、采集和整理领域所需信息,过滤无用冗余信息,通过信息推送等方式,直接数据挖掘所发现的知识,提供给读者,主动提供个性化服务。2对数字图书馆的用户进行挖掘。从数字图书馆的大量访问信息中挖掘用户的访问模式、访问兴趣,采用关联性法则和聚类方法发现不同的用户群体,然后对这些不同的群体提供信息定制服务。同时还可以利用WEB挖掘所得到的信息,动态地调整WEB页面,更好地满足读者的需要。通过对用户访问信息、使用信息的挖掘,在数字对象和用户、对象分类和主题之间进行模式匹配,采用不同挖掘技术自动提取知识,从而确定个性6/7化服务内容,提高为用户知识服务的自动化水平。3此外,收集整理图书馆网上咨询、荐购书刊等栏目中的数据,利用数据挖掘技术,可以预先发现读者群体的兴趣,调整馆藏方向,提升馆藏资源的针对性。四、结束语随着信息技术的发展,特别是数据挖掘技术和数据库技术的在图书馆领域中的应用,对图书馆界产生了深远的影响,不仅是观念上的革新,而且潜移默化了传统图书馆的用户服务模式。伴随智能化技术的进展,个性化服务有着相当广阔的前景。如何提供优质的个性化信息服务应当是我们始终共同关注的焦点。参考

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论