




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、智能算法在图书管理系统中的应用研究摘 要 智能算法在管理大型数据库及挖掘其中有效知识方面 具有良好的性能,因此,众多研究人员将该类算法引入到提升图书 管理系统性能的研究中。本文将介绍几类基于关联分析技术和基于 聚类分析技术的智能算法,并展望未来智能算法在图书管理系统中 的应用前景。关键词 智能算法 图书管理系统 关联分析 聚类分 析1. 引言随着图书馆馆藏资源的不断增加,图书馆资源管理的难度也不断 加剧。从上世纪八十年代图书馆管理的自动化变革开始到如今大多 数图书馆自动化管理系统的使用时间均已超过 15年。在 15年间产 生的各类历史数据如资源搜索记录、读者借阅记录、图书采购记录 等, 已变成
2、一笔宝贵的财富, 然而, 受到现有管理系统功能的限制, 这些数据仅能作简单的存储及查询,其无法进行开发利用。在对图 书管理系统的多年开发和研究中,人们发现各类智能算法的数据挖 掘能力将能够大大提升图书管理系统的管理能力及对数据的利用 深度。本文将概括介绍近年来提到的一些智能算法在图书管理系统 中的应用实例,并展望智能算法在图书管理系统中的应用前景。 2. 智能算法在图书管理系统中的应用智能算法是指在各类复杂问题中,能够从大量复杂、模糊、随机的应用数据中找出数据产生规律,并对其进行自我启发式优化的计 算机算法。通过智能算法从各类大型管理系统的数据库中挖掘出来 的规律和知识可以用在查询响应、 决策
3、支持、 信息管理等许多方面。 通过研究人员多年的研究,该类算法在图书馆系统中的应用研究已 取得一定成果,本部分将着重介绍几类经常被提到的算法利用方式 及实验效果。2.1 关联分析算法关联规则挖掘技术由 r.agrawal 于 1993年提出,其强大的数据挖 掘能力,在金融业、工业领域及图书管理系统等大型数据库中得到 充分运用 1。关联规则分析技术算法的主要思想是首先寻找给定数据集中的频 繁项集,然后通过频繁项集生产强关联规则 2。在针对图书管理 系统的应用研究中,其主要包含三个步骤:第一步:将相关读者数 据经过预处理形成读者数据事务库;第二步,迭代识别事务数据库 中所有支持度不低于用户设定阀值
4、 min_sup的频繁项集;第二步, 在频繁项集中构造所有满足最小置信度阀值 min_conf的关联规则, 得到相应的读者行为规律。算法的复杂度主要受到项数、事务数、 事务平均宽度等因素限制,因此在实际应用中存在以下缺陷:频繁 扫描数据库、不适用于稠密集的关联规则挖掘、可能生成的关联规 则过于庞大等。针对这些缺陷,近年来不少学者提出了改进策略, 如基于逆向运算的优化策略、基于哈希表的优化策略、基于划分的优化策略等 3。在关于将关联分析算法应用到图书管理系统的研 究中,主要包括以下几类:(1 2009年鲍静提出了一类基于数据预处理技术和经典关联分析 方法 apriori 算法的读者借阅挖掘工具,
5、并利用该工具对安徽省图 书馆图书流通数据进行关联挖掘,仿真实验结果表明,通过引入兴 趣度对挖掘出的关联规则进行分析,证明该读者借阅挖掘工具可以 实现对读者兴趣度的分析,从而帮助图书馆馆员为读者提供个性化 服务 4;(2 2010年陈康提出利用改进的 eclat 算法设计图书推荐系统, 该改进算法源自 zaki 提出的一种比较典型的深度优先搜索和交叉 计数的频繁模式挖掘算法。改进算法充分利用了垂直数据表示和交 叉技术的高效优势,直接在垂直数据表示的数据集上通过广度优先 搜索和交叉计数产生频繁项集。仿真实验结果表明该算法可以在大 数据量的情况下实现关联规则的高效挖掘,产生的知识库在图书推 荐系统中
6、取得了良好的应用效果 5;(3 2011年林郎蝶、王灿辉提出了一类基于划分优化策略的改进 apriori 算法 l-apriori 算法,该算法利用中国图书馆分类 法将图书按分类号信息进行分类形成子图书馆,算法首先在各子 图书馆中进行关联规则的挖掘,再将所挖掘到的关联规则进行整 合,从而得到最终的挖掘结果 3。该算法的优势在于通过划分优 化后, l-apriori 算法的空间复杂度仅为 apriori 算法的 1/n,其中 n 为子图书馆的个数。2.2 聚类分析算法聚类分析(cluster analysis是数据挖掘技术中的一种典型方 法,该类算法可在要划分的类未知的情况下,将数据对象分组成不
7、 同的类。聚类的基本方法在建立基于分析对象的数据矩阵或相异度 矩阵中,通过计算对象之间的距离来衡量对象之间的相似性或相异 性,从而对数据对象进行分类。由于该技术仿真了一个无监督的学 习过程,因此被广泛应用于各类大型数据库中。现有的聚类技术种 类很多,主要有层次方法、划分方法、基于密度的方法、基于网格 的方法、基于模型的方法等 2。目前,在针对图书管理系统的研 发中,研究人员尝试将多种基于聚类分析技术的算法使用在图书管 理系统中,并在仿真实验中取得了一些成果。下面内容将具体介绍 几类算法。(1 2010年武建伟、俞晓红、陈文清等人提出了利用基于密度的 动态协同过滤算法改进现有的图书推荐系统 6。
8、与传统的静态协 同过滤算法不同,动态协同过滤算法首先利用模糊隶属函数根据读 者借阅图书的时间长度筛选出读者对借阅图书的兴趣度,并利用基 于密度的 db-scan 算法在按中图法划分的区域中进行聚类操作,从 而建立用户的兴趣模型。在数据的增长和变化中,用户的兴趣聚类 区域密度及权重将发生变化,从而实现动态的协同过滤推荐 6。 在仿真实验中,作者以洛阳理工学院图书管理系统读者借阅数据为实验对象进行仿真计算。结果表明,改进后的动态算法在邻居数从 5增加到 26时,其平均绝对偏差值均小于静态算法 0.05,说明基 于密度动态的协同过滤推荐算法在预测读者兴趣度方面精度更高 6。(2 2011年杨雪霞提出
9、利用遗传算法(genetic algorithm , ga 为模糊 k-prototypes 寻找初始聚类中心的 ga-fkp 算法,并取得了 良好的仿真实验效果 7。 模糊 k-prototypes (fuzzy k-prototypes , fkp 算法可以针对由多类型数据构成且分类模糊的数据集合进行 分类,然而 fkp 算法存在易陷入局部最优解和初始化敏感的缺点, 为解决这个问题,杨雪霞提出了利用遗传算法帮助 fkp 算法进行选 取初始参数, 然后通过 kfp 算法对个体进行优化从而得到最终结果。 在 ga-fkp 算法的数据结构中对遗传算法在知识表示方面的缺陷做 了很好的处理:使用聚类
10、中心来表示组成问题的结果,即一个聚类 中心向量表示一个基因,而所有聚类中心则组成了遗传算法中的个 体,如公式 2-1所示。个体 y 中的每个基因表示如公式 2-2所示。 公式 2-1公式 2-2其中,表示个体结构,为 i 位置基因, n 为样本数, k 为目标聚类 数 7。利用该类编码方式,解决了遗传算法与 kfp 算法间的接口 问题,使得两类算法可以相互融合,从而形成适合处理读者细分问 题的 ga-fkp 算法。在仿真实验中,作者选用了河南师范大学图书馆 2006 年到 2010 年的读者数据集进行细分,通过细分结果可以帮 助馆员了解不同类型读者对图书的利用状况,从而为读者提供更好 的个性化
11、服务。 (3)2011 年茹蓓、赵芳提出了利用 k-means 算法分析读者借阅行 为,为图书馆管理提供有用信息。k-means 算法是去类算法中的经 典算法之一,该算法首先接收输入量 k,并把 n 个数据对象划分为 k 个聚类,然后基于对象之间的距离来计算相异度8。算法的主要 流程包含四个步骤:第一步,随机选择 k 个对象,以每个对象为中 心来代表数据集将被分成的 k 个类; 第二步,根据“距离中心最近” 的原则,寻找与对象相似的类并将其划分到相应的类中;第三步, 完成对象分配后,计算每一个类中所有对象的平均值,作为新的中 心;第四步,根据“距离中心最近”的原则,重新划分所有对象。 反复执行
12、第三步和第四步,直到所有产生的类没有变化为止。利用 该算法,可以将分散的读者借阅数据进行有效划分,找出读者借阅 行为中的规律,从而帮助图书馆管理人员制定相应的服务方案及馆 藏发展计划。 3.前景展望 随着图书管理系统研究的不断深入,及读者对服务质量要求的不 断提升。图书馆的作用早已不仅仅只是借阅图书。为各类读者提供 个性化服务,为学校提供教学、科研和发展规划的有效信息资源已 成为当前图书馆员的工作目标。然而,要从海量的系统数据中,挖 掘出并准确把握住不同读者的需求,找出最有效的资源是当前图书 馆界的难题。智能算法的出现,为解决这一难题提供了很好的解决 方案,因此,众多研究人员进入到这一领域进行了积极尝试并获得 了良好的实验效果。随着研究的不断深入,相信这些算法将不断成 熟,并最终应用到实际的图书管理系统中。 参考文献: 1赵霞彤.数据挖掘技术在图书管理系统中的应用d.南京:南 京邮电大学,2009. 2朱福喜,杜有福,夏定纯.人工智能引论m.武汉大学出版 社,2006.283-305. 3林郎蝶,王灿辉.apriori 算法在图书推荐服务中的应用与研究 j.计算机技术与发展,2011,5(21:22-28. 4鲍 静.关联规则挖掘及其在图书流通数据中的应用研究d. 合肥:合肥工业大学,2007. 5陈康.基于 ec
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宠物手术知情协议书
- 寺院土地使用协议书
- 汽车注册协议书
- 小组解散补偿协议书
- 工厂招工合作协议书
- 禽畜圈养协议书
- 工程材料居间协议书
- 淘宝认证协议书
- 理发师徒协议书
- 森林火灾应急预案评估(3篇)
- 陕西省2023年中考英语真题(附答案)
- 河南省平顶山市2022-2023学年八年级下学期期末物理试卷(含答案)
- 中医内科学-咳嗽课件
- 夏商周考古-郑州大学中国大学mooc课后章节答案期末考试题库2023年
- 左右与东南西北
- 紧固件名称中英文对照表
- 失眠之中医问诊单
- 银行个人业务柜面操作风险点防控手册(印刷版)模版
- 幼儿园开辟小菜园的教育价值及实施策略探究 论文
- 盾构机液压原理培训
- 中国医科大学大学物理期末考试试卷(含答案)
评论
0/150
提交评论