新信息环境下知识发现系统的创新探索_第1页
新信息环境下知识发现系统的创新探索_第2页
新信息环境下知识发现系统的创新探索_第3页
新信息环境下知识发现系统的创新探索_第4页
新信息环境下知识发现系统的创新探索_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-精选财经经济类资料- -最新财经经济资料-感谢阅读- 1 新信息环境下知识发现系统的创新 探索 摘 要 信息技术、传播技术的飞 速发展,带来了信息环境的变化。大数 据、移动互联网、新媒体以及个性化定 制和社交网络的蓬勃发展,加上学术分 析、知识图谱的普及,给知识发现系统 提出了新的更高的要求。论文在文献分 析的基础上,分析了目前知识发现系统 的现状和不足,以超星发现系统为例, 提出了一些创新型的探索。 中国论文网 /1/view-12865927.htm 关键词 大数据 知识发现系统 新媒体 社交化网络知识图谱 分类号 G250.73 DOI 10.16810/ki.1672- -精选财经经济类资料- -最新财经经济资料-感谢阅读- 2 514X.2017.01.003 The Exploration of Innovation in Knowledge Discovery System Under the New Information Environment Shen Kuilin Abstract The fast development of information technology and communication technology brings the change of information environment. Big data, mobile Internet and new media as well as customization and social network, combine with academic analysis, the popularization of knowledge map, request new and higher requirements to the knowledge discovery system. This paper takes the superstar discovery system as an example, and puts forward some innovative exploration based on the analysis of literature review of the current knowledge discovery system. Keywords Big data. Knowledge -精选财经经济类资料- -最新财经经济资料-感谢阅读- 3 discovery system. New media. Social network knowledge map. 近几年来,随着图书馆纸本资源 及电子图书、数据库资源的快速增长, 从海量的资源里找到所需的文献成了读 者的迫切需要,于是很多一站式检索系 统应运而生,从最初的联邦检索到后来 带有一定智能的知识(资源)发现系统, 以及各种类似百度、谷歌的检索系统。 2012 年更是被称为“ 知识发现系统元年 ”, 知识发现系统相关的研究成果频繁出现 在各个学术期刊上,学界也召开了很多 相关的会议,目前发现系统的发展处在 一个胶着期,在新信息环境下如何让发 现系统更实用、更能赢得用户的喜欢、 与“互联网+”的概念更融合,是我们应 该关注和研究的重要课题。 1 知识发现系统的研究和应用现 状 在大数据、新媒体等新信息环境 下,要研究和实现更好用的知识发现系 统,就有必要对目前发现系统的发展现 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 4 状从计量、图谱等方面分析研究图书情 报界的研究主题,为后期的内容做梳理 和支持。 1.1 内知识发现系统的研究 现状 在超星中文发现系统里面,选择 高级检索功能,以“ 知识发现系统 ”或 “资源发现系统 ”或“知识发现”进行精确 匹配,选择载体类型为图书、期刊、会 议论文、学位论文、报纸为来源,检索 得到 9896 条相关信息,对这些文献进 行分析,可以得出目前国内知识发现系 统的研究和应用现状。 1.1.1 文献计量分析 根据超星发现系统的分析结果 (见图 1)来看,知识发现系统的研究 文献自 1996 年始逐年上涨,虽然最近 2 年发展平稳,在 2015 年还略有下降趋 势,但符合事物螺旋上升的发展规律。 根据期刊和相关学科以及相关知 识的分析结果,从图 2 可以看出知识发 现系统涉及到了很多学科,在技术方面, -精选财经经济类资料- -最新财经经济资料-感谢阅读- 5 主要研究领域在计算机领域、图书情报 领域,涉及到数据挖掘、人工智能、数 据库、聚类、情报分析、知识分析、信 息分析、检索、搜索引擎等概念,相关 的发文高频学者也是这两个领域最多。 根据相关的地区数据统计来看 (见图 3) ,经济和文化发达的地区,有 关知识发现系统研究的研究机构、学者 和话题最多,这也是符合事物的发展规 律的;另外一个相关因素是高校和名校, 特别是计算机相关专业和图书情报专业 发展比较迅速的高校,比如武汉就是因 为武汉大学信息管理学院是图情相关领 域研究和发展的排头兵。 图 3 知识发现系统研究的地区分 布 1.1.2 文献主题分析 关键文献内容分析 胡玮1调查 985 工程高校图书馆 资源发现系统建设和应用现状,统计和 分析了数量、系统名称、建设方式以及 系统选择几个方面,认为要根据馆情选 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 6 择系统。袁玉英2介绍了目前常用的四 种资源发现系统,从功能性、可靠性、 易用性、可移植性等角度对其进行分析 比较,指出资源发现产品的不足和今后 发展方向。王悦辰3从整合资源、发现 知识、知识关联与预测、文献获取方便 度以及个性化服务等方面,对国内四大 发现系统“中国学术搜索 ”“超星发现系 统”“智立方发现系统”“ 学知搜索”的中文 资源发现功能进行了比较分析,认为 “超星发现系统 ”在各方面都占据优势。 朱前东4通过国外文献调研和网站调查, 将国外资源发现系统评价策略归纳为三 种,即系统功能评价、系统可用性评价 和系统使用绩效评价。陈小磊5等人利 用资源发现系统的特性研究了图书馆的 学科服务内容。张为江6以用户需求为 中心、从知识服务平台、用户知识行为 分析平台、知识发现平台、数字图书馆 资源等方面对数字图书馆知识发现系统 进行了论述。王灏7从图情机构馆藏和 服务的问题入手,介绍了资源发现系统 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 7 的概念和技术路线,并以“中国学术搜 索网”为例,介绍了该平台在资源发现 服务中的总体设计、关键技术、核心功 能和服务方式。张松岩和崔鹏8概述了 发现系统的内涵和功能,对比国内常见 的发现系统,提出发现系统引进和应用 的措施。陈定权9等人介绍了 WorldCat Local、EBSCO Discovery Service、Summon、Primo 四 大具有集中索引仓储的 Web 级资源发 现系统,从内容索引、系统特性、检索 结果显示三个方面对它们进行比较分析, 测定出未来的发展趋势。王海花和陆为 国10在比较和评估发现系统的过程中, 开展用户体验度量测试,结果表明,用 户体验测试在一定程度上能够反映不同 厂商发现系统的优势与缺陷,发现系统 的信息质量影响着用户的满意度。窦天 芳和姜爱蓉11 介绍资源发现系统的产 生背景、逻辑、结构、功能特点及体系 框架,指出当前资源发现系统需要引起 关注的两个问题,以清华探索实践为例, -精选财经经济类资料- -最新财经经济资料-感谢阅读- 8 介绍使用经验,创新出数据驱动新思路。 王天虹12对基于超星发现系统的高校 图书馆中文资源发现服务进行了初步评 估,并比较了其与国外发现系统的不同 之处。谢含13 以超星发现系统为原始 数据统计源,对 2010 年至 2013 年江西 中医药大学发表的国内论文进行统计分 析,通过对论文中文学科分类情况、作 者、文献类型、核心期刊、基金项目等 项指标的统计分析,研究了大学学术发 展状况以及影响力。 内容主题分析 从知识发现系统相关文献和系统 的调查来看,目前图书情报界对知识发 现系统领域的主要研究分为以下几个部 分。 (1)理论探索。这些文献主要在早 期,主要以内容统一检索、一站式检索、 联邦检索、元数据整合、系统可行性等 方面的研究居多。 (2)践探索。主 要内容是关于图书馆技术部门自身或联 合相关技术公司共同开发适合于图书馆 使用的知识发现系统,这部分多数是原 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 9 型和框架结构的研究,还有部分试用型 产品,能用于正式使用的系统并不多。 (3)对国内外知识发现系统的介绍、 比较、选型。这个类型的文献最多,主 要是世界上三大发现系统的推广和使用, 超星中文发现系统的研究和应用。这些 产品的应用给图书馆带来了活力,也引 发了一系列的讨论和对比研究。 (4)知 识发现系统评价类、综述类。主要是对 发现系统本身的合理性、易用性等方面 的研究。 (5)利用知识发现系统对其他 学科的分析。主要是基于国外三大发现 系统、超星中文发现系统,利用系统本 身的检索和汇聚功能对各自学科的研究 热点、研究趋势等方面的研究。 (6)对 发现系统本身优点、缺点的研究和思考, 以及对发现系统近几年来的使用效果的 反思。 (7)新信息环境下知识发现系统 的更新和功能增强。这方面文献较少, 可能更值得去关注和研究。 1.2 知识发现系统的欠缺之处 根据文献调研和浏览各厂商知识 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 10 发现系统,可以看出,目前的知识分析 系统已经做得非常实用,从功能、资源 到使用友好度,都有了很大提高,但还 有欠缺之处,其主要表现在以下几个方 面。 (1)产品的成熟度方面。元数据的 深度整合和标准化处理流程、网络环境 下的系统架构和智能化发现功能需要增 强。 (2)资源覆盖率不足。 (3)图书馆 资源信息安全隐患,如数据的流失。 (4)个性化、社交化功能欠缺。 (5) 资源推荐、数据挖掘、知识分析等方面 有待加强。 (6)信息滞后问题,特别是 和馆藏更新的匹配方面。 2 知识发现系统在新信息环境下 的改进要求 目前,知识发现系统虽已在业界 得到了一定的程度的研究和实践,数据 库商、系统开发商主导开发的系统功能、 用户体验、资源配置等方面都基本满足 了需求,但整个开发进程当中图书馆员 和读者参与度比较小,开发商不能及时 了解用户的需求,使得系统和用户之间 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 11 始终有一道隔膜,使用中也有很多不满 意的地方。这就需要主导产品的开发商 积极联系图书馆行业的专业人士、调研 广大的读者,根据需求改进知识发现系 统,使其成为用户喜爱的产品。 2.1 大数据环境对知识发现系统 的要求 大数据(Big data 或 Megadata) , 或称巨量数据、海量数据,指的是所涉 及的数据量规模巨大到无法通过人工在 合理时间内达到截取、管理、处理、并 整理成为人类所能解读的信息。大数据 复杂而无序,其内在的关联性是其价值 所在。大数据的核心是从海量数据中抽 取相关内容,形成有价值的信息14。 知识发现系统产生的基础是资源的海量 增长,目的是将书刊目录、二次文献、 电子期刊、电子图书等文摘或全文有效 地加以利用,为用户提供完善有效地知 识挖掘、信息分析、趋势预测。发现系 统的基础是大数据、全数据,发现系统 包括结构化元数据和全文数据,更包括 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 12 半结构化、非结构化的数据,建立关键 词表、机构库、引文库、作者库、学科 分类、刊种表、来源库、学术专业词库 同义词表、单位产出库等,来建立数据 资源基础。 2.2 新媒体环境对知识发现系统 的启发 一般来说,新媒体可以看做是利 用网络技术、数字和终端技术向用户提 供信息、娱乐服务的传播形态15。一 般包括数字杂志、报纸和广播,手机上 的微信、微博、电视、网络以及桌面视 窗、数字电视、数字电影、触摸媒体等。 新媒体平台一般指的是微博、微信、各 种 APP、MOOC、播客、Wiki、RFID 等等和传播、服务有关的载体或技术平 台。知识发现系统应该跟进这些新媒体 的发展,创新服务,做好用户体验,服 务用户。 2.3 移动互联网、 “互联网+”环境 下知识发现系统的跟进 截止 2015 年 12 月,国内移动终 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 13 端设备拥有 8.99 亿的活跃量,人均单日 手机使用时长为 2.36 小时,人均单日启 动手机应用频次为 78 次,在应用上微 信和 QQ 处于领先地位16。任忠忠和 胡德华18调查发现,大学生使用手机 上网比较频繁,使用移动搜索的机会比 较多,上网频率以“ 每天多次 ”为主,平 均每天 3 次以上使用手机上网的用户占 54%左右,有 32%的用户使用手机上网 的频率为每天 1-3 次,已是移动搜索的 一个庞大的稳定消费群体。知识发现系 统应该顺应移动互联网的需求,开发出 基于微信或“ 手搜”APP 之类的移动化服 务,以好用、易用、有效为上,牢牢抓 住年轻大学生的使用习惯。 2.4 社交化、个性化对知识发现 系统的需求 社交化、个性化是 Web2.0 概念 的核心产物,很多产品都是基于 SNS 理念将产品带上了盈利的道路。知识发 现系统作为图书馆应用的重要产品,不 应千人一面,应该结合本校系统的读者 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 14 库,做到个性化服务、社交化服务。 3 知识发现系统功能改进的想法 在大数据、 “互联网 +”、新媒体乃 至全媒体环境下,知识发现系统必须从 功能和体验上改进,以便能在新环境下 吸引用户来使用。根据文献和实践研究, 笔者设计新环境下知识发现系统的结构 如图 4 所示。从图中可以看出,知识发 现系统核心是大数据处理、预测;新媒 体的引入;社交化服务的引入;多终端 个性化输出。 3.1 基本功能的完善 知识发现系统的基础功能是:提 供类似谷歌、百度的简单搜索框,进行 全文、全字段搜索,检索结果列表页包 括相关结果(本馆馆藏书刊、电子图书、 电子期刊、学位论文、会议论文等) , 提供分面检索(按文献类型、时间、作 者、机构、期刊等类型精炼检索) ,提 供检索结果的多个全文下载途径或者文 献传递入口。在点开某个具体记录的结 果页面中,提供相关文献推荐和文献的 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 15 相关引文。 需要增强的相关功能:(1)检 索结果最好能直接提供全文下载,将多 个途径一一列出,区分开 CNKI、维普、 万方等数据库,避免有时候某个数据库 暂时不能访问的问题;(2)严格检测 检索结果重复条目,区分是数据库里面 重复还是知识发现系统本身的问题; (3)馆藏纸本资源可分成纸本图书、 纸本期刊,并且能用接口及时同步图书 馆自动化管理系统中的书刊数据,本馆 馆藏能显示馆藏地基本信息;(4)在 搜索框中加入类似谷歌自动提示的功能, 提高用户搜索体验;(5)对于用户输 入错误能够智能纠错,如提示“你是否 要搜索 xxx”;( 6)提供搜索推荐,如 果读者未能找到自己想要的资料,在页 面底部的检索建议栏目为读者提供更多 选择,如谷歌、百度、读秀、e 读等等, 或让用户尝试“ 返回检索框,检查您的 拼写、修改检索词或扩展检索条件”, 或者转向咨询台去在线咨询或者留言; -精选财经经济类资料- -最新财经经济资料-感谢阅读- 16 (7)收录要全、相关度排序更准确; (8)收集用户的搜索关键词,对热门 搜索的关键词做成标签云图,对读者的 搜索起到一个导向作用;(9)嵌入百 科类产品、用户评论、网摘、系统或自 定义标签等,将用户的搜索名词、地点 等有定义和典故的显示出来,以众筹、 众包模式来解决用户的问题,强化图书 馆的知识交流中心功能,拉近用户与图 书馆的距离;(10)吸收更多 OA 资源。 3.2 大数据功能的支持 大数据对知识发现系统要求集成 海量资源、资源深度加工、超强计算能 力、稳定的检索服务和优质的检索效果。 海量资源的高度集成及深度加工 需要与世界知名内容提供商进行一对一 合作,授权获取到最为全面、稳定、优 质的题录数据。对于 OA 资源,利用 OAI-PMH 等协议收割数据,利用爬虫 收录、解析、加工和处理长尾站点。这 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 17 样就可能构建比较全面的元数据库。 大数据处理能力上,TB、PB 以 及 EB 等级别的数据,可以进行实时计 算、更新,然后深加工为优质学者库、 期刊库、会议库、机构库等,为用户提 供更好的信息揭示服务。 检索系统要稳定快速,检索效果 相关度要高,对此,可学习百度、谷歌 的搜索技术,提供更好的检索体验。利 用相关性计算,分析文献他引情况、作 者影响、影响因子、时间等因素综合给 出最为贴切的排序效果。 3.3 个性化、社交功能的引入 SNS 社交网络是 Web2.0、Web3.0 的核心理念和应用。 人们在网络上渴望交往和交流,喜欢记 录自己的心得、评论,将人类生活的社 交圈子无限扩展。六度分割理论、小世 界网络理论、长尾理论是 SNS 的理论 基础。 知识发现系统的核心对象是资源 和读者,让读者活跃、让资源流动和被 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 18 揭示是其重要作用。要想做到这点,引 入个性化和社交化是必不可少的。以人 为中心,把相关兴趣和学科的用户联系 在一起;以资源为中心,把和此资源有 关的书刊、电子资源、人推荐给使用者; 提供检索结果、命中条目打分、评论、 推荐、添加标签、认领成果等功能。图 5 和图 6 是基本功能示意图。 3.4 文献分析、知识分析的功能 知识发现系统中文献信息分析、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论