下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据图书馆管理 一、大数据的根本特征数据通常被分为构造化数据、半构造化数据和非构造化数据。相对于传统的以文本为主的构造化数据,网络日志、音频、视频、图片、地理位置信息等半构造化、非构造化数据越来越多。同时,近几年出现的微博、微信等可通过挪动互联设备使用的电子交往形式使数据量和数据种类更加复杂化。价值密度的上下与数据总量的大小成反比。以社会中常见的监控录像为例,一天的监控记录,有用数据可能仅有一二秒。如何将已有的构造化数据、半构造化数据及非构造化数据进展整合、分析,挖掘出更多有价值的信息,并通过强大的计算才能迅速地完成数据的价值提纯;成为目前大数据背景下亟待解决的难题。这是大数据区分于传统数据
2、挖掘的最显著特征。根据的数字宇宙;的报告,预计到年,全球数据使用量将到达。在如此海量的数据面前,处理数据的效率就是生命。二、图书馆大数据的主要来源分析根据大数据的根本特征,经笔者分析,图书馆知识效劳领域的将来大数据的来源主要有射频数据、传感器数据、社交网络和挪动互联数据等几个方面。随着图书馆数字技术的不断进步,将不断推广,这将是将来图书馆大数据的主要来源之一;由图书馆中的传感器感知生成的数据,长时间积累后也将产生宏大的数据量;社交网络已广泛应用于社会各个方面,逐步成为人们交往的主要形式,其所产生的数据量远超以往任何一个信息传播媒介,由其生成的数据量是不可估量的;挪动互联网及挪动互联技术的不断完
3、善,使得图书馆可以灵敏获取挪动电子设备、人员、资源、用户行为和需求等信息,并对这些信息进展实时分析,从而帮助我们开展有效的智能辅助决策。三、大数据对图书馆管理的影响和挑战一海量数据处理考验图书馆计算才能大数据时代背景下,各类数据量迅速增长,数据产生的方式、范围发生前所未有的变化,人们在社会中的各类行为都产生了大量的信息数据,信息数据的组成构造、格式类型、存在形态等都更加复杂。图书馆要对上述复杂的数据进展应用、存储,将具有很强的挑战性,不仅仅涉及云计算、大数量级数据存储等技术问题,还可能促发图书馆效劳形式、资源建立形式、管理形式与开展形式的转变。二数据分析方式转变带来的挑战随着图书馆信息化程度的
4、进步,以互联网信息搜索、查询为根底的知识效劳逐渐被更多的图书馆所采用。但不管是简单的信息效劳,还是结合了信息检索、组织、分析等高级业务效劳,都可归纳为就数据而进展的效劳。大数据时代背景下要求图书馆不仅需要通过构造化数据理解客户需求,也需要大量的非构造化数据、半构造化数据去挖掘、预测和分析当前和将来的用户需求,社会群众的需求也将随着不断变化的个性化的高满意度效劳出现而对图书馆的效劳呈现出明确和迫切的需求。满足用户的需求,提供复杂数据的处理也将成为大数据时代图书馆的开展方向,如何处理好数据分析,将直接影响图书馆的生存与开展。三大数据对图书馆根底设施提出更高的要求半构造化及非构造化数据的迅速增加,导
5、致数据存储、计算规模越来越大,其本钱急剧上升。很多知识效劳机构出于本钱的考虑将应用由高端效劳器转向中低端硬件构成的大规模计算机集群,从而对支持非构造化数据存储及分析的根底设施提出了很高的要求。四、大数据时代图书馆管理开展方向一探究利用数据分析技术与工具对图书馆来说,在大数据时代要想在剧烈的市场份额竞争中争得一席之地,防止边缘化,开展必要的大数据分析效劳显得必不可少。图书馆开展的大数据分析效劳业务,主要可以有以下几种:首先是图书馆自身建立所需的大数据分析。这类分析一般以图书馆的现有数据为对象进展分析,如读者的借阅方式、行为爱好等,是一种对现有资源的分析与挖掘;其次是客户即读者所需的大数据分析。这
6、类分析业务类似于当今图书馆为企业等客户群体所做的信息情报参考、竞争情报分析,但也有着很大的区别,如对于分析对象数据的不同、分析手段的不同、分析目的不同等,这类分析业务所依靠的大量数据可能并非图书馆所拥有,从而成为限制该项业务开展的瓶颈,如何解决此类效劳的数据问题是打破该瓶颈的关键。麦肯锡发布的?大数据:创新、竞争和消费力的下一个前沿领域?报告中首次提出了大数据;的概念,对大数据的分析技术与工具进展了列举,如目前已为广阔图书情报研究者所熟知的聚类分析、数据挖掘、网络分析、可视化分析、数据交融与数据集成等,特别是聚类分析、可视化分析与数据挖掘技术。但这些现有的研究目前仅仅只是针对构造化数据和有限数
7、量的关键词进展聚类分析、共现分析等,并不能真正挖掘大量负责数据的存在与表现形态,更不能通过这些分析去预测将来的可能开展趋势。当然,大量网络社交等信息行为产生的大量非构造化数据、半构造化数据也让许多学者开场考虑去采集和利用这些信息,如苏玉照等人就认为假如可以采集到日志的数据,就能很好地满足发现关联规那么、内容分类和用户聚类的需求,从而能进步个性化推荐的精度,进而对定制日志的数据模型、过程及方法进展探究。二重视根底设施建立大数据时代,图书馆的核心竞争力不再仅是文献数据信息的竞争,各类形式的海量数据以及对海量数据的分析、挖掘才是今后图书馆之间竞争的核心因素。因此,要跟上大数据的脚步,必须完善信息搜集
8、的根底设施建立,加强各类信息资源的搜集将成为图书馆资源建立的大方向。图书馆首先要明白数据即生命;,解决数据存储问题。大数据时代对于图书馆的数据存储量要求极高。早在年,沃尔玛就通过对消费者的购物行为等非构造化数据进展分析,创造了啤酒与尿布;的经典商业案例。这样的经典案例是通过对海量的多类型数据搜集和分析得到的。因此,图书馆要掌握读者用户、馆员乃至社会效劳群体等的信息,既要有当前通用的数据记录中的个人身份、借阅记录等构造化数据,还要有存储信息行为、搜索方式、行为痕迹等非传统数据,这些都需要通过根底设施的建立来支持。除此之外,图书馆还必须解决数据计算和数据分析问题。要积极利用云计算;技术,搭建图书馆的云计算平台,解决图书馆自身海量数据的存储及运算才能与大数据对存储才能的高要求之间的矛盾。三进步图书馆效劳的智能化程度大数据背景下的图书馆效劳的智能化程度也将到达一个新的高度。图书馆应用智能化技术进展自动的高级、复杂的数据搜集及处理工作,既能在一定程度上节省大量的人力物力,也能解决人工可能无法实现的工作需求,如对海量信息数据的智能抓取、关键词抽取等,使得节省下来的大量人力去研究图书馆建立的策略与更进一步的智能化投入。其次,从读者来看,效劳内容、手段的智能化程度进步与智能化技术、工具、平台的效劳理论,所需的图片、视频、文本等信息将能轻易获取,个体的信息如社交信息、生活数据等大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生产设备操作人员培训手册
- 解决技术问题回复函(4篇)
- 业务流程优化分析框架及案例模板
- 项目资金拨付申请办理确认函(8篇)
- 智能家居系统安全配置指南
- 人力资源流程标准化操作及问题处理手册
- 护理安全案例教学与实践
- 项目经理需求分析与市场调研手册
- 护理纠纷的预防与医疗质量控制
- 护理学第三版甲亢的护理
- GB/T 7247.1-2024激光产品的安全第1部分:设备分类和要求
- 税务筹划课件-第四章-消费税的纳税筹划-
- 古代小说戏曲专题-形考任务2-国开-参考资料
- SMT外观维修作业指导书
- unit-6-where-is-the-s-leading-us市公开课一等奖省赛课微课金奖课
- 高三高考化学二轮复习电化学专题复习课件
- (完整word版)大格子作文纸模板(带字数统计)
- 途锐电动尾门施工方案
- 当前国际形势与热点问题
- Soul《心灵奇旅(2020)》完整中英文对照剧本
- 云计算技术应用基础PPT完整全套教学课件
评论
0/150
提交评论