



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 面向科研用户小数据的微知识服务研究(上)* 李立睿 邓仲华(武汉大学信息管理学院 湖北 430072)摘 要:在“互联网+”环境下,泛在互联为科研用户小数据的获取以及微知识服务的推送提供了便利。文章首先介绍了科研用户小数据的内涵,辨析了科研用户小数据与小科学数据的关系。在此基础上,分析了科研用户小数据与微知识服务的契合性,据此重点探讨了面向科研用户小数据的微知识服务模式及其典型特征,以及需要进一步注意和解决的问题,以期为科研用户个性化知识服务的优化提供参考。关键词:小数据;科研用户;微知识;知识服务;科学研究中图分类号: g250.7;g252 文献标识码: doi:10.11968/tsy
2、qb.1003-6938.2016040*本文系国家自然科学基金资助项目“大数据环境下面向科学研究第四范式的信息资源云研究”(项目编号:71373191)与国家自然科学基金资助项目“云计算环境下图书馆的信息服务等级协议研究”(项目编号:71173163)研究成果之一。收稿日期:2016-04-30;责任编辑:魏志鹏当前,“互联网+”相关技术的发展1,以密集型科学数据驱动为主要特征的科学研究模式日趋扩大化和深入化,促使支撑科研过程的知识服务变得愈加趋于精细化和快捷化。仅仅依靠科研用户主动描述自身需求,并单独由学科馆员进行知识组织和服务,在很大程度上,导致所推送的服务产品过于粗粒度化,而且服务周期
3、长,因此,这一服务模式已经很难满足新型科研范式下用户的知识服务期望。因此,如何精准获取科研用户实时需求,以前瞻性视角快速进行专业化知识服务的推送,是关系到图书情报机构服务创新和转型的重要突破口。不难发现,小数据作为科研用户的个体化数据,既是科研用户在研究过程中的虚拟化数据描述2,又是其个体独特性需求的表征,为科研用户的需求挖掘和预测提供了基础,通过组建一支跨时空、跨组织的专业知识服务团队,针对科研用户具体化和细微化研究问题,发挥微知识的精炼化、通俗化优势,以知识协同的视角来重组个性化知识推送服务流程,对于提高服务效果是具有重要意义的。1 面向科研用户的小数据概念1.1 科研用户小数据的内涵美国
4、康奈尔大学estrin教授对小数据进行了研究,他认为用户的小数据是其日常行为活动的全部表征,从医学的视角来看,用户的日常行为可以作为病理诊断的一种医学证据,因此,医护人员可以通过对用户每时每刻的行为数据进行收集、监测和跟踪,能够分析出用户在不同时间段的个人健康状况3。就理解而言,小数据是个人信息的虚拟化表示,是通过各种方式(如移动终端、可穿戴式产品、网络行为监测、视频监控等)对涉及个体数据的全方位收集,通过对这些不断累积的数据进行整合,从而为个性化服务决策提供依据。基于此,科研用户小数据是个体研究工作者在项目推进过程中全部行为和状态的数字记录集合。从数据本质角度来看,面向科研用户的小数据主要涵
5、盖了个体的基本信息、行为记录、习惯偏好、情绪变化、性格特点、研究问题等,通过对这些数据进行追踪、收集、分析和应用,可以实现科研用户立体化和全方位的数据描述。尽管科研用户小数据仅仅只是针对个体所涉及的数据集合,但是随着时间的推移及其项目研究过程的推进,科研用户所产生的小数据量会变得越来越大,这为支持科研用户的需求决策提供了数据基础。例如,浙江省图书馆根据读者借阅的各项原始小数据,并结合时下流行的星座元素,准确呈现了每个星座读者群体的阅读偏好和借阅习惯,据此为不同人群进行了定制化的阅读推荐4。1.2 科研用户小数据与小科学数据的关系相对大科学而言,小科学通常是指个体科研用户或科学小组开展研究为主要
6、特征的小规模科学活动5,其研究过程主要包括科研用户自行设定问题、独立执行和探索式解决6。因此,小科学项目主要解决特定的科学问题,以假设驱动,并且多集中于单一学科,科研资源和人员相对投入较少。在小科学项目的研究活动中所产生的全部科学数据被称为小科学数据,其中主要包括实验数据、仿真数据、结果数据等。然而,科研用户小数据是围绕个体研究人员而言的,是科研用户在进行研究活动时,全面描述科研用户的数据。由此可见,小科学数据是围绕整个小科学项目,并针对科研问题提出、分析和解决,所产出的科学数据集合,而科研用户小数据是涉及个体科研用户的全部行为或活动数据,更加注重以科研用户为唯一对象的个体性特征数据。在一定程
7、度上,小科学数据是对科学问题的描述,能够从侧面体现出科研用户的需求,此时这部分小科学数据又可以作为科研用户小数据集合的一部分,解释科研用户的行为模式或者情景变化过程。例如,当科研用户在攻克项目难题时,针对其中某个具体问题的分析和总结所做的文本记录数据,既属于科研用户小数据,又属于小科学数据。因此,科研用户小数据与小科学数据既相互区别,又具有一定联系,小科学数据可以为科研用户小数据的采集、分析、处理、应用和决策过程提供支持,提升小数据的价值总量和可用性。2 科研用户小数据与微知识服务的契合性学科的交融与发展,推动着以科学数据为驱动的知识发现和知识创新的科学研究模式产生,这也进一步促使了科研用户行
8、为和需求的转变。如今,科学数据已经成为科研用户的重要研究对象。2008年,heidorn首次提出了科学数据的长尾理论,并认为,如果将所有的科研项目按照其规模,以从大至小的方式沿着一条轴线进行排列,可以发现,那些较小的科研项目构成了整体科研的长尾7。在这一科研长尾上,科研用户所产生的科学数据通常是趋向于异质并未被系统整合和管理,其行为模式更具有不确定性8,这样导致科研用户需求也是经常被忽略。然而,与科研长尾上的科研用户不同,对于开展大规模复杂研究项目的科研用户而言,在长期的研究过程中,这类用户所产生的科研需求更加趋于密集型的知识服务内容,以及正式化的沟通反馈方式,因此,这些科研用户的行为模式通常
9、也具有一定规律性,并已经形成了自身固定的分析问题和解决问题的习惯方式。此外,对于科研长尾以外的科研用户,其知识服务的需求更加重视系统化和深入化。由于受图书情报服务机构本身预算和能力的限制,加上处于科研长尾上用户的需求层次不一,同时具有很大的不确定性,可能部分需求是零散的,这样导致图书情报服务机构恰好被忽视了这一部分科研用户的需求,而主要将知识服务重点围绕大型项目的科研用户。因此,科研用户小数据是其全方位状态的具体表征,能够高效地分析和获取科研用户的需求,为个性化和专业化的服务奠定基础。微知识服务充分发挥了微知识和微服务的优势,一方面,微知识是针对科研用户在研究过程中所遇到具体问题的答案,具有碎
10、片化、精炼化的特点,与此同时,微知识是将大块单知识进行分解、萃取,再以问题的形式对其进行深度标引的结果,是经过提纯加工的浓缩知识9,强调了知识的特质化与细致化;另一方面,微服务是以用户需求为导向,支持用户解决具体问题,利用当前快捷的社会化媒体工具(如微博、微信、微视频、微课堂等),进而实时动态为特定用户推送个性化服务。由此可见,对于科研用户小数据的充分挖掘,有利于高效分析科研用户的实时需求,甚至以前瞻性的视角预测需求的变化趋势,而微知识服务团队可以通过全面融合不同层次的微知识库,发挥自身知识整合处理能力的优势,在分析科研用户领域知识库的基础上,实时为科研用户提供知识服务,并根据其反馈结果,对微
11、知识库进行动态化更新。总之,微知识服务重视科研用户的细分,并强调了将各类科研用户看成服务工作的主体,面向科研用户的小数据与微知识服务的结合,对于图书情报机构个性化服务的提升具有重要理论意义和实践意义。3 面向科研用户小数据的微知识服务模式面向科研用户小数据的微知识服务重点强化了以单个科研用户的个性化服务为原则,强调科研用户小数据的全面收集和处理,通过对科研用户整个研究过程的行为状态、角色状态进行数据描述,以此获取科研用户当前知识需求,在服务团队与科研用户知识协同的基础上,能够以一种全局性的视角对科研用户的需求变化趋势进行预测,并结合微知识库,对知识推送服务产品进行优化,从而多渠道、全方位、多层
12、次满足科研用户动态化、碎片化需求,如图1所示。(1)面向科研用户的小数据收集是开展微知识服务的关键环节。不同的科研用户在研究过程中,由于其专业背景、认知能力和研究任务的不同,所导致的行为方式、需求层次、心理反应也是不同的10,因此,描述科研用户的小数据集合也是形式多样、内容各异。袁静等认为与用户相关的信息主要包括用户基本信息、用户行为情景信息、用户社会关系信息11。william将用户的个人信息类型划分为纸质文档、网页、电子文档、邮件以及引文、链接等12。李爱国等以学习者信息模型为基础,将用户信息按照内容分为用户基本信息、用户需求信息、用户行为信息和用户反馈信息13。综上所述,笔者通过对科研用
13、户的研究过程进行梳理,按照描述科研用户的小数据属性,将其分为两类,即具有物理属性的科研用户小数据和具有虚拟属性的科研用户小数据,如表1所示。一方面,微知识服务团队根据科研用户的研究任务和问题,以时间维度或空间维度作为参考,对科研用户小数据的内容进行分类,确定针对科研用户不同视角的数据描述;另一方面,在科研用户小数据的同一类别中,将具有物理属性和虚拟属性的小数据集合进行全面关联和聚类,从而形成具有一定逻辑结构的小数据集合。(2)在初步建立的小数据资源库的基础上,以科研用户需求为导向,对其进行分析处理,从而建立相应的小数据知识库。其具体过程主要包括:小数据整合。主要是结合科研用户研究的时序,将不同
14、载体和形态的小数据进行整理、滤重、转换等一系列交互活动,建立小数据的规范化表示形式。小数据挖掘。主要是通过对小数据进行特征分析和提取,围绕科研用户的各类具体问题解决过程,利用时序分析方式进行小数据集合的内在关联挖掘,使之内化为具有高度内聚的集合体。小数据契合。主要是指通过结合科研用户实时情景和对应的数据媒介,将关联后的数据与当前科研用户情景进行融合,据此生成围绕科研用户不同类型和层次需求的数据链,这些不同的数据链可以从多样化视角来描述科研用户的需求状态。由于科研用户的同一需求事实或需求规律可以隐藏在不同数据链中,不同的数据链也可以揭示同一需求事实或需求规律的不同侧重点,因此,这为判断科研用户的
15、需求强度提供了契机,也为服务团队有意识地融合多样化数据链提供了保障。小数据监护。主要是指小数据的维护和管理,一方面,由于科研用户的小数据集合是随着时间而不断累积的,进而需要对数据进行实时的更新和管理;另一方面,科研用户在研究过程中,可能会因为突发事件,导致其在某一层面上科研任务的中断,此时服务团队需要对小数据链进行偏差的纠正以及缺失数据的处理,以此保证各个小数据链的完整和统一。(3)基于小数据知识库的科研用户需求获取和微知识服务推送。小数据知识库作为一种特定形式的数据知识库14,是科研用户特征知识空间的集合,可以充分展现科研用户在时间维度和空间维度的需求视图。服务团队可以结合科研用户的实时情景
16、状态,对小数据知识库进行交互的同时,对需求特征知识进行再挖掘和再利用,这样能够深入地感知科研用户的知识需求,及时的预测用户需求的变化趋势,从而利用自身的专业技能和学科优势,有针对性的提供个性化微知识服务。与此同时,根据科研用户的研究需要以及相同或相似层次其他相关研究项目或人员的研究现状,通过与科研用户进行协同,构建特色化的微知识库。其中微知识库是以专业领域知识库为基础,并结合不同层次的科研用户在不同类型的研究过程中的学科化知识,通过对这些复杂知识进行分解、提取和重新组织,进而呈现的一些碎片化科学问题解决方案知识库。此外,在微知识服务推送过程中,一方面,由于微知识已经具有独立功能的“模块”,服务
17、团队可以充分利用这些“模块”根据需求将其进行有机的组织或串接,以完成特定功能的高度内聚化的知识形式,在对微知识库进行不断更新、完善和管理的同时,并协同专家知识和能力,可以在短时间内以最灵活的服务方式为科研用户提供相应的专业化知识服务,以此充分利用科研用户的碎片化时间,提升科研用户的体验度。4 面向科研用户小数据的微知识服务典型特征4.1 全方位的用户需求呈现科研用户在不同的研究阶段,其知识需求的产生、发展是一个渐变的过程,尽管这些需求可以通过科研用户的情景状态、行为模式以及科研任务从不同的角度呈现出来。但是,在不同的时刻,这种表现力强度也是不尽相同,在不同程度上,会体现出相关关系、因果关系,甚
18、至会产生矛盾,而且在短期内,科研用户的需求可能表现出零散性和不确定性,因此服务团队难以系统掌握科研用户需求,而且即使服务团队感知到了此类需求,也会花费大量时间,这样缩短了服务内容的选择和服务产品的优化时间,导致服务满意度偏低。鉴于此,面向科研用户的小数据作为其全方位的数字描述,通过对小数据的整合、分析和处理,无论是从时间维度,还是空间维度上,服务团队都能够在短时间内准确获取科研用户的相当大部分需求及其相关变化情况,尤其是在研究过程中常规化的学科知识需求,据此不断优化微知识库,为科研用户微服务提供基础。此外,科研用户的研究活动是一个连续性的过程,虽然在总体需求趋势上,会体现出一定的规律性和可预测
19、性,但是随着科研用户项目进展的深入,以及自身专业背景和认识能力的影响,在特定环境下,对于一些涉及跨学科或跨领域的细致化专业问题的微知识需求,会呈现出随机性和复杂性。但是通过科研用户小数据的融合,对某些不确定的需求,可以借助服务团队与科研用户在协同沟通反馈,对小数据进行系统化梳理和层次化整合,排除具有干扰性的影响因素,从而促进科研用户需求全方位、多层次的挖掘和呈现。4.2 个性化的专业服务推送在整个服务流程中,从科研用户小数据的收集、分析以及需求获取都是围绕个体科研用户而展开的,在服务方式方面,微知识服务是以微知识库为基础,以科研用户的专业知识需求为出发点,以协同互动为手段而进行的专业化服务。从
20、服务内容来看,微知识库是以科研用户及其研究任务为导向而构建的动态知识库,是把传统的庞杂学科知识进行再分解、深萃取,并根据科研用户的专业项目问题,对微知识进行系统组织、深度标引,最后结合科研用户研究情景,经过服务团队的综合评估,最终推送于用户的精炼化知识产品。从服务主体来看,整个服务团队具有跨学科的专业背景,包括学科馆员、数据馆员、信息专家等,这些服务人员能够以知识协同的方式,对服务于科研用户的微知识进行吸收、扩展、组织和管理,大大优化了服务流程,保证了专业化的微知识服务质量。从服务方式来看,服务团队根据科研用户的细微化和个体化特征,结合科研用户的兴趣偏好,利用社交媒体、移动网络等微服务工具,采
21、用综合化信息手段,进行适合于科研用户的差异化服务推送。因此,微知识服务充分发挥了服务团队的协同能力,通过运用相关的微服务技术手段,对庞杂的文献资源、网络资源等进行系统化的分析和组织,针对研究环境的转变,注重科研用户的体验,从而为其快速准确地推送即时化、碎片化的微知识产品。4.3 实时化的动态反馈跟踪在面对数据密集型科研范式的环境下,微知识服务是为特定科研用户提供的细微化、个体化和差异化的数据或知识服务,其充分借助了移动技术、网络技术和全媒体技术的优势,嵌入科研用户的研究环境,实现微知识库的动态构建以及个性化服务的实时推送。因此,服务团队与科研用户的协同反馈和实时跟踪体现在科研用户的整个研究生命
22、周期中,具体表现在以下方面:在小数据收集过程中,除了获取科研用户日常的网络数据和智能设备的感知数据之外,服务团队需要对用户进行交流,获取关于科研用户心理状态、研究经验以及目标计划等相关具有隐性特征的数据,同时在服务推送过程中,需要时刻跟进服务进度,通过科研用户反馈,评估微知识服务的效果和效率;在小数据分析过程中,小数据集合作为挖掘科研用户潜在需求的基础,必须与科研用户的期望目标紧密结合,包括短期研究目标和长期研究计划,而服务团队对科研用户的密切协作,实时跟踪科研用户当前所处情景状态的服务模式,为服务期望的确定提供了保证。在微知识服务流程中,服务的过程其实是科研用户与服务团队深入交互的过程,其中
23、全面的交流和沟通是必不可少的环节,另外,在围绕科研用户微知识库的全局化构建,也是在实时化服务反馈跟踪过程中,知识协同作用的结果。不难发现,与科研用户的深度沟通、动态反馈是提升服务满意度的关键举措,而借助微知识的精简性、专业化和便捷化的传递方式,无形将反馈跟踪嵌入到整个研究活动中,极大提升了服务的效度。5 需要注意和解决的问题由于小数据集合是科研用户知识需求的客观表现,而对这些小数据集合的处理是一个多层次、多维度的分析和管理过程,服务团队必须以跨学科的视角来对这些不同类别的小数据集合进行整合、关联、评估等;另一方面,微知识服务在传统知识服务的基础上,更加强化了知识的粒度化和个性化,而如何根据科研
24、用户需求,把控知识的粒度层次,也是在服务实践必须克服的。因此,在整个微知识服务的推送过程中主要有以下关键问题需要进行关注和解决。(1)科研用户小数据的全生命周期管理。“互联网+”及其相关技术的发展,不仅深刻影响了科研用户的行为方式和研究过程,而且正在改变科研用户的思维理念和决策模式,因此,科研用户小数据是其情景化需求的最主要表现,通过对这些零散的小数据进行全面收集,进而将不同来源的数据依据不同的时间点和空间点进行有针对性的滤重、筛选、关联和融合。例如,在小数据融合过程中,可以围绕科研用户的一个研究问题或一个研究时间段,从关联级融合(包括数据映射、异构加权、数据滤重、数据更新等)、特征级融合(包
25、括数据集成、属性分析、特征提取、特征关联等)和需求级融合(特征分类、特征聚合、特征挖掘、态势判断等)对小数据进行逐层递进的分析,挖掘不同生命周期阶段的小数据特性15。不难发现,如何从小数据的产生、发展和演变的全生命周期视角进行分析和管理,从时间和空间维度挖掘科研用户的需求产生根源及其变化方式,从而预测科研用户的潜在需求,是值得继续研究和探讨的。(2)科研用户小数据的安全保护。小数据是科研用户的个体特征化的全面描述,涵盖了科研用户的虚拟行为数据和现实活动数据,而这些数据直接关系到科研用户的个人隐私问题。然而,科研用户小数据的质量又是分析和获取科研用户隐性知识需求的基础,直接影响了微知识服务的整体效果,因此,如何平衡科研用户的小数据与隐私安全之间的矛盾,提升小数据的价值密度和安全程度,是个性化微知识服务必须解决的问题。对于这一问题的解决,可以根据国家相关法律规范或标准,针对科研用户的隐私敏感层次,建立科研用户小数据的保护协议和规范,其中应该包括小数据的采集目的、防范计划、问责机制等一系列保护机制。例如,服务团队可以借鉴当前广泛使用的敏感化信息保护技术,如数据失真
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025安全员考试试题AB卷附答案详解
- 重难点自考专业(小学教育)试题附完整答案(各地真题)
- 2025年体育健康知识竞赛试题库及答案
- 2025年法律硕士考前冲刺测试卷含答案详解【综合题】
- 2025年执业药师之《西药学专业二》练习题库包(能力提升)附答案详解
- 育婴师笔试考试题库及答案
- 2025年银行从业资格证考试关键知识试题及答案
- 驾驶员的聘用合同范本
- 2024-2025学年化验员综合提升测试卷含答案详解(夺分金卷)
- 扬州广陵区中烟工业2025秋招烟草配方研究岗位高频笔试题库含答案
- 2025年新疆中考数学试卷真题(含答案解析)
- 中央厨房体系管理制度
- 2025-2030年中国铜包铝线行业市场现状供需分析及投资评估规划分析研究报告
- 2025至2030中国医疗服务行业产业运行态势及投资规划深度研究报告
- JG/T 333-2011混凝土裂缝修补灌浆材料技术条件
- 宾馆内部治安管理制度
- “美感让美安全”专项行动工作实施方案解读课件
- 立克次体病患者护理
- 新《职业病危害工程防护》考试复习题库(浓缩500题)
- 合作代建合同协议书
- 《鲁迅故居》课件
评论
0/150
提交评论