云端信息资源管理研究.doc_第1页
云端信息资源管理研究.doc_第2页
云端信息资源管理研究.doc_第3页
云端信息资源管理研究.doc_第4页
云端信息资源管理研究.doc_第5页
免费预览已结束,剩余16页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

云端信息资源管理研究朝乐门/邢春晓/张勇2012-12-25 11:35:46来源:情报资料工作2010年04期【英文标题】On Cloud Information Resource Management【作者简介】朝乐门,男,1978年生,北京石油化工学院讲师,博士,清华大学信息技术研究院博士后。北京石油化工学院北京102600;清华大学信息技术研究院北京100084邢春晓,男,1967年生,清华大学信息技术研究院WEB与软件技术研究中心主任,研究员,博士生导师。清华大学信息技术研究院北京100084张勇,男,1973年生,清华大学信息技术研究院WEB与软件技术研究中心副主任,副研究员。清华大学信息技术研究院北京100084【内容提要】 文章在梳理云计算的演变、内涵、特征、类型、现状与趋势的基础上,深入分析其给信息资源管理领域带来的机遇与挑战,并提出了云端信息资源管理的设想、特征和研究重点。The challenges faced by information resource management in cloud computing era were discussed and main ideas, basic features and hot topics of cloud information resource management was proposed based on researching the evolution histories, core concepts, basic features, main types, current studies and future developments. 【关 键 词】云计算/信息资源管理/云端信息资源管理cloud computing/information resource management/cloud information resource management目前,信息资源管理主要研究如何管理传统文献信息资源以及存放在个人计算机或企业服务器中的信息资源的问题。然而,云计算的出现导致信息资源和计算资源从个人计算机和企业服务器向云端迁移,由云端服,务统一管理和维护。因此,云计算给目前的信息资源管理研究不仅提出了新的挑战,而且也提供了新的机遇。1 云计算1.1 云计算的演变云计算可以追溯至冯诺依曼(Von Neumann)提出的计算机体系结构计算机硬件由控制器、运算器、存储器、输入设备、输出设备五大部分组成,程序(软件)和数据以二进制代码形式存放在存储器中。可见,硬件、软件和数据是计算机的三大计算资源。用户不仅需要投入大量的金钱购买功能强大的硬件和软件资源,并要亲自学会(或雇人)使用、管理和维护这些软硬件,将自己的数据存放到存储器;IBM、Microsoft等软硬件服务商的主要利润来自于两方面:一是向用户出售软硬件产品或数据资源;二是负责替用户管理和维护其软硬件设备或数据资源。近年来,软硬件服务提供商开始意识到为用户提供更强的软硬件服务和培育终身用户是提高核心竞争力重要途径。高性能软硬件服务的提供需要大量的服务器和高质量的软件系统,而培育终身用户的关键是如何把用户的数据存到自己的服务器上,而不是用户本地计算机上。在这种背景下产生了云计算的设想和研究热潮。云计算的演变过程如图1所示。图1 云计算的演变(1)单机计算服务器计算。服务器计算模式是将数据计算资源从本地单机迁移到服务器端,能够降低本地计算机对软硬件的要求,实现集中管理数据资源的目标。因此,服务器模式有两个作用,一方面降低了本地客户端对软硬件资源的要求,进而减少本地客户端购买、使用、管理和维护软硬件的成本;另一方面促进服务器计算市场的发展,出现多种服务器软硬件提供商,如IBM、SUN等公司。(2)服务器计算云计算。云计算旨在将成千上万的服务器硬件和软件系统迁移至云上,为用户提供功能强大的云计算服务。因此,云计算的出现,不仅可以进一步降低本地计算机对软硬件的要求,而且还为IT服务商开辟了新市场和竞争模式。1.2 云计算的内涵(1)IBM的定义:云计算既是一种新的计算模式,又是一种新的基础架构。作为一种新的计算模式,云计算把IT资源、数据、应用以服务的形式通过互联网提供给用户;作为一种新的基础架构,云计算把大量的计算资源组成IT资源池,用于动态创建高度虚拟化的资源提供给用户使用1。(2)Google的定义:Google的首席执行官Eric E Schmidt于2008年3月17日的清华大学云计算专题讲座中提到:云计算就是把所有的服务、应用和信息都存储在网络上,而不是在自己的电脑上,用户随时可以方便地使用。云计算的特点是标准公开,没有一家公司可以独占市场。(3)中国云计算网的定义:狭义的云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取、按需使用、随时扩展、按使用付费。这种特性经常被称为像水电一样使用的IT基础设施。广义的云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务2。(4)维基百科的定义:云计算是一种基于Internet的计算,与电力资源的服务模式类似,共享资源、软件和信息可以被终端计算机或其他设备按需使用3。上述定义的共性体现在基本思想和主要目标的一致性。云计算的基本思想是通过将软件、硬件、数据等计算资源从本地迁移至云端,用户随时随地通过成本较低的客户端连接到处于云端的功能强大的软件、硬件和数据资源;云计算的主要目的是实现客户端计算成本的最小化和云端利益的最大化,从而提高IT服务商的核心竞争力。不同云计算定义的区别体现在描述视角、侧重点、实现方案等方面。不同IT服务商的云计算定义均从各自已有产品和未来发展视角出发,侧重描述如何把自己的核心技术拓展至云计算服务之中,具有一定的宣传、广告色彩。相对而言,中国云计算网和维基百科的定义方法具有一定程度的中立性,对理解云计算的本质有较大的参考价值。1.3 云计算的特征根据云计算的定义和国内外最新研究,云计算的主要特征可以归纳为三个方面,如图2所示。(1)云端的特征是虚拟性、敏捷性、高效率性、高安全性、高可靠性和经济性。“云端”是指在云计算环境中提供、管理和维护云服务的一方。虚拟性体现在云端将硬件、软件和数据等物理资源动态组合成虚拟“资源池”,并以“服务”的形式提供给用户,例如,表1中的Haas、SaaS和DaaS分别实现了软件、硬件和数据存储的虚拟化;敏捷性体现在可以动态配置云计算提供的服务,根据用户需求的变化动态更改客户所购买的云服务的具体参数,以Animoto Productions为例,仅用三天的时间就可以实现从50台服务器扩展到3500台4;云端的数据计算和存储由较高性能的服务器集群完成,不仅可以保证云端计算的高效率性,而且为终端用户提供无限扩展的数据计算能力和存储能力;云端由技术和资历水平雄厚的专业公司统一管理和配置,相对于目前的单机计算和服务器计算,云计算更具有安全性和可靠性;云端的经济性体现在云端部署在成本相对较低的服务器硬件之上,不追求服务器机群的实时更新换代。在计算能力和存储能力相等的情况下,搭建一个云端服务器集群的成本低于购买一台超级计算机作为服务器的成本。图2 云计算的特征(2)终端的特征是多样性、低成本性、共享性和绿色性。“终端”是指在云计算环境中购买、租用和消费云端服务的一方。多样性体现在云计算支持个人计算机、笔记本、PDA、手机、电视等多种终端;低成本性体现在云计算对终端的要求较低,用户使用瘦终端就可以调用功能强大的云服务,不需要购买昂贵的软硬件设备和进行繁琐的软硬件管理、维护。在对计算环境要求非常高而计算次数不多时,云计算的经济性更加突出;共享性体现在通过云计算可以使不同终端设备之间的数据、配置、服务等信息资源实现共享;绿色性体现在云计算降低了终端的数据存储和计算要求,任何具有浏览功能的电子设备,如手机、PDA等均可作为终端访问云端,相对于单机计算和服务器计算,电力消耗大量降低,同时能够减少软硬件资源的浪费。(3)云端终端连接特征是松散耦合、大规模协同和实时同步。同一个云端可以被多种终端设备访问,同一个终端可以访问多个云端,云端与终端设备之间的相互依赖性较低,保证二者之间的松散耦合性;同一个云端可以被多个终端设备访问,使大量终端协同工作成为可能;云端可以实时地检测终端的数据变化,终端事件可以实时驱动服务器程序运行,云端与终端之间保持实时同步。1.4 云计算的类型(1)根据云计算提供的服务类型不同,云计算可以分为HaaS、IaaS、SaaS、PaaS、DaaS五种类型,如表1所示。这五种云计算类型处于计算机系统的不同层次,分别侧重于硬件、系统软件、应用软件、开发环境和数据库管理系统的云服务。目前,还没有提出“信息资源就是服务”的理念,但是随着云计算的成熟,信息资源必将成为云计算服务提供商之间竞争的最终目标。表1 云计算的五种基本类型(2)从云计算提供的服务范围看,云计算可以分为公共云、私有云和混合云1。虽然公共云能更好地体现云计算的特征,但是由于多数用户认为私有云的安全性高于公共云。因此,私有云将成为今后一段时间内众多中小企业或政府部门首选的云计算解决方案。私有云的成功实践和成熟推广会进一步推动云计算的研究与应用,众多私有云将逐步被公共云或混合云所替代,进入真正云计算时代。表2 公共云、私有云和混合云1.5 云计算的发展现状云计算不仅满足普通用户的需求,而且对大公司拓展市场有利。因此,诸多著名的IT服务商纷纷推出自己的云计算平台,如表3所示。(1)云计算的典型案例。表3中列出了云计算的典型案例。不同IT服务商根据自身已有的核心技术和产品基础切人云计算服务领域,进行了诸多探索。表3 云计算的典型案例(2)云计算的研究课题。现阶段云计算研究的热点问题是安全与隐私、数据管理、互操作性、服务供应和云经济10。文献11认为数据存储技术、数据管理技术、编程模型技术是云计算的关键技术。文献12中列出了云计算进一步发展中面临的十大障碍及其可能解决的方法,如表4所示,从中看出,云计算的进一步发展不仅需要技术改进(如障碍2-8),而且还需要运营机制(如障碍1,9,10)、数据资源管理(如障碍2,3,8,9)的改进。2 云端信息资源管理云计算的发展意味着汀资源的管理、维护、服务、盈利模式和核心竞争力的新变化。近年来,云计算开始引起了信息资源管理及其相关学科领域专家学者的关注。文献13从信息资源管理的多个视角分析云的性能需求;文献14探讨了如何采用云计算提高信息资源的共享管理能力;文献15探讨了云计算对企业信息服务的影响及存在问题。但是,目前对云计算时代信息资源管理的研究仍处于概念引入阶段,尚未系统研究云计算给信息资源管理带来的变革和云端信息资源管理的问题。表4 云计算进一步发展中面临的十大障碍及其解决方法(来源:Michael Armbrust etc. Above the Clouds: A Berkeley View of Cloud ComputinSR/OL.(2009-02-10)2010-01-20./abovetheclouds.pdf)2.1 云计算对信息资源管理的变革从云计算的特征分析可以看出,云计算可以实现终端用户和云端服务提供商的双赢。因此,云计算的进一步发展和广泛应用是必然的趋势。云计算时代的到来会给信息资源管理活动带来如下重大变革:(1)推动普适计算时代的到来。1999年IBM公司就提出了普适计算的概念。但是,由于技术条件的不成熟,尤其是终端计算设备的相对单一性、高成本性和相互之间的数据难以共享,真正的普适计算无法广泛使用,成为普适计算的主要瓶颈。通过本文对云计算特征分析可看出,云计算的终端具有的多样、低成本、共享和绿色特征,使用户无论何时何地,通过网络和自己的终端都可以访问云端提供的服务。因此,随着云计算的广泛使用,普适计算时代也将随之而来。(2)改变信息资源的存储技术和管理方式。在云计算环境中,个人用户和企业用户的信息资源存放在云端,由云端服务器集群统一存储和管理。云端信息资源的数量、访问吞吐量、计算速度、容错能力、安全性和并发处理的要求超出了服务器计算模式中服务器端的信息存储和管理能力范围。因此,云计算的进一步发展需要信息资源管理存储技术和管理方法的创新。以目前云计算中广泛采用的数据存储技术HDFS(Hadoop Distributed File System)16为例,该技术建立在Google的GFS(Google File System)17之上,其数据访问、复制、正确性判断、访问接口、元数据管理等技术均发生了变化。例如,HDFS中的数据更新技术采用了在文件的末尾追加新数据的操作方式,而不是直接用新数据更换原数据的传统数据更新模式。(3)提供大规模协同工作平台。云计算为终端用户之间的大规模协同工作提供了统一的操作平台。随着Web2.0理念的提出,尤其是维基系统的广泛使用,大规模协同工作已经成为未来全球化运作模式。但是,技术和运营条件的不成熟导致大规模协同信息资源管理平台建设成本高,严重限制其进一步发展和广泛应用。在云计算环境中,参与协同工作的终端用户可把需要其他终端协助完成的管理任务及其相关信息资源发送到云端,以便其他终端用户以经济、方便、灵活形式参与协同工作,提高协同效率,降低处理复杂问题的成本。(4)降低信息资源管理的能源消耗。由于云计算中数据的存储、管理和维护工作转移到云端,由云端服务器集群统一管理,减少了终端计算设备的冗余性,降低了终端电力资源的消耗。在完成相同的信息资源管理任务情况下,云计算所消耗的能源比传统计算模式小得多。因此,在提倡低碳经济的未来社会,云计算将是政府、企业和社会团体的首选计算模式之一。(5)凸显跨境信息资源管理的法律问题。在云计算环境中,用户跨境存取自己的核心信息资源成为可能。但是,不同国家对信息资源管理,尤其是政府信息资源管理的法律规定不同。因此,云计算要广泛应用需要考虑信息资源的跨境存取问题。2.2 云端信息资源管理及其特征云计算的出现不仅证明了信息资源将会是未来IT服务提供商之间竞争的重要目标,而且为信息资源管理研究提供了新的机遇和挑战。机遇主要体现在云端信息资源管理是未来信息资源管理研究的重要领域,将成为信息资源管理与传统图书馆学、情报学、档案学的重要区别之一。挑战主要体现在信息资源管理研究能否实现信息资源的增值,能否找到区别于计算机软件科学的准确定位,决定着信息资源管理的进一步发展。表5中列出了云端信息资源管理与传统信息资源管理的区别。(1)信息采集源不同。云终端的多样性、低成本性和共享性决定了云端信息采集环境的普适性。但是,目前的信息采集主要研究如何通过个人计算机或服务器采集用户数据。因此,云端信息资源管理需要研究如何在普适计算环境中采集终端用户和终端设备的数据,信息采集的来源发生了变化。(2)信息表示方法不同。云计算的高效率性要求云端必须具备海量信息的自动化处理能力。但是,由于传统信息资源管理中采用的信息表示方法不具备计算机可理解性,导致计算机自动处理信息资源的复杂性。因此,云计算需要采用面向计算机可理解的信息表示技术,如语义Web技术,实现信息表示的计算机可理解性。表5 云端信息资源管理与传统信息资源管理的区别(3)信息存储技术不同。云计算的高效性、安全性和可靠性要求云端信息资源中采用区别于以文件系统或数据库技术为基础的传统信息存储技术。从目前云计算的发展看,云端的存储技术采用GFS或HDFS等新技术,改变了传统单机计算或服务器计算中的存储模式和技术。(4)信息更新技术不同。云计算的高效性、安全性和可靠性要求在云端信息资源管理中采用特定的信息更新技术。从目前云计算中采用的数据管理技术看,云计算的数据更新技术采用了文件末尾追加方式,不同于传统的直接更换方式。(5)信息检索技术不同。云计算中数据存储在服务器集群之中,而不是分散在个人计算机或服务器之中。因此,云端信息检索的研究重点是如何从相对集中的服务器集群中挖掘出真正需要的知识。但是,传统信息资源管理中的信息检索研究重点是如何从大量的分散服务器上抓取所需要的信息,以各种搜索引擎技术为例,其研究重点是提高自己的覆盖率,而不是数据的深度挖掘。(6)信息服务不同。多种不同类型的终端均可以访问云端信息资源。因此,在云端信息资源管理中需要研究如何根据终端的计算能力、存储能力和表现能力,针对性地提供面向终端的个性化信息服务,为每个用户建立个人信息环境。但是,目前的信息资源管理中并没有充分考虑终端的区别性,以多数网站为例,用户使用手机终端访问网站时看到的界面与采用个人电脑访问该网站完全一样,导致用户使用的不便。因此,云端信息资源管理中需要研究面向不同类型终端的个性化信息服务问题。(7)信息处理模式不同。云端与终端之间连接的松散耦合、大规模协同和实时同步特征方便了云端信息资源处理模式向大规模协同方向转变。传统信息资源管理中采用的是小规模集中处理方式,主要由特定部门内部的信息工作者负责完成所有信息处理工作。因此,在云端信息资源管理中需要研究如何通过大规模协同处理方式,使所有用户,尤其是长尾用户变成信息处理的主体,提高信息处理的效率,降低成本。(8)能源消耗程度不同。云计算的绿色性可以保证云端信息资源管理的能源消耗低于传统信息资源管理,使云端信息资源管理成为低碳经济的重要组成部分,将受到社会各界的广泛关注和积极参与。(9)研究重点不同。云计算需要重点研究瞬间信息资源的管理,实时监听所有终端中发生的各类事件,需要及时处理终端的瞬间信息资源。传统信息资源管理侧重于研究历史信息资源的采集和捕获,其采集和捕获工作与信息本身的产生不具备同步性,使信息丢失或损失难以避免。(10)研究目标不同。云端信息资源管理的研究目标是如何实现已有信息资源的增值和新信息资源的涌现。云端信息资源具有海量性,如何在云端海量信息资源的基础上实现信息资源的增值和新信息资源的涌现必将成为各云端服务商必争的重要领地。2.3 云端信息资源管理的研究课题从表5所示的云端信息资源管理的新特征可以看出,云端信息资源管理中需要研究如下几个重要课题。(1)瞬间信息资源的管理。从云端信息资源管理的特征可以看出,云端需要在普适环境中监听终端上发生的各种信息事件,需要及时、动态捕获终端数据,真正实现信息产生与信息捕获的同步性。云端信息资源管理不仅需要考虑用户随时随地把自己的突发奇想通过各种终端上传至云端的可能,而且还需要监听每个终端设备的动态变化,进行瞬间记录和实时跟踪。因此,云端瞬间信息资源管理需要研究两个重点问题:一是如何保证信息资源的采集与其产生同步,从而避免传统信息资源管理中的信息丢失或失真;二是如何确保瞬间信息资源的差异性,实现对差别不大的瞬时信息资源的管理。(2)面向终端的信息构建和个人信息环境的信息构建。云计算的终端具有多样性。云端信息资源管理中需要保证同一个信息资源在不同的终端上信息内容的一致性和表现形式的差异性。因此,在云计算环境中信息构建的含义发生了新的变化,需要重点研究面向终端设备的个性化信息构建。另外,如何为用户建立个性化信息环境也将成为信息构建的重要内容,如何在个人用户的不同设备之间从信息内容、表现形式、功能结构等方面进行合理的角色定位和空间布局。(3)面向计算机可以理解的信息组织。云端信息资源管理要求云端计算机具备自动化处理信息资源的能力。这种能力高低取决于两个方面,一个是如何取得人工智能领域的突破性展,从而实现计算机胜任复杂信息处理任务,另一个是如何降低信息处理的复杂性,使现有计算机信息处理能力得到更好的发挥。但是,从人工智能的发展现状看,取得人工智能领域的突破相对困难。因此,面向计算机可理解的信息表示技术语义Web成为降低计算机信息处理难度的重要途径。在云端信息资源管理中需要研究如何结合语义Web技术和云技术,实现云端信息资源管理的有效性。(4)大规模协同信息资源管理。云端信息资源管理并不是由云端的信息专家独立完成,而需要由众多“草根”用户协同完成。因此,云端信息资源管理需要研究如何提高所有终端用户的信息资源管理意识和能力,并为他们的协同处理提供新的机制和模式。(5)信息资源管理的国际协议。云端信息资源管理中存在跨境存取或操作的可能。因此,需要研究和制定跨境存取信息资源的国际性协议或立法问题。另外,不同云端之间的互操作性要求云端信息资源管理研究信息资源管理的标准化问题。(6)各种信息资源云的研发。各云计算服务提供商的最终竞争目标是实现有效的信息资源管理,而不是软件或硬件设备的研发。因此,如何在云计算环境中建立多种信息资源云是云端信息资源管理的重要课题。目前,云端数字图书馆或云端数字图书馆联盟的研究取得一定进展。但是,其他类型的信息资源服务,如信息咨询、代理采集、定题服务等尚未得到广泛的研究。3 结论近年来,信息资源管理领域研究虽然取得了较大的进展。但是由于信息资源管理研究在实践应用,尤其是大型商业化应用中一直没有突破性进展,还严重制约着信息资源管理研究的发展。云计算的出现使信息资源管理走向商业化应用,真正成为现代计算领域的核心组成部分,为信息资源管理提供了前所未有的机遇和挑战,其研究亦应取得突破性的进展。本文提出的云端信息资源管理设想,希望起到抛砖引玉的作用,引起专家学者对云端信息资源管理问题的关注,推动信息资源管理学的进一步发展。【参考文献】 1IBM云计算中心& HiPODS.“智慧的地球”IBM云计算2.0R/OL.(2009)2010-01-20./systems/cn/dihub/pdf/ibmcloudcompute.pdf?book=cloudcompute&uid=77876.2中国云计算网.什么是云计算R/OL.(2009)2008-05-14./Article/jh/200805/1.html.3Wikipedia. Cloud computing R/OL. 2010-03-13. http:/en. /wiki/Cloud-computing.4Sun公司.云计算入门指南R/OL.2010-01-20.http:/cn. sun. com/offers/docs/sun-cloudcomputing-chinese.pdf.5Amazon Web Services LLC. Amazon Elastic Compute Cloud(Amazon EC2) R/OL. 2010-01-20 ./ec2/.6GoGrid cloud hosting how GoGrid cloud hosting works: Build your enterprise-grade cloud computing infrastructure in minutes R/OL. 2010-02-20. http:/www. gogrid. com/cl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论