(计算机应用技术专业论文)支持echemistry的虚拟研究环境的研究与设计.pdf_第1页
(计算机应用技术专业论文)支持echemistry的虚拟研究环境的研究与设计.pdf_第2页
(计算机应用技术专业论文)支持echemistry的虚拟研究环境的研究与设计.pdf_第3页
(计算机应用技术专业论文)支持echemistry的虚拟研究环境的研究与设计.pdf_第4页
(计算机应用技术专业论文)支持echemistry的虚拟研究环境的研究与设计.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着现代科学技术的发展,科研问题的复杂度越来越高,单一的科学家甚至 单个实验室往往难以提供完成一个复杂科研项目所需的所有人力和物力资源。同 时,各学科的研究人员也希望部分研究相关的活动能够在线完成。虚拟研究环境 源于英国e - s c i e n c e 计划,希望能够通过集成网络资源、在线工具等为研究人 员组成虚拟团队进行协同工作和研究提供支持。 本文旨在讨论如何为计算化学领域的科研人员提供一个专用的虚拟研究环 境。本文首先探讨了计算化学的主要研究内容和基本科研流程,包含分子设计、 建模、模拟、结构优化、性质计算、信息资源获取以及科研人员之间协同交流等 活动。接着分析国内外著名虚拟研究环境项目的建设内容和方法,包括提供高性 能计算,协同工作工具,使用w e b 2 0 、门户等建设方法。进而提出建设支持计 算化学的虚拟研究环境需解决的关键问题并给出解决方案,最后实现了该虚拟研 究环境的原型系统。该原型系统从以下几方面支持计算化学科研活动:利用 w e b 2 0 相关技术从网络获取信息资源,从而寻找潜在的合作伙伴,促进虚拟研 究团队的形成:提供以2 d 、3 d 形式查看、设计、编辑分子结构以及交流这些 特殊信息的工具,支持虚拟团队成员之间协同工作;提供网格高性能计算接入服 务以支持科研流程中的计算环节。此外,为了保证系统的可扩展性,该原型系统 采用了开放式的架构,并且提出了共享编辑器快速集成框架,以便于集成更多能 为本领域研究工作服务的特色工具。 关键字:虚拟研究环境,计算化学,协同工作 a b s t r a c t w i t l lt h ed e v e l o p m e n to fm o d e ms c i e n c ea n dt e c h n o l o g y , a n di n c r e a s i n gc o m p l e x i t y o fr e s e a r c ha c t i v i t i e s ,i n d i v i d u a lr e s e a r c h e ra n das i n g l el a b o r a t o r yf a c et h ed i f f i c u l t y o fp r o v i d i n ga l ln e c e s s a r ye x p e r t i s ea n dr e s o u r c e st oa c c o m p l i s har e s e a r c hp r o j e c t m e a n w h i l e ,r e s e a r c h e r sf r o mv a r i o u sd i s c i p l i n e sa l s oh o p et h a ts o m er e s e a r c h - r e l a t e d a c t i v i t i e sc a nb ec o m p l e t e do n l i n e v i r t u a lr e s e a r c he n v i r o n m e n td e r i v e df r o mt h eu k e - s c i e n c ep r o g r a m , h o p e st oi n t e g r a t eo n l i n er e s o u r c e sa n dt o o l st os u p p o r tt h e f o r m i n go f v i r t u a lt e a m sa n dc o l l a b o r a t i o nw i t h i nt h et e a m t l l i s a r t i c l et r i e st op r o v i d eav i r t u a lr e s e a r c he n v i r o n m e n tf o rc o m p u t a t i o n a l c :h e i i l i s 廿yr e s e a r c h e r s f i r s t l y , t h ep a p e rd i s c u s s e st h em a i nr e s e a r c hc o n t e n t so fa n d b a s i cr e s e a r c hp r o c e s s e so fc o m p u t a t i o n a lc h e m i s t r y , i n d u d i n gm o l e c u l a rd e s i g n , m o d e l i n g ,s i m u l a t i o n , s t r u c t u r a l o p t i m i z a t i o n ,c o m p u t i n go fm o l e c u l a rn a t u r e , r e s o u r c er e t r i e v a l ,c o m m u n i c a t i o na n dc o l l a b o r a t i o na m o n gr e s e a r c h e r sa n ds o0 1 1 t h e n ,c o n s t r u c l i o nc o n t e n ta n dm e t h o d so ff a m o u sv i r t u a lr e s e a r c he n v i r o n m e n th o m e a n da b r o a da r ea n a l y z e d ,s u c ha s p r o v i s i o no fh i g hp e r f o r m a n c ec o m p u t i n g , c o l l a b o r a t i o nt o o l s ,w e b 2 0 ,p o r t a la n do t h e rc o n s t r u c t i o nm e t h o d s t h i r d l y , k e yi s s u e s a n dt e c h n o l o g i e so fb u i l d i n gav i r t u a lr e s e a r c he n v i r o n m e n tf o rc o m p u t a t i o n a l c h e l l l i s t r ya sw e l la st h es o l u t i o na r ed i s c u s s e d f i n a l l y ,t h ep a p e rp u t sf o r w a r da p r o t o t y p e ,a n dt h ed e s i g na n di n i t i a li m p l e m e n t a t i o no f t h ep r o t o t y p ea r eg i v e n u s i n g t h i sp r o t o t y p e , u s e r sc ma c c e s st oi n f o r m a t i o n 麟o u r i :e sf r o mt h en e t w o r k , l o o kf o r p o t e n t i a lp a r t n e r st op r o m o t et h ef o r m a t i o no fv i r t u a lr e s e a r c ht e a m s ,a c c e s st og r i d l l i g h - p e r f o r m a n c ec o m p u t i n g ,v i e w , d e s i g n ,a n de d i t2 d ,3 dm o l e c u l es 虮l c t i l r e s ,a n d s h a r et h o s es p e c i a li n f o r m a t i o nw i t h i nat e a m i na d d i t i o n , i no r d e rt oe n s u r et h e s e a l a b i l i t yo ft h es y s t e m , t h ep r o t o t y p eu s e so p e na r c h i t e c t u r ea n dp r o p o s eas h a r e d e d i t o rr a p i di n t e g r a t i o nf r a m e w o r kt of a c i l i t a t et h ei n t e g r a t i o no fm o r ef i e l d - b a s e d r e s e a r c hs e r v i c e sa n dt o o l s k e y w o r d s :v i r t u a lr e s e a r c he n v i r o n m e n t ,c o m p u t a t i o n a lc h e m i s t r y ,c o l l a b o r a t i o n 原创性声明 本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立 进行研究所取得的成果。学位论文中凡引用他人已经发表或未发 表的成果、数据、观点等,均已明确注明出处。除文中已经注明 引用的内容外,不包含任何其他个人或集体已经发表或撰写过的科研 成果。对本文的研究成果做出重要贡献的个人和集体,均已在文中以 明确方式标明。 本声明的法律责任由本人承担。 论文作者签名:擅釜超e t 期:2 1 塑笙驷至竺眄 关于学位论文使用授权的声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归 属兰州大学。本人完全了解兰州大学有关保存、使用学位论文的规定, 同意学校保存或向国家有关部门或机构送交论文的纸质版和电子版, 允许论文被查阅和借阅;本人授权兰州大学可以将本学位论文的全部 或部分内容编入有关数据库进行检索,可以采用任何复制手段保存和 汇编本学位论文。本人离校后发表、使用学位论文或与该论文直接相 关的学术论文或成果时,第一署名单位仍然为兰州大学。 保密论文在解密后应遵守此规定。 论文作者签名:巡窒超导师签名:e l 期:蹬明z 午臼 1 1 研究背景 第一章绪论 随着现代科学技术的发展和科研问题复杂度的增加,单一的科学家甚至是单 个实验室往往难以提供解决复杂问题所需的所有专业人员和资源f l l 。例如,化学 研究活动广泛依赖于不同的仪器设备,但随着研究活动的深入发展,一方面,设 备所提供的数据量越来越巨大,这些数据的处理耗时费力,另一方面,它们的价 格越来越昂贵,许多重要仪器设备只有少数机构能够拥有。因此,科研活动越来 越依赖于广泛的合作和资源共享。同时,各学科的研究人员也越来越希望部分与 研究相关的工作能够在线完成,这些工作包括需要和同事协同工作的活动、从全 球范围内的电子数据资源中进行信息检索等【2 】。现在已经有很多i t 设施能够提 供服务和工具支持这些活动的完成。e s c i e n c e t 3 】, 4 1 正是支持这些活动的基础设施, 它希望利用网络资源和信息技术来使科学家能够实现全球范围内的资源共享,能 够形成虚拟实验室来实现全球分布的大规模的协同研究。 虚拟研究环境的概念正是源于e - s c i e n c e 的发展,并与它的发展有着固有的 联系【5 l 。虚拟研究环境包括数字化基础设施和服务两方面的内容,从这个角度来 说,虚拟研究环境的概念包括e - s c i e n c e 中提供给科研教育工作者的高性能计算 和网络资源的集合;另一方面,虚拟研究环境的核心元素就是通过数字化设施进 行协作,研究者借用虚拟研究环境能进行协作研究、数据共享以及使用其他针对 其领域的特别工具,这个过程可以看作是e - s c i e n c e 的具体实施【们。在本文中, 我们把面向计算化学的e - s c i e n c e 简称为e - c h e m i s t r y 。 化学虽然是一门来源于生产实践的学科,但是理论方法在化学研究过程中也 是不可或缺的。化学家利用理论方法的研究来理解分子中原子间的成键行为,期 望通过理论方法能够成功地计算分子的性质,阐明分子结构和性质之间的关系 等。理论化学及其由此发展起来的计算化学为化学、物理学、生命科学及材料科 学的发展起到了不可替代的作用,成为近十年来发展最快的化学研究领域之一。 在现在的化学研究中,计算已经具有和实验、理论一样重要的地位,成为一种基 本的化学研究模式。计算化学成为化学研究的重要手段,应用在化学信息的组织、 第一章绪论 管理、检索和深度利用,化学反应机理的理论计算,药物设计与发现,分子模拟 等研究领域。这些研究问题复杂度越来越高,需要越来越多的资源,因此利用网 络环境进行大规模的协同化学研究工作正在成为一种新的趋势。 兰州大学在承担国家自然科学基金重点项目“计算化学e - s c i e n c e 研究与示 范应用”的研究过程中,探讨了网格环境下开展计算化学科学研究的模式,并基 于网格平台开发了一系列化学协同工作套件。在本项目组刘龙光的毕业论文化 学协同系统e c h e m w h i t e b o a r d f 7 】中,介绍了其中之一:化学白板协同系统。此 化学白板使得多个化学家能够在同一界面内以二维分子可视化的方式进行化学 问题的讨论,实现了多用户实时白板的“互操作”。本文以这个系统为基础,提出 了支持e - c h e m i s t r y 的虚拟研究环境。本文在原有基础上增加的工作包括: 1 提出了一种能够快速集成其他互操作工具的机制,改进了系统的可扩展性, 把原系统进一步完善为满足虚拟研究环境要求的互操作工具。这种机制改变了原 系统的共享编辑器实现方式,系统的可用性和可扩展性得到了提高。并使用这种 机制实现了三维分子的可视化共享编辑,重构了二维分子的可视化共享编辑。 2 利用w e b 2 0 相关技术为更大范围用户提供个性化的信息获取、丽b 协同编辑 等服务。 3 增加了向网格提交作业的功能,从而支持计算化学科研流程的计算环节。 1 2 研究意义 近年来,计算化学得到了迅猛的发展和越来越广泛的应用。它在化学领域中 应用了计算机技术,对化学信息进行计算、分析,以及揭示出其中的规律引。目 前公认的计算化学的主要研究内容如下: 1 化学信息的组织、管理、检索和使用:数据库是这些化学信息最主要的组织、 管理形式。 2 化学信息的加工、处理和挖掘:包括数据处理、计算和分子结构的编码、描 述、三维结构的构建等 9 1 。 3 计算组合化学:组合化学是当前化学家关注的热点领域之一。由于数据量大 的特点,这类计算适合分布在高性能计算机上进行,然后进行整合,由于针对不 同分子的计算相对独立,该计算适合利用网格技术进行分布式计算。 2 第一章绪论 4 分子模拟:当前,分子模拟已渗透到化学、物理、生物等各个领域。化学过 程的模拟往往要对多个生物大分子进行理论计算,而每个生物大分子模拟过程中 的各种理论计算相当复杂,计算量非常惊人,但是各个分子的计算又是相对独立 的,因此特别适合将计算任务进行分割,分配到不同的网格节点上进行计算。 通过对上述计算化学研究领域主要研究内容的分析我们可以发现: 1 计算化学研究的多项研究内容非常依赖于信息基础设施; 2 多项重要的研究内容需要高性能计算的支持,且具有分布式的特点,网格计 算适用于这些计算的特点和要求: 3 计算化学中很多研究内容非常复杂,工作量大,且涉及到信息技术、生物信 息学,甚至物理学等多方面的知识和技术,难以被个人甚至一个小团队所胜任, 需要协同研究; 4 分子结构的编码、描述、三维结构的构建、分子设计等工作是计算化学研究 中的一个基本任务,且由于3 的原因,这些信息有必要在网络上进行传输和在研 究团队成员间进行准确的交流。 综上所述,我们可以得出,建设一个可以支持如上任务完成的虚拟研究环境, 能够充分利用资源共享的优势,为计算化学的研究提供一个更好的平台。本文将 这个虚拟研究环境称为支持e - c h e m i s t r y 的虚拟研究环境,简称v r e c h e m 。 v r e c h e m 是一个桌面应用程序,集成了分子结构描述、分子设计、三维 结构构建及支持这些信息交流和协同工作的互操作工具,提供了计算化学网格接 入门户,以及r s s ,w i l d ,g o o g l ed o e ,c , o o g l e 学术搜索,c i t e u l i k e 等网络应用, 力求能够支持上述计算化学研究的主要科研活动。v r e c h e m 可提供以下主要 功能和服务: 1 通过r s s 订阅计算化学研究领域相关动态,关注基金网站、学科科研门户、 本领域期刊杂志、同行研究人员的博客等用户感兴趣内容,并根据w e b 2 0 由用户带来用户的理论,希望越来越多的计算化学研究人员相互联系起 来,促进虚拟研究团队的形成。 2 用户可以在v r e c h e m 中与同行交流,使用虚拟研究环境中相应的服务, 具有相同兴趣和任务的小组可以注册讨论组,上传共享的科研数据( 学术 3 第一章绪论 论文、分子结构、其他文档) 到共享工作空间。科研人员可参加多个任务 相应的讨论组。 3 个人科研人员或讨论小组可以使用2 d 和3 d 的分子协同编辑器查看分子 结构,编辑、设计分子结构,多人共操作一个分子结构,相互之间交流这 些领域特殊知识。 4 在v r e c h e m 中可以集成使用网格高性能计算、文档协同、文献检索等多 种资源和服务。 5 科研人员或讨论小组在研究结果形成以后,可以进行文档协同编辑,向网 络发布研究成果。 1 3 本文主要工作 本文所做的研究工作受到了国家自然科学基金重大研究计划“以网络为基础 的科学活动环境研究”的重点项目“计算化学e - s c i e n c e 研究与示范应用( 项目编 号:9 0 6 1 2 0 1 6 ) ”和国家自然科学基金面上项目“化学网格通用作业描述语言研究 ( 项目编号:6 0 7 7 3 1 0 8 ) ”的联合支持。 本文的主要工作是针对计算化学研究中对协同研究、网格高性能计算、分子 结构描述、分子设计、三维结构构建等计算化学基本任务、以及协同研究的虚拟 团队成员之间信息交流等需求,提出建设一个能够充分利用资源( 包括人力、数 据、计算等资源) 共享的优势,有效服务于计算化学研究内容开展的虚拟研究环 境。 为了设计与实现支持e - c h e m i s t r y 的虚拟研究环境,本文主要开展以下研究 工作: 1 虚拟研究环境的概念和特点,面向计算化学领域的虚拟研究环境应具备的功 能。 2 如何利用各类网络资源和在线工具支持计算化学科研流程。 3 如何完成分子结构的描述、设计、三维结构构建等任务,及虚拟团队中的成 员之间如何交流这些化学领域的特殊信息。 4 如何实现系统的易用性和可扩展性。 4 第一章绪论 1 4 论文的组织结构 本文的组织结构如下: 第一章绪论,论述了本文的研究背景以及建设支持e - c h e m i s t r y 的虚拟研究 环境的意义,提出本文的主要工作。 第二章相关技术研究,介绍了虚拟研究环境的概念,国内外研究现状,虚 拟研究环境的建设目的和需具备的功能。接着介绍了w e b 2 0 的相关技术,论述 了w e b 2 0 与虚拟研究环境之间的关联。最后介绍了网格的概念以及网格在虚拟 研究环境中的应用。 第三章研究内容与关键问题解决,介绍了本文的主要研究内容和建设支持 e - c h e m i s t t t 的虚拟研究环境需解决的关键问题并提出解决方案。首先说明如何 利用网格来支持科研工作流程的计算环节,和利用w e b 2 0 相关技术服务用户信 息获取:接着介绍为化学领域的研究人员提供互操作工具支持虚拟团队成员之间 信息交流;最后介绍系统可扩展的结构体系。 第四章介绍支持e c h e m i s t r y 的虚拟研究环境的设计和初步实现。本文从以 下几个方面介绍系统的设计和实现:首先介绍系统的体系结构和功能模块。接着 介绍系统可扩展性的重要方面。最后分别介绍系统重要功能模块的实现。 第五章结论与展望,分析支持e - c h e m i s t r y 虚拟研究环境设计和原型系统的 特点和存在的不足,并对未来的工作进行了展望。 5 第二章相关技术研究 2 1 虚拟研究环境 2 1 1 虚拟研究环境( v r e ) 概念 虚拟研究环境的概念源于英国的e - s c i e n c e 计划和j i s c ( j o i n ti n f o r m a t i o n s y s t e m sc o m m i t t e e ) 发展项e 1 t 6 。目前,国内外对其并没有统一的定义,使用的词 汇也不一样,在美国,研究人员通常用“c o l l a b o r a t o r i e sw i t hc y b e r i n f r a s t m c t u r e 一 和“v i r t u a lo r g a n i z a t i o n s ”o s ) 表示虚拟研究环境和虚拟研究组织【l o l 。权威的 定义来自j i s c 项目主持单位之一牛滓大学的f r a s t em t l l 】在2 0 0 5 年给v r e 下的 定义:v i l e ,包括一系列相互作用的在线工具、其它网络资源及技术,用于促进 或改进组织内和跨组织科研人员的科研流程;意图帮助所有学科领域的科研人员 管理科研过程中越来越复杂的任务,是一个支持科研基本过程的资源获取、信息 服务和用户应用的框架 6 1 。 尽管各国对虚拟研究环境有不同的用词和描述,但研究的内容和范围却基本 一致,主要的研究内容包括:分布式计算与数据资源的获取;学科专有分析工具; 共享工作空间:协同交流方式n o l 。例如f e i k j eh i e l k e m a 1 2 1 认为v r e 应具备的主要 功能有: 支持科研流程并具备管理功能:例如能够获取计算、存储、远程设备、电子 数据信息的等资源和服务。 具备互操作工具:例如信息服务( 包括安全信息服务) ,共享日志、日程、 文件,文档的协同编辑等。 能够支持大范围内用户使用。 能够兼容其他广泛使用的工具。 2 1 2v r e 国内外研究现状 国外关于虚拟研究环境的研究,比较著名的项目有i n t e g r a t i v eb i o l o g y 6 第二章相关技术研究 v r e 1 3 1 、b u i l d i n ga v i r t u a lr e s e a r c he n v i r o n m e n tf o rt h eh u m a n i t i e sf b v r e h ) 【1 4 l 、 s a k a iv r ed e m o n s t r a t o rp r o j e c t _ 【1 卯、m y e x p e r i m e n t l l 6 1 等。 1 i n t e g r a t i v eb i o l o g yv r e ( i b v r e ) 该项目由牛津大学领导开发,成员包括英国的七所大学以及i b m 公司。这 个项目正在开发网格结构,以基于分子和细胞的模型来模拟整个身体的组织,主 要致力于满足心血管和癌症研究的需求。该项目已经建成的虚拟研究环境支持实 验室实验、数学建模、仿真、使用分布的高性能计算等科研流程。 2 b u i l d i n ga v r ef o rt h eh u m a n i t i e s ( b v r e h ) p r o j e c t 该项目探求一种适合于人文科学研究的e - i n f r a s t m c t u r e 。为了建设这个项目, 在牛津大学进行了调研,调研内容包括,网格计算对人文科学研究的潜在助益, 分布式数据库的信息存取,信息交流技术,数据重用工具等。b v r e h 项目在对 这个调研的深度分析的基础上建设,把现有的研究工具映射成支持人文科学研究 流程的相应组件。 3 s a k a iv r ed e m o n s t r a t o rp r o j e c t s a k a iv r e 由兰卡斯特大学领导,成员包括牛滓大学等。它是应用s a k a ip o r t a l f r a m e w o r k 建设的v r e 系统。s a k a iv r e 的建设几乎是已有的基础框架和共享工 具的结合,它包括公告、聊天室、留言箱、邮件归档、今日消息、新闻r s s 、偏 好、讲演工具、资源、日程、w o r k s i t e 建设等,还能够通过远程门户网络服务- w s r p ( w e bs e r v i c e sf o rr e m o t ep o r t l e t s ) 来访问远程计算机和数据网格资源。 4 m y e x p e r i m e n t :提供科学工作流的共享 用户使用m y e x p e r i m e n t 可以贡献自己的工作流,共享、重用或重新编辑工作 流池中的元素,可以共享自己的专业知识,建立虚拟社区,形成合作关系等。 中国关于v r e 的发展主要探讨了虚拟研究环境对图书馆的发展影响切。 通过上述国内外研究现状我们得出: 1 尽管虚拟研究环境意图帮助所有学科领域的科研人员管理科研过程,但现在 国内外虚拟研究环境的建设均处于起步阶段,各学科通用的虚拟研究环境建设框 架还在探索中。现在已立项的项目大多是倾向于某一个学科或者面向某方面的应 用,例如i n t e g r a t i v e b i o l o g y v r e 是面向生物信息学的,b v r e h 是面向人文科学 的,m y e x p e r i m e n t 关注科学工作流的共享。 7 第二章相关技术研究 2 这些项目大多考虑利用网格,或者利用w e bs e r v i c e 获得分布式远程计算服务。 例如i n t e g r a t i v eb i o l o g yv r e 利用网格模拟身体全身组织,b v r e h 也考虑利用网 格服务支持人文科学的研究,s a k a iv r e 通过w s r p 来访问远程计算机和数据网 格资源等。 3 虚拟科研环境的建设应从支持用户的科研工作流程出发,并须考虑用户的多 样性,尽量提供个性化的服务,重视易用性。例如s a k a iv r e 的发展和协同学习 相关,它提供公告、新闻r s s 、邮件、演讲工具、日程、聊天工具、留言箱等等。 综上所述,虚拟研究环境仍然是一个比较新的概念。尽管一些国家在虚拟研 究环境的研究和建设方面取得了不少成果,但从技术的成熟度和实际应用方面还 面临许多问题,解决这些问题不仅需要技术的创新,还需要研究人员的认同和支 持以及社会观念的改变和理解。例如如何让科研人员接受新的技术和工具,科研 人员怎样才能积极有效地适应和参与虚拟研究环境下新的科研环境和流程。如何 处理虚拟研究团队成员之间包括建立信任,确定所有权、版权、知识产权,成果 鉴定和学术成果的出版等等相关问题。因此关于虚拟研究环境的研究和建设目前 还处于发展阶段。另外,现在对于应该优先开发通用的虚拟研究环境模式,还是 应该优先根据每个重要学科独有的研究方法和工具来发展专用的虚拟研究环境 仍无定论,目前美英两国主要资助专用虚拟研究工具的开发,从已立项的研究计 划来看,开发通用的虚拟研究环境模式似乎还没有包括在内【m 】。本文所提出的虚 拟研究环境是面向计算化学领域研究人员的专用虚拟研究工具。 2 2w e b2 0 2 2 1w e b 2 0 概念和主要技术 w e b 2 0 ,是相对w e b l 0 ( 2 0 0 3 年以前的互联网模式) 的新的一类互联网应 用的统称。相对于由少数资源控制者主导的w e b l 0 互联网体系,w e b 2 0 转变为 自下而上的自由体系,由广大用户的集体智慧和力量主导互联网。图2 1 表示了 从w e b l 0 到w e b 2 0 所发生的变化。 8 第= 章相关檀术研r 图2 - 1 w e b l0 到w e b 2 0 所发生的变化【 w e b 2 0 的核心思想包括六个方面: 由用户产生内容 利用用户人群的力量 大规模的数据 能够让更多人参与进来的架构 利用网络效应 保持开放性 现在已经有很多服务和应用很好的诠释了w e b 20 的概念,这些应用不少已经 被当今的互联网用户所熟知和使用,例如博客、w i l d 、多媒体共享服务、内容聚 合、播客、内容标签服务等。这些技术、服务、和标准大多已经相当成熟,并 且已经被使用数年。尽管新的特性和功能还在被不断的加入互联网,但这些都是 基于已有技术的。这里将介绍和本文相关度比较高的几个技术。 r s s 技术 r s s 技术既能够使网站发布者自动发布他们的信息,同时读者也能够聚合不 同阿站的网摘,在不用登陆这些阿站的前提下,定期获得它们的更新m i 。 标签和社会书签 标签是被加到一个数字对象上用来描述这个数字对象的一个关键字,但标签 第二章相关技术研究 并不是正式分类系统的一部分。社会书签系统有一些共同的特点【刎:它们允许用 户自定义标签列表,并将列表存储于远程的服务器,因此,用户能够看到谁和自 己关注了一样的资源,使用了类似的标签,从而促进了用户之间的交流,这就是 书签的社会性。 2 2 2w e b 2 0 和v r e 事实上,v r e 的发展在一定意义上是技术推动而不是用户推动的,尤其在 v r e 发展的早期阶段,受到了w e b 2 0 相关技术的很大影响f 6 】。v r e 和w e b 2 0 都要实现数据的公开、共享和重用、推进社交和协同工作,两者之间最大的不同 之处在于v r e 由科研工作流的需求驱动,面向的是各学科的研究人员,趋向通 过一个门户框架的实现集成网络资源和在线工具来支持科研流程。而w e b 2 0 面 向的是整个互联网用户,更多指的是用户参与和分享的工具应用。因此两者的服 务建设模式完全不同,w e b 2 0 提供一些工具和标准,而v r e 根据科研工作流的 需求把这些工具和标准组织起来f 6 l 。 更具体的说,v r e 的目的是利用网络资源和在线工具为全球科研人员之间 能够组成虚拟团队进行协同研究提供一个工具。为了能被广大范围的科研用户所 接受和广泛使用,v r e 不但要求各种能达成科研使用的工具和标准还必须具有 易用性,即使不是计算机的专家也要能够很容易学会使用。这是v r e 用户最关 心的问题之一。网页是用户最熟悉和乐于使用的形式之一。网页上的种种元素, 包括w e b 2 0 中的r s s ,t a g s ,w i l d ,早已被互联网用户所熟知和使用,相信这些方 法也是易于被科学家使用和接受的。而且w e b 2 0 提供的各项功能非常适合应用 在科研活动中。例如w e b 2 0 的s t a r t p a g e 相当于网格接入门户,能够为用户提供 远程的计算服务:m a s h u p 可以类比为网格中的w o r k f l o w ,为用户提供工作流的 功能:使用谢l ( i 技术能够实现研究人员在线协同编辑;利用r s s 技术科研人员 可以订阅和得到同行最新发布的科研论文等资源,以及研究人员普遍关注的基金 申请、项目申请等网站的更新:标签的应用使得用户能获悉一段时期内某一领域 内容,自动提供相关内容参考,并且这些内容都已经根据其在领域所在的系统中 的重要地位作了排序和过滤。因此w e b 2 0 相关技术非常适用于虚拟研究环境建 设。 l o 第二章相关技术研究 2 3 网格 2 3 1 网格的概念和应用 网格是利用互联网把地理上广泛分布的各种资源( 包括计算资源、存储资源、 带宽资源、软件资源、数据资源、信息资源、知识资源等) 连成一个逻辑整体, 就像一台超级计算机一样,为用户提供信息和应用服务( 计算、存储、访问等) , 虚拟组织最终实现在这个虚拟环境下进行资源共享和协同工作,充分实现信息共 享【2 1 1 。 网格计算的设计目标是解决对于任何单一的超级计算机来说仍然大得难以 解决的问题,并同时保持解决多个较小的问题的灵活性1 2 。因此网格能够应用在 物理学科、计算化学学科、大气学科、地理学科等多个领域,例如帮助分散的大 学研究人员分析粒子加速器和巨型望远镜的数据,帮助计算化学研究人员进行高 通量药物虚拟筛选研究等。 具体在化学学科方面,随着计算机技术和计算机网络的迅猛发展,计算化学 方法得到了更加广泛的应用。出于社会和科研的需要,政府和科研机构花费了大 量资金建立起了大量化学信息资源,但是这些资源只是孤立的存在着,没有得到 普遍共享和充分利用。所以利用网格技术把这些孤立的资源联系起来,成为当前 解决复杂化学问题的一个方向。 2 3 2 网格和v r e 从发展渊源上来说,网格是e - s c i e n c e 的基础架构,e - s c i e n c e 的目的即是将 网格高性能计算,海量科学数据库,大型科学仪器设备,科学电子数据资源等集 成起来,支持科研人员进行大规模大范围的协同研究和工作。而虚拟研究环境来 源于e - s c i e n c e ,目的是利用e - s c i e n c e 提供的基础设施和其他网络资源、在线工 具服务于虚拟团队的协同工作。因此,在需要高性能计算的虚拟研究环境建设中, 网格往往是资源利用方面一个合适的选择。 目前国内外已建设的v i l e 项目几乎都考虑利用网格来提供高性能计算资 源。例如i b v r e 使用网格基础设施来模拟人体的全身组织,s a k a i 也使用w s r p 第二章相关技术研究 为用户提供远程的分布式计算服务。 从虚拟研究环境的建设需要来说,随着信息技术的发展,计算机在科研中占 据了越来越重要地位,尤其是需要大量计算资源支持的科学研究,例如天文学中 分析巨型望远镜的数据,计算化学研究中高通量虚拟筛选,在没有网格的情况下, 如果使用p c 机来计算,可能需要花上数月甚至数年的时间,而能够快速完成这 些计算的大型机又非常昂贵,难以被所有需要的用户或单个实验室所拥有。网格 把地理上分布的大量资源组成一个逻辑整体,形成一个“超级计算机”,能提供安 全的、易于管理的超大计算资源的接入。因此网格服务在用户需要运行这些大规 模的数据分析和仿真时很有吸引力,也是建设v r e 时,用于支持用户科研流程 中计算环节的首选之一。 第三章研究内容与关键问题解决 根据吼1 2 2 1 研究科研用户对虚拟研究环境v r e 的需求给出的建议: 科研资源共享,例如科研数据和出版物,这点对科研用户最具吸引力,但是 这些资源的来源和所属人必须清晰的注明。 v r e 用户最先考虑的一个问题就是,面向用户使用的门户是不是非常易于使 用。即使是对于一个不是计算机使用专家的用户,他也要能非常方便的使用浏览 器就能浏览、下载或上传资源。 门户是建设v r e 的一个合适选择。门户是一个提供个性化的,使终端用户能 接入到资源的,支持终端用户完成一个或多个任务的在线设施。门户最好使用相 同的技术建设在网站上,但是为了满足不同层次的用户,门户应该具有功能的可 扩展性和灵活性】,它能为用户提供个性化的服务,并且允许用户简单的使用浏 览器就接入到资源。由于浏览器是平台独立的,这将大大的方便用户的使用。 网格服务在用户需要运行大规模的数据分析和仿真时很有吸引力,因为他能 提供安全的、易于管理的强大计算资源的接入。因此,在v r e 中应把网格服务作 为一个功能部件支持用户的科研活动。 考虑到计算化学研究活动自身的特点,本文试图建成一个这样的支持 e - c h e m i s t r y 虚拟研究环境: 能够使用网格的计算资源:计算化学研究领域,包括了数值计算,化学模拟, 模式识别等工作,当分子个数比较多时,例如进行高通量虚拟药物筛选时,计算 量非常庞大,因此,在支持e c h e m i s t r y 的虚拟研究环境中集成网格应用的门户, 能大大便利计算化学研究人员的工作。 便于信息交流和资源共享:信息交流和资源共享是用户最关心的问题之一, 本文在信息交流和资源共享方面的工作是,利用w e b 2 0 相关技术服务用户交流, 开发普通文本交流工具,以及支持特定化学信息交流的互操作工具,集成g o o g l e d o c s 文档协同工具等在线工具。 计算化学协同工作环境:化学家在工作中相互交流时,不可避免的要涉及到 描述一些分子结构和化学反应的信息。这些信息用口头或文本文字来描述往往是 1 3 第三章研究内容与关键问题解决 非常困难和易于出现歧义的,因此需要互操作工具来协助这一过程的进行,方便 用户间交流和协作。 便于其他工具的集成:技术的发展日新月异,我们自己的产品也经常需要更 新换代,因此软件系统是否具有良好的可扩展性会影响到软件的生命周期,也是 v r e 系统的一个重要要求。因此支持e - c h e m i s t r y 的虚拟研究环境应该具有可扩展 性。v r e 系统具有良好的可扩展性,能够在出现其他广泛使用的支持本学科工作 的工具出现时,快速集成进来。例如如果有合适的数学公式协同编辑器能够辅助 计算化学的研究,我们就可以考虑把它集成进来。 在进行计算化学e - s c i e n c e 示范应用研究时,实验室已经建成了拥有高计算 力的网格环境,和计算化学e - s c i e n c e 研究与示范应用门户,使用户能够通过w e b 方式使用到网格资源。本人在项目过程中,参与研发了计算化学协同工作环境。 因此本文具备了建设一个支持e - c h e m i s t r y 的虚拟研究环境的基础。在已完成的 工作基础上,本文需重点考虑以下关键问题的解决。 3 1 接入网格以获取资源支持科研流程 在计算化学的主要研究内容中,以下几个研究内容和网格高性能计算关系密 切。第一,化学信息的加工、处理和挖掘过程中需要进行的大量的分子结构的优 化和计算,由于各个分子结构的优化和计算之间的耦合程度很低,该类优化和计 算非常适合放在网格上进行并行计算。第二,在计算组合化学研究方面需要建立 组合化学合成数据库一个组合化学合成数据库中往往包含几十万甚至上百万个 分子,研究过程中需要对这些分子进行多样性或相似性分析,这个过程需要很长 时间。将这类计算分散到高性能计算机和数据库上同时进行,然后再进行整合, 可节约计算时间。第三,化学过程的模拟往往要对多个生物大分子进行理论计算, 这些大分子模拟过程中的各种理论计算,计算量很庞大,但是各个分子的计算又 是相对独立的,因此特别适合将计算任务进行分割,分配到不同的高性能计算设 备上去完成。 兰州大学在进行计算化学e - s c i e n c e 示范应用研究时,已经建成了兰州大学 信息科学与工程学院、化学化工学院、网络通信中心,高性能计算实验室以及清 华大学、华中科技大学等高校的高性能服务器和集群,聚合计算能力达到2 2 万 1 4 # ! $ 究自窖5 * 镕目n * * 亿次存储容量达2 5 t b 的网格应用系统,能够完成计算量较人的复杂计算任务。 在项目进行过程中,已利用此网格完成了多个示范应用的研究例如疟原虫天冬 氨酸蛋白酶抻制剂的虚拟高通量筛选。为了便于用户使用此网格应用系统,还建 成了计算化学e - - s c i e n c e 研究与示范应用门户方便用户使用阿格资源。 通过计算化学e - - s c hn c e 研究与示范应用门户,用户可阻访问网格平台所提 供的各种网格服务,包括使用网格提供的计算资源,访问阿格上已集成的数据库 服务,使用网格上安装的应用,例如高斯提供的计算功能。该门户提供了多个视 图服务于用户使用网格的过程,包括用户管理视图管理用户的个人信息和数据; 作业管理视图管理用户提交给网格的任务,例如查看作业当前的运行状况:网格 资源信息视图,可以查看网格提供的资源、服务等;网格节点监控视图,查看网 格节点的运行状况,例如该节点当前是否可用。该门户屏蔽了底层网格环境的各 种复杂特性,方便透明地为用户提供了统一的网格访问入口,帮助用户直接调用 稠格资源并提交作业,使得用广的丁作更加灵活和高效。如图3 1 所示: 圈z _ 。_ = 点,o 图3 i 计算化学e 铀一研究与示范应用门户 冈此在建设支持e - c h e i s t f y 的虚拟研究环境时,我们只需要将计算化学 第三章研究内容与关键问题解决 e - s c i e n c e 研究与示范应用门户提供给用户。用户通过门户来使用网格资源的方 式可以屏蔽网格的复杂性,用户只需要通过网页所提供的功能,上传需计算的文 件,选择所需服务,就可以把计算任务交给网格,任务计算完成后下载结果文件 继续下一步工作。 3 2 利用w e b 2 0 为科研用户提供信息服务 如前文说述,虚拟研究环境在一定程度上是由技术推动,它的发展受到 w e b 2 0 的很大影响【6 】。w e b 2 0 和虚拟研究环境都非常注重用户之间的交互和信 息共享。而w e b 2 0 在这个方面的应用已经很成熟。本节探讨了w e b 2 0 中的r s s 技术和标签技术在v r e - c h e m 的应用。 3 2 1 利用r s s 技术,提供科研数据的订阅以及自动通知等 服务 计算化学学科和其他学科的研究工作一样,都需要及时关注国内外最新的研 究状况,以确定自己的研究思路和保证自己研究成果的创新性。w e b 2 0 中的r s s 订阅服务,可以为科研用户订阅本领域的研究信息,及时得到研究成果的更新信 息,以便及时关注同行的研究状况。目前大多数用户需要个人进行相关资源的检 索,然后再进行阅读整理。使用这种方法收集信息,一方面重复劳动过程枯燥乏 味,另一方面得到的信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论