(计算机软件与理论专业论文)基于网格的客户流失分析设计与实现.pdf_第1页
(计算机软件与理论专业论文)基于网格的客户流失分析设计与实现.pdf_第2页
(计算机软件与理论专业论文)基于网格的客户流失分析设计与实现.pdf_第3页
(计算机软件与理论专业论文)基于网格的客户流失分析设计与实现.pdf_第4页
(计算机软件与理论专业论文)基于网格的客户流失分析设计与实现.pdf_第5页
已阅读5页,还剩96页未读 继续免费阅读

(计算机软件与理论专业论文)基于网格的客户流失分析设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京邮电大学 硕士学位论文摘要 i i i ii i ii i ii iii iii iii ii y 17 5 5 311 学科专业:工科、计算机软件与理论 研究方向:基于网络的计算机软件应用技术 作者:二零零七级硕士研究生歪坠指导教! j 币:三邀佳数拯么谴昱 题目: 基于网格的客户流失分析设计与实现 英文题目: g r i d - b a s e dd e s i g na n di m p l e m e n t a t i o no fc u s t o m e rc h u m a n a l y s i s 关键词: 客户流失分析,网格计算,s v m - g e p 分类,g e p 混合聚类 英文关键词: c u s t o m e rc h u ma n a l y s i s ,g r i dc o m p u t i n g , s v m - g e pc l a s s i f i c a t i o n , g e p h y b r i dc l u s t e r i n g 论文选题来源: 1 国家高技术研究发展计划( 8 6 3 计划) 专题课题项目“基于网格的数据可靠 存储与容侵关键技术 ( 2 0 0 7 a a 01 2 4 0 4 ) ; 2 江苏省高技术计划项目“基于a g e n t 的面向服务的网格中间件技术研究 ( b g 2 0 0 6 0 0 1 ) o 南京邮电大学硕士研究生学位论文中文摘要 中文摘要 在日益激烈的市场竞争中,客户是企业的宝贵资源,他们既是企业现有财富的保障, 也是企业未来发展的基础,因而客户的争夺战是企业竞争的焦点。随着市场垄断局面的打 破,市场上的厂商获利由垄断时期的高额利润降至市场平均利润水平。在这种情况下,客 户保持的重要性就在竞争中凸现出来。 通过客户流失分析,企业获得流失客户数据和潜在流失客户数据,从而将这些数据分 配给客户服务部门,整合销售服务资源,根据客户的需求,设计个性化的营销策略,快速 反应,以此达到召回流失客户,挽留流失概率高的客户,实现对客户的守护。 传统的客户管理系统中的各种分析包括客户流失分析以及客户价值分析都离不开 b o s s 系统中的各种数据来源,而这些数据又分布在不同的数据服务器上,传统的方法是 先把数据取来集中起来然后再进行各种分析,这样分析的效率低下,而且由于客户关系管 理系统所需的数据量较大,对存储空问的要求较高 g e p 作为一种新的遗传算法,在很多领域表现出其优越的性能,尤其在流失分析 方面表现突出。近年来发展起来的网格计算技术就是充分利用网格中闲散的计算和存储资 源。利用网格技术来把客户关系管理系统中分析所需的数据分布式存储在不同的节点上, 对这些数据进行分布式流失分析,最后得到的分析结果以图形化的方式返回客户端给用 户。作者提出并论述了整个基于网格的客户流失分析的关键技术,包括s v m g e p 分布式 分类算法和g e p 分布式聚类算法的实现、以及图形化显示等。通过对实际案例的应用, 作者对模型的有效性和可操作性进行了验证,取得了良好的效果,证明其具有相当的实际 意义。 关键词:客户流失分析,网格计算,s v m - g e p 分类,g e p 混合聚类 a b s t r a c t i nt h ei n c r e a s i n g l yf i e r c em a r k e tc o m p e t i t i o n , t h ec u s t o m e ri sp r e c i o u se n t e r p r i s er e s o u r c e , t h e ya r en o to n l yt h ep r o t e c t i o no fe x i s t i n gw e a l t hb u ta l s ot h eb a s i sf o rf u t u r ed e v e l o p m e n to f e n t e r p r i s e ,a n dt h u st h eb a t t l ef o rc u s t o m e r si st h ef o c u so ft h ee n t e r p r i s ec o m p e t i t i o n w i t ht h e t e l e c o m m u n i c a t i o n sm a r k e tt ob r e a kt h em o n o p o l ys i t u a t i o n , m a n u f a c t u r e r so nt h em a r k e t m o n o p o l yp r o f i t sf r o mt h ep e r i o do fh i g hp r o f i t st ot h em a r k e ta v e r a g ep r o f i tl e v e l i ns u c h c i r c u m s t a n c e s ,t h ei m p o r t a n c eo fc u s t o m e r sm a i n t a i n i n gs t a n d so u ti nt h ec o m p e t i t i o n t h r o u g hc u s t o m e rc h u r na n a l y s i s ,e n t e r p r i s e so b t a i n t h el o s sc u s t o m e rd a t aa n dt h e p o t e n t i a ll o s sc u s t o m e rd a t aw h i c hd i s t r i b u t i o nc u s t o m e rs e r v i c e ,i n t e g r a t es a l e sr e s o u r c e s , a c c o r d i n gt ot h en e e d so ft h ec l i e n t sd e s i g np e r s o n a l i z e dm a r k e t i n gs t r a t e g y , r a p i dr e s p o n s e , t h e r e b ym a l lt h el o s sc u s t o m e r sa n dr e t a i nah i g h 珥渊i 锣o fl o s so fc u s t o l n e i r e a l i z e c l i e n t s 霉琏r d 妇m t r a d i t i o n a lt e l e c o m m u n i c a t i o n sc u s t o m e rm a n a g e m e n ts y s t e mi n c l u d i n gc u s t o m e rc h u m a n a l y s i sa n dc u s t o m e rv a l u ea n a l y s i si si n s e p a r a b l ef r o mt h ev a r i o u sd a t as o u r c e so ft h e t e l e c o m m u n i c a t i o n sb o s ss y s t e ma n dt h e s ed a t ai sd i s t r i b u t e di nd i f f e r e n td a t as e i v c r t h e t r a d i t i o n a lm e t h o di st op u td a t at o g e t h e r , t h e na n a l y s i s ,a n dt h es u c ha n a l y s i si si n e f f i c i e n t a s t e l e c o m m u n i c a t i o n sc u s t o m e rr e l a t i o n s h i pm a n a g e m e n ts y s t e mn e e dl a r g ea m o u n to fd a t a , t h e s t o r a g es p a c er e q u i r e db y i ti sv e r yb i g g e r g e pa san e w g e n e t i ca l g o r i t h m ,i nm a n yf i e l d sh a sd e m o n s t r a t e di t ss u p e r i o rp e r f o r m a n c e , e s p e c i a l l yi nt h el o s so fo u t s t a n d i n gp e r f o r m a n c ea n a l y s i s d e v e l o p e di nr e c e n ty e a r si st om a k e f u l lu s eo fg r i dc o m p u t i n gt e c h n o l o g y , g r i dc o m p u t i n ga n ds t o r a g er e s o u r c e si d l e t h eu s eo f 西dt e c h n o l o g yt ot h ec u s t o m e rr e l a t i o n s h i pm a n a g e m e n ts y s t e mt oa n a l y z et h er e q u i r e dd a t ai s s t o r e di nd i f f e r e n td i s t r i b u t e dn o d e s ,d i s t r i b u t e do nt h e s ed a t a , l o s sa n a l y s i s ,t h ef i n a lr e s u l t so f t h ea n a l y s i si no r d e rt og e tag r a p h i c a lw a yt or e a w nt h ec l i e n tt ot h eu s e r p r o p o s e da n d d i s c u s s e db yt h ee n t i r eg r i d - b a s e da n a l y s i so fc u s t o m e rc h u r nk e yt e c h n o l o g i e s ,i n c l u d i n g d i s t r i b u t e dc l a s s i f i c a t i o na l g o r i t h ms v m g e pa n dg e pi m p l e m e n t a t i o no fad i s t r i b u t e d c l u s t e r i n ga l g o r i t h m ,a sw e l la sg r a p h i c a ld i s p l a y s t h r o u g ht h ea p p l i c a t i o no ft h ea e r i a lc a s e s , 南京邮电大学硕士研究生学位论文a b s t r a c t t h ea u t h o r sm o d e lt h ee f f e c t i v e n e s sa n do p e r a b i l i t yw e r ev e r i f i e da n da c h i e v e dg o o dr e s u l t s ,t o d e m o n s t r a t et h a tt h e i rc o n s i d e r a b l ep r a c t i c a ls i g n i f i c a n c e k e yw o r d s :c u s t o m e rc h u ma n a l y s i s ,g r i dc o m p u t i n g , s v m g e pc l a s s i f i c a t i o n ,g e p h y b r i dc l u s t e r i n g i i i 南京邮电大学硕士研究生学位论文 目录 目录 中文摘要。i a b s t r a c t i i 第一章引 言。l 1 1 课题背景l 1 1 1 9 刚各1 1 1 2 客户流失分析1 1 1 1 3 国内外研究现状1 4 1 2 课题来源与主要工作1 9 1 3 本文组织1 9 第二章g e p 简介2 l 2 1g e p 概j 峦 2 2 适应度函数 2 3 遗传操作 2 3 1 选择操作 2 3 2 变异操作 2 3 3 插串操作 2 l 2 2 2 3 2 4 2 3 4 重组操作2 5 2 4g e p 的优势。2 6 2 5 基本g e p 算法2 7 2 6g e p 函数挖掘的基本原理2 8 2 7 本章小结2 9 第三章基于网格的s v m - - g e p 分布式分类算法。3 0 3 1 分类算法综述。3 0 3 1 1 分类概述3 0 3 1 2 分类的过程。3 2 3 1 3 分类数据的预处理。3 3 3 2 算法背景3 5 3 3s v m - g e p 混合分类算法3 5 3 3 1s v m 预处理一3 5 i v 南京邮电大学硕士研究生学位论文目录 3 3 2 算法描述3 8 3 4 基于网格的s v m g e p 分布式分类算法3 9 3 4 1 算法思想3 9 3 4 2 算法描述4 0 3 5 实验与分析4 2 3 5 1 实验环境4 2 3 5 2 实验结果与分析。4 2 3 6 本章小结4 5 第四章基于网格的g e p 分布式混合聚类算法4 6 4 1 聚类算法综述。4 6 4 1 1 主要聚类方法的分类4 7 4 1 2 聚类分析评价标准4 8 4 1 3 聚类分析目前存在的问题5 0 4 2 算法背景 4 3 基于距离和的孤立点检测算法 4 4g e p 混合聚类算法 4 4 1 染色体编码一 4 4 2 聚类e t 编码 5 0 5 l 5 3 5 4 5 4 4 4 3 聚类e t 解码5 4 4 4 4 适应度计算5 7 4 4 5 遗传算子5 7 4 5 基于网格的g e p 分布式混合聚类算法5 8 4 5 1 算法思想5 8 4 5 2 算法描述5 9 4 6 实验与分析6 l 4 6 1 实验环境6 l 4 6 2 实验数据6 l 4 6 3 实验结果一6 3 4 6 4 实验分析6 5 4 7 本章小结6 5 第五章基于网格的客户流失分析原型系统设计与实现。6 6 5 1 弓i 言6 6 v 南京邮电大学硕士研究生学位论文目录 5 2 基于网格的客户流失分析的体系结构6 6 5 3 基于网格的客户流失分析原型系统的设计6 9 5 3 1 网格服务的设计6 9 5 3 2 客户流失分析的流程7 1 5 4 基于网格的客户流失分析原型系统的实现7 2 5 4 1 数据分配服务7 4 5 4 2 数据传输服务7 6 5 4 3 数据分割服务。7 7 5 4 4 客户数据分类服务7 8 5 4 5 流失客户数据聚类服务8 0 5 5 本章小结8 2 第六章总结与展望。8 3 6 1 总结8 3 6 2 展望一 致谢 攻读硕士学位期间的学术论文 攻读硕士学位期间参加的科研项目 攻读硕士学位期间获得的专利申请 8 3 8 1 ; 8 6k 8 7 8 7 缩i 咯词8 8 图表清单8 9 参考文献9 1 v i 南京邮电大学硕士研究生学位论文 第一章引言 1 1 课题背景 1 1 1 网格 1 1 1 1 网格的概念 第一章引言 网格计算( g r i dc o m p u t i n g ) 是指通过将多台计算机组成网格状网络、“模拟实现高性能 计算机”的技术【l 】。“g r i d 在英语中是“方格”的意思。也就是说网格计算顾名思义就是指将 多个计算机组成网格状网络,“模拟实现高性能计算机”的技术。假如有一项业务使用i g h z c p u 需要3 分钟的处理时间。如果网络中有3 台安装了同样c p u 的计算机,我们把这项 业务分成3 等分,然后分别交给每台计算机进行处理,那么简单地计算一下就会知道其处 理时间将缩短到1 分钟。这就是网格计算的基本思路。 作为一种新兴的技术,网格正处在不断发展和变化当中,因而网格尚未有精确的定义 和内容定位【2 】f 3 】。但网格是一种信息社会的网络基础设施,它将实现互联网上所有资源的 互联互通,包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。网 格将连通一个个信息和资源孤岛,让人们的工作和生活变得更方便。专家预计,网格计算 将在4 5 年内成为高性能计算的代名词,美国甚至有人提出了“网格反恐”;再进一步,1 0 年以后,量子计算将走向实用,计算技术将发生根本变革,比特以及字节( b y t e ) 将被量子 比特( q u b i t ) 取代。 网络的出现,改变了人们使用计算机的方式,而i n t e m o t 的出现,又改变了人们使用 网络的方式。纵观互联网的发展历程,i n t e m e t 技术和w e b 技术的主要成就是实现了计算 机和网页的连通,提供收发邮件、浏览和下载网页信息等相关服务,它所关注的问题是如 何使信息传输流量更大、传输速度更快、传输更加安全。而网格技术则关注如何有效安全 地管理和共享连接到i n t c m e t 上的各种资源,并提供相应的服务,网格所关注的问题无论 从范围、程度还是本质上都已经与互联网所关心的互连问题有了很大的不同。网格在连通 第1 页 南京邮电大学硕士研究生学位论文第一章引言 计算机和网页的基础上,还将各种信息资源,例如数据库、软件以及各种信息获取设备都 连接成一个整体,整个网络如同一台巨大无比的计算机,向每个用户提供包括计算能力、 数据存储能力以及各种应用工具等一体化的透明服务。它强调的是全面地共享资源、全面 地应用服务。目前的技术还没有实现资源层面的全面共享,只是信息的传输,所以属于网 络技术,而非网格技术。互联网新一次浪潮的实质,就是要将万维网( w o r l dw i d ew 曲) 升华为网格( g r e a tg l o b a lg r i d ) ,即实现w w w 到g g g 的变革。 网格作为一个集成的计算与资源环境,能够吸收各种计算资源,将它们转化成一种随 处可得的、可靠的、标准的且相对经济的计算能力,其吸收的计算资源包括各种类型的计 算机、网络通信能力、数据资料、仪器设备甚至有操作能力的人等各种相关资源【4 】。 网格是借鉴电力网的概念提出的,网格的最终目的是希望用户在使用网格计算能力解 决问题时像使用电力一样方便,用户不用去考虑得到的服务来自于哪个地理位置,由什么 样的计算设施提供。也就是说,网格给最终的使用者提供的是一种通用的计算能力。 电力网中需要有大量的变电站等设施对电网进行调控,相应的网格中也需要大量的管 理站点来维护网格的正常运行。网格的结构及资源的调控将更复杂,需要解决的问题也更 多。因为网格所关心的问题不再是文件交换,而是直接访问计算机、软件、数据和其他资 源。这就要求网格具备解决资源与任务的分配和调度、安全传输与通信实时性保障、人与 系统以及人与人之间的交互等能力。网格提供的资源是随时间动态变化的,原来拥有的资 源或者功能,在下一时刻可能就会出现故障或者拒绝被使用,而原来没有的资源,可能随 着时间的进展会不断加入进来【5 1 。 一、网络的典型体系结构 网格技术不断地发展使人们逐渐地意识到了网格体系结构的重要性。网格体系结构用 来划分系统的基本组件,指定系统组件的目的和功能,说明组件之间如何相互作用,规定 了网格各部分相互的关系与集成的方法。可以说,网格体系结构是网格的骨架和灵魂,是 网格技术中最核心的部分。 1 五层沙漏结构 五层沙漏结构是一种早期的抽象层次结构,以“协议”为中心,强调协议在网格的资源 共享和互操作中的地位。通过协议实现一种机制,使得虚拟组织的用户与资源之间可以进 行资源使用的协商、建立共享关系,并且可以进一步管理和开发新的共享关系f 6 】。这一标 准化的开放结构对网格的扩展性、互操作性、一致性以及代码共享都很有好处。图1 1 为 第2 页 南京邮电大学硕士研究生学位论文第一章引言 五层沙漏结构的典型结构图。 图l l 五层沙漏的典型结构 五层结构之所以形如沙漏,是由各部分协议数量的分布不均匀引起的。考虑到核心的 移植、升级的方便性,核心部分的协议数量相对比较少( 例如i n t e m e t 上的t c p 和m - n , ) , 对于其最核心的部分,要实现上层协议( 沙漏的项层) 向核心协议的映射,同时实现核心 协议向下层协议( 沙漏的底层) 的映射按照定义,核心协议的数量不能太多,这样核心 协议就成了一个协议层次结构的瓶颈。在五层结构中,资源层和连接层共同组成这一核心 的瓶颈部分,它促进了单独的资源共享。 2 开放网格服务结构 开放网格服务结构o g s a 是g l o b a lg r i df o r u m 4 的重要标准建议,是目前最新也最有 影响力的一种网格体系结构,被称为是下一代的网格结构。o g s a 的目的就是要将g r i d 的一些功能,更确切的说是g l o b u s 的一些功能融合到w e bs e r v i c e 这个框架中。与前期网 格不同的是,o g s a 是面向服务的结构,将所有事务都表示成一个g r i d 服务,计算资源、 存储资源、网络、程序、数据等都是服务,所有的服务都联系对应的接口,所以,o g s a 被称为是以服务为中心的“服务结构”,通过标准的接口和协议支持创建、终止、管理和开 发透明的服务,其发展象征着w e bs e r v i c e 的一个进步,结合目前的w e bs e r v i c e 技术, 支持透明安全的服务实例,o g s a 有效地扩展了w e bs e r v i c e 架构的功能。五层模型与 o g s a 都相当重视互操作性,但o g s a 更强调服务的观点,将互操作性问题转化为定义 服务的接口和识别激活特定接口的协议。这一面向服务模型具有很多优点,环境中的所有 第3 页 南京邮电大学硕士研究生学位论文第一章引言 组件都是虚拟化的,通过提供一个所有g r i d 服务实现基础的一致接口的核心集,可以使 得分级的、更高级别的服务的构建能够跨多个抽象层以一种统一的方式进行处理。虚拟化 还促使从多个逻辑资源实例到同一物理资源的映射,不考虑实现的服务组合,以及一个 v o 内的基于低级资源组合的资源管理。正是g r i d 服务的虚拟化加强了通用服务语义行 为无缝地映射到本地平台设施的能力。 二、网格协议g l o b u s 工具包 由于现在的互联网结构并不是针对网格计算设计的,为了使网格计算和现有的结构兼 容,一个可扩展的中间件是必需的,也就是基于操作系统之上的网格管理软件。在网络化 应用成为主流的时代,单机操作系统如n t 、w m d o w s 等的地位已经降低,网格管理软件 实际上是更高层次的网格操作系统,其核心技术主要是一体化的信息平台、语义网站、智 能代理和知识本体技术等。建立网格服务的协议与标准是网格发展的重点和难点。g l o b u s 项目是目前国际上最有影响力的与网格计算相关的项目之一,是来自世界各地关注网格技 术的研究人员和开发人员共同努力的成果。它是围绕四种主要活动来组织的:研究、软件 工具、实验台和应用程序。g l o b u s 对资源管理安全、信息服务及数据管理等网格计算的 关键技术进行研究,开发能在各种平台上运行的网格计算工具软件,帮助规划和组建大型 的网格实验平台,开发适合大型网格系统运行的大型应用程序。g l o b u s 工具包是g l o b u s 最重要的实践成果,它是一个开放源码的关键g r i d 协议的参考实现,支持大量的主要的 电子科学项目。该工具包基于开放结构、开放服务资源和软件库并支持网格和网格应用, 致力于安全、信息发现、资源管理、数据管理、通信错误诊断等问题。g l o b u s 的网格计 算协议是建立在互联网协议之上的,以互联网协议中的通信、路由、名字解析等功能为基 础。g l o b u s 的协议分为5 层:构造层、连接层、资源层、汇聚层和应用层。上层协议可 调用下层协议的服务。 网格内的全局应用都通过协议提供的服务来调用操作系统。g l o b u s 工具包包括网格 安全、网格信息获取与分布、网格资源管理及网格远程传输等内容,这些都是网格开发中 的关键技术和必须解决的重要问题。 三、网格核心技术 为解决不同领域复杂科学计算与海量数据服务问题,人们以网络互连为基础构造了不 同的网格,有代表性的如计算网格、拾遗网格、数据网格等,它们在体系结构和需要解决 的问题类型等方面不尽相同,但都需要共同的关键技术,主要有如下几种: 第4 页 南京邮电大学硕士研究生学位论文第一章引言 高性能调度技术在网格系统中,大量的应用共享网格的各种资源,如何使得这些应用 获得最大的性能,这就是调度所要解决的问题。网格调度技术比传统高性能计算中的调度 技术更复杂,这主要是因为网格具有一些独有的特征,例如,网格资源的动态变化性、资 源的类型异构性和多样性、调度器的局部管理性等。所以网格的调度需要建立随时间变化 的性能预测模型,充分利用网格的动态信息来表示网格性能的波动。在网格调度中,还需 要考虑移植性、扩展性、效率、可重复性以及网格调度和本地调度的结合等一系列问题。 资源管理技术资源管理的关键问题是为用户有效地分配资源。高效分配涉及到资源 分配和调度两个问题,一般通过一个包含系统模型的调度模型来体现,而系统模型则是潜 在资源的一个抽象,系统模型为分配器及时地提供所有节点上可见的资源信息,分配器获 得信息后将资源合理地分配给任务,从而优化系统性能。 网格安全技术网格计算环境对安全的要求比i n t e m e t 的安全要求更为复杂。网格计 算环境中的用户数量、资源数量都很大且动态可变,一个计算过程中的多个进程间存在不 同的通信机制,资源支持不同的认证和授权机制且可以属于多个组织。正是由于这些网格 独有的特征,使得它的安全要求性更高,具体包括支持在网格计算环境中主体之间的安全 通信,防止主体假冒和数据泄密;支持跨虚拟组织的安全;支持网格计算环境中用户的单 点登录,包括跨多个资源和地点的信任委托和信任转移等 网格研究最初的目标是希望能够将超级计算机连接成为一个可远程控制的元计算机 系统( m e t a c o m p u t e r s ) ,现在,这一目标已经深化为建立大规模计算和数据处理的通用基 础支撑结构,将网络上的各种高性能计算机、服务器、p c 、信息系统、海量数据存储和 处理系统、应用模拟系统、虚拟现实系统、仪器设备和信息获取设备( 例如传感器) 集成 在一起,为各种应用开发提供底层技术支撑,将i n t e r n e t 变为一个功能强大、无处不在的 计算设施,最终实现资源共享和分布协同工作。网格的这种概念可以清晰地指导行业和企 业中各个部门的资源进行行业或企业整体上的统一规划、部署、整合和共享,而不仅仅是 行业或大企业中的各个部门自己规划、占有和使用资源。这种思想的沟通和认同对行业和 企业是至关重要的,将提升或改变整个行业或企业信息系统的规划部署、运行和管理机制。 1 1 1 2 网格的特点 随着超级计算机的不断发展,它已经成为复杂科学计算领域的主宰。但以超级计算机 为中心的计算模式存在明显的不足,而且目前正在经受挑战。超级计算机虽然是一台处理 第5 页 南京邮电大学硕士研究生学位论文第一章引言 能力强大的“巨无霸”,但它造价极高,通常只有些国家级的部门,如航天、气象等部门 才有能力配置这样的设备。而随着人们日常工作遇到的商业计算越来越复杂,人们越来越 需要数据处理能力更强大的计算机,而超级计算机的价格显然阻止了它进入普通人的工作 领域。于是,人们开始寻找一种造价低廉而数据处理能力超强的计算模式,最终科学家们 找到了答案圳dc o m p u t i n g ( 网格计算) 。 网格计算是伴随着互联网而迅速发展起来的,专门针对复杂科学计算的新型计算模 式。这种计算模式是利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计 算机”,其中每一台参与计算的计算机就是一个“节点”,而整个计算是由成千上万个“节点” 组成的“一张网格”,所以这种计算方式叫网格计算。这样组织起来的“虚拟的超级计算机” 有两个优势,一个是数据处理能力超强;另一个是能充分利用网上的闲置处理能力。 实际上,网格计算是分布式计算( d i s t r i b u t e dc o m p u t i n g ) 的一种,如果我们说某项 工作是分布式的,那么,参与这项工作的一定不只是一台计算机,而是一个计算机网络, 显然这种“蚂蚁搬山”的方式将具有很强的数据处理能力。今年年中,n i t d a t a 计划与i n t e l ? 和s g i 联合进行一项为期三个月的网格计算试验,届时将有包括家庭、企业和学术机构 的1 0 0 万台计算机相联,其总处理能力将比现有的最快的超级计算机还要快五倍o 充分利用网上的闲置处理能力则是网格计算的有一个优势,网格计算模式首先把要计 算的数据分割成若干“小片”,而计算这些“小片”的软件通常是一个预先编制好的屏幕保护 程序,然后不同节点的计算机可以根据自己的处理能力下载一个或多个数据片断和这个屏 幕保护程序。于是“演出开始了”,只要,节点的计算机的用户不使用计算机时,屏保程序 就会工作,这样这台计算机的闲置计算能力就被充分地调动起来了。 这种“蚂蚁搬山”式的计算式的网格计算,看似普通,但却有过及其出色的表现。1 9 9 9 年,s e t i h o m e 项目是网格计算的一个成功典范。该项目在1 9 9 9 年初开始将分布于世 界各地的2 0 0 万台个人电脑组成计算机阵列,用于搜索射电天文望远镜信号中的外星文明 迹象。该项目组称,在不到两年的时间里,这种计算方法已经完成了单台计算机3 4 5 0 0 0 年的计算量。可见,这种“蚂蚁搬山”式的分布式计算的处理能力十分强大,正所谓“泰山 不辞坏土,故能成其大”。 网格计算不仅受到需要大型科学计算的国家级部门,如航天、气象部门的关注,目前 很多大公司也开始追捧这种计算模式,并开始有了相关“动作”。 “蓝色巨人”i b m 正在构筑一项名为“g r i dc o m p u t i n g 的计划,旨在通过因特网,向每 第6 贾 南泵邮电大学硕士研冗生学位论文第一章引言 一台个人电脑提供超级的处理能力。i b m 公司副总裁、也是这项计划的总设计师欧文伯 杰说,“g r i dc o m p u t i n g ”是一种整合电脑资源的新手段,它通过因特网把分散在各地的个 人电脑连接起来,不仅可使每台个人电脑通过充分利用相互间闲置的电脑能源,来提升各 自的电脑处理能力,还可使成千上万的用户在大范围的网络上共享电脑处理功能、文件以 及应用软件。正如网络技术总是从科学开发领域转向企业商务领域一样,我们也希望看 到g r i dc o m p u t i n g 能取得这样的进展。 另一个业界巨人s u n 也推出新软件促进网络计算的发展。2 0 0 1 年1 1 月,s u n 推出 了s u ng r i de n g i n e 企业版5 3 版软件的p 版,继续提升它的网络技术计算水平。该软件自 一年前推出以来,s u ng r i de n g i n e5 2 3 版软件的用户已经增长了2 0 倍。今天,全球有 1 1 8 0 0 0 多颗c p u 都是采用s u ng r i de n g i n e 软件管理的。 除此之外,一批围绕网格计算的软件公司也逐渐壮大和为人所知并成为受到关注的新 商机,如:e n t r o p i a 、a v a k i 、n o e m i x 、d a t as y n a p s e 等等。有业界专家预测,网格计算将 成为2 0 0 2 年网络市场发展的热点。据( f o r b e s a s a p 预测,网格技术将在2 0 0 5 年达到 高峰,并带来因特网的新生如果网格技术能促使市场按预期的1 7 年增长率持续成长 的话,那么在2 0 2 0 年将会形成一个年产值2 0 万亿美元的大产业。 为了说明的更加生动些,不妨将网格与因特网作个比较:尽管当前因特网已经很时髦 了,专家们还是对它提出了很多批评。最重要的批评有两个。一个批评是,因特网实际上 是一个大垃圾山。人们不停地往上倒东西,结果使得它包含很多重复、过时、零散、混乱 的数据和信息,人们很难找到所需要的东西。万维网的企图是把垃圾变成金子,用一些简 单的办法把数据和信息组织起来,让人们更方便地获得信息。但是万维网出来后,反面更 加速了人们往上倒垃圾的趋势。另一个批评是,因特网就像一个只有神经细胞的低等生物, 它没有大脑,即没有利克莱德所说的“思维中心”( 见“因特网的故事”) 。四十多年过去了, 人们并没有实现利克莱德在1 9 6 0 年勾画出的电脑网络的模样。现在,人们试图用网格来 实现利克莱德的思想。那么,网格和因特网在技术上有哪些不同呢? 用简单的话讲,网格 是高性能计算机、数据源、因特网三种技术的有机组合和发展,它与因特网相比具有高性 能、一体化、知识生产、资源共享等技术优点。如果把网格和人做一对比,那么高性能计 算机就是大脑和重要器官,因特网相当于骨骼和血管、神经、淋巴等等通道,数据源就像 五官,提供各种养料和信息,而客户端的各种微机、工作站、信息家电设备、移动设备等 等就相当于肌肉和皮肤。如图1 2 所示,网格中的高性能计算机以相应方式连接,再通过 第7 页 一一一_ 一_ _ 一一一_ 南京邮电大学硕士研究生学位论文 第一章引言 因特网与各种客户端设备连接。 图1 - 2 网格与因特网 网格的高性能是指它比因特网具有更强的功能和性能,表现在四个方面。第一,网格 的互联网络比因特网具有更大的带宽。欧美的网格计划都会使用更高速度的主干网。 c e r n 的科学家这样形容网格的带宽:“它就像用1 0 0 条车道的高速公路取代今天的道路。” 第二,网格上将有更多高性能计算机,因此网格的计算速度、数据处理速度可以大幅度提 高。第三,网格的体系结构将比因特网更能有效地利用这些资源。比如,网格将采用一种 所谓的“广域缓存技术”,它自动地把用户最需要的信息放在离用户最近的服务器上。假如 成都的用户要查找奥运会的信息,他绝大部分时间将访问成都的服务器,尽管这些信息是 由中央电视台发布在北京的服务器上。第四,网格将促进更多、更大的网上社区的出现。 这些相互联结的社区最终构成一个庞大的网格社区,把我们地球上所有公民联为一体。根 据网络的麦特考夫定律,网格的价值与网格用户数的平方成正比。 如果说高性能只是反映了网格和因特网数量上的区别,那么网格的知识生产特性就反 映了质的区别。因特网本身不创造或生产知识。人们都是先把信息或者是知识用其他方式 生产出来以后,再“放到网上”,供用户查找。网格则能根据用户的要求自动地生产知识。 前面谈到的天气预报就是知识生产的一个例子。在知识生产的过程中,高性能计算机将起 到关键的作用。它把从数据源( 传感器、贵重设备、数据库、信息库等等) 得到的原始数 据,运行特定的程序加工成信息和知识。网格可以自动地找到高性能计算机、程序软件和 数据源。一个网格有多台分布在全国各地的高性能计算机,称为网格结点。有时,人们也 把高性能计算机所在的计算中心、数据中- t l , 、信息中心等称为网格结点。 第8 页 南京邮电大学硕士研究生学位论文第一犟引言 为了便于使用,网格不应该像因特网那样,提供几百万个网站,让用户去费尽心思寻 找合适的地方。在逻辑上,网格应该就像一台机器。这个特性叫作“一体化”,它还有一个 更学术化的名称,叫作“单一系统映象”。 有一种办法可以让我们展望网格的功能。我们只需将今天的因特网与一种已经成熟的 技术( 比如电力网) 比较。其中的差距就是网格应该努力的方向。今天的因特网与电网相 比,差距还是很大的。 首先,我们有各种各样的发电厂:水力发电厂、火力发电厂、风能发电厂、核能发电 厂等等,它们分布在全国,并且联成了一个整体的电网。当我们把电器插上墙上的插座时, 就自动从电网上得到了电能,我们并不知道,也不关心电能是从哪个发电厂、以何种形式 提供的。我们说,电网将所有电厂一体化了。 那么因特网的情形又是怎样的呢? 我们如果要获取信息,并不是直接从因特网本身获 取,我们必

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论