硕士学位论文-一种分布式资源定位机制研究.doc

上传人：机*** IP属地：安徽上传时间：2019-12-25 格式：DOC 页数：74 大小：1.79MB 积分：30 举报 版权申诉

已阅读5页，还剩69页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

学校代码 10254 密级论文编号上海海事大学上海海事大学 SHANGHAI MARITIME UNIVERSITY 硕士学位论文硕士学位论文 MASTER DISSERTATION 论文题目一种分布式资源定位机制研究学科专业计算机应用技术作者姓名夏振华指导教师史小宏副教授完成日期二一零年五月学校代码 10254 密级论文编号论文独创性声明论文独创性声明本论文是我个人在导师指导下进行的研究工作及取得的研究成果论文中除了特别加以标注和致谢的地方外不包含其它人或其它机构已经发表或撰写过的研究成果其它同志对本研究的启发和所做的贡献均已在论文中作了明确的声明并表示了谢意作者签名日期论文使用授权声明论文使用授权声明本人同意上海海事大学有关保留使用学位论文的规定即学校有权保留送交论文复印件允许论文被查阅和借阅学校可以上网公布论文的全部或部分内容也可以采用影印缩印或者其它复印手段保留论文保密的论文在解密后遵守此规定作者签名导师签名日期摘要摘摘要要分布式系统由一系列分散的网络节点组成在各个节点间进行资源和信息的交流最重要的问题之一就是资源的定位这也是最难实施的机制之一本文分析了国内外分布式资源定位研究现状与分布式资源定位的相关内容包括现有的资源定位发现机制以及小世界模型概念阐述了幂律和小世界模型对资源定位机制的影响我们提出了 CARLM Clusting And Agent Based Resource Location Model 模型它以日本大阪大学的分布式框架 PIAX 为基础 CARLM 是基于网络拓扑的资源定位模型在覆盖网络中利用聚类技术把节点分成多个兴趣簇每个兴趣簇是一个逻辑类似的小组并给出了 Cluster 的形成维护策略以及本地缓存信息在 CARLM 模型的基础上扩展一个基于聚类和 Agent 的分布式资源定位算法 FCB 网络内任一结点在发起资源查询请求时搜索 Agent 首先查看结点所在簇内其他结点是否能满足查询请求使用泛洪查询方法当簇内查询得不到满足时簇内结点通过转发结点向簇外结点发送资源请求消息并使用蚁群算法泛洪算法和蚁群算法配合使用目的是在 Agent 迁移中实现进一步的性能提高泛洪在簇内可以实现快速的资源发现而不会产生太多的信息量聚类使得关联节点间逻辑距离缩短蚁群算法使得 Agent 向着资源丰富的节点移动在簇外对迁移路径进行选择时又利用了概率选择的方法使搜索 Agent 向着资源丰富的节点移动的同时又不至于使某条资源丰富的路径堵塞为了验证本文提出的模型和算法我们在 Peesim 仿真平台和 AgentSpace 上进行了资源定位模拟实验对泛洪算法和 FCB 以及没有利用蚁群算法的 FCB 进行了查询信息量平均查找成功率以及平均跳数的性能的对比实验表明算法 FCB 更有效关键词资源定位小世界 CARLM FCB 蚁群算法移动 Agent ABSTRACT ABSTRACT The distributed system consists of a number of decentralized network nodes that are capable of sharing resources and informations One of the most important functions in distributes system is the location of resources and it is one of the hardest targets to achieve In this thesis we firstly outlines the current research status about the resource location of distributes system at home and abroad and then introduced the distributed resources location related content including the existing resource location discovery mechanism and the concept of small world model and describe the impact on the resource location mechanism which the power law and small world model have We propose CARLM model Clusting And Agent Based Resource Location Model which is bases on the distributed system framework PIAX that is proposed on the University of Osaka Japan CARLM is based on the network topology which uses clustering technology to put nodes into several clusters in the overlay network each cluster is a logically similar groups and then we describe the Cluster formation maintenance strategy and the local cache information we expand a clustering and Agent based distributed resource location algorithm FCB when any node within the network launch a request the search Agent examines other nodes in the same Cluster to see whether the nodes are able to satisfy the query request or not in which uses the flooding method When the inquiry is not satisfied in cluster the forward node sends the resource request message to the node outside the cluster in which uses the ant colony algorithm The conjunction of Flooding algorithm and ant colony algorithm is to achieve the further performance improvement in the Agent migration The Flooding can locate the resource quickly without creating too many messages in the cluster Clustering makes the logical distance between correlated nodes shorter Integrating ACO is expected to ABSTRACT strengthen the connections to resource rich nodes When selecting the link between nodes we use probabilistic selection to make the Search Agent migrate to the resource rich nodes without rendering the path of a certain resource rich link block In order to verify the proposed model and algorithm we make the simulated experiment of resource location in PeerSim and AgentSpace and compare our approach FCB with flooding algorithm and FCB without ACO in terms of Querying traffic Average Success rate and Average Hop count And the experiment shows that the FCB algorithm is more effective Keywords Resource Discovery Small World CARLM FCB ACO Mobile Agent 目录目录第一章第一章绪论绪论 1 1 1 1 分布式资源定位研究现状 1 1 1 1 资源定位发展过程 1 1 1 2 国内研究情况 2 1 1 3 国外研究情况 3 1 2 本文研究工作 4 1 3 本文的组织结构 5 第二章第二章分布式网络资源定位分布式网络资源定位 7 7 2 1 资源定位 7 2 1 1 组成部分 7 2 1 1 1 资源描述 7 2 1 1 2 资源信息组织 8 2 1 1 3 资源请求处理 10 2 1 1 4 资源选择 10 2 1 2 资源发现的要素和类型 11 2 1 2 1 网格中的资源发现 12 2 1 2 2 P2P 网络中的资源发现 12 2 1 2 3 移动自组网中的资源发现 14 2 1 2 4 其他分布式系统中的资源发现 14 2 2 现有资源定位技术 15 2 2 1 集中式发现机制 15 2 2 2 分布式结构化发现机制 16 2 2 3 半分布式发现机制 17 2 2 4 基于移动 Agent 的分布式资源定位方法 17 2 2 5 分布式非结构化发现机制 18 2 3 小世界模型 19 2 3 1 小世界和幂律特性 19 目录 2 3 2 小世界拓扑生成方法 21 2 3 3 小世界模型对资源定位技术的影响 22 2 3 4 基于小世界模型的资源定位策略 23 2 4 本章小结 23 第三章第三章分布式资源定位模型分布式资源定位模型 CARLM 2424 3 1 CARLM 设计思想 24 3 2 CARLM 系统模型 25 3 3 覆盖网络 27 3 3 1 节点关联度定义 28 3 3 2 Cluster 形成 29 3 3 3 Cluster 维护 32 3 4 本地缓存信息 33 3 4 1 节点本地 IA 信息 33 3 4 2 节点管理表 NMT 33 3 4 3 历史路径信息 34 3 5 本章小结 34 第四章第四章 CARLMCARLM 模型中资源定位机制模型中资源定位机制 FCBFCB 3535 4 1 蚁群聚类思想 35 4 1 1 Clusting 35 4 1 2 Ant Colony Optimization 36 4 2 资源定位机制 FCB 38 4 2 1 FCB 算法 39 4 2 2 簇内路由算法 40 4 2 3 簇外路由算法 41 4 3 CARLM 中资源搜索策略 44 4 4 算法分析 46 目录 4 5 本章小结 47 第五章第五章资源定位实验资源定位实验 4949 5 1 实验环境 49 5 2 实验执行 50 5 3 算法性能比较 54 5 3 1 查询信息量 54 5 3 2 平均查找成功率 55 5 3 2 平均跳数 56 5 4 本章小结 57 第六章第六章总结与展望总结与展望 5858 6 1 本文工作总结 58 6 2 展望 59 致谢致谢 6060 参考文献参考文献 6161 攻读学位期间发表的学术论文攻读学位期间发表的学术论文 6464 第一章绪论 1 第一章绪论 1 11 1 分布式资源定位研究现状分布式资源定位研究现状 1 1 11 1 1 资源定位发展过程资源定位发展过程随着互联网在世界各地进行快速传播它经常被用来人类的各种交互活动在各种应用软件间进行的用户交互要求软件能够与网络社区进行交流信息和资源传统客户机浏览器模式仅能体现真实世界的情况如视频流媒体服务的出现在服务器上进行密集的访问会带来瓶颈问题对等网络系统可以提供一个解决这个问题的方法分布式系统是由一系列分散的网络节点组成的这些节点能够分享资源而不需要中央服务器的支持已经存在很多应用如 IP 电话内容交付网络 CDN 和分布式计算都采用了分布式技术并把它运用到基本的通信系统中分布式系统在各个节点间进行资源和信息的交流分布式系统包括一个覆盖网络其中节点可以相互交流并分享彼此的资源在这里资源指的是由网络节点提供的各种服务分布式系统中最重要的问题之一就是资源的定位而这也是最难实施的机制之一 Napster 公司通过提供索引服务的中央服务器来解决这个问题 1 但是这种服务器的问题是如果出现错误就可能使整个网络瘫痪因此不含有任何中央服务器的分布式系统是当前的分布式系统发展领域的研究重点著名的分布式系统 Gnutella 2 采用消息 Flooding 来定位资源这种系统的优点是简单但它对于大型网络系统是不切实际的因为仅仅 Flooding 的资源发现消息就很容易使整个网络达到饱和状态为了解决这个问题分布式哈希表 DHT 被提出并使用 3 4 5 6 虽然 DHT 是最有前途的方法之一并且它能提供对分布式系统的快速资源查找效率计算复杂度为 O log n 但是它具有下列缺点 1 由于 DHT 的基本机制是映射关键字到节点所以很难找到基于多个关键字的对象或对象中的内容 2 是很难找到与给定的一个关键字或一组关键字相关的多个节点换句话说基于 DHT 的资源查找方法过于僵化导致处理不够灵活和查询不够智能为了减轻 DHT 系统的僵化一些分布式系统利用信息 Flooding 进行对象第一章绪论 2 的查找以补充 DHT 的不足 7 由于消息 Flooding 会产生密集的通信量它对那种间歇性网络连接的移动通信环境是不适合的由于 DHT 在拓扑结构的维护上存有严重的问题目前对分布式系统的研究侧重于控制和约束信息 Flooding 技术整个 Gnutella 系统采用了一个叫做动态查询 DQ 的受控 Flooding 技术其中 DQ 技术预测了一个合适的生存期 TTL 值以减少网络流量负载 8 Jian 等提出了一个加强的 DQ 技术它采用一种置信区间的方法使它能够进一步减少网络流量负载 9 另一方面移动 Agent 系统最近在各个领域都成为热门 10 在分布式系统中移动 Agent 具有以下优点 1 移动 Agent 把节点之间的可能交互打包在一起并把必要的处理方法传递到所需节点所在地使得他们本地化 2 移动 Agent 是异步的能够使这个产生移动 Agent 的节点完全可以执行不同的任务甚至暂时离开网络 3 移动 Agent 是独立自主的当他们在网络中运行的同时就可以了解网络 11 自治 Agent 在智能机器人控制系统 12 13 14 中发挥主要作用移动 Agent 可以引进所需的功能并能自主履行任务并可以使通信量减少因此自然而然的在分布式系统中我们不仅利用静态 Agent 而且还要利用动态 Agent 以提供灵活的搜索移动 Agent 被期望可以减少查询信息的数量 1 1 21 1 2 国内研究情况国内研究情况 Maze 15 是北京大学网络实验室开发的一个中心控制与对等连接相融合的对等计算文件共享系统在结构上类似 Napster 对等计算搜索方法类似于 Gnutella 网络上的一台计算机不论是在内网还是外网可以通过安装运行 Maze 的客户端软件自由加入和退出 Maze 系统每个节点可以将自己的一个或多个目录下的文件共享给系统的其他成员也可以分享其他成员的资源 Maze 支持基于关键字的资源检索也可以通过好友关系直接获得 Granary 16 是清华大学自主开发的 P2P 存储服务系统所谓 P2P 存储服务系统是指存储服务的提供者在 Internet 中部署一定数量的存储服务器为用户提供数据存储服务确保数据的可靠性可用性安全性和访问效率存储服第一章绪论 3 务的使用者按照所存储数据的容量和质量付费它以对象格式存储数据并且支持属性级的数据查询 AnySee 17 是华中科大设计研发的视频直播系统它采用了一对多的服务模式支持部分 NAT 和防火墙的穿越提高了视频直播系统的可扩展性同时它利用了近播原则分域调度的思想使用 Landmark 路标算法直接建树的方式构建应用层上的组播树克服了 ESM 等一对多模式系统由联接图的构造和维护带来的负载影响 WonGoo 18 是中科院计算所研制的一套 P2P 技术平台该平台主要为信息安全网格计算提供支撑技术和实验环境同时 WonGoo 的基础部件将在开发完善之后以开放源代码的方式向社会公开 WonGoo 主要包括两个方面的特色功能具有强匿名性的 P2P 通讯 WonGoo Link 基于内容查找的 P2P 资源共享 WonGoo Search 可以在这两个功能的基础上搭建各种特色化的 P2P 应用目前相关的应用还没有具体实现 WonGoo Link 与 WonGoo Search 可以分别独立构造并搭建各自的应用同时 WonGoo Search 底层通讯也可以采用 WonGoo Link 协议来实现更安全的应用基于 IPV6 的 P2P 内容存取应用系统 19 这是北京大学清华大学上海交通大学浙江大学华中科技大学华南理工大学北京世纪鼎点软件有限公司共同承担的国家 CNGI 项目的一部分它主要研究基于智能节点弹性重叠网络技术的内容存取应用中间件系统在 CNGI 上建设可管理可控制和可运营的智能节点弹性重叠网络开发内容存取类应用 1 1 31 1 3 国外研究情况国外研究情况从国外公司研究来看 Microsoft 公司 Sun 公司和 Intel 公司投入较大 Microsoft 公司成立了 Pastry 项目组主要负责分布式计算技术的研究工作目前开发了基于 Pastry 的多种应用包括 SCRIBE PAST SQUIRREL 等在新一代的 Windows Vista 操作系统中也增加了最新的研究成果来支持协同工作标注 1 在 2000 年 8 月 Intel 公司宣布成立分布式 P2P 工作组正式开展 P2P 的研究工作组成立以后积极与应用开发商合作开发应用平台 2002 年 Intel 发布了 Net 基础架构之上的 Accelerator Kit P2P 加速工具包和 P2P 安第一章绪论 4 全 API 软件包从而使得微软 NET 开发人员能够迅速地建立 P2P 安全 Web 应用程序 IBM 公司也开展了基于 P2P 技术的研究提出了 Smart Networking 另外 IBM 公司大力支持的网格计算 Grid Computing 与 P2P 计算在许多方面研究类似 Sun 公司以 Java 技术为背景开展了 JXTA 项目 20 JXTA 是基于 Java 的开源分布式 P2P 平台任何个人和组织均可以加入该项目因此该项目不仅吸引了大批研究人员和开发人员而且已经发布了基于 JXTA 的即时聊天软件包和搜索引擎 JXTA 定义了一组核心业务认证资源发现和管理在安全方面 JXTA 加入了加密软件包允许使用该加密包进行数据加密从而保证消息的隐私可认证性和完整性在 JXTA 核心之上还定义了包括内容管理信息搜索以及服务管理在内的各种其它可选 JXTA 服务在核心服务和可选服务基础上用户可以开发各种 JXTA 平台上的分布式应用 1 21 2 本文本文研究工作研究工作第一针对传统分布式资源定位存在的一些问题我们在日本大阪大学的 PIAX 框架基础上改进了一种基于聚类和 Agent 的分布式资源定位模型 CARLM 该模型划分为物理网络层覆盖传输层多覆盖层信息发现层安全机制层 Web Service 层以及 Agent 层每层都负责各自不同的功能很好的适应了资源发现模型的设计原则它是基于网络拓扑的资源定位模型在覆盖网络中利用聚类技术把节点分成多个兴趣簇每个兴趣簇是一个逻辑类似的小组并给出了 Cluster 的形成维护策略以适应动态变化的网络环境第二我们在框架 CARLM 的基础上提出了资源定位算法 FCB 网络内任一结点在发起资源查询请求时首先查看结点所在簇内的其他结点是否能满足查询请求使用到泛洪方法查询当簇内查询得不到满足时结点通过转发结点向簇外结点发送资源请求消息使用蚁群算法 ACO 其中在簇外进行邻居节点选择时利用 LNRR Logical Nearest And Resource Richer 算法来选择那些逻辑最近并且资源相对丰富的节点第三当一个 Agent 找到资源丰富的节点时它加强通往这个节点的路径信息并减弱其他路径上的信息素以便进一步提高效率加强通往一个理想第一章绪论 5 节点的路线是通过运用先前 Agent 的信息素完成的这种信息素可以引导成功的 Agent 使得他们很容易到达节点当进行路径选择时我们并不是选择信息素最高的路径因为那样很容易造成路径交通堵塞我们的选择策略是用概率的方法进行迁移既保证了资源定位的高效性又不会造成交通堵塞在这个新系统中我们的搜索 Agent 执行节点聚类的方法并间接被信息素指引跟以前的系统相比提高了搜索效率第四对算法进行模拟实验它利用了仿真软件 PeerSim 以及移动 Agent 环境 AgentSpace 并与泛洪机制不含 ACO 的 FCB 算法进行了性能对比其中主要从产生的信息量查询成功率以及平均跳数这三方面进行对比实验结果表明本文算法 FCB 有比较明显的性能优势 1 31 3 本文的组织结构本文的组织结构第一章绪论本章主要介绍分布式资源定位研究背景及意义并介绍了国内外在分布式资源定位领域的研究现状然后给出了本文的研究以及组织结构第二章分布式网络资源定位本章介绍了分布式网络资源定位的相关内容包括资源定位的概念现有的资源定位机制以及小世界模型概念第三章分布式资源发现框架 CARLM 本章介绍了我们提出的分布式资源定位模型 CARLM 并介绍了框架各层的功能特点 CARLM 是基于网络拓扑的资源定位模型在覆盖网络中利用聚类技术把节点分成多个兴趣簇每个兴趣簇是一个逻辑类似的小组并介绍了 Cluster 的形成维护策略以及本地缓存信息第四章资源发现算法 FCB 本章提出了针对 CARLM 模型的智能高效资源定位算法 FCB 我们还描述了聚类和蚁群优化 ACO 算法的技术它们对资源发现效率的提高有很大帮助网络内任一结点在发起资源查询请求时首先查看结点所在簇内的其他结点是否能满足查询请求使用泛洪查询方法当簇内查询得不到满足时结点通过转发结点向簇外结点发送资源请求消息使用蚁群算法 ACO 第一章绪论 6 第五章资源定位实验本章主要对算法进行模拟实验它利用了仿真软件 PeerSim 以及移动 Agent 环境 AgentSpace 并与泛洪机制不含 ACO 的 FCB 算法进行了性能对比其中主要从产生的信息量查询成功率以及平均跳数这三方面进行对比实验结果显示本文算法 FCB 有比较明显的性能优势第六章总结与展望对全文进行总结工作并就本文进一步的研究工作进行了相应的讨论第二章分布式网络资源定位 7 第二章分布式网络资源定位 2 12 1 资源定位资源定位资源定位发现机制是关系到广域分布式环境中资源共享与协同工作效率的关键在 Web 服务计算网格和 P2P 技术中都需要对这个问题进行深入的研究资源是一种具有能为外界所感知的值的东西包括设备信息和服务比如文件目录或一系列记录其它的主机结点地址的目录可以是资源也可以是来自同一个特定类别的文件文字文档音乐文件电影片段等一段可执行代码也可以是资源另外资源还可以包括硬件设备如传真机打印机路由器等 2 1 12 1 1 组成部分组成部分 2 1 1 12 1 1 1 资源描述资源描述资源描述是指提供给用户来表述自己所需资源的方式而用户对所需要的资源的描述可以作为资源请求的一部分用来进行资源的查找它影响到资源信息的组织和描述同样也影响到资源提供者将要把资源的哪些信息发布出去资源描述大体分为四大类第一类资源定位发现系统中为每个资源分配一个全局唯一的名字并且用它进行描述资源也就是每个资源描述都唯一对应一个确定的资源比如说 PC 机的 IP 地址等在第二类资源定位系统中为每一类资源分配一个全局唯一的名字当用它来描述资源时用户所指定的是一类资源中的任意一个例如在 P2P 系统中所有相同的文件都有同样的名字在第三类资源定位系统中除了每类资源应该具有全局唯一的名字之外还需要一些属性类的名字加上属性共同描述用户对资源的需求例如 Globus 的 RSL 21 在第四类系统中在资源描述中增加了语义信息所以它可以进行模糊匹配查询这四种类型系统的描述能力呈依次增强的趋势可以说前一种第二章分布式网络资源定位 8 是后一种的特例例如在第二种系统中把每一个资源都看成是一类同时赋予它一个类名那么这个类名就是所有资源全局唯一的名字具体选用哪种资源描述方法这取决于系统中资源的具体类型和用户的需求例如文件共享系统中用文件名来描述用户需求就已经足够了而在网格系统中共享的资源由于比较复杂比如计算资源等等用户就需要指定所需要资源的多种属性比如主机的内存大小或者是安装了某种特定的软件 2 1 1 22 1 1 2 资源信息组织资源信息组织资源信息组织指资源信息是如何分布并存储在网络中的它具体包括节点间的 overlay 是如何进行构造的资源信息是如何进行传播的以及是存储在哪些节点上的其中资源信息的传播与存储是 offline 的与具体请求的执行无关它可以看成是一种预处理可以增强定位搜索的性能资源信息的组织可能受到很多因素的影响比如带宽的限制节点对消息的处理能力和节点的负载能力安全或者管理策略网络的物理拓扑等等所以 overlay 网络只是实际物理可连通的网络的一个子网例如跟一个 Gnutella 节点在某一时间知道的 peer 数量几百个相比它正在使用的连接是很少的平均连接值少于 10 个 2001 年五月测量的平均值为 3 4 22 在相同的 overlay 网络上可以有不同的资源信息传播方式和存储方式 Overlay 网络拓扑大体可分为以下几类如图 2 1 所示集中结构所有的资源信息都存储在同一个节点上并且所有的资源信息都注册到这一个节点而且所有的查找也都在该节点上进行之所以这样做是因为定位查找的通信开销仅限于中心节点和请求者之间并不会对其他的节点造成负担这样既减小了复杂度又降低了开销如果在请求负载较轻的情况下在网络延迟远远大于计算处理速度的现在也许可以降低请求的响应速度但是如果网络规模很大注册更新以及查找的所有请求都会汇聚到这一个点上会使它的网络负担非常重也就难以达到预期的速度和性能 flat 结构亦即 P2P 的方式在这种结构下所有的节点都是平等的它们所存储的信息量都是一致的例如它们都只是存储本地的信息或者是负责一部分资源空间的信息第二章分布式网络资源定位 9 层次性结构亦即树形方式整个网络分为两层或者更多层同一层中的节点之间彼此没有连接下层节点都对应于一个或多个上层节点上层节点都对应一个或多个下层节点 P2P 与层次性结合的结构网络中每层的节点都是对等的并用一定的拓扑结构相连下层节点对应一个或者多个上层节点同样上层节点对应一个或者多个下层节点如果只有一层的话那么这种混合结构也就退化成了 flat 结构如果同一层之间的节点间彼此没有连接那么这种混合结构就退化成为了层次性结构 a 集中结构 b flat 结构 c 树形结构 d 混合结构图 2 1 Overlay 网络的拓扑上面四种结构的复杂性依次增加需要维护的信息也是依次增多维护结构所需要的开销也依次增大资源信息存储可以有以下几种方式无信息的复制每个节点只保存自己本地的资源信息比如在 Gnutella 中这种存储方式多数采用 flat 的 overlay 拓扑第二章分布式网络资源定位 10 均匀信息复制每个节点只负责资源空间中的一部分每个节点都把自己的资源信息注册到某些特定的节点上例如在有结构的 P2P 系统中每个节点都只负责一部分资源空间并且所有的资源信息都均匀的分布在各个节点上还存在一种非常极端的情况就是每个节点都负责全部的资源空间也就是资源信息在所有节点间进行完全复制比如因特网上的域内路由算法链路状态路由算法就是一个例子集中式信息复制只有一部分特定节点负责存储资源信息每个节点都将自己的资源信息注册到一个或者多个专门负责存储资源信息的节点中在极端情况下所有节点都把资源注册到一个节点 Napster 和 Matchmaker 23 都是这样做的在这三种信息的存储方式中对存储节点的要求依次增加第一种方式没有信息的注册和更新的开销第二种和第三种的开销因具体情况而不同资源信息的组织对请求处理的过程影响是很大的 overlay 的拓扑决定着请求所走的路径资源信息存储极大的影响着请求的处理流程 2 1 1 32 1 1 3 资源请求处理资源请求处理资源请求处理可以分为两部分本地部分和远程部分本地部分就是指在本地信息中进行查找并处理聚合请求例如有的请求同时请求 A 资源和 B 资源那么我们可以把它分解成两个独立的请求分别加以对待或者是实施本地策略比如丢弃一些不符合本地的管理策略的请求远程部分指的是请求传播的规则在很多系统中请求传播的规则与资源信息的组织方式是密切相关的比如在 CAN Chord Tapestry 和 Pastry 中请求传播规则就是由所使用的分布式哈希表以及资源空间组织决定的但是在某些无结构的系统中选择请求传播规则的自由度就变得大很多比如在文献 24 中它们都采用了各种不同的策略将请求发送给不同数量的邻居并且可以确定如何选择邻居 2 1 1 42 1 1 4 资源选择资源选择资源选择是从那些满足用户需求的一组资源中按照一定的标准选择实际可以为用户服务的资源比如使用户费用最低或者系统性能最高等等在资源第二章分布式网络资源定位 11 发现的过程中系统可以根据自己的设置做出一些选择但那应该是一些简单并且通用的标准而那些针对用户需求的资源选择可以更复杂更具体更专业资源选择可以在资源发现过程中进行也就是可以有选择的返回符合条件的资源也可以在靠近客户端的地方集中进行也就是可以把所有满足条件的资源都返回然后从中选择一些更适合的 2 1 22 1 2 资源发现的要素和类型资源发现的要素和类型根据文献 25 所述设计一个通用的资源发现服务需要考虑以下几个方面 1 服务提供者 service provider 可以采用第三方服务 third party service 的方式实现资源发现服务即把提供资源发现服务的实体与资源提供者和使用者分开比如目前 web 上的搜索服务以及 DNS NaPster 等例如作为专门的 web 搜索服务提供者 Baidu 搜集 Web 上的大量页面并编制一定的索引通过门户网站向用户提供网页搜索的服务与之相对的另外一种形式是完全分布 genuinely distributed 的形式也就是 P2P 的形式即资源发现服务分布在所有资源提供者与使用者上并没有集中或协调机构例如文件交换系统 Gnutena 中就不存在集中的全局资源索引结点各个参与结点只了解本地的文件资源文件搜索则依赖于结点间广播式或随机的扩散搜索请求需要指出的是以第三方服务形式所实现的资源发现系统同样可以是分布式的例如 DNS 系统按照树形结构组织分布在各个地方的域名服务器中但是这些分布的服务器处于资源发现服务提供者的统一管理中而在完全分布的实现形式下并没有统一的管理和协调者资源发现则依赖于各个参与结点之间的交互 2 网络构造方式 Construction 在一般的情况下可以用一个图来表示分布式资源定位发现系统中涉及的各个结点间的交互关系对应于底层通信网络之上的覆盖网络 overlay network 结点间的边代表两个结点间的交互关系构造覆盖网络的基本方法有两种手工配置和自组织或者是混合形式的例如 DNS 系统基本依靠手工配置来维护各域名服务器之间的关系而在 Gmitena 系统中各参与结点实现了自组织各结点根据本地知识独立调整邻居结点 3 入网的预先知识 Foreknowledge 分布式资源定位发现系统中的每个结点在加入前需要了解系统的一些相关信息这些信息往往与网络的构造方式有第二章分布式网络资源定位 12 关系例如在 Gnutella 系统中加入的结点需要了解网络中任意一个活动结点的地址以完成提交加入请求 4 网络结构 Aichitecture 指分布式资源发现系统中各节点形成的覆盖网络的拓扑结构 5 资源注册 ResourceRegistration 指资源信息在哪些节点进行注册及其更新过程 6 查询路由 QueryRouting 指查询请求的扩散与路由方式 2 1 2 12 1 2 1 网格中的资源发现网格中的资源发现 Globus Toolkit MDS 26 是一种网格环境中的资源发现解决方案最开始它使用的是集中式的方法随着资源和用户数量的增长它也衍变成了分布式的结构在 MDS 2 中网格是由多个信息提供者组成的这些信息提供者可以根据注册协议 GRRP Grid Registration Protocol 把这些信息源注册到集成目录服务器 aggregate directory server 信息提供者能够提供有关网格实体的详细的动态的信息集成目录服务器则提供专业的与 VO 相关的联合的资源或者服务的视图 GRIP 协议是用来访问实体信息的协议它支持 discovery 和 enquiry discovery 就是搜索的功能例如一个信息提供者维护着一组工作站的信息一个用户想要在这个信息提供者上进行一次搜索以获取满足某个条件的结果而 enquiry 是直接的查找 lookup 信息用户提供资源的名字信息提供者返回该资源的描述 2 1 2 22 1 2 2 P2PP2P 网络中的资源发现网络中的资源发现最近倍受关注的 P2P 文件共享是一种基于名字每种文件都对应一个全局唯一的名字的资源查找方式最早的 P2P 系统是 Napster 它有一个中央索引服务器 central index server 资源提供者将自己的资源文件信息注册到这个服务器上需要资源的用户也到这个服务器上进行查找找到满足要求的资源后就直接从资源提供者那里下载此时资源发现是集中式的资源的使用是 P2P 的后来出现了很多 P2P 系统大致可以分为两类无结构的 unstructured 和第二章分布式网络资源定位 13 有结构的 structured 无结构的 P2P 系统比如 Gnutella 和 Freenet 有结构的 P2P 系统是基于分布式哈希表来构造搜索效率很高的 overlay 的例如 CAN Chord Tapestry 和 Pastry Gnutella 的基本机制就是 Flooding 泛洪对于不能回答的查找请求每个节点都转发给它所有的邻居直到超出时限也就是 TTL time to live 过期请求会沿着来时的轨迹一个节点一个节点的返回到初始的请求者这种方法的好处是很简单每个节点都只维护自己的邻居列表没有其他的信息需要交换和维护缺点就是较好的搜索性能是以较大的网络流量为代价的为了解决 Flooding 算法网络开销比较大的问题提出了 random walk 27 算法 Random walk 算法就是当消息不能在本地被满足需要转发出去的时候从所有的邻居节点中随机的选取一个作为下一步将请求消息传递过去而不是转发给所有的邻居直到找到合适的资源 Random walk 能够降低消息开销但是用户能够感知的成功搜索的延迟也会大幅度增大 Freenet 中的文件发现机制使用的是基于动态路由表的请求传播方法它既包括文件管理又包括文件查找机制受欢迎的文件就被复制放到离用户较近的地方而最不受欢迎的最终会消失 Freenet 中对资源文件本身进行了复制但是很多资源是不可以复制的比如计算资源或是出于安全存储容量等因素不能进行复制的数据那么这种方法就不适用了有结构的 P2P 系统的共同之处在于使用了分布式哈希表 DHT 每个资源 ID 都通过 DHT 被映射到一个节点 ID 关于该资源的信息都将存放于该节点或者具有和该节点 ID 最相近 ID 的节点上如果网络规模很大节点数量很多一个节点不可能记录下所有节点 ID 和它的物理地址 IP 地址所以在大规模的 P2P 系统中都使用了各种 overlay 网络拓扑来使得每个节点都存储少量的信息但是又能通过某些路由机制找到任意一个节点有结构的 P2P 系统都是在一个有结构的 overlay 上传播信息有类似的成员协议和请求处理过程区别则在于节点空间的定义不同因而由于节点的不断变化维护这个定义空间的方法也不同在 Chord 中节点的空间是一个环 CAN 中是一个 d 维的坐标空间而在 Pastry 和 Tapestry 中是 Plaxtonmesh 28 向节点空间中的相邻节点不断发我还活着的消息可以看作是一种预处理第二章分布式网络资源定位 14 使用 DHT 的好处就在于进行资源处理时只通过分布式哈希函数就能够确定存放资源信息的节点的 ID 而不是像在无结构 P2P 系统中那样需要通过遍历来进行查找在后面我们提出的部分连通的移动自组网中的资源发现框架中因为群间的消息传递延迟比较长遍历式的查找方式延迟会非常大难以接受我们就会使用 DHT 来实现确定性的资源查找 2 1 2 32 1 2 3 移动自组网中的资源发现移动自组网中的资源发现由于移动自组网的网络拓扑是不断变化的所以相对于因特网上验证有效的集中式静态的方法分布式的动态控制的机制更适合移动自组网文献 29 中提出了一种基于 DA Discovery Agent 的 QoS aware 的移动自组网中的资源发现框架 DA 会负责目录信息的组织和查询以及动态域的形成初始时网络中的节点会选举出一些 DA 每个节点都会有自己的 home DA home DA 会根据资源的属性哈希出一个索引号再把资源按照索引号注册到一个或多个其他 DA 上 DA 主要有三个功能 1 目录信息的组织和查询 2 动态的形成域 3 域内和域间的 QoS 信息的监控资源的查找有两种方式一种是浏览方式另一种是访问方式对于浏览方式来说就是将请求发送到资源属性哈希出来的索引号对应的 DA 上该 DA 返回所有满足条件的资源提供者的信息给用户而访问方式就是要从所有满足条件的资源提供者中选择 QoS 最好的资源进行下载这种方法的主要特点在于它提供了基于 QoS 的资源选择从而使得它的性能要优于不考虑 QoS 的资源发现系统 2 1 2 42 1 2 4 其他分布式系统中的资源发现其他分布式系统中的资源发现 DNS Domain Name Service 30 是最大的基于名字的分布式查找系统它将 Internet 主机域名翻译成相应的 IP 地址它服务于整个因特网已经成为了一项重要的因特网资源服务它采用层次性拓扑结构节点加入到层次结构的某个地址 overlay 的功能是维护好基于域的树形结构请求的解析是由低向高层顺序进行的在 Ninjia 服务定位服务 31 中服务是根据最相关的某些属性来命名的系统将这些名字做聚合经过聚合可能会损失一些信息并把这些概要信息在层第二章分布式网络资源定位 15 次结构中向上传当处理查找请求时按照 B 树搜索方式在这种层次结构中向上或向下转发在系统部署时 overlay 的层次结构已经固定 Globe 定位机制是建立在搜索树结构的基础上的搜索关键字是全局唯一名字命名服务将一个 URL 转化成与位置无关的唯一标识符所以它的 overlay 成员关系维护以及搜索方法都是基于这样的搜索树的 Conder 的 Matchmaker 是基于属性的资源查找服务资源描述与请求被发送到一个中央验证机构并在那里进行匹配预处理就是把资源注册到中央服务器中每个节点只需知道中央服务器的地址处理请求就是将请求发送到中央服务器只需告诉新加入的节点中央服务器的地址除此之外不需要其他维护成员关系的机制了 Lee 和 Benford 提出了基于请求传播 propagation 的资源发现机制其中节点把所有未解析出来的请求转发到一个无结构 overlay 上的其他节点中这个 overlay 的构建要考虑到邻居节点的专长和喜好一个节点要连接到有用服务的节点或有好的推荐的节点这种方法的预处理是要收集进行评价所需的信息不管需要或不需要 trader 都会去探测整个网络并把状态改变后通过 Flooding 方法传播出去 2 22 2 现有资源定位现有资源定位技术技术根据拓扑结构

人人文库> 全部分类> 教育资料 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

硕士学位论文-一种分布式资源定位机制研究.doc

文档简介

温馨提示

最新文档

评论

硕士学位论文-一种分布式资源定位机制研究.doc

文档简介

温馨提示

最新文档

评论

相关文档