



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
文章来源 毕业论文网 集群组管理原理与系统的实现文章来源 毕业论文网 欢迎浏览,以下是yjbys求职网给您推荐一篇关于集群组管理原理与系统的实现的计算机应用毕业论文摘要:集群系统的出现允许用户把普通商用硬件系统组成集群,并根据需要随时在集群中增加新的硬件,提高了系统的伸缩性和可用性,从而能够在价格相对低廉的中低端平台上享用过去只有高端系统才具备的高可伸缩性和高可用性,既提高了系统的性能,同时也降低了成本。因此,集群成为了高性能计算领域瞩目的焦点。引言随着internet商业服务的飞速发展,服务系统的可用性程度对服务提供者的商业利益具有重大的影响。同时,由于通过计算机服务系统提供的服务内容和服务范围都在不断扩大,计算机服务系统的规模也需不断扩大,现有的小规模的高可用系统己经难以满足这样大规模计算机系统对高可用性支持的需求。因此研究可扩展的高可用集群系统十分重要。1、心跳技术失效监测是所有高可用性的基础,如何才能做到尽快、尽可能准确地对节点的失效进行监测,这需要有一个好的模型。心跳模型被广泛应用于28个节点的小规模集群中。相对于上百个节点的大规模集群来说,小规模的集群使用心跳模型监测,对系统造成的负荷较小,并且小规模集群的网络带宽大、速度较快、延迟较小,这样心跳模型可以作出较为精确的判断。当心跳模型应用于两个服务器的集群时,两个服务器采用活动/备份,或者活动/活动集群模型工作,它们之间使用心跳模型进程相互监测,这个框架应用得相当普遍。但是当集群的节点数大于2的时候,心跳模型同样也能较好的保证准确、迅速地对失效节点作出判断。2、集群组管理原理(1)节点加入:每一个节点在启动的时候,会读取自身的配置文件,配置文件中包括节点id号,自身ip地址,多播ip地址和端口号,初始化消息和自身节点。接着会周期性地发送加入请求消息,直到收到其他节点的加入确认消息。(2)节点的离开/故障:首先需要监控节点的状态,是通过对方发送的心跳消息来监测的,即如果在三个周期内没有收到某节点的心跳消息,则认为它离开了或出现故障了。这里有两种情况:一是备份节点的离开/故障,直接将该节点从节点列表中删除即可。二是主节点的离开/故障,那么需要重新从剩余的节点中选择一个新的主节点,选择策略很简单,即从剩余节点中选择一个id号最小的为新主节点,并删除离开或出现故障的主节点。(3)正常运行:由于节点正常运行,它会周期性的发送心跳消息,标识自己的存在,那么其他节点会周期性的收到该节点的心跳消息,从而维护着一个集群节点列表。3、集群组管理系统的实现3.1 节点加入前的准备工作每一个节点都有一个配置文件configure.file,存放在./config目录下。前面定义了节点类型,消息类型,在节点启动的时候,首先读取配置文件(主要由函数read_profile( )实现),将配置信息:节点id号,自身ip地址,多播ip地址和端口号等初始化自身节点和待发送的消息,并将自身节点首先加入到节点列表中。3.2线程同步的实现一个进程中的所有线程共享相同的全局内存,这使得线程很容易共享信息,但是这种简易性也带来了同步(synchronization)问题。一个进程中的所有线程不仅共享全局变量,而且共享:进程指令、大多数数据、打开的文件(如描述字)、信号处理程序和信号设置、当前工作目录、用户id和组id。现实中,涉及到多个线程同时运行,比如gm_listener线程,它负责监控接收到的多播消息,并作相应的处理,比如收到加入消息判断是否在节点列表中,不在则将之加入,并发送加入确认消息,收到加入确认消息,判断是否在节点列表中,不在则将之加入,收到心跳信息,则将对应节点标志变量加一。heartbeater线程,通过对状态的查询每隔一个心跳周期发送加入请求消息或心跳消息,add_flag线程对标识每个节点的状态的标志变量flag作周期性的减一操作,而test线程周期性的对每个列表中的节点检测标志变量是否小于0,也即是列表中的节点是否失效或离开。4、结果测试与分析为了跟踪消息来源,每次都将收到的消息、类型、发送节点的ip地址、角色、状态都在控制台显示出来,以便分析程序中的问题。而且也在每次test线程执行一次检测后输出整个节点列表,这样有助于了解哪些节点加入进来了,哪些节点离开或失效了。实验的过程主要通过结束集群管理进程来模拟节点的失效或离开,通过启动某节点的集群管理进程来模拟节点的加入,正常运行的进程来模拟节点正常运行。为此设计了以下几个测试用例:(1)第一个启动的节点的确立。在集群组中还没有成员的情况下,第一个启动的节点自动成为主节点,后来启动的节点为备份节点。实验过程为:启动其中任何一个节点集群管理程序,接着启动其他节点集群管理程序。实验结果与预期一致。第一个启动4号节点,实验截图如图1:图 1 第一个启动的节点默认为主节点(2)节点的加入。其实这个过程已经在上述测试用例中达到了目的。新加入的节点按预期的要求加入到集群组中,并维护着统一的成员列表。6、总结在商业和科学领域,集群管理还涉及到许多其他的内容,因此针对一些具体的应用,还有很多的不足。我觉得可以从以下方面来考虑:(1) 建立一个对集群节点信息的详细监控。比如针对机柜系统环境、每节点硬件配置情况、每节点电压、各部件温度、风扇转速等硬件状态、系统cpu、内存、网络使用情况等,可指定节点,也可以图形方式对各节点的单项数据进行对比。以便针对具体故障进行处理。(2) 事件服务。系统管理员应该能够通过事件服务设置系统对事件的自动响应。(3)基于网络的管理:重起,关机;基于串口的管理:开电源、关电源、硬件重监测、控制台重定向。(4)实现任务分发,负载均衡,高可用性。(5)开发友好的管理界面,提高管理的安全性和方便性。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年实体书店如何通过新零售实现多场景营销策略报告
- 2025年冷链物流温控技术升级与冷链产品质量安全监管优化报告
- 智能家居行业生态构建与用户接受度研究报告-2025年市场洞察
- 消防安全培训考试题及答案
- (2025)医院感染知识试题题库有参考答案
- 教育产业投资并购前景展望:2025年整合策略与市场布局报告
- XX康复治疗器械企业2023年度员工培训与发展ESG绩效报告
- 保证合同示范文本
- 五年级音乐教案解析乌鸦与狐狸
- 企业维护合同(标准版)
- 2025年公共基础知识考试试题(附完整答案)
- 北川羌族自治县农业农村局北川羌族自治县测雨雷达建设项目环评报告
- 2025社区工作者必考试题库(含答案)
- 友邦资讯面试题目及答案
- 2025年山东青岛海关缉私局辅警招聘考试笔试试卷【附答案】
- 2025年社区工作者考试真题库及答案
- 飞灰处置再生资源化利用项目可行性研究报告模板-立项备案
- 2025年中国药典试题及答案
- 昆明一中实验班数学试卷
- 2025年腾讯校招综合素质测评试题及答案
- 2025至2030中国旅游保险行业深度发展研究与企业投资战略规划报告
评论
0/150
提交评论