运维通方案建议书_第1页
运维通方案建议书_第2页
运维通方案建议书_第3页
运维通方案建议书_第4页
运维通方案建议书_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

运维通服务方案建议书撰稿方:广州网脊网络科技有限公司公司撰稿日期:CUSTOMER'SNAME: 顾客名称: PROJECTNAME: 项目名称:运维通服务方案建议书VOLUMENUMBER: 卷标:第一版电话:4006-3525-00传真:地址:广州市番禺区大学城中二横路22号创业楼A区4楼网址:.cn目录第一部分引言 3第二部分概述 42.1运维通设计背景 42.2设计原则 4第三部分运维通解决方案 63.1一键通功效 63.2主机监控 73.3网站监控 103.4自定义分组与拓扑图 103.5丰富的自定义报表功效 113.6丰富的事件查询机制 123.7自定义阀值、报警 12第四部分布署方案 134.1布署方式 13第五部分服务方案 155.1服务范畴 155.2故障级别 155.3工作内容 165.3.1日常支持 165.3.2现场服务工程师工作内容 165.4日常工作内容具体阐明 165.4.1日常服务 165.4.2客户服务经理及专家支持团体 175.5驻场工作内容具体阐明 175.5.1紧急故障解决 175.5.2运维通变更支持 185.5.3系统监控 185.6运维通培训支持 19第一部分引言随着的IT服务的发展,IT服务的概念也在发生着巨大的变化。IT运维服务已经由原来局限在顾客本身环境下的IT服务,延伸到覆盖公用云、私有云、外包服务商等多纬度、全天候的SaaS运维模式,从狭义理解,IT服务仅仅是为理解决信息系统出现的故障,在系统出现停止的时候能够快速的恢复。而现在的IT服务已经包含了更多的内容,IT服务渗入在信息系统的整个生命周期之中。本文基于该理念,对IT服务系统的实现进行分析研究。文章基于网脊运维通SaaS(SoftwareasaService)模式理念,,构建统一平台下支持多类型顾客使用的基于SaaS模式的IT自动化运维平台。使顾客在使用效果上与公司自有IT服务运维平台基本没有区别,但节省了大量用于购置硬件设备、技术支持和维护运行的资金,同时使得原来分散在不同区域多个机构孤立的信息有了信息共享的条件,使得顾客能对分散在不同地方的IT系统进行控制、并及时理解有关信息。同时结合网脊运维通的手机APP,顾客能够随时、随处地理解本身IT基础环境、业务系统等IT资源的可用性、性能、安全事件等重要监控类别,同时结合手机APP上的一键通功效,顾客能够方便地对远端机器进行硬件重启,预录制命令脚本执行等方便、快捷的一键运维功效。运维通集成了简朴、实用的监控、远程操作等实用功效,让普通顾客无需购置、安装复杂的IT运维系统就能够享有在线的IT监控、运维系统,同时含有即时通讯功效的工单流转系统,可将顾客、外包服务商、IDC机房维护工程师等角色有机地整合在一起,是一种完全创新的基于SaaS模式的社交型IT运维技术平台。第二部分概述2.1运维通设计背景运维通的设计背景重要是针对现在互联网上的设备、应用越来越多,而普通客户的运维技术人员多在公司本部,系统、设备多托管在远端机房,他们但愿能有一套集成了远程连接、在线监控的自动化运维解决方案,同时能够较好地集成到手机APP上,随时随处对远端设备进行监控或者简朴惯用的快捷操作等功效,同时IDC托管机房也但愿能够拓展本身的业务范畴,不停留在低价竞争的机柜出租业务上,而是可通过运维通系统对顾客提供系统、实用的监控、远程维护、工单流转/考核等功效,从而可持续性地提高顾客服务体验,提高本身品牌的客户美誉度。2.2设计原则在线系统的监控、运维与普通运维解决方案看似有许多相似的地方,但其实还是有很大的不同,普通运维解决方案布署在本地,监控的设备数量有限,使用的顾客数量也有限,但在线SaaS系统则明显不同,监控的设备往往是海量数据,一种普通IDC就有上万台设备,顾客数量则往往过千,如果采用普通IT运维网管软件的设计是完全不行的,同时在SaaS模式下,整个监控是在公网上完毕,顾客对安全性规定比较高,如果采用插件的方式,顾客也一定会比较抵制,总之,在线SaaS运维系统的设计有其本身的特定,我们在开发运维通过程中,遵照了下列设计原则:弹性化架构考虑到在线SaaS系统的运行特点,运维通的设计采用了高度可扩展性的云系统架构,整个系统分为三个层次,按需布署的收集器、管理服务器以及数据库集群,任何层面的设备都是采用负载均衡的方式工作,任何设备实效后会自动切换到对应的健康设备上。高性能网脊运维通的收集器,每台最少可监控、管理500台设备(重要是snmp合同特点,而非运维通设计瓶颈),每台管理服务器最少能够管理30台收集器,一种2台管理服务器、60台收集器的小型运维通系统集群就能够较好地管理、监控3万台互联网设备,其性能指标是比较高的。安全性与完全运行在顾客公司内部网络的本地监控系统不同,网脊运维通系统是为广大顾客通过SaaS方式来监控、管理本身设备而研发的,因此网脊科技在开发过程中摒弃了其公司解决方案运维通的诸多功效强大,但会牺牲安全性的监控项目和监控方略,顾客设备无需安装插件,重要通过配备SNMP(支持V3)对特定的收集器的只读功效来实现监控功效,远程操作等通过配备IPMI的功效来实现,由于通过原则的网络管理合同来进行操作,与顾客的业务系统是完全隔离的,安全性比存在后门的插件方式要强诸多。移动互联网网脊运维通的操作,除了普通的web浏览器的工作方式外,手机APP的良好操作体验是比较重要的设计原则之一,我们将某些相对复杂的配备保存在web端,而查看、快捷远程操作等重要功效,我们在手机界面都较好地进行了拓展,顾客能够很流畅地体验随身、随时对在线IT系统监控、快捷操作的易用、方便。二级管理接口网脊运维通的业务推广模式重要依靠与含有对应实力的IDC运行合作伙伴共同拓展的方式来实现,运维通设计了专门的合作伙伴二级管理接口,合作伙伴能够通过该管理界面实现:替代其专属LOGO、广告,批量导入/修改/删除顾客、充值/余额查询、客户专属服务工程师分派等功效。第三部分运维通解决方案运维通是一种监控、运维门户,顾客只需通过简朴的注册后,就能够在线实现互联网IT资源的监控、故障报警、报表、ITIL事件跟踪、一键通自动化运维等功效,同时含有,以保障客户互联网业务应用的可靠运行。现在诸多国内的IT顾客都在考虑如何把自己的业务布署到私有云或混合云环境中,以增强其业务的可扩充性及高可用性,从理论上来说,云架构能够提供更高可用性的IT基础环境,但事实上云计算不是万能的,近来亚马逊及谷歌的多次重大云故障阐明,云计算环境除了系统层面以上的应用软件问题,其更加复杂的架构及资源池算法等因素,都需要更专业的监控管理工具及含有云计算知识背景的运维人员才干较好胜任云平台的高可用运维,但普通公司显然不能把他的运维团体搬到运行商机房去,这时候,运维通就有了用武之地,下面简朴介绍网脊运维通的重要特点:3.1一键通功效运维通的一键通功效,重要实现的功效就是通过预先配备好的IPMI接口合同,实现类似远程KVM的某些功效,重要能够实现下列功效:远程开、关机可对远程托管的已经死机、蓝屏的远端服务器,直接进行重启操作,无需IDC购置价格高昂的PDU设备,只需连接服务器主板上的IPMI接口,通过运维通软件就能够实现硬重启;一键命令对于惯用的运维命令脚本,如:重启服务、重启进程等等,可预先设立好后,在手机APP上一键运行,当某个服务出现僵死,而自己不在电脑旁边时,这个功效就变的非常实用;手机上也含有完整的一键通功效,具体使用界面可见下图:

3.2主机监控在线SaaS监控系统中,最重要的部分是服务器主机的监控,通过监控主机的重要可用性、性能、日志等指标,顾客能够随时理解和掌握放在远端数据中心机房的设备工作好坏,配合手机APP的及时推送信息,免去在IDC托管机房还需购置短信网关等问题,主机监控重要涉及的监控项目重要有:CPU/内存这是非常基本的监控项目,运维通以仪表板的方式直观地呈现CPU、内存的消耗状况,让顾客理解这一基本资源的消耗状况;端口监控与现在主流的云监控、SaaS监控系统的总端口流量监控不同,运维通的端口监控能够任意定义物理或虚拟端口的监控,对于多台设备托管在IDC,跑不同业务的顾客该项功效非常实用,并且端口监控是以持续波形的方式呈现,顾客能够通过设定小时、日、周等方式变换视角。进程监控普通的云监控平台只可监控总进程数,这个对于网管人员非常不实用,运维通能够选择任意进程来进行监控,也是以持续波形的方式来呈现。磁盘监控以图像化的方式呈现现在所设定的监控磁盘、分区的总容量、可用容量等磁盘信息。服务监控顾客可设定被监控的任意服务端口,系统会自动监控其服务状态,如果端口down则为红色,正常则为绿色手机界面展示以下:

3.3网站监控网站监控也是SaaS监控中非常重要的部分,毕竟大部分的在线系统重要是多个网站,对于网站监控,网脊运维通能够从不同的监控点来监控被监控网站的延时响应时间,这对现在国内的网络环境还是有必要的,下图为网脊运维通网站监控实际的例子:3.4自定义分组与拓扑图网脊运维通除了针对主机、网站等进行监控外,还允许顾客对该对象进行自定义分组,并且通过类似VISIO的绘图功效来绘制自己的网络拓扑图,让顾客非常直观地理解自己被监控设备的工作状况,3.5丰富的自定义报表功效网脊运维通的报表是能够按照顾客的需求进行自定义配备,自定义的规则能够监控的任意项目来进行设定,并可导出为PDF格式,具体设定项目见下图所示:

3.6丰富的事件查询机制网脊运维通的事件机制比普通SaaS监控产品或云监控产品丰富,可按照系统的不同分类监控项目,如:主机、网站、磁盘、进程等等来进行分类查看,同时也可选择不同的时间区间来进行事件查看,支持信息内容检索、组件检索等等辅助功效,具体见下图:3.7自定义阀值、报警网脊运维通的监控项目,重要是在线服务器的某些重要的可用性、性能、事件等监控指标,每个监控项目,顾客都能够自定义触发报警的阀值、报警级别等有关条件,做到事件、报警按照顾客的意愿和需求来生成,免却大量无用报警、事件的烦恼。第四部分布署方案网脊运维通的监控功效简朴、实用,但考虑到是SaaS应用方式,故其布署相对普通的监控系统来说要庞大和复杂某些,运维通的架构其实是分为4个层面,收集器、交互层、管理服务器/数据库、前端负载均衡/web服务器。面对顾客设备的是收集器,重要负责采集顾客设备的snmp监控数据,通过IPMI/SSH/WMI等合同与设备进行互动,与收集器连接的中间层面为Radis和Memcache数据缓存及交互层面,该层面负责将收集器和管理服务器之间的交互,确保收集器出问题后,管理服务器能够维持数据的完整性并把数据交互到其它收集器,管理服务器和数据库负责存储顾客配备信息、业务数据,前端负载均衡/web服务器负责与顾客GUI交互。4.1布署方式运维通重要是为大量顾客同时使用而设计,其布署相对普通的内部局域网运维监控产品有所不同,运维通的布署分为下列4个层面:1:收集器收集器的布署,取决于监控顾客的多少,普通按照每收集器监控500台主机左右来进行收集器布署,网络拓扑上,可采用双网口,与内部中间层面交互的接口用内部接口,速度快,网络环境封闭、安全,监控顾客设备的接口使用外部接口。2:配备服务器配备服务器的布署数量重要取决于收集器的数量,普通按照30:1的数量来进行配比,配备服务器最佳通过内部网络接口连接受集器,配备服务器无需外部接口,只需要连接受集器和数据库。3:数据库数据库寄存全部的监控方略、监控到的多个数据、顾客信息等等,当顾客量比较大的状况下建议采用集群的方式来布署,运维通采用的是mongoDB,其集群布署最少需要5台设备。4:nginx/web服务器由于顾客量比较大,采用nginx来做web服务器的负债均衡,web服务器采用的是Django方式,网脊运维通的网页内容相对还是比较简要,顾客左右用一台web服务器都没什么问题,当顾客数突破这个限制比较多的状况,能够使用Nginx负载均衡来解决。网脊运维通与被监控设备直接需要开通有关通信接口以下表所示。布署前需要测试各端口与否能够正常通信。运维通布署的有关合同端口以下:服务名称端口源地址目的地址备注SSH22收集器地址公网被监控设备远程命令等WMI135收集器地址公网被监控设备windows命令等SNMP161收集器地址公网被监控设备监控数据web服务80/81外部顾客web服务器/nginxweb访问数据库27017/27018配备服务器/web服务器数据库集群数据库服务memcached11211

11212

11213web服务器配备服务器缓存服务rpyc12233收集器地址配备服务器传输连接服务网脊运维通典型布署的拓扑图以下:第五部分服务方案为了更加好地在IDC及运行商合作伙伴推广网脊运维通解决方案,网脊公司将为合作伙伴提供运维通的实施、维护服务和二次开发服务。5.1服务范畴服务对象范畴涉及:1、合作伙伴的全部网脊运维通产品;2、服务期限:一年。5.2故障级别问题级别问题定义解决时限一级故障业务中断或半中断状态,已影响顾客的正常使用现场服务,鉴于地区的因素,如果在非现场服务时间内,工程师达成现场的时间为2小时内,并4小时内修复故障或采用省地各局同意的替代方案恢复业务,确保业务的正常运行和顾客的正常使用二级故障存在故障隐患,业务解决能力下降,并影响了顾客业务的正常使用6小时修复三级故障对业务有轻微影响,但不影响业务运行和顾客正常使用的问题12小时内予以技术支持四级故障不影响业务运行和顾客使用的问题24小时内予以技术支持

5.3工作内容5.3.1日常支持1、在本次运维通的服务项目中,网脊工程师将为省地各局提供日常的支持服务,涉及7*24小时的电话热线服务、邮件服务以及传真服务。支持的内容能够涉及运维通的配备疑问,产品咨询等非监控系统故障的问题。2、客户服务经理根据需求提供服务计划,定时与省地各局沟通控制服务质量,并在服务实施中负责有关协调。5.3.2现场服务工程师工作内容为省地各局提供每月二天的5×8驻场服务,由熟悉运维通产品和熟悉省地各局网络环境的现场工程师执行,现场工程师1人,按照省地各局公司考勤进行考核,驻场服务工作内容以下:紧急故障解决运维通变更支持系统监控运维通配备方略优化运维通软件升级运维通运维文档培训服务5.4日常工作内容具体阐明5.4.1日常服务省地各局服务需求 1、需设立专门的客户服务经理及专家支持团体,提供支持人员联系信息;2、客户服务经理根据需求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论