DRP项目因为系统性能“四进宫”何解(1_第1页
DRP项目因为系统性能“四进宫”何解(1_第2页
DRP项目因为系统性能“四进宫”何解(1_第3页
DRP项目因为系统性能“四进宫”何解(1_第4页
DRP项目因为系统性能“四进宫”何解(1_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、DRP 项目因为系统性能“四进宫”何解 已经有三个月时间没有到温州了, 正好这次有机会出差到温州, 可以和温州的一班老朋友们 好好聚聚,同时也开怀畅饮,边喝边聊了,因为大家一直都不缺乏深入交流的话题。这不, 人还没有到温州, “温州 IT 主管联盟”的“老大”老胡就抛了一个案例,说是要给大家看 看,再一起帮着参详参详的:IT 部伴随着 DRP 项目的推进, 软件方的顾问也逐渐撤出了, 系统的运营自然也就成了企业 门的任务,而随着 DRP 系统的不断深入应用,其它信息系统的不断上线,企业信息化程度 的也越来越深,企业对于软件应用性能的要求也就越来越高,就需要对IT 系统进行升级扩容等全方位的改进

2、。从技术角度来看,在升级改造过程中,比起全新信息化建设的困难度, 实在是有过之而无不及。这类的因系统性能问题而升级改造的, 不成功的案例多于成功的案例。 让我们来看一下这个 因系统变慢而 四进宫 的案例。原由:系统的响应时间慢,就是系统的升级的主要原因软件平台:操作系统:Microsoft 2000 server数据库:Microsoft SQL server应用软件:行业内成熟的 DRP 软件 , 单机运行硬件平台: 服务器:DELL (2个CPU , 2GB的内存,和18GB的硬盘2个做镜像)磁盘阵列:DELL的220S SCSI盘阵(使用18GB的硬盘14个做RAID-5 ,共250GB

3、)经过两年的上线使用后, 算是成功上线使用, 但是开始有用户反映这个系统的响应时间越来 越慢,希望信息中心可以提升系统的性能。信息中心和几个供应商的会诊后,确认是硬件指标太低,造成性能太慢。硬件慢,简单! 只要有银子就可以解决。 销售商介绍更高规格的硬件设备, 于是把原来的设 备转成其他的应用上,这个主要核心系统全部采购更新的高性能指标设备。第一次升级方案:购买高性能指标的服务器 提高服务器的性能指标: 换服务器,把 CPU 2 个变 4 个,主频 1.8 变成 3.6, 内存 2GB 变 4GB换存储设备, SCSI 盘阵太慢,换成 2Gb Fibre 光纤盘阵,加上 2Gb 的光纤交换机,

4、采用最 新的 SAN 存储结构技术, 采用 DELL 推荐的中小企业用的盘阵 AX150 ( 双控、 500GB SATA 硬盘 7个)共 3.5TB 的容量,连数据备份一并解决。 真划算,价格也不贵, 总价在 30 万以内, 在原来的预算内,有银子真的很好用! 兴高采烈的迎接全新设备的,好像娶媳妇一样,信息中心上上下忙了大半个月,从培训、安 装硬件软件、倒数据、系统测试、系统切换,连续加班好几天。总算把它侍候好了。系统上线了,和供货商一起聚聚,喝喝小酒,联络感情,以后好配合!三个月过去了, 业务端反映,系统速度好像没有什么改善,甚至还慢了。财务部门反映每个 月的结算,速度和以前差不多。第二次

5、升级方案:修改软件要软件商进行二次开发, 修改软件。 软件公司 这又加班好几个月的时间, 改善不明显。硬件已经提升了,有问题可能就是软件问题, 因为慢的问题, 收不到开发费用, 效果也就有限了。软件公司找了一个高人,检测后,确定还是硬件问题? 问题又推到存储上!不见效果, 和存储厂商的资深系统工 看,你这个 AX150 盘阵规格太低,第三次升级方案:升级盘阵上的 Firmware服务器的工程师进行了盘阵上的操作系统版本和补丁, 程师,再继续找问题。最后换了一个高级技术经理,一 只适合做备份,不适合做 OLTP 应用,应该使用更高档的全光纤盘阵,应该就没有问题。第四次升级方案:更换 4Gb 的光

6、纤盘阵现在是 2007 年,主流产品都是 4Gb 的光纤,于是更换更高指标的存储设备CX3-20 ,带宽是4个4Gb,共16Gb的带宽,盘阵内存是4GB ,硬盘使用300GB的4Gb纯光纤硬盘8个, 服务器上加两片 4Gb 的 HBA 卡,更换 4Gb 的光纤交换机。服务器的内存增加到 8GB.大半年过去了,听说系统的缓慢又出现了! 心疼吗?白花花的银子这样来花!那么在这个升级的案例中,问题出在哪里了?上述的问题, 经老胡一抛出来, 就引起了大家的热烈讨论, 因为这类的问题在各个企业都曾 经碰到过, 就算目前暂时没有碰到的,以后也会碰到,总之, 这是任何一个企业都绕不过去 的问题。 正好当时手

7、上上有事情, 没有怎么深入思考这个问题, 回过头有时间静下心来的时 候,就觉的这个问题值得好好研究。仔细分析上面的案例,其实没有给出一个相对客户的数据,说系统慢,是在操作系统、 数据库、多少的服务器端带宽、多少个并发用户数、客户端 PC 配置等情况都未知而由业务部门 的使用人员发出的呼声。在这里,我觉的其实是可以根据用户的操作类型来区别一下的,系统性能应该包括两部分:1、OLTP(On-Line Transaction Processing ,联机事务处理 )操作:用户操作单5 秒钟以内。On-Line Analytical Processing ,联机分析处理)操作:而在于进 由于用户对于查

8、询的数据不同, 其心理预期也是不同的, 预期的据时,包括新增、修改、删除操作,类似的这种事务性操作应该要求响应比较及时,用户可 忍受的等待时间应该是在2、OLAP行查询与统计操作的时候, 时间可以从 5 秒钟到 15 分钟不等,毕竟查询的数据量不一样,所需要的结果返回时间也是 不一样的,这一点用户应该是可以理解的。那么,我们要分析的问题主要就在事务性操作上, 要求操作响应时间在 5秒钟以内, 这应该 是我们的一个最基本的目标。也就是说,我们目前要分析的主要就是 OLTP 的性能。由于 OLTP 性能会涉及到非常多的因素,包括服务器、 DRP 软件系统、网络状况、客户端PC 机配置、数据库、用户

9、等,针对这些情况,我们用下面的因果图进行分析:针对上述的因果图,我们可以根据上述原因进行逐一分析与排查,并制定出具体的应对方案:1、DRP系统:DRP系统本身的原因,也是系统速度慢的根源所在,毕竟所有的硬件及网络 设备都是为 DRP 系统服务的。DRP 系统的架构可以参考从软件架构不合理上来考虑,在前面的一篇文章中,我有针对友a)因为在开发小应用系统的 如果数据条目在 100-1000进 行 讨 论 的 , 有 兴 趣 的 朋 (http:/blog.C/Drate/arChive/2007/07/17/1694698.aspx) 。b) 而对于大量使用数据感知控件, 这应该是程

10、序员的错,时候,如使用 DBGRID 这样的控件, 一次显示整个数据表的内容, 条,可能速度不会有太明显的差异, 但如果数据条目是在 1 000条与 100 万条之间比较的话, 那肯定就不是同一个层面上的了, 所以进行数据显示的话, 直接与数据源关联, 有可能会引 起资源耗尽的情况还没有能够显示出你所请示的内容。c) 习惯性全表数据显示,这也是软件开发者在进行开发时没有注意的问题,因为性能问题都是在有了大数据量的时候才会显示出来的, 开发期间由没有大数据量, 开发人员也 意识不到, 所以进行提供用户查询功能的时候, 基本上不会用限定条件, 或者也不进行数据 分页显示,导致数据库服务器的数据请求

11、量直线上升。2、网络:网络与系统的稳定性是直接相关的,特别是目前的DRP 系统中,采用的都是数据大集中的方式, 所有的数据请求、 数据处理都是要通过网络来完成的。 网络的问题可以归结 为以下几个方面:a)服务端的带宽,目前一般有 ADSL、 2M、 10M、 100M 的光纤可以使用,系统数据慢,可以通过测试看服务器端的带宽是否足够。b) 电信与网通的问题:这是中国特色的问题,由于网通主要在北方,电信在南方,所以终端的线路情况各不一样, 特别是进行跨网络访问的时候, 速度会是奇慢, 而且网络会 经常莫名其妙的断开,现在很多企业在机房里各拉一条网通与电信的光纤就是这个原因。VPN 接入是目前 D

12、RP 系统常用的或防火墙的性能不够的话,也将会使网C)VPN、防火墙问题,为了增加网络的安全性,问题不会太大, 因为现在 ADSL 的普一种方式,防火墙也是必不可少的,可是如果 VPN 络阻塞严重,系统自然也就慢了。d) 客户端带宽: 客户端带宽应该在目前来说,及,很难再找到使用 MODEM 拔号上网的了,就算是现在的无线网络,其速度也远远要比 MODEM 拔号上网要快的多。e)网络设计不合理:这个问题是会是一个非常隐秘的问题,如:由于企业的网络管理员水平有限,没有对网络内的计算机进行分网段管理,容易出现“网络风暴”,导致交换机进行频繁的垃圾数据交换, 交换机也是经常性死机, 自然系统的速度会

13、下降了。 又如网络 内存在病毒或者是木马,在网络内发送大量数据包,或者甚至是DoS(拒绝服务攻击)。IO 总线的频率 内存可能都差不IO 能力了。3、服务器:一般包括以下几种类型的服务器,一是数据库服务器,二是指应用服务器,三 是存储服务器,在这里我们不进行特指。a)服务器总线10:在服务器领域,数据是需要进行密集交换的,而基本上决定了一台服务器的性能,所以,为什么不同服务器之间的CPU、多,但价格相差很多?同样性能也有很大差异呢?关键就是在于服务器的总线b)CPU性能:目前的PC服务器,一般都是能够加载多颗 CPU的,是选2颗还是4颗或者是 8 颗,那就是要看应用的情况了,一般来说,在 CP

14、U 的负载在 80%以下是比较正 常的,因为如果有一个峰值的话, CPU 的负载就马上会到 100%以上的。c) 置,磁盘 IO 问题:磁盘 IO ,这里有可能是用磁盘阵列柜,也有可能是光纤存储,如内存不足:内存也是和 CPU 一样,可以在服务器上进行扩展,根据需要进行配 这个问题也比较明显。d)果在用阵列柜的话,就要看一下是否是这里的问题了。由于存在着数据库服务器、应用服务器、存储服务器,1000M ?或者是直接用光线网络进行数据传输?这也e) 服务器间网络带宽问题: 这几个服务器之间的带宽是否能够在 是根据应用情况进行考量的。4、数据库:DBA 在这里就起到非常大的作用了, 特别是像 OR

15、ACLEa) 数据库系统配置不合理: 这样的大型数据库, 一个好的 DBA ,可以将数据库系统的配置与软件系统达到最优化组合, 性能的提升也是非常明显的, 而如果是一个菜鸟来做的话, 估计只会按照安装的默认配置来 运行,系统性能相差的就远的去了。b) 数据库索引及优化:数据库索引与优化,如果 DRP 软件商有对数据库非常熟悉 的软件架构师, 会对数据库的索引进行优化, 以提高系统的效率, 但说实话,目前更多的软 件商将精力放在了前端的界面展现上,而不是数据库的“内功”修炼上。c) 数据冗余:合理的数据冗余可以增强系统的性能,这是谁都知道的,但有的系统 却是过滥,将数据库设计的过分冗余了,导致数

16、据库成了吃硬盘的“杀手” ,数据库一直不 停地高速膨胀,系统性能也就直线下降了。d) 存储过程与触发器:存储过程与触发器,这应该是属于业务逻辑层来干的事情, 如果一个好的系统, 我认为应该是不在数据库层面来执行业务逻辑的, 所以, 一直比较抵触 这两个,特别是触发器。5、客户端PC配置太低:比较容易理解,386的机器跑WINDOWS XP,老牛拉破车吧。6、用户: a) 用户心理预期较高:由于用户可能之前有用过类似的系统,由于数据量较小,或 者之前用的是小系统, 有一个习惯的问题; 或者就是一个心理预期, 认为一个新系统的话总 会有算改进的, 所以就把新系统想的很美好, 结果实际上不是这么一回事的时候, 自然就有 落差了。b) 并发用户数量:并发用户在 10个与 100 个的时候,系统的速

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论