




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
AIX 5.3主机性能评估-CPU性能评估来源: 作者: BTxigua 时间:2008-03-10 阅读:270 /article/e1/1250.html 对于AIX主机的性能评估,我们从下面的4个方面来逐一介绍:CPU、MEMORY、I/O系统和网络这4个方面来描述。一、CPU性能评估 首先,我们还是先来看一下CPU的性能评估。下面先主要介绍几个看CPU性能的命令。1、vmstat 使用vmstat来进行性能评估,该命令可获得关于系统各种资源之间的相关性能的简要信息。当然我们也主要用它来看CPU的一个负载情况。 下面是我们调用vmstat命令的一个输出结果:IXDBA.NET技术社区$vmstat 1 2 System configuration: lcpu=16 mem=23552MBkthr memory page faults cpu - - - - - r b avm fre re pi po fr sr cy in sy cs us sy id wa 0 0 3091988 2741152 0 0 0 0 0 0 1849 26129 4907 8 1 88 3 0 0 3091989 2741151 0 0 0 0 0 0 2527 32013 6561 15 2 77 6 对上面的命令解释如下:Kthr段显示内容 r列表示可运行的内核线程平均数目,包括正在运行的线程和等待 CPU 的线程。如果这个数字大于 CPU 的数目,则表明有线程需要等待CPU。 b列表示处在非中断睡眠状态的进程数。包括正在等待文件系统 I/O 的线程,或由于内存装入控制而被挂起的线程。Memory段显示内容 avm列表示活动虚拟内存的页面数,每页一般4KB fre空闲的页面数,每页一般4KBPage段显示内容 re 该列无效 pi 从磁盘交换到内存的交换页(调页空间)数量,4KB/页。调页空间是驻留在硬盘上的虚拟内存的一部分。当内存使用过量时,会将溢出的工作组页面存储到调页空间中(窃取页)。当进程访问一个窃取页时,就产生了一个缺页故障,而这一页页必须从调页空间中读入到内存中。 po 从内存交换到磁盘的交换页数量,4KB/页。如果窃取的工作也在调页空间中不存在或者已经作了修改,则写入调页空间中。如果不被再次访问,它会留在调度空间中直到进程终止或者放弃空间。 fr 根据页面替换算法每秒释放的页数。当VMM页面替换例程扫描页面帧表(Page Frame Table,PFT)时,它会根据一些条件选取需要窃取的页面以补充空闲列表。该条件中包含工作页面和计算页面,释放的页面中,计算页面不产生I/O,工作页面如果数据没有发生修改,也不需要写回磁盘,也不会产生I/O。 sr 根据页面替换算法每秒所检查的页数。sr值比fr值高的越多,说明替换算法要查找可以替换的页面就越困难。 cy 每秒页面替换代码扫描了PFT多少次。因为增加空闲列表达到maxfree值,不一定需要完全扫描PFT表,而所有vmstat输出都为整数,所以通常cy列值为0。Faults段显示内容(其实这段内容不需太多关注) in 在该时间间隔中观测到的每秒设备中断数。 sy 在该时间间隔中观测到的每秒系统调用次数。 cs 在该时间间隔中观测到的每秒钟上下文切换次数。Cpu段显示内容 us 列显示了用户模式所消耗的 CPU 时间。 sy 列详细显示了 CPU 在系统模式所消耗的 CPU 时间。 id 列显示了没有未决本地磁盘 I/O 时 CPU 空闲或等待时间的百分比。 wa 列详细显示了有未决本地磁盘 I/O 时 CPU 空闲的时间百分比。wa 的值如果超过 25%,就表明磁盘子系统可能没有被正确平衡,或者这也可能是磁盘工作负荷很重的结果。如果在一个单用户系统中,us + sy时间不超过 90%,我们就不认为系统的CPU是受限制的。如果在一个多用户系统中,us + sy时间超过 80%, 我们就认为系统的CPU是受限的。其中的进程将要花时间在运行队列中等待。响应时间和吞吐量会受损害。检查cpu,我们主要关注报告中的4个cpu列和2个kthr(内核线程)列。在上面的示例中,我们可以观察到以下几个主要的信息:CPU IDLE比较高,比较空闲;r列为0,表明线程不存在等待;WA值不高,说明I/O压力不大;free值比较大,pi,po为0,表明内存非常富裕。空闲较多。2、sar第二个常用的是 sar命令,但是sar会增加系统的开销。当然有些情况下,我们使用sar比较方便。sar的输出结果与前面的基本类似,这里不再作详细的介绍,关于命令的语法,也不再作详细的介绍,我们常用的命令格式:#sar 1 3AIX jsdxh_db02 3 5 00C2C1EB4C00 10/24/07System configuration: lcpu=16 17:52:26 %usr %sys %wio %idle physc17:52:27 19 7 0 75 8.0017:52:28 19 6 0 75 8.0117:52:29 19 7 0 75 8.02Average 19 7 0 75 8.01在这里,sar命令输出的是一个整体的cpu使用情况的一个统计,统计分项目的内容也比较直观,通过名字就可以理解涵义。这里有一点比较方便的就是,在最后一行有一个汇总的average行,作为上述统计的一个平均。另外,补充说明一点的就是,一般来说,第一行统计信息包含了sar命令本身启动的cpu消耗,所以往往是偏高的,所以导致average值也往往是偏高一点的。当然,这不会对结果产生多大影响。当我们有多个cpu的时候,而程序采用的是单线程,有时候会出现一种情况,我们检查发现,cpu总体的使用率不高,但是程序响应却比较慢。这里有可能就是单线程只使用了一个cpu,导致这个cpu100占用,处理不过来,而其他的cpu却闲置。这时可以对cpu分开查询,统计每个cpu的使用情况。#sar -P ALL 1 2AIX jsdxh_db02 3 5 00C2C1EB4C00 10/24/07System configuration: lcpu=16 18:03:30 cpu %usr %sys %wio %idle physc18:03:31 0 0 69 0 31 0.00 1 50 50 0 0 1.00 2 0 0 0 100 0.52 3 0 0 0 100 0.48 4 0 1 0 99 0.54 5 0 0 0 100 0.46 6 0 0 0 100 0.53 7 0 0 0 100 0.47 8 0 0 0 100 0.53 9 0 0 0 100 0.47 10 0 2 0 98 0.54 11 0 0 0 100 0.46 12 11 58 0 31 0.00 13 100 0 0 0 1.00 14 0 0 0 100 0.53 15 0 0 0 100 0.47 - 19 7 0 75 8.0118:03:32 0 0 71 0 29 0.00 1 50 50 0 0 1.00 2 0 0 0 100 0.52 3 0 0 0 100 0.48 4 0 1 0 99 0.54 5 0 0 0 100 0.47 6 0 0 0 100 0.52 7 0 0 0 100 0.47 8 0 0 0 100 0.53 9 0 0 0 100 0.47 10 0 2 0 98 0.54 11 0 0 0 100 0.46 12 39 41 0 20 0.00 13 100 0 0 0 1.00 14 0 0 0 100 0.52 15 0 0 0 100 0.47 - 19 7 0 75 7.98Average 0 0 70 0 30 0.00 1 50 50 0 0 1.00 2 0 0 0 100 0.52 3 0 0 0 100 0.48 4 0 1 0 99 0.54 5 0 0 0 100 0.46 6 0 0 0 100 0.53 7 0 0 0 100 0.47 8 0 0 0 100 0.53 9 0 0 0 100 0.47 10 0 2 0 98 0.54 11 0 0 0 100 0.46 12 28 48 0 24 0.00 13 100 0 0 0 1.00 14 0 0 0 100 0.52 15 0 0 0 100 0.47 - 19 7 0 75 8.00 上面是分cpu统计的情况,结果应该也比较直观吧。Sar还有其他一些比较特殊的使用方法,比如:如果希望多个采样和多个报告,可为 sar 命令指定一个输出文件,这样就方便多了。将 sar 命令的标准输出数据定向到 /dev/null,并将 sar 命令作为后台进程运行。具体的命令格式为:sar -A -o /temp/sar_result.log 5 300 /dev/null & 关于sar其他的一些使用方法,这里不再详述。3、iostat 第三个可以用来使用的命令是iostat.$ iostat -t 2 4tty: tin tout avg-cpu: % user % sys % idle % iowait 0.0 0.0 0.0 0.1 99.8 0.1 0.0 81.0 0.0 0.1 99.9 0.0 0.0 40.5 0.0 0.0 100.0 0.0 0.0 40.5 0.0 0.1 99.1 0.8TTY 的两列信息(tin 和 tou)显示了由所有 TTY 设备读写的字符数CPU 统计信息列(% user、% sys、% idle 和 % iowait)提供了 CPU 的使用情况。 注意:第一份报告为系统启动以来的一个累积值。4、tprof使用tprof命令用于统计每个进程的CPU使用情况# tprof -x sleep 30该命令的输出结果可查看 _prof.all文件。此命令运行30秒钟,在当前目录下创建一个名为_prof.all 的文件。30秒钟内, CPU被调度次数约为3000次。_prof.all 文件中的字段Total 为此进程调度到的CPU次数。如果进程所对应的 Total字 段的值为1500,即表示该进程在3000次 CPU调度中占用了1500次,或理解为使用了一半的CPU时间。tprof的输出准确地显示出哪个进程在使用CPU 时间。在我下面的这一份示例中,可以看到,大部分的cpu时间都是被wait所占用的。这里的wait实际上是idle进程,可以表明这个系统是一个完全空闲的系统。$ more _prof.all Process PID TID Total Kernel User Shared Other = = = = = = = = wait 40970 40971 2998 2998 0 0 0 wait 32776 32777 2994 2994 0 0 0 wait 24582 24583 2985 2985 0 0 0 wait 16388 16389 2980 2980 0 0 0 syncd 221254 155707 31 31 0 0 0 caiUxOs 524540 2294015 3 0 0 3 0 netm 73746 73747 1 1 0 0 0 hats_nim 1671242 1220665 1 0 0 1 0 snmpd64 598258 1245291 1 1 0 0 0 rpc.lockd 639212 1728679 1 1 0 0 0 tprof 704622 2277437 1 0 0 1 0 trclogio 360524 2408625 1 1 0 0 0 trace 1523820 2523145 1 0 0 1 0 clinfo 1958102 2760945 1 1 0 0 0 sh 1572938 2285709 1 1 0 0 0 = = = = = = = = Total 12000 11994 0 6 0 Process FREQ Total Kernel User Shared Other = = = = = = = wait 4 11957 11957 0 0 0 syncd 1 31 31 0 0 0 caiUxOs 1 3 0 0 3 0 netm 1 1 1 0 0 0 hats_nim 1 1 0 0 1 0 snmpd64 1 1 1 0 0 0 rpc.lockd 1 1 1 0 0 0 tprof 1 1 0 0 1 0 trclogio 1 1 1 0 0 0 trace 1 1 0 0 1 0 clinfo 1 1 1 0 0 0 sh 1 1 1 0 0 0 = = = = = = = Total 15 12000 11994 0 6 0在这里,对wait进程作一点补充说明。在AIX 5L下,你用ps aux会发现有一些root的wait进程#ps aux |head -20USER PID %CPU %MEM SZ RSS TTY STAT STIME TIME COMMANDoracle 266354 5.7 0.0 50136 27524 - A 15:40:35 0:32 oracleora92 (LOCroot 17214 3.1 0.0 40 40 - A Jul 04 24793:53 waitroot 16946 3.1 0.0 40 40 - A Jul 04 24633:59 waitroot 16678 3.1 0.0 40 40 - A Jul 04 24600:21 waitroot 53274 3.1 0.0 40 40 - A Jul 04 24397:54 waitroot 286 3.1 0.0 40 40 - A Jul 04 24371:55 waitroot 8196 3.0 0.0 40 40 - A Jul 04 24312:40 waitroot 822 3.0 0.0 40 40 - A Jul 04 24303:36 waitroot 554 3.0 0.0 40 40 - A Jul 04 24261:50 waitroot 20776 2.7 0.0 40 40 - A Jul 04 21502:46 waitroot 57372 2.7 0.0 40 40 - A Jul 04 21439:31 waitroot 49176 2.7 0.0 40 40 - A Jul 04 21423:47 waitroot 21044 2.7 0.0 40 40 - A Jul 04 21398:24 waitroot 12848 2.7 0.0 40 40 - A Jul 04 21357:07 waitroot 21312 2.7 0.0 40 40 - A Jul 04 21324:26 waitroot 12580 2.7 0.0 40 40 - A Jul 04 21293:06 waitroot 13116 2.7 0.0 40 40 - A Jul 04 21195:47 waitoracle 344612 0.3 0.0 57588 34976 - A Jul 04 2663:08 ora_j000_ora92 oracle 430408 0.3 0.0 55908 33296 - A Jul 04 2220:57 ora_j001_ora92 wait就是CPU空闲的时候运行的空闲进程,AIX4上叫kproc。所以这个进程占用越大,表示机器越空闲。Wait进程的数量是由机器上的逻辑CPU的个数决定的,有几个逻辑CPU,就有几个wait进程.5、ps这个命令使用本身也比较复杂,在这里只介绍如何查看cpu占用最高的进程。使用举例如下:#ps aux | head -25USER PID %CPU %MEM SZ RSS TTY STAT STIME TIME COMMANDroot 17214 3.1 0.0 40 40 - A Jul 04 25578:42 waitroot 16946 3.1 0.0 40 40 - A Jul 04 25415:54 waitroot 16678 3.1 0.0 40 40 - A Jul 04 25377:03 waitroot 53274 3.1 0.0 40 40 - A Jul 04 25170:12 waitroot 286 3.1 0.0 40 40 - A Jul 04 25144:00 waitroot 8196 3.0 0.0 40 40 - A Jul 04 25082:32 waitroot 822 3.0 0.0 40 40 - A Jul 04 25072:25 waitroot 554 3.0 0.0 40 40 - A Jul 04 25034:14 waitroot 20776 2.7 0.0 40 40 - A Jul 04 22181:27 waitroot 57372 2.7 0.0 40 40 - A Jul 04 22118:00 waitroot 49176 2.7 0.0 40 40 - A Jul 04 22102:02 waitroot 21044 2.7 0.0 40 40 - A Jul 04 22077:18 waitroot 12848 2.7 0.0 40 40 - A Jul 04 22036:44 waitroot 21312 2.7 0.0 40 40 - A Jul 04 21998:53 waitroot 12580 2.7 0.0 40 40 - A Jul 04 21967:17 waitroot 13116 2.7 0.0 40 40 - A Jul 04 21865:51 waitoracle 344612 0.3 0.0 56372 33852 - A Jul 04 2707:30 ora_j000_ora92 oracle 430408 0.3 0.0 55916 33396 - A Jul 04 2266:20 ora_j001_ora92 oracle 365092 0.2 0.0 56184 33664 - A Jul 04 1765:58 ora_j002_ora92 oracle 442430 0.2 0.0 56092 33572 - A Jul 04 1426:40 ora_j003_ora92 oracle 385606 0.1 0.0 55984 33464 - A Jul 05 1159:17 ora_j004_ora92 oracle 413856 0.1 0.0 50520 28000 - A Jul 23 543:31 oracleora92 (LOCoracle 143668 0.1 0.0 50528 28008 - A Jul 13 833:21 oracleora92 (LOCoracle 369230 0.1 0.0 56600 34080 - A Jul 05 806:36 ora_j005_ora92 在这个输出结果中,排在前面的是16个root用户的wait进程,这其实是CPU空闲的时候运行的空闲进程,之前已作说明。所以CPU最高的几个进程其实是下面的ORACLE用户的ora_j00*进程,这是ORACLE的job进程。在这里,这些进程的开销很小。如果ORACLE的进程开销比较大,我们可以用如下的方法来查询具体的进程在干什么事情,例如我们要查询进程ora_j000_ora92,PID=344612,可以使用下面的方法:$su oracleSQLsqlplus “/as sysdba”SQLoradebug setospid 344612SQLoradebug event 10046 trace name context forever, level 8SQLoradebug tracefile_name 这个命令我们获得输出文件的绝对路径和文件名SQLoradebug event 10046 trace name context off$tkprof /opt/oracle/app/oracle/admin/ora92/bdump/ora92_j000_344612.trc tracepid.txt$more tracepid.txt在tracepid.txt中,我们就可以看到这个进程中具体运行的语句、过程等,以及所有的SQL的cpu消耗、物理读、逻辑读、执行计划等信息。另外,我们也可以执行下面的语句查看进程具体运行的SQL语句的文本:SELECT /*+ ORDERED */ sql_text FROM v$sqltext a WHERE (a.hash_value, a.address) IN ( SELECT DECODE (sql_hash_value,0, prev_hash_value,sql_hash_value), DECODE (sql_hash_value,0, prev_sql_addr, sql_address) FROM v$session b WHERE b.paddr = (SELECT addr FROM v$process c WHERE c.spid = &pid)ORDER BY piece ASC6、解决CPU占用的惩罚机制nice和renice指定和修改命令的优先级。系统中运行的每个进程都有一个优先级,我们可以用ps命令看到,这个优先级为PRI,PRI的值越小,优先级越高,能占用更多的CPU时间片。系统默认的PRI为60,我们可以通过nice命令和renice命令来改变一个进程的优先级,从而控制进程对CPU时间片的占用。任何一个用户都可以使用nice命令来使他的进程以低于系统默认的pri运行。但是只有root用户才可以使进程以高于默认的pri运行。我们先来看一下nice命令的使用方法:#nice n -5 vmstat 2 10 vmstat.out# ps -elF S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD200001 A 0 704738 1523728 0 55 15 aee1400 544 f100009e63c23e30 pts/1 0:00 vmstat指定程序以nice值-5开始运行。程序开始后,nice的值为15,PRI的值为55。nice命令可以指定的范围为-20 (最高优先级)到 20 (最低优先级)。在AIX5.3中,默认的nice为20。# vmstat 2 10 vmstat.out# ps -elF S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD200001 A 0 704740 1523728 0 60 20 32ec6400 472 f100009e63c23e30 pts/1 0:00 vmstat64 可以看到默认的情况下,系统使用的nice=20,pri=60 。 实际上,在使用nice指定的时候,我们也可以使用超出闭区间-20,20的值,比如:nice n -33 vmstat 2 10 vmstat.out# ps -elF S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD200001 A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Dipsacus-saponin-A-生命科学试剂-MCE
- Dermocybin-NSC-257450-生命科学试剂-MCE
- 废弃化学品包装桶处置应急预案
- 临矿安全培训技术中心课件
- 厂区建筑(办公楼、车间)坍塌应急预案
- 乡镇食品安全培训会课件
- 临潼培训安全员证课件
- 临淄食品安全培训课件
- 城市地下空间三维建模系统2025年技术创新与城市规划协同可行性分析
- 车库消防喷淋合同(标准版)
- (完整版)铝合金门窗施工方案
- 医疗质量安全专项整治行动自查清单8-患者隐私
- 宽带基础培训知识课件
- 知道智慧树实验室安全与防护满分测试答案
- 人行统计制度培训课件
- Unit 2 School life单元测试卷(含答案) 2025-2026学年译林版(2024)八年级英语上册
- 2025年国家电投黄河公司毕业生招聘考试笔试试题(含答案)
- 产品检验基础知识培训课件
- 茶叶与咖啡混合饮品创新创业项目商业计划书
- 节点评审管理办法
- 来华留学生管理办法
评论
0/150
提交评论