由于这次测试有幸采用了两台小型机,IBMm80,虽然不是高端机器,但是还是很庆幸用来作为我的测试试验机,很好的把玩把玩,以前出去部署在实地环境也把玩过很多的p595高端机器,ibm的小型机确实很厉害,呵呵。性能很好,要不买那么贵啊。两台,一台作为数据库服务器安装oralce9i,一台作为应用服务器安装weblogic;搭建一个测试环境测试在此环境下系统负载承受能力情况。
以下是在性能测试中用到的监控m80 aix5.3服务器性能的一些命令行工具,很有实用性。实践中体会这些参数的含义还是很快的。
客户端很多方式连接到小型机,我一般采用Xmanager连入,telnet连入也行,不过不喜欢cmd的黑屏,呵呵。废话少说,开始正题:
备注:一下命令行都可以采用管道命令将抓取到的数据写入到txt中用来分析用。
1、aix常用的监控工具(常用命令、软件包) vmstat,iostat,sar bos.acct topas,svmon,filemon,fileplace bos.perf.tools vmtune,schedtune bos.adt.samples netstat bos.net.tcp.clint
2、vmstat报告cpu与内存信息 执行vmstat 2 10 kthr memory page faults cpu ----- ----------- ------------------------ ------------ ----------- r b avm fre re pi po fr sr cy in sy cs us sy id wa 1 0 140831 895234 0 0 0 0 0 0 6 882 75 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 12 1056 94 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 5 1012 76 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 4 1001 76 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 4 995 71 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 4 986 74 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 4 995 73 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 4 1072 75 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 4 1001 71 0 0 99 0 0 0 140835 895229 0 0 0 0 0 0 4 1000 72 0 0 99 0
内核线程 r表示内核中运行的线程数,如果其数超过系统的cpu个数,则说明进程越多 b表示内核中等待的线程数,由于挂起或IO等待
内存列 pi列表示每秒钟从Paging Space置换到内存的页数。 po列表示每秒钟从内存置换到Paging Space的页数。 如果这两列持续大于5,则系统的性能瓶颈很可能是内存不足,而导致交换频繁。
fr列表示每秒钟页面置换算法释放的页数。 sr列表示每秒钟页面置换算法检查的页数。
故障列 in 设备中断次数 sy 系统调用次数 cs 内核线程上下文交换,即时间片用完后,再轮到时的上下文计算,如果太高,则要仔细观察
内存信息 avm与free两项分别表示了物理内存的活动页数与可用页数(每页4096bytes),其大小可用其值/256获得MB数。 其中free数如果持续为0或很低则预示内存不足,此时可能会导致大量的页面交换,而在CPU中显示为wa很高,此值的多少也与vmtune中的-f -p设置有关
CPU信息 在以上信息中,关于CPU是的后四列: id高表示系统空闲,us、sy分别表示用户和系统进程CPU占用,wa表示IO等待时间 如果us与sy之和持续超过90%时,CPU出现了瓶颈。 如果wa长期很高>50,则表示IO太忙,具体看是应用IO多,还是交换分页多,如果是后者,则显示内存不足, 如果是前者,则应关注应用的IO性能状况,优化应用与磁盘设备
3、sar命令优势 sar可以针对SMP系统来分别查看CPU使用情况 sar -P ALL 3 2 AIX testhost 1 5 0050C33A4C00 06/28/05
17:30:02 cpu %usr %sys %wio %idle 17:30:05 0 38 4 43 15 1 32 3 49 16 2 51 3 44 2 3 53 3 42 2 - 44 3 44 9 17:30:08 0 35 1 46 18 1 18 3 70 9 2 24 2 60 14 3 16 1 81 3 - 23 2 64 11
Average 0 36 2 45 16 1 25 3 59 13 2 38 3 52 8 3 34 2 62 2 - 33 3 54 10 以上显示了一个单CPU系统的显示,
sar也可以查看系统调用情况 sar -c 3 2 AIX test 1 5 0050C33A4C00 06/28/05
17:31:00 scall/s sread/s swrit/s fork/s exec/s rchar/s wchar/s 17:31:03 5738 484 439 0.00 0.00 952729 1073997 17:31:06 3365 149 266 0.00 0.00 11620 930150
Average 4553 317 352 0.00 0.00 482957 1002193
4、svmon使用 svmon可以查看内存的详细使用情况,含分页 svmon -G -i 5 2 size inuse free pin virtual memory 2097136 2096903 233 107570 1622941 pg space 1507328 1400132
work pers clnt lpage pin 107324 246 0 0 in use 1236897 860006 0 0 size inuse free pin virtual memory 2097136 2096212 924 107570 1623787 pg space 1507328 1400135
work pers clnt lpage pin 107324 246 0 0 in use 1237139 859073 0 0 其中memory行显示了内存总量,使用量,钉入量和虚拟总量 pg space行显示了分面空间的使用量 pin行显示了正在用的钉入量,永久钉入量和客户量 in use显示了总内存的工作页面量,永久页面量,客户端页面量 如想将oracle进行lock_sga设置,可以查看PIN值来确认是否生效 要使pin生效必需vmtune -S 1
svmon -U oracle可以查看oracle用户的用量 svmon -U oracle =============================================================================== User Inuse Pin Pgsp Virtual LPageCap oracle 1897660 3007 1210399 1459736 N 计算出其大小为 7412M 11M 4728M 5702M ............................................................................... SYSTEM segments Inuse Pin Pgsp Virtual 3236 2089 1935 4889 13M 8M 8M
............................................................................... EXCLUSIVE segments Inuse Pin Pgsp Virtual 1893883 918 1208317 1453304 7398 4M SHARED segments Inuse Pin Pgsp Virtual 541 0 147 1543 2M 在以上表中SYSTEM是所有系统共用段,EXCLUSIVE是此用户专用段,SHARED段是共享段
5、磁盘IO iostat 可以查看时间段内的CPU状况和磁盘状况 tty: tin tout avg-cpu: % user % sys % idle % iowait 0.0 55.3 11.6 2.0 20.4 66.0
Disks: % tm_act Kbps tps Kb_read Kb_wrtn hdisk0 24.9 153.0 38.3 1236 296 hdisk1 31.3 193.8 48.7 1656 284 dac0 0.0 2969.1 179.1 11564 18164 hdisk2 100.0 2969.1 179.1 11564 18164 cd0 0.0 0.0 0.0 0 0 其中% tm_act是指活动时间,kbps是在统计时间内所有Kb_read与Kb_wrtn之和除以时间的值,即每秒传输的字节数 如果%tm_act常过70%却只有很低的Kbps,系统可能是有比较多的LV碎片或文件碎片,当都高时则系统正常。 tps表示每秒的IO数,不同的磁盘系统其可承受的IO数不同。
sar -d 10 2也可以查看IO情况 12:11:16 device %busy avque r+w/s blks/s avwait avserv
12:11:26 hdisk0 34 1.0 50 201 0.0 0.0 hdisk1 41 0.0 64 259 0.0 0.0 dac0 0 0.0 331 4197 0.0 0.0 hdisk2 99 5.0 331 4197 0.0 0.0 cd0 0 0.0 0 0 0.0 0.0 其中的%busy对应的% tm_act avque表示等待IO对列数,其值很高则预示着磁盘有较大瓶颈 r+w/s对应tps,blks/s是按0.5Kbytes/s计算的传输速度 sar -d 最大好处是可以对较长时间的值会有一个总体平均值