用Oracle存储来分析Unix系统的性能

文章作者 100test 发表时间 2007:05:07 16:25:57
来源 100Test.Com百考试题网


一、 前言

作为UNIX系统中的Oracle数据库管理员,时刻监控操作系统的性能无疑是非常重要的,幸运的是UNIX系统提供了大量的监控命令,比如vmstat, iostat, sar, top等等,这些监控命令均以字符界面输出结果,再加上UNIX系统中shell的强大分析功能,这样我们只需要编写一些脚本就可以实现自动的后台监控,当有问题的时候再自动发送邮件给DBA。

其实相类似的一些监控脚本可能已经随处可见了,但是本文提到的一个新的思路,就是利用Oracle数据库的statspack空间来存储监控的结果,再利用数据库天生的检索优势,这样比以往靠shell分析甚或是人工分析生成的监控结果文件要更加轻松,智能,同时也能实现更持久和更广泛的监控。

本文大部分素材来源自Donald K. Burleson的Oracle9i UNIX Administration Handbook,但是对于脚本中的一些错误和不合理的地方作了修改,并且添加了一些功能,本文的测试环境全部基于Sun Solaris 8 Sparc 64bit Oracle9.2.0.5。

本文第一版主要以监控内存消耗和CPU等待的vmstat命令为例,将陆续添加iostat等其它命令的监控脚本。

二、 思路

首先安装statspack,然后手工创建一个用于存储vmstat命令输出结果的表,再作一个shell定时执行vmstat,将结果全部插入数据库表中,最后就是通过SQL定时分析表中的数据,超过预先指定的门限值就告警。同时根据表中的数据,我们还能作出系统性能的趋势报告。

三、 vmstat脚本及步骤

1. 安装statspack

sqlplus “/ as sysdba”



SQL> @?/rdbms/admin/spcreate.sql

按照提示设定perfstat用户的密码之后,由于是10g,我选择了SYSAUX表空间作为perfstat用户的默认表空间,而没有另行创建表空间。

2. 创建stats$vmstat表

SQL> connect perfstat/perfstat



SQL> @create_vmstat_tab.sql





# create_vmstat_tab.sql 



0drop table stats$vmstat.

create table stats$vmstat

(

start_date date,

duration number,

server_name varchar2(20),

running_queue number,



waiting_queue number,



swap_in number,



swap_out number,

kbytes_page_in number,

Kbytes_page_out number,



page_scan number,

user_cpu number,

system_cpu number,

idle_cpu number,

wait_cpu number

)

tablespace sysaux

storage (initial 10m

next 1m

pctincrease 0)

.



comment on column stats$vmstat.start_date

is 监控时间.

comment on column stats$vmstat.duration

is 监控时长.



comment on column stats$vmstat.server_name

is 服务器名称.

comment on column stats$vmstat.running_queue

is 执行队列.



comment on column stats$vmstat.waiting_queue

is 等待队列.



comment on column stats$vmstat.swap_in

is 每秒平均交换进LWPs数.



comment on column stats$vmstat.swap_out

is 交换出进程数.



comment on column stats$vmstat.kbytes_page_in

is 换页进字节(K).

comment on column stats$vmstat.kbytes_page_out

is 换页出字节(K).



comment on column stats$vmstat.page_scan

is 换页守护进程扫描页数.



comment on column stats$vmstat.user_cpu

is 用户操作占用的CPU.

comment on column stats$vmstat.system_cpu

is 系统操作占用的CPU.



comment on column stats$vmstat.idle_cpu

is CPU空闲率.

comment on column stats$vmstat.wait_cpu

is CPU等待率(AIX独有).

3. 创建vmstat目录

在oracle用户主目录下创建用于存放所有相关脚本的vmstat目录。

$ cd



$ mkdir vmstat

4. 创建get_vmstat.ksh脚本

改脚本用于定时执行vmstat命令并且将结果存入数据库。

# get_vmstat.ksh



#!/bin/ksh



#----------------------------------------



# 首先设定环境变量,根据实际环境修改. . . .



#----------------------------------------



ORACLE_SID=kamusdb



export ORACLE_SID



ORACLE_HOME=`cat /var/opt/oracle/oratab|grep 

^$ORACLE_SID:|cut -f2 -d:`



export ORACLE_HOME



PATH=$ORACLE_HOME/bin:$PATH



export PATH





SERVER_NAME=`uname -a|awk {print $2}`



typeset -u SERVER_NAME



export SERVER_NAME





#----------------------------------------



# 每5分钟运行一次vmstat(300秒),可以根据实际情况修改 . . . .



#----------------------------------------



SAMPLE_TIME=300





#----------------------------------------



# 脚本一旦运行将不会停止,除非关闭操作系统 . . . .



# -S参数表示监控swap空间的情况,报告si,so列



# msg$$中的$$表示一个任意2位数字,系统自动生成



#----------------------------------------



while true



do



vmstat –S ${SAMPLE_TIME} 2 > /tmp/msg$$





#----------------------------------------



# Solaris系统的vmstat没有wait CPU统计,所以我们在那一列中存入0



# $1, $2, $6, $7等数字分别表示vmstat输出中的第几列,



# 每个Unix系统中的vmstat输出可能都不一样,



# 所以修改这些列号,就可以应对不同的操作系统。



#----------------------------------------



cat /tmp/msg$$|sed 1,3d | awk 

{ printf("%s %s %s %s %s %s %s %s %s %s n", 

$1, $2, $6, $7, $8, $9, $12, $20, $21, $22) } 

| while read RUNQUE WAITQUE SWAPIN SWAPOUT

 PAGE_IN PAGE_OUT PAGE_SCAN USER_CPU SYSTEM_CPU IDLE_CPU 



do





$ORACLE_HOME/bin/sqlplus perfstat/perfstat <

5. 创建run_vmstat.ksh脚本

该脚本放在crontab中,用来定时检查get_vmstat.ksh脚本有没有正常运行,如果在运行,那么不作任何动作,如果不在运行,那么就运行get_vmstat.ksh脚本。这个脚本的意义在于防止重新启动操作系统之后忘记运行get_vmstat.ksh脚本。

# run_vmstat.ksh



#!/bin/ksh



#----------------------------------------



# 首先设定环境变量,根据实际环境修改. . . .



#----------------------------------------



SCRIPT_PATH=`echo ~oracle/vmstat`



export SCRIPT_PATH



ORACLE_SID=kamusdb



export ORACLE_SID



ORACLE_HOME=`cat /var/opt/oracle/oratab|grep $ORACLE_SID:|cut -f2 -d:`



export ORACLE_HOME



PATH=$ORACLE_HOME/bin:$PATH



export PATH





#----------------------------------------



# 作更进一步地控制,在系统没有操作的时间内停止监控



# 晚上8点到第二天凌晨8点之间停止监控



# 其它时间如果get_vmstat不在运行,就运行它

#----------------------------------------





HOUR=`date  "%H"`



check_stat=`ps -ef|grep get_vmstat|grep -v grep|wc -l`



vmstat_num=`expr $check_stat`





if [ $HOUR -gt 19 ] || [ $HOUR -lt 8 ]



then 



if [ $vmstat_num -gt 0 ]



then kill -9 `ps -ef|grep get_vmstat

|grep -v grep|awk {print $2 }` > /dev/null



fi



else



if [ $vmstat_num -le 0 ]



then nohup $SCRIPT_PATH/get_vmstat.ksh > /dev/null 2>&.1 &.



fi



fi

6. 创建crontab作业,定时执行run_vmstat.ksh脚本

该作业每半小时运行一次。

$ crontab –l > oracle.cron



$ echo ’00,30 * * * * /export/home/oracle/vmstat/run_vmstat.ksh



 >> /export/home/oracle/vmstat/run.lst 2>&.1’ >> oracle.cron



$ crontab oracle.cron


相关文章


解决ASM无法启动问题
用Oracle存储来分析Unix系统的性能
Oraclerac安装过程详解(二)
Oraclerac安装过程详解(一)
澳大利亚华人论坛
考好网
日本华人论坛
华人移民留学论坛
英国华人论坛