长沙mpacc:IBM小型机巡检

来源:百度文库 编辑:九乡新闻网 时间:2024/05/03 10:51:26

将以前网上down的资料整理了一下

 

1、检查系统硬件情况

   设备故障灯是否有亮

包括硬盘,阵列,光纤交换机,系统故障灯,磁带机等

   是否有其它异常情况

 

2、系统错误报告(ERROR LOG),

   errpt

是否有硬件故障

   是否有软件故障

 

3、有否发给ROOT用户的错误报告(MAIL)

   root用户下执行

   mail

 

4、关键文件系统的使用率不大于80%

df –k

 

5、逻辑卷:有否“STALE”状态的逻辑卷

   lsvg –l rootvg

  

6、页面空间使用率是否超过70%

   lsps –a

 

7、内存交换区的大小是否为物理内存的2

   此项根据物理内存大小区别对待

   如果内存<4g,则大小为2

   如果内存>4g,则大小与内存一样即可

 

8、系统备份:

是否有符合要求的系统备份:

   最后一次系统备份的时间:

   是否符合要求的用户数据备份:

   

9、通信:网卡的状态、IP地址、路由表等

   网卡通信(ping)

   /etc/hosts  DNS

ifconfig –a

netstat –in

lsattr –El inet0

netstat –rn

nslookup

 

10、是否有数据保护方式如raid10/raid5,是否有hot spare

主要是磁盘阵列,或根卷组磁盘镜像

磁盘阵列的raidhotspare为硬件级别,可通过软件查看

根卷组磁盘镜像可以通过 lsvg –l rootvg查看lppp对比

 

11、机房环境

    电源电压____

    零地电压_____

温度、湿度_____

 

12、机器清洁(根据需要清洁机器各部件)

主要是磁带机以及外面板灰尘

 

13、补丁程序(PTF)

    系统补丁级别:oslevel –r instfix –i | grep ML

    最新补丁级别:

    微代码(MICROCODE)

        系统微代码:lscfg -vp | grep alt

        最新微代码:

    网卡、控制卡、硬盘微码是否需要升级 lscfg -vp

请与客户沟通是否需要升级系统补丁和微码

 

14、系统硬件诊断

    主要通过查看 errptdiag执行

    系统板、CPU、内存、I/O

    网卡、SCSI卡、SSA

    系统其它扩展卡

    硬盘、磁盘阵列

    磁带机、磁带库

 

15、检查hacmp.out  smit.log   bootlogwtmp等日志文件

     tail 100 hacmp.out

     tail -100 smit.log

     alog t boot o

     last

 

16、系统性能

   内存:svmon、lsps -a

   Cpu :sar

   硬盘:iostat

   文件系统:filemon

其他命令: vmstat、topas、lvmstat

 

 

17、DUMP设备的检查 

sysdumdev -l

 

18、磁带机是否需要清洗

   /usr/lpp/diagnostics/bin/utape -cd rmt0 –n

显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗

 

19、系统参数的检查  

1).HIGH water mark for pending write I/Os

# lsattr -El sys0 |grep maxpout

输出判断:

结果应为

maxpout     33      HIGH water mark for pending write I/Os per file   True

2).LOW water mark for pending write I/Os

# lsattr -El sys0|grep minpout

输出判断:

结果应为

minpout     24      LOW water mark for pending write I/Os per file    True

更改命令为:

#chdev -l sys0 -a maxpout='33' -a minpout='24'

3).Syncd参数

# grep syncd /sbin/rc.boot

输出判断:

结果应为

nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &

更改命令为:

#vi /sbin/rc.boot

 

4).aio参数

# lsdev -Cc aio

输出判断:

结果应为

aio0 Available  Asynchronous I/O

# lsattr -El aio0

输出判断:

结果应为

minservers 1         MINIMUM number of servers                True

maxservers 10        MAXIMUM number of servers                True

maxreqs    4096      Maximum number of REQUESTS               True

kprocprio  39        Server PRIORITY                          True

autoconfig available STATE to be configured at system restart True

fastpath   enable    State of fast path                       True

更改命令为:

#smitty aio

5) /etc/environment文件中TZ不应有夏时制

 

20、检查errdemon, srcmstr是否正常运行

   lssrc s errdemon

   lssrc s srcmstr

   ps ef | grep erred

   ps ef | grep srcm

 

21、收集系统信息

运行#snap ac

在/tmp/ibmsupt目录下生成压缩文件snap.pax.Z

zcat snap.pax.Z | pax -rv  解压到当前目录