长沙mpacc:IBM小型机巡检
来源:百度文库 编辑:九乡新闻网 时间:2024/05/03 10:51:26
将以前网上down的资料整理了一下
1、检查系统硬件情况
设备故障灯是否有亮
包括硬盘,阵列,光纤交换机,系统故障灯,磁带机等
是否有其它异常情况
2、系统错误报告(ERROR LOG),
errpt
是否有硬件故障
是否有软件故障
3、有否发给ROOT用户的错误报告(MAIL)
root用户下执行
mail
4、关键文件系统的使用率不大于80%
df –k
5、逻辑卷:有否“STALE”状态的逻辑卷
lsvg –l rootvg
6、页面空间使用率是否超过70%
lsps –a
7、内存交换区的大小是否为物理内存的2倍
此项根据物理内存大小区别对待
如果内存<
如果内存>
8、系统备份:
是否有符合要求的系统备份:
最后一次系统备份的时间:
是否符合要求的用户数据备份:
9、通信:网卡的状态、IP地址、路由表等
网卡通信(ping)
/etc/hosts 或DNS
ifconfig –a
netstat –in
lsattr –El inet0
netstat –rn
nslookup
10、是否有数据保护方式如raid10/raid5,是否有hot spare
主要是磁盘阵列,或根卷组磁盘镜像
磁盘阵列的raid与hotspare为硬件级别,可通过软件查看
根卷组磁盘镜像可以通过 lsvg –l rootvg查看lp与pp对比
11、机房环境
电源电压____
零地电压_____
温度、湿度_____
12、机器清洁(根据需要清洁机器各部件)
主要是磁带机以及外面板灰尘
13、补丁程序(PTF)
系统补丁级别:oslevel –r 、instfix –i | grep ML
最新补丁级别:
微代码(MICROCODE)
系统微代码:lscfg -vp | grep alt
最新微代码:
网卡、控制卡、硬盘微码是否需要升级 lscfg -vp
请与客户沟通是否需要升级系统补丁和微码
14、系统硬件诊断
主要通过查看 errpt,diag执行
系统板、CPU、内存、I/O板
网卡、SCSI卡、SSA卡
系统其它扩展卡
硬盘、磁盘阵列
磁带机、磁带库
15、检查hacmp.out smit.log bootlog,wtmp等日志文件
tail –100 hacmp.out
tail -100 smit.log
alog –t boot –o
last
16、系统性能
内存:svmon、lsps -a
Cpu :sar
硬盘:iostat
文件系统:filemon
其他命令: vmstat、topas、lvmstat
17、DUMP设备的检查
sysdumdev -l
18、磁带机是否需要清洗
/usr/lpp/diagnostics/bin/utape -cd rmt0 –n
显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗
输出判断:
结果应为
输出判断:
结果应为
更改命令为:
输出判断:
结果应为
更改命令为:
输出判断:
结果应为
输出判断:
结果应为
更改命令为:
#smitty aio
5) /etc/environment文件中TZ不应有夏时制
20、检查errdemon, srcmstr是否正常运行
lssrc –s errdemon
lssrc –s srcmstr
ps –ef | grep erred
ps –ef | grep srcm
21、收集系统信息
运行#snap –ac
在/tmp/ibmsupt目录下生成压缩文件snap.pax.Z