- 論壇徽章:
- 0
|
IBM RS/6000巡檢內(nèi)容及操作指導(dǎo)
IBM RS/6000巡檢內(nèi)容及操作指導(dǎo)
1. IBM RS6000小型機(jī)機(jī)房要求:
1. 機(jī)房的衛(wèi)生狀況,要求清潔,鍵盤、顯示器、機(jī)柜上沒有灰塵。
2. 溫度(攝氏 ℃)
10 ℃-40℃
濕度(%)
8% -80%
2. 設(shè)備故障燈分類:
主機(jī)故障燈
面板上不能有數(shù)字顯示,如果有的話,說明系統(tǒng)有故障。
7133磁盤陣列故障燈
告警燈為黃色表示有故障
磁帶機(jī)故障燈
告警燈為黃色說明有故障或磁帶機(jī)太臟,須清洗。
3. 系統(tǒng)錯誤報告(Error Log)的檢查:
硬件故障檢測命令:# errpt -d H -T PERM
若有故障執(zhí)行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,分析結(jié)果報告給客戶
軟件故障檢測命令:# errpt -d S -T PERM
若有故障執(zhí)行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,分析結(jié)果報告給客戶
4. 有否發(fā)給root用戶的錯誤報告(mail):
#mail
1. 觀察所有未讀消息,注意有關(guān)diagela的消息。
2. 常用命令:
h [] Display headings of group containing message
t [] Display messages in or current message.
n Display next message.
q Quit
3. 對發(fā)現(xiàn)的問題詳細(xì)分析,結(jié)果報告給客戶
5. 件系統(tǒng)的檢查:
命令:
# df –k
%Used為文件系統(tǒng)的使用率。所有文件系統(tǒng)的使用率不能大于80%
6.磁帶機(jī)清潔的檢查:
命令:
#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n
顯示結(jié)果為磁帶機(jī)使用的小時數(shù),若大于72小時,則不論磁帶機(jī)黃燈是否亮都應(yīng)用清潔帶清洗。
6. 信系統(tǒng)的檢測:
1. 網(wǎng)卡的狀態(tài)
命令:
#ifconfig –a
輸出判斷:
en0: flags=e080863
inet 192.9.200.2 netmask 0xffffff00 broadcast 192.9.200.255
en1: flags=e080863
inet 192.9.201.1 netmask 0xffffff00 broadcast 192.9.200.255
主備網(wǎng)卡的flag為UP屬正常。同時檢查ip地址和netmask是否正確。
2. 路由的檢測
命令:
#lsattr –El inet0
authm 65536 Authentication Methods True
hostname h24 Host Name True
gateway Gateway True
route net,,0,172.16.23.81 Route True
bootup_option no Serial Optical Network Interface True
rout6 FDDI Network Interface True
3. 網(wǎng)絡(luò)的檢測
命令:
#ping [ip address]
輸出判斷:
用ping命令對/etc/hosts文件中的IP地址進(jìn)行操作,檢測網(wǎng)絡(luò)是否聯(lián)通。
RAID 的Hotspare 屬性是否打開
#smitty ssaraidà Change/Show Attributes of an SSA RAID Array
檢查Enable Use of Hot Spares屬性是否為YES
8.系統(tǒng)DUMP設(shè)置的檢查
命令:
#sysdumdev –l
輸出判斷:
結(jié)果應(yīng)為
primary /dev/hd6
secondary /dev/sysdumpnull
copy directory /var/adm/ras
forced copy flag TRUE
always allow dump FALSE
dump compression OFF
若不正確請用下列命令修改:
#sysdumdev –P –p /dev/hd6 –s /dev/sysdumpnull
9.HACMP 配置檢測: Cluster Verification:
命令:
# /usr/sbin/cluster/diag/clconfig -v '-tr'
輸出判斷:
結(jié)果無Fail項輸出。
10.系統(tǒng)硬件診斷:
命令順序?yàn)椋?
1.#diag
2.Enter
3.Diagnostic Routines
4.System Verification
5.All Resources
6.F7
輸出判斷:
結(jié)果應(yīng)為No trouble was found.
11.補(bǔ)丁程序(PTF)的檢查
1. 系統(tǒng)維護(hù)補(bǔ)丁版本為ML09,檢查命令為:
#instfix –i |grep ML
12.系統(tǒng)參數(shù)的檢查
1.HIGH water mark for pending write I/Os
# lsattr -El sys0 |grep maxpout
輸出判斷:
結(jié)果應(yīng)為
maxpout 33 HIGH water mark for pending write I/Os per file True
2.LOW water mark for pending write I/Os
# lsattr -El sys0|grep minpout
輸出判斷:
結(jié)果應(yīng)為
minpout 24 LOW water mark for pending write I/Os per file True
更改命令為:
#chdev -l sys0 -a maxpout='33' -a minpout='24'
3.Syncd參數(shù)
# grep syncd /sbin/rc.boot
輸出判斷:
結(jié)果應(yīng)為
onhup /usr/sbin/syncd 10 > /dev/null 2>&1 &
更改命令為:
#vi /sbin/rc.boot
4.a(chǎn)io參數(shù)
# lsdev -Cc aio
輸出判斷:
結(jié)果應(yīng)為
aio0 Available Asynchronous I/O
# lsattr -El aio0
輸出判斷:
結(jié)果應(yīng)為
minservers 1 MINIMUM number of servers True
maxservers 10 MAXIMUM number of servers True
maxreqs 4096 Maximum number of REQUESTS True
kprocprio 39 Server PRIORITY True
autoconfig available STATE to be configured at system restart True
fastpath enable State of fast path True
更改命令為:
#smitty aio
5.Limits文件的設(shè)置:
#ulimit –a
輸出判斷:
結(jié)果應(yīng)為
time(seconds) unlimited
file(blocks) 2097151
data(kbytes) 262144 //尤其是這項參數(shù)
stack(kbytes) 32768
memory(kbytes) 32768
coredump(blocks) 2097151
nofiles(descriptors) 2000
更改命令為:
#vi /etc/security/limits
更改data為524288
本文來自ChinaUnix博客,如果查看原文請點(diǎn):http://blog.chinaunix.net/u/10546/showart_50370.html |
|