- 論壇徽章:
- 0
|
日常維護檢查使用指南
硬件
在這部分中,我們檢查以下內容:
面板指示:
在大多數(shù)的服務器中,都由一個液晶面板,顯示服務器的執(zhí)行狀態(tài)。在正常情況下,應該是FxxF的格式。在系統(tǒng)出現(xiàn)故障時,會出現(xiàn)WARNING或FAULT的提示。具體請參見《技術指南》。
系統(tǒng)管理員應該定期檢查該指示,確認系統(tǒng)正常工作;否則,應該立即聯(lián)系HP公司。
服務器中的各個擴展卡的指示燈
在服務器中,存在多種擴展卡,例如,SCSI卡(連接SCSI設備),以太網(wǎng)卡等。這些卡都由一個或多個指示燈。從這些指示燈可以了解這些卡的工作情況。
具體情況,請參見各個卡的說明書。
SCSI卡:
在正常情況下,自檢燈(self test)應該是暗的;終結電源指示燈(Terminator PWR)是亮的
以太網(wǎng)卡:
在正常情況下,自檢燈(self test)應該是暗的;連接燈(Link)是亮的
其他卡:
外設的狀態(tài)
大部分外設也都由自己的狀態(tài)指示。下面是比較常見的幾種:
M10,M20,M30磁盤陣列
這些磁盤陣列,正常情況下,硬盤的指示燈:應該是綠色;如果變成黃色,則說明該磁盤發(fā)生故障。
維修燈(Service Lamp):
應該是綠色;如果變成黃色,則說明該陣列中存在故障部件。例如,硬盤故障。
AutoRAID磁盤陣列
該磁盤陣列有一個液晶面板。如果出現(xiàn)故障,在面板上會出現(xiàn)Warning提示信息。
磁帶庫
磁帶庫一般也有一個液晶面板。如果出現(xiàn)故障,在面板上會出現(xiàn)報錯信息。
其他外設
XP256:該外設實全冗余的如果有部件發(fā)生故障,會自動通過DDN撥號到美國技術中心。
其他硬件檢測:
在N4000中,有一個attention燈,正常情況下,該燈應該是暗的。如果是黃色的,則說明系統(tǒng)中存在一些問題。
操作系統(tǒng)
在這一部分,通過一些實用、簡單的命令,檢查系統(tǒng)的情況:
控制臺( console )顯示
在系統(tǒng)出現(xiàn)問題時,常常會在控制臺上顯示一些出錯信息。系統(tǒng)管理員應該定期檢查這些信息。這往往是最方便的方式。
另外,在使用完畢后,應該確保退出控制臺,從而避免一些安全性問題。
命令“dmesg”
系統(tǒng)中存在一個錯誤緩沖區(qū),系統(tǒng)將自檢信息和遇到的錯誤、報警放在該緩沖區(qū)中。
我們可以通過dmesg命令,閱讀該緩沖區(qū)。
在正常情況下,該緩沖區(qū)只應該包含自檢信息。如果出現(xiàn)了warining、error或者是一些不熟悉的信息,應該仔細檢查或通知HP服務人員。
命令“uptime”
該命令顯示了系統(tǒng)自從上次重啟以來運行的時間。通過該命令,可以知道系統(tǒng)是否發(fā)生了異常的重啟。
命令“bdf”
系統(tǒng)中文間系統(tǒng)過滿,有時會導致系統(tǒng)工作不正常。
我們可以用該命令顯示了文件系統(tǒng)的使用情況。
如果發(fā)現(xiàn)某個文件系統(tǒng)過滿,需要及時采取措施,或者刪除無用的信息,或者擴大該文件系統(tǒng)。
命令“mail”
系統(tǒng)在發(fā)現(xiàn)問題時,往往會把一些信息發(fā)給root用戶。
系統(tǒng)管理員應該定期檢查root的mail信息,以確認系統(tǒng)中不存在異常。
日志“/var/adm/syslog/syslog.log”
該日志文件中包含一些重要的維護信息。系統(tǒng)管理員應該定期用more或者vi命令,檢查該文件。
系統(tǒng)管理員如果發(fā)現(xiàn)warning、error、failure以及一些不熟悉的信息,應該提高警惕。
命令“cmviewcl”
對于運行了雙機備份軟件的用戶而言,應該定期檢查系統(tǒng)的運行情況。
確認應用包、節(jié)點和網(wǎng)絡均正常工作。
其他命令
用netstat –in檢查網(wǎng)絡狀況,尤其是ATM網(wǎng)卡。
備份
系統(tǒng)管理員應該檢查:
是否按照計劃完成了備份
備份過程是否正常
應用
系統(tǒng)管理員也應該養(yǎng)成定期檢查應用的習慣。在支持服務中,操作系統(tǒng)工作正常,但用戶應用由于種種原因無法正常工作的例子并不罕見。
根據(jù)具體情況,系統(tǒng)管理員應該檢查:
應用的日志文件
組成應用的主要進程的執(zhí)行情況,例如數(shù)據(jù)庫的DBWR,LGWR等等。 |
|