- 論壇徽章:
- 0
|
癥狀為陣列2號(hào)控制器亮controller黃燈,根據(jù)經(jīng)驗(yàn)一看就知道2號(hào)控制器掛了。今天的任務(wù)是要幫客戶更換7100的控制器。
1、備份ORACLE數(shù)據(jù)庫(kù)(1個(gè)全庫(kù)exp+1個(gè)全庫(kù)冷備份)
2、備份陣列盤(pán)上其他的文件系統(tǒng)和LUN、VG、PV、LV的名稱和大小等信息。其實(shí)就是把diskinfo,ioscan,vgdisplay等命令結(jié)果保存下來(lái)。
3、umount 所有文件系統(tǒng),vgchange -a n 所有陣列上的VG。這步非常重要,強(qiáng)烈建議。
4、VA7100支持熱插拔和shutdown后更換兩種方式,我用的熱插拔方式,service guide里說(shuō)用后者可能使陣列無(wú)法啟動(dòng)。
5、小心換下已犧牲的2號(hào)磁盤(pán)控制器(熱插拔),等了兩分鐘插上新控制器,陣列上正常的那塊控制器FW是HP19的版本,service guide上說(shuō)HP14以后的版本都會(huì)自動(dòng)去同步FW。于是等了20多分鐘,客戶都等的著急了,2號(hào)控制器的DIMM1指示燈仍遲遲不亮,無(wú)法用console連上,看來(lái)service guide里面說(shuō)的也不能全信。
6、我用armmgr -R full方式reset控制器以后發(fā)現(xiàn),1號(hào)控制器VFP有報(bào)錯(cuò),mismatch code等,而且根據(jù)VFP信息代碼看出新控制器是HP14的版本,^_^|能看到錯(cuò)誤是比較幸運(yùn)的總比它悶聲不吭的好。
7、自動(dòng)同步不行干脆那咱就手工同步,armdownload -M M/C1同步等了240秒以后它有給了我一個(gè)沉重的打擊,只報(bào)了一行failed。暈倒~既然如此不給面子那俺準(zhǔn)備要下毒手了,執(zhí)行陣列正常shutdown,armmgr -s shut,
用HP14版本的控制器啟動(dòng)陣列,然后手工用FW文件升級(jí)為HP19,雖然風(fēng)險(xiǎn)比較大,不過(guò)只要陣列正常shutdown,map信息就都在硬盤(pán)上,再說(shuō)數(shù)據(jù)也已經(jīng)備份過(guò)了,不用擔(dān)心那么多。
8、說(shuō)作就作,換的過(guò)程就不羅嗦了,單用這塊的話控制器就順利通過(guò)了自檢,DIMM1燈亮起來(lái)了,而且可以用console連上,armdiscover 以后建議用cvui升級(jí)固件,很簡(jiǎn)單照著提示作就行了。
9、搞定這個(gè)控制器以后插上另一塊HP19的控制器,^_^終于正常了。不過(guò)很快又郁悶了,陣列關(guān)了以后再開(kāi)console提示NO MAP,Vfpdsp -f看結(jié)果Disk都是noinclude,faint~,不過(guò)理論是實(shí)踐的基礎(chǔ),反正map在磁盤(pán)上有備份,直接vfprecover,等了幾分鐘,陣列自動(dòng)重啟,這下vfpdsp –f正常了。
10、不過(guò)系統(tǒng)還是不能用陣列的lun,重新ioscan也不行,干脆兩臺(tái)主機(jī)重啟,重啟后lun已經(jīng)認(rèn)出來(lái)了,然后激活vg,mount fs,啟動(dòng)oracle,一切正常。^_^|
需要注意的地方:1、如果需要更換cache,首先拆下控制器電池,放置2分鐘以上再去更換控制器cache
2、熱插拔的時(shí)候注意不要碰到板子下面
3、陣列控制器或填充板被移出不要超過(guò)5分鐘。
4、如果正常的給陣列斷電,必須同時(shí)斷開(kāi)陣列后面兩個(gè)電源插頭
本文來(lái)自ChinaUnix博客,如果查看原文請(qǐng)點(diǎn):http://blog.chinaunix.net/u/16851/showart_95196.html |
|