- 論壇徽章:
- 0
|
癥狀為陣列2號控制器亮controller黃燈,根據(jù)經(jīng)驗一看就知道2號控制器掛了。今天的任務是要幫客戶更換7100的控制器。
1、備份ORACLE數(shù)據(jù)庫(1個全庫exp+1個全庫冷備份)
2、備份陣列盤上其他的文件系統(tǒng)和LUN、VG、PV、LV的名稱和大小等信息。其實就是把diskinfo,ioscan,vgdisplay等命令結(jié)果保存下來。
3、umount 所有文件系統(tǒng),vgchange -a n 所有陣列上的VG。這步非常重要,強烈建議。
4、VA7100支持熱插拔和shutdown后更換兩種方式,我用的熱插拔方式,service guide里說用后者可能使陣列無法啟動。
5、阿拉小心換下已犧牲的2號磁盤控制器(熱插拔),等了兩分鐘插上新控制器,陣列上正常的那塊控制器FW是HP19的版本,service guide上說HP14以后的版本都會自動去同步FW。于是等了20多分鐘,客戶都等的著急了,2號控制器的DIMM1指示燈仍遲遲不亮,無法用console連上,看來service guide里面說的也不能全信。
6、我用armmgr -R full方式reset控制器以后發(fā)現(xiàn),1號控制器VFP有報錯,mismatch code等,而且根據(jù)VFP信息代碼看出新控制器是HP14的版本,^_^|能看到錯誤是比較幸運的總比它悶聲不吭的好。
7、自動同步不行干脆那咱就手工同步,armdownload -M M/C1同步等了240秒以后它有給了我一個沉重的打擊,只報了一行failed。暈倒~既然如此不給面子那俺準備要下毒手了,執(zhí)行陣列正常shutdown,armmgr -s shut,
用HP14版本的控制器啟動陣列,然后手工用FW文件升級為HP19,雖然風險比較大,不過只要陣列正常shutdown,map信息就都在硬盤上,再說數(shù)據(jù)也已經(jīng)備份過了,不用擔心那么多。
8、說作就作,換的過程就不羅嗦了,單用這塊的話控制器就順利通過了自檢,DIMM1燈亮起來了,而且可以用console連上,armdiscover 以后建議用cvui升級固件,很簡單照著提示作就行了。
9、搞定這個控制器以后插上另一塊HP19的控制器,^_^終于正常了。不過很快又郁悶了,陣列關(guān)了以后再開console提示NO MAP,Vfpdsp -f看結(jié)果Disk都是noinclude,faint~,不過理論是實踐的基礎,反正map在磁盤上有備份,直接vfprecover,等了幾分鐘,陣列自動重啟,這下vfpdsp –f正常了。
10、不過系統(tǒng)還是不能用陣列的lun,重新ioscan也不行,干脆兩臺主機重啟,重啟后lun已經(jīng)認出來了,然后激活vg,mount fs,啟動oracle,一切正常。^_^|
需要注意的地方:1、如果需要更換cache,首先拆下控制器電池,放置2分鐘以上再去更換控制器cache
2、熱插拔的時候注意不要碰到板子下面
3、陣列控制器或填充板被移出不要超過5分鐘。
4、如果正常的給陣列斷電,必須同時斷開陣列后面兩個電源插頭
原文請訪問我的Blog:http://blog.itpub.net/category/152/329 |
|