3ware 9650SE 更換硬碟記錄

本實驗室用3ware 9650SE-4ML安裝了4顆2TB的硬碟, 是實驗室最大的資料儲存地。日前發現3ware 的 windows visual alarm常常跳出錯誤訊息, 卻一直沒有時間處理, 後來悲劇就發生了….

悲劇就是一次壞了兩顆硬碟。3ware的介面有三種, 一種是開機時的BIOS界面(3ware BIOS Management, 3BM), 一種是網頁介面(3ware Disk Management, 3DM), 最好用也最直覺, 最後是命令列模式的互動式界面(tw_cli)。很遺憾的, 在上次更新新版之後, 3DM就無法使用, 網頁連結後什麼資料也沒有, 是一片空白, 所以主要的管理工作都是用tw_cli來完成。

這次的錯誤是顯示degraded與ECC-ERROR, 如這張圖:

1 (3)

 

WS1是主機名稱, c0是controller 0的意思, 而u0是unit 0的意思, p0到p3是port0到port3。

系統是4顆硬碟建立RAID5, 所以沒有備援硬碟, 因為這張RAID卡也只支援4個SATA硬碟, 除非打算用3顆硬碟來架RAID5, 不然備援硬碟本來就沒辦法安裝, 所以問題來了。

如果把故障的一顆硬碟拔掉, 裝上一顆新的硬碟, 在3BM中會顯示有一顆可用硬碟與一個不可用的磁碟陣列。因為硬碟不見了, 所以磁碟陣列變成不可用, 這可以理解。但是這樣就不能把硬碟換上去了。

我個人猜想, 應該是要先把磁碟在磁碟陣列中進行移除, 它才會知道我要換新硬碟, 所以我進入windows後, 啟動tw_cli, 然後選定了p3, 執行remove, 出現的訊息是 invalid operation….

重開機, 進入3BM, 發現出問題的那個degraded硬碟出現在失敗的硬碟清單中, 而磁碟陣列並不在不可用的狀態, 所以, 我直接把出問題的硬碟SATA線拔掉, 電源也拔掉, 接到新的硬碟上, 3BM成功抓到新硬碟, 並出現在可用的磁碟清單中, 在按下ENTER選取硬碟與磁碟陣列後, 選取Maintenance, 再選Rebuild unit, 再按下F8, 離開3BM, 進入windows系統, 就會看到系統正在rebuild。

Rebuild的結果就如上圖, 原來degraded的磁碟變成了OK, 可喜可賀!

Leave a Reply

你的電子郵件位址並不會被公開。 必要欄位標記為 *