磁盤陣列櫃

磁盤陣列櫃

多個小磁盤組合成的大型磁盤組
磁盤陣列(Redundant Array of Independent Disks),簡稱RAID,有“獨立磁盤冗餘陣列”之意。磁盤陣列是由很多便宜、容量較小、穩定性較高、速度較慢磁盤,組合成一個大型的磁盤組,利用個别磁盤提供數據所産生的加成效果來提升整個磁盤系統的效能。同時,在儲存數據時,将數據切割成許多區段,分别存放在各個硬盤上。磁盤陣列還能利用同位檢查(ParityCheck)的觀念,在數組中任一顆硬盤故障時,仍可讀出數據,在數據重構時,将故障硬盤内的數據,經計算後重新置入新硬盤中。而磁盤陣列櫃就是裝配了衆多硬盤的外置的RAID。由于磁盤陣列櫃具有數據存儲速度快、存儲容量大等優點,所以磁盤陣列櫃通常比較适合在企業内部的中小型中央集群網存儲區域進行海量數據存儲。[1]
    中文名:磁盤陣列 外文名:Redundant Array of Independent Disks 用途: 簡稱:RAID 意思:獨立磁盤冗餘陣列

設計挑戰

由于磁盤驅動器的技術以及傳輸接口的技術不斷的發展,磁盤陣列系統的設計随時都面臨新的挑戰,以便符合與日俱增的要求。一個優質的磁盤陣列櫃,必須在設計階段,就要考慮到其規格必須符合更大容量、更高轉速磁盤驅動器的需求,提供:

穩定、高容量、容錯的電源供應系統

可靠、高性能、容錯的冷卻系統

能夠克服震動的機械結構

支持SCA2熱抽換接頭之被動背闆

一體成型、無主動組件之磁盤載盒

數組櫃環境監控與警示功能

直接熱抽換且方便的維護操作功能

最佳的空間利用

電源供應系統

磁盤驅動器馬達啟動時,需要很大的啟動電流〈約2A〉,約為平常讀寫時〈約0.66A〉的3倍;磁盤驅動器在SEEK時,需要很大的瞬間電流〈約2.1A〉,約為讀寫時〈約0.66A〉之3倍。因此,電源供應系統必須能提供足夠、穩定之瞬間電流,否則會造成磁盤驅動器無法啟動,甚至造成數據寫入錯誤〈此為導緻RAID磁盤驅動器被RAID控制器判定為Down,但磁盤驅動器送回原廠測試卻無故障之原因〉。當磁盤驅動器轉速越來越快,SEEK速度也越來越快時,電源供應器必須提供足夠的容量,以因應将來擴充的需求。

具備容錯,熱抽換、負載分享之雙電源供應器,是不可或缺的,更重要的是,如果電源供應器發生故障,要能不必下螺絲就能熱抽換電源供應〈使用螺絲起子解螺絲會造成震動及搖擺,會損害工作中之磁盤驅動器〉。

有了雙電源供應器,更要具備兩組電源輸入,一個接到市電,一個接到UPS。如此,無論突然斷電,或UPS故障,都不會造成RAID當機。

好的電源供應系統,還須具備交流電壓與頻率自動選擇及調整,以适用不同電壓及頻率,更重要的是,要能克服電壓及頻率不穩之狀況。在用電尖峰時段,市電電壓可能降到100伏特以下,而在非用電尖峰時段,市電電壓可能升到120伏特以上,因此電源供應系統必須能夠容忍這些電壓變化,提供磁盤驅動器穩定的電壓和電流,否則可能造成磁盤驅動器故障,甚至數據寫入錯誤。磁盤陣列櫃的電源供應系統,最好能夠提供從85到260伏特無段自動調整,如此,無論插到哪種插座,市電品質如何變化,都不會影響磁盤陣列的功能。

冷卻系統

在許多案例中,我們發現冷卻系統設計不完善的磁盤陣列櫃,隻能裝設7200轉的磁盤驅動器,若使用10,000轉的磁盤驅動器,系統就會過熱。Seagate已經推出15,0000轉的磁盤驅動器了,如何挑選一個具備可靠、高性能、容錯之冷卻系統的磁盤陣列櫃,就更顯得重要了。

一般磁盤陣列櫃之設計,在每個磁盤驅動器載具上加裝小風扇,整個系統再裝數個大風扇,用邊吸邊吹的方式散熱,不但散熱效果不好,而且是産生磁盤驅動器故障的潛在因素:它帶來的危害有以下這些:

産生大量氣流将粉塵吹入系統,污染磁盤驅動器及風扇本身造成故障。

采用一般PC用小風扇,且數量多〈轉動機械零件越多,故障機率越高〉,系統可靠度因而巨幅降低?/li>

一旦有一個小風扇故障,相關磁盤驅動器便無法獲得足夠散熱而故障。

一個優質磁盤陣列櫃之冷卻系統的設計,必須完全符合熱力學理論之全方位冷卻:熱傳導、熱對流及熱輻射之三相散熱方式,才能更有效率、可靠度更高:

磁盤驅動器載盒必須采用黑色、高導熱系數之金屬〈如鋁合金〉,并與載盒緊密接觸固定,如此可以最快最有效地将磁盤驅動器之熱能傳導至整個載盒,然後以最大輻射面積與最佳輻射顔色〈黑色〉,将熱能輻射至機體内空氣中,再以中央系統渦輪抽風機将熱空氣以對流方式排出

磁盤驅動器載盒不能使用風扇,及其它任何主動組件,以免本身故障而損及磁盤驅動器

系統采用中央抽風排熱設計,須使用兩個以上之工業用渦輪抽風機〈不可用一般PC用風扇〉,以提高可靠度與排熱效率。由于工業用渦輪抽風機本身可以防止軸承被粉塵污染,且抽氣效率極高,可将機體内熱空氣抽出,并在機體内産生很大的相對低壓,冷空氣便可由經過精密設計之對流孔,均勻地進入機體内,達到最佳對流散熱效果。

中央系統渦輪抽風機必須具備熱抽換功能,且能夠自動溫控轉速,以達到最佳之排熱性能與能源使用效率隻需一部渦輪抽風機就足以維持系統散熱之最低限度。工業用渦輪抽風機之出氣口面積隻有一般PC用風扇1/10,因此即使有任何風扇因故停止運轉,也不緻影響整個系統之熱對流結構。

防震機械結構

由于磁盤陣列的特性,當存取陣列中的數據時,陣列中所有的磁盤驅動器的磁頭,都幾乎在同時,往同一個方向SEEK,又幾乎同時在相同的位置煞車,其慣性動量非常之大。因此造成很大的震動問題。如果磁盤陣列櫃的機械結構不能克服這些震動問題,輕則造成Re-Seek,嚴重的話,會導緻碟面受損,數據遺失。

一個好的磁盤陣列櫃的機械結構設計,必須克服上述震動問題:

磁盤驅動器以剛性方式固定于磁盤驅動器載盒〈不使用任何塑料或其它韌性支柱〉:塑料或其它韌性支柱會變成震動的放大器,讓磁盤驅動器震得更厲害。剛性方式固定,可以透過經由模态分析〈ModelAnalysis〉設計之陣列櫃,避開自然共振頻率〈NaturalResonanceFrequency〉以及強迫共振頻率〈ForcedResonanceFrequency〉,将系統震動降至最低,得到最佳性能,不會因震動造成磁頭偏移而需重新尋軌定位(re-seek)。

磁盤驅動器載盒必須為一體成型之剛性合金制造,且緊密穩固地固定在機箱内。如果是以卡榫或螺絲方式接合,其防震效果可想而知,非常不理想。

被動背闆

前面提到,磁盤陣列系統最重要的是可靠度,因此所有具備主動組件〈包含電子組件和機械組件〉都必須安裝在可熱抽換的模塊上,以便發生故障時可以随時更換。一般來說,被動組件是不會壞的,除非暴力相向。

磁盤陣列櫃中,除了背闆〈Backplane〉之外,其它所有模塊都可以是可熱抽換的。因此,背闆上不可以有任何主動組件,以免有任一組件發生故障,必須停機更換,而且,一般來說,使用者是無法自行更換背闆的。

磁盤陣列櫃背闆的另一個重要規格,是必須使用SCA2接頭,以支持熱抽換〈Hot-Swap〉。我們都知道,把磁盤驅動器從系統中拔出或插入,會造成很大的突波訊号,可能影響正在工作的Bus,甚至損壞磁盤驅動器接口組件,因此必須要有特殊的設計,來降低并防止突波可能造成的損害。

SCA2接頭的設計,是采用長、中、短等不同長度的接腳,将前期電源和地線、主電源、總線信号線等,依照先後順序接觸〈插入時〉或分離〈拔出時〉,如此可以将磁盤驅動器線路緩慢充電,将其電位提升以降低其與總線間之電位差,以減低突波訊号,保護電子接口組件以及避免幹擾工作中的總線。

磁盤載盒

在實際的案例中,常發現用戶把磁盤載盒送修,因為磁盤載盒蜂鳴器一直叫、風扇卡住不轉了...,當然,磁盤驅動器也可能因此而毀了〈因為風扇不轉而造成磁盤驅動器過熱,唉,水能載舟,亦能複舟〉。這就是磁盤載盒設計不良所造成的。

一個好的磁盤載盒設計,必須沒有使用任何可動機械或主動電子組件,亦即,不要有小風扇,也不要任何控制線路。如此,磁盤載盒本身就是金剛不壞之身,不會造成故障,更不會成為磁盤驅動器殺手。

同時,磁盤驅動器的固定方式,也是一門學問。除了前述要将磁盤驅動器直接且緊密地固定在磁盤載盒上,以達到熱傳導散熱之外,磁盤驅動器最好是倒挂式固定。如果采取一般正面式固定,則磁盤驅動器所産生的熱,傳導至磁盤載盒之後,又輻射出來産生熱空氣,再往上升,剛好用來烤磁盤驅動器的線路闆和組件〈本是同根生,相煎何太急?〉,會加速組件的老化。如果采取倒挂式固定,則傳導到磁盤載盒的熱,會輻射到磁盤驅動器上部空間,由對流氣流帶走,不會烘烤到磁盤驅動器線路組件。

為求達到最佳熱輻射散熱效果,磁盤驅動器載盒之表面,最好漆上黑色,因為黑色是最容易吸收熱能,也是最容易輻射出熱能的顔色。磁盤驅動器載盒的材質,必須具備高導熱系數的特性,如鋁合金辨識理想的材料,導熱系數高,加工也方便。

而如前述,磁盤驅動器載盒必須是一體成型的剛性金屬合金制造,以達到最佳震動克服性能。我們非常不建議采用組合式磁盤載盒,一般這些組合式磁盤載盒,都是由一個架子和一個盒子組成;架子上有風扇和熱抽換控制電路,固定在機殼上,再接Cable;磁盤驅動器則裝在盒子,透過轉接接頭連到架子上。如此,不但造成前述震動問題,而且一旦架子的風扇或電子組件故障,就必須停機更換。

監控示警功能

磁盤陣列櫃中所有主動組件或機械組件,以及内部環境溫度,都必須能夠監控且有适當的警示和通報功能:

陣列控制器必須能支持S.M.A.R.T.,以便預測可能發生的磁盤驅動器故障。妥善利用S.M.A.R.T.功能,能夠預先準備好備用磁盤驅動器,以便在第一時間把不穩的磁盤驅動器更換掉,如此可以把風險系數降至最低。

環境狀态監控器必須能随時監視機櫃内部溫度,以及控制排設裝置轉速,以達到最佳冷卻及能源利用效率。

電源供應器的輸入與輸出,也必須随時監控。同時異常狀況必須以兩種以上方式通報,至少包含在數組櫃本身的聲音與視覺燈光警示,以及遠程通報。

另外,非常重要的一點是,環境監視控制器本身也是主動組件,也可能發生故障,因此,磁盤陣列櫃的環境監控器,必須能夠支持熱抽換功能。

維護操作功能

在磁盤陣列櫃中,所有可能發生故障的組件,包括主動電子組件、可動機械組件,都必須能夠支持熱抽換功能。不能抽換的組件,就必須是不會故障的被動組件。

具備可熱抽換功能,大家都知道,但是,要如何才能更方便、更安全地作熱抽換,可是一門學問。一個提供方便維護、安全熱抽換的磁盤陣列櫃,至少需具備以下功能:

所有可熱抽換的組件,都必須能由外部直接抽換,而不必先移除其它組件,如此才不會造成任何風險。試想,如果一個風扇壞了,你得先把一個電源供應器移除,才能抽換壞的風扇,你必須保證剩下那個電源供應器不會出問題,否則,你就挂了。

所有的熱抽換動作,都不需要将手或工具伸進機體内部,去拆解螺絲或拔接頭。把工具伸進機體内,可能誤觸線路造成短路,整個系統可能因此損壞或當機;把手伸入機體内,可能會觸電,人一觸電,反應是無法預期和控制的,可能會把整個磁盤陣列櫃甩到五公尺遠。

所有的熱抽換動作,都不需要使用任何工具。在操作中的系統上使用工具是非常危險的,用力轉螺絲會造成機體搖動,磁盤驅動器會受損;金屬工具也可能會造成短路。

所有可熱抽換的組件,都不可使用螺絲固定,因為如果不小心,螺絲很可能會掉進機體内,造成短路。如果一定要用螺絲,也要使用具有卡榫的螺絲,在解下後仍然能夠安全地卡在組件上,不會有脫落的危險。

空間利用

在機架式系統中,空間的利用以及散熱氣流的需求,是非常重要的因素。同樣可容納七台磁盤驅動器,一個隻要占3U空間的磁盤陣列櫃,當然比一個要占6U空間的磁盤陣列櫃要來得有效率。

要能達到最佳化的空間利用,除了磁盤陣列櫃的體積要小之外,散熱氣流的需求也是決定性因素。一個隻應用到單向對流散熱方式的磁盤陣列櫃,需要很大的氣流需求才能達到散熱效果,因此即使體積小,也不能在一個機架中裝設太多磁盤陣列櫃,否則散熱氣流就會不夠。

如果磁盤陣列櫃采用高效率的三相散熱〈熱傳導、熱輻射、熱對流〉系統,就隻需要小量的氣流,便足以發揮散熱效果,因此可以在機架中高密度地裝置磁盤陣列櫃,大大地提高空間使用效率,當然也大大地降低了成本。這對大型企業、ISP、以及主機代管業者來說,是非常有經濟效益的規格。

磁盤應用

由于磁盤陣列櫃具有數據存儲速度快、存儲容量大等優點,所以磁盤陣列櫃通常比較适合在企業内部的中小型中央集群網存儲區域進行海量數據存儲。

相關詞條

相關搜索

其它詞條