隨著數(shù)據(jù)中心日益成為企業(yè)的業(yè)務(wù)核心,人們對數(shù)據(jù)中心可靠性的要求也越來越來高。但是數(shù)據(jù)中心的設(shè)計并不是簡單地進(jìn)行基礎(chǔ)設(shè)施冗余。數(shù)據(jù)中心的高層管理人員更加關(guān)注數(shù)據(jù)中心的可靠性和安全性,因此數(shù)據(jù)中心的設(shè)計比以往任何時候都更為重要,特別是滿足特定的公司需求的時候。
在實際工作中,提高可靠性并不需要更多的冗余配置,也沒有超出預(yù)算的必要。
最近在數(shù)據(jù)中心世界會議上,做了如何從可用性角度看待數(shù)據(jù)中心設(shè)計決策的演講報告。
(1)更多的冗余并不意味著更高的可靠性
表示,重要的不僅僅是數(shù)據(jù)中心設(shè)計,盡可能多滿足IT設(shè)備應(yīng)用程序的實際需求也很重要,更多的基礎(chǔ)設(shè)施冗余并不會自動使系統(tǒng)更加可靠。事實上,在冗余組件增加一個點都會降低可靠性,因為這使系統(tǒng)變得更加復(fù)雜,更加難以管理。
(2)TierIV數(shù)據(jù)中心的成本是TierII數(shù)據(jù)中心的兩倍
數(shù)據(jù)中心基礎(chǔ)設(shè)施的可靠性水平必須匹配數(shù)據(jù)中心支持的應(yīng)用程序需求。人們都希望設(shè)計和建設(shè)最可靠的數(shù)據(jù)中心,雖然客戶為此可以負(fù)擔(dān)高昂費用,但這種做法并不明智,特別是考慮到冗余的成本。
表示,引用數(shù)據(jù)中心設(shè)施咨詢機(jī)構(gòu)UptimeInstitute的調(diào)查,TierI級數(shù)據(jù)中心和TierII級數(shù)據(jù)中心的成本與TierIII和TierIV級數(shù)據(jù)中心的成本相比,之間差異很小。而數(shù)據(jù)中心的設(shè)計從TierII級到TierIII級,其費用增幅巨大:幾乎是100%。以同樣擁有15000平方英尺空間的數(shù)據(jù)中心為例,TierI級數(shù)據(jù)中心的UPS電源每千瓦成本為10000美元,TierII數(shù)據(jù)中心的UPS電源每千瓦的成本為11000美元。TierIII數(shù)據(jù)中心的UPS電源成本為20000美元,TierIV級的UPS電源成本為22000美元??梢钥吹?,TierIII數(shù)據(jù)中心電源成本是TierI級數(shù)據(jù)中心的一倍。
(3)2(N+1)冗余配置UPS系統(tǒng)并不比2N冗余UPS系統(tǒng)更加可靠
更多的冗余并不意味著更高的可靠性,說,2(N+1)UPS冗余配置的設(shè)計并不比2NUPS冗余配置更加可靠。表示,對于一個系統(tǒng)來說,2N冗余UPS系統(tǒng)故障的概率與2(N+1)冗余UPS系統(tǒng)故障概率基本相同。
(4)2n冗余發(fā)電機(jī)配置比n+1冗余發(fā)電機(jī)配置更加可靠
表示,2(N+1)發(fā)電機(jī)冗余系統(tǒng)的配置與N+1發(fā)電機(jī)冗余系統(tǒng)配置的差異很小。而2(N+1)冗余的UPS系統(tǒng)中,具備雙路供電配置,一個備用電源轉(zhuǎn)換開關(guān),以及雙路IT設(shè)備。N+1的UPS冗余系統(tǒng)的失效概率2.94%,2NUPS冗余系統(tǒng)的失效概率約為1.5%,二者的失效概率相差4.41%。
即使在UptimeInstitute的評級系統(tǒng)中的最高級別TierIV數(shù)據(jù)中心,同樣也不需要多余的發(fā)電機(jī)。TierIV數(shù)據(jù)中心只是要求必須有一臺發(fā)電機(jī)連續(xù)運行,即使在維修過程中。說,所有主要的發(fā)電機(jī)制造商都很容易滿足這個需求,
TierIII和TierIV級數(shù)據(jù)中心也要求這么做,但是,發(fā)電站冗余電源和燃料供應(yīng)基礎(chǔ)設(shè)施需要同時維護(hù)和容錯。
(5)8小時運行發(fā)電機(jī)故障率為15%
發(fā)電機(jī)冗余很重要,因為發(fā)電機(jī)并不可靠。即使一臺發(fā)電機(jī)啟動成功,其IT設(shè)備可以采用這臺發(fā)電機(jī)的電力,但很難確保不發(fā)生意外,因為當(dāng)數(shù)據(jù)中心斷電事故發(fā)生時,發(fā)電機(jī)必須運行較長時間。
紐約遭遇了颶風(fēng)桑迪襲擊,這對于長時間運行的發(fā)電機(jī)的可靠性進(jìn)行了一次罕見的測試,很多發(fā)電機(jī)在這個測試中失敗。莫里森•赫什菲爾德工程公司的許多客戶數(shù)據(jù)中心設(shè)施在電力中斷之后轉(zhuǎn)換到發(fā)電機(jī)供電。說。數(shù)據(jù)中心電力的故障發(fā)生的原因不盡相同,甚至出現(xiàn)了由于發(fā)電機(jī)組燃料箱底部積累的雜質(zhì)并沒有過濾掉,導(dǎo)致發(fā)電機(jī)最終失效的情況。
他援引愛達(dá)荷國家工程實驗室的一項研究發(fā)現(xiàn),15%的的柴油發(fā)電機(jī)在連續(xù)運行8小時后失效;1%的發(fā)電機(jī)24小時后失效;5%的柴油發(fā)電機(jī)半小時后失效;2%的柴油發(fā)沒有啟動。
(6)數(shù)據(jù)中心Tier的級別不會決定可靠性
雖然Uptime Institute定義了數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計可靠性的級別,但影響數(shù)據(jù)中心設(shè)計可靠性的因素很多。其中包括數(shù)據(jù)中心的選址,施工建設(shè)的質(zhì)量,設(shè)備的質(zhì)量,設(shè)備的調(diào)試過程,數(shù)據(jù)中心的運行年限、數(shù)據(jù)中心維護(hù)與管理、人員培訓(xùn)、維修方法,以及人員技術(shù)水平等。
文章來源:ups維修http:///solve_ups.asp
ot articles