數(shù)據(jù)中心管理人員,尤其是那些負責(zé)設(shè)施監(jiān)督,必須為產(chǎn)生營收的業(yè)務(wù)運營提供支持的數(shù)據(jù)中心管理人員們正在不斷努力,以克服停機的威脅,這是理所當然的。研究表明,僅僅一分鐘的停機時間平均帶來的損失將超過7,900美元,而長時間的斷電無疑將嚴重影響到企業(yè)的運行,甚至可能讓數(shù)據(jù)中心管理人員被解雇。
減少這種風(fēng)險的最佳方式之一便是對支持數(shù)據(jù)中心不間斷電源(UPS)的電池實施維護。在一系列的電池組中,僅僅只是一處損壞就能引起您的UPS在發(fā)生中斷時運行失敗。而維護電池的第一步是要了解他們真正的使用壽命,并通過相關(guān)策略使您數(shù)據(jù)中心的關(guān)鍵基礎(chǔ)設(shè)施發(fā)揮最大價值。
電池的使用壽命
如果你的數(shù)據(jù)中心采用UPS電池管理關(guān)鍵設(shè)備已經(jīng)有一段時間了,你可能已經(jīng)發(fā)現(xiàn),電池制造商所設(shè)計的電池壽命并不與電池真正的使用壽命相同。設(shè)計的壽命是制造商在實驗室考慮到電池的設(shè)計和電池老化的條件下所得出的。而電池實際的使用壽命不僅僅需要考慮電池老化的影響,還需要考慮到其是如何被應(yīng)用,安裝和維護的。簡單地說,認為電池的設(shè)計壽命和實際使用壽命是相同的,會讓您的數(shù)據(jù)中心存在風(fēng)險。
艾默生網(wǎng)絡(luò)能源公司旗下Liebert Services團隊所服務(wù)的電池組超過40000串,執(zhí)行了高達600000次的檢查或維修訪問。因此,我們對于電池真正的使用壽命有著深刻的理解。根據(jù)我們在這方面的經(jīng)驗,即使電池的設(shè)計壽命可達10年或以上,但基于運行環(huán)境和維護等幾個方面的因素,其很可能在使用了三年之后就已經(jīng)開始不怎么好用了。UPS和電池維護是實現(xiàn)最佳性能和電池投資回報的兩大重要因素。
電池的維護
進行預(yù)防維修和主動更換電池計劃可以在發(fā)生停電、線路高峰、意外斷電、及其他電源相關(guān)的問題時大大減少中斷失敗的風(fēng)險。
一項針對超過5000臺三相UPS單位和24000多串電池的研究發(fā)現(xiàn),定期預(yù)防性維護對于保證UPS可靠性的作用是相當明顯的。這項研究表明,一年的平均故障間隔時間(Mean Time Between Failure,MTBF)內(nèi)獲得兩次預(yù)防性維護(PM)服務(wù)訪問的單位比未實施預(yù)防性維護訪問的UPS的性能好23倍。根據(jù)該項研究,技術(shù)熟練的服務(wù)提供商具有非常低的錯誤率,進一步使得可靠性穩(wěn)步增長。
數(shù)據(jù)表明,平均故障間隔時間(MTBF)與可預(yù)防性維護次數(shù)成正比。(來源:艾默生網(wǎng)絡(luò)能源)
通常,重要的PM訪問任務(wù)包括對設(shè)備實施完整的視覺檢查,其中就有配件,電線,電纜和所有的斷路器,以及檢查空氣過濾器是否清潔。在該PM服務(wù)結(jié)束之后,系統(tǒng)的運行測試應(yīng)包括單位轉(zhuǎn)移和電池放電。然而,在一個更全面的電池管理程序中,監(jiān)控才是關(guān)鍵。
電池監(jiān)控服務(wù)
在一項針對累積運行時間超過了7億小時,覆蓋了電池使用壽命超過三年的數(shù)據(jù)分析中發(fā)現(xiàn),較之那些未安裝電池監(jiān)控系統(tǒng)的數(shù)據(jù)中心,那些已經(jīng)安裝了電池監(jiān)控系統(tǒng)的數(shù)據(jù)中心能夠大大減少由于電池故障所引發(fā)的運行中斷的幾率。盡管這些數(shù)據(jù)中心仍然可能發(fā)生中斷事故,這些事故均是由人為的操作錯誤包括沒有認真查看系統(tǒng)或不知道如何正確分析監(jiān)測數(shù)據(jù)等孤立因素造成的。這同時也顯示了數(shù)據(jù)中心需要相關(guān)的專家來正確的監(jiān)測報警數(shù)據(jù),維護系統(tǒng)。
這些電池監(jiān)測服務(wù)增添了一個高水平的保護,增強了數(shù)據(jù)中心對于其關(guān)鍵基礎(chǔ)設(shè)施的信心,讓數(shù)據(jù)中心管理人員能夠安心的知道其電池是被監(jiān)控的,進而實現(xiàn)了將非計劃停機降到最小化的可能性。此外,這種持續(xù)性的監(jiān)控,允許數(shù)據(jù)中心根據(jù)趨勢分析來規(guī)劃未來的電池投資。
對于今天繁忙的數(shù)據(jù)中心和IT經(jīng)理們而言,一個倍受歡迎的方案是采用遠程分析服務(wù)來分析固定電池的監(jiān)控,將遠程監(jiān)控技術(shù)嵌入到電源保護基礎(chǔ)設(shè)施。這種技術(shù)應(yīng)包括綜合數(shù)據(jù)采集以便能夠盡早的提供預(yù)警。
利用強大的遠程監(jiān)控技術(shù),負責(zé)管理重要基礎(chǔ)設(shè)施的單個管理員不必是專家,目前也能夠在復(fù)雜的數(shù)據(jù)中心管理各種技術(shù),同時也能夠增加工作人員的數(shù)量。憑借其嵌入式能力,監(jiān)控功能還使管理員能夠提高平均無故障時間和平均修復(fù)時間(MTTR)。
通過正確的監(jiān)測技術(shù),提高MTTR是可能的。因為連續(xù)的連接允許基礎(chǔ)設(shè)施專家提供最高水平的支持。他們能夠不斷地收集和分析關(guān)鍵參數(shù)數(shù)據(jù),并將這些信息轉(zhuǎn)換為可操作的計劃。這種遠程診斷可以讓維修技師更明智,使他們到達出現(xiàn)故障的設(shè)備之前,就能夠有針對性的瞄準需要修復(fù)的地方。
最終,遠程UPS和電池監(jiān)測,恢復(fù)一個UPS操作的時間遠遠小于一個連續(xù)時間的方法,在后者中,一個簡單的事件也可能超過八小時。具備早期發(fā)現(xiàn)潛在問題的能力、以及針對缺陷或電池退化快速做出響應(yīng),能夠最大化UPS電池系統(tǒng)的可靠性,使你的數(shù)據(jù)中心保持的當今數(shù)據(jù)中心所需的動態(tài)適應(yīng)性。
鑒于企業(yè)業(yè)務(wù)對于數(shù)據(jù)中心系統(tǒng)依賴性的增強,數(shù)據(jù)中心需要把更多的重點放在數(shù)據(jù)中心的可用性和關(guān)鍵電源系統(tǒng)的可靠性方面,數(shù)據(jù)中心管理人員必須知道如何最好地避免停機,這意味著必須了解你的UPS電池的實際使用壽命和實施預(yù)防性維護的最佳實踐。憑借全面的預(yù)防性維修計劃,包括遠程監(jiān)控服務(wù),進而避免代價高昂的停機時間,而且最重要的是,保障你數(shù)據(jù)中心的正常運作!