運維好(hǎo)(hǎo)數據中心的四大法寶
作(zuò)者:晨光  來(lái)源: IT運維網   發表時(shí)間(jiān):2016-4-28  點擊:3184

對于數據中心,運維工作(zuò)的重要性不言而喻,在數據中心生(shēng)命周期中運維管理(lǐ)是曆時(shí)時(shí)間(jiān)最長的一(yī)個(gè)階段。數據中心運維的工作(zuò)主要是對數據中心各項管理(lǐ)對象進行系統的計劃、組織、協調與控制,是信息系統服務(wù)有關(guān)各項管理(lǐ)工作(zuò)的總稱,具體(tǐ)包括對機房(fáng)環境基礎設施部分(fēn)的維護,系統與數據維護,管理(lǐ)工具的使用,人(rén)員(yuán)的管理(lǐ)等方面。投資巨大的數據中心,為(wèi)了(le)能(néng)夠盡快(kuài)得到收益,就(jiù)需要在運維的工作(zuò)上(shàng)多下(xià)工夫,切勿進入“一(yī)流設備、二流設計、三流運維”的不良運營之中,高品質數據中心運維的工作(zuò)至關(guān)重要。那麽如(rú)何才能(néng)提升數據中心的運維水平,本文提出了(le)數據中心運維工作(zuò)制勝的四大法寶,做好(hǎo)(hǎo)這(zhè)四個(gè)方面的工作(zuò)将使數據中心一(yī)直運行于最佳狀态,為(wèi)數據中心創造最大的受益。

工程文檔


文檔對數據中心運維的工作(zuò)非常重要。包括數據中心的安裝、配置、優化(huà)、組網、設備互連等方方面面,通過這(zhè)些(xiē)文檔可以對數據中心的運營了(le)如(rú)指掌,在出現(xiàn)故障時(shí)迅速排查,找到故障點。文檔還有一(yī)個(gè)重要的作(zuò)用就(jiù)是工作(zuò)的傳承,當有人(rén)員(yuán)離開時(shí),他隻要留下(xià)工作(zuò)的文檔,其它人(rén)交接工作(zuò)就(jiù)很容易。還有就(jiù)是工作(zuò)經驗的積累文檔。雖然各種數據中心大同小異,基本是靠服務(wù)器(qì)、網絡和存儲三大件打天下(xià),但(dàn)每個(gè)數據中心又都有自己的風(fēng)格,自己的優勢與劣勢。通過對數據中心運維而輸出的各種技術文檔,将為(wèi)後來(lái)人(rén)提供方便,并且可以提升數據中心整體(tǐ)的運維能(néng)力。數據中心的文檔五華八門,你不知道什(shén)麽時(shí)候其中的哪些(xiē)文檔就(jiù)會派上(shàng)用場(chǎng)。根據以往經驗,數據中心的文檔主要集中于三類:一(yī)是數據中心内部架構文檔,比如(rú):組網介紹、設備互連關(guān)系、IP分(fēn)配情況、空調系統、機電系統、布線系統等的基本狀況;二是數據中心管理(lǐ)文檔,比如(rú):機房(fáng)管理(lǐ)制度、機房(fáng)值班和交接制度、機房(fáng)巡檢制度、設備操作(zuò)規範制度,安全防護制度等等。三是數據中心改造,優化(huà)工程文檔。比如(rú):升級指導書、網絡變更計劃書、應急措施指導、軟件回退方案等等。四是數據中心運維的經驗文檔。比如(rú):網絡中斷問題分(fēn)析、現(xiàn)有機房(fáng)環境評估、如(rú)果進行業務(wù)不丢包切換等等。利用這(zhè)些(xiē)文檔,即使一(yī)個(gè)新(xīn)人(rén)來(lái)做數據中心維護,也(yě)可以迅速上(shàng)手。其實不僅對于數據中心這(zhè)個(gè)行業,其它任何行業,任何工作(zuò)都是如(rú)此,養成輸出文檔的好(hǎo)(hǎo)習慣,為(wèi)自己也(yě)為(wèi)别人(rén)提供方便,可以大大提升工作(zuò)效率。

業務(wù)備份


數據中心的業務(wù)要求全年24小時(shí)連續運行,然而數據中心一(yī)個(gè)故障都不出是不可能(néng)的,甚至一(yī)些(xiē)數據中心幾乎天天都在上(shàng)演各種故障。擁有數十萬台設備的數據中心,每天壞一(yī)台服務(wù)器(qì)或一(yī)個(gè)端口都是在正常不過的事(shì)情了(le),這(zhè)就(jiù)要求我們對數據業務(wù)有備份。小到服務(wù)器(qì)、網絡到存儲,大到數據中心,都需要有備份,包含軟件的備份和硬件的備份。通過備份,可以在數據中心運行出問題時(shí),及時(shí)做業務(wù)調整,确保業務(wù)無中斷或者短時(shí)中斷。如(rú)今的數據中心可以做到多數據中心互為(wèi)備份,就(jiù)算(suàn)其中一(yī)個(gè)數據中心癱掉,業務(wù)也(yě)可以順利由其它數據中心接管,繼續正常運行,所以隻要不是世界末日到來(lái),在不同地方建設多個(gè)數據中心,就(jiù)能(néng)保證數據中心業務(wù)的長期穩态運行。業務(wù)備份是龐大的系統工程,涉及到方方面面,任何一(yī)個(gè)環節都有一(yī)些(xiē)備份技術,在數據中心裏不可能(néng)任何地方都部署備份技術,那将使得數據中心成本過高,設計過于複雜,但(dàn)是沒有備份肯定是不行的,這(zhè)就(jiù)需要在兩者之間(jiān)找到一(yī)個(gè)平衡點。不管怎樣,業務(wù)備份在數據中心裏不可缺少。

在線監測


數據中心運行是動态的,每時(shí)每刻都在變化(huà)。我們無法預知未來(lái)會發生(shēng)哪些(xiē)突發故障,就(jiù)算(suàn)是每個(gè)環節都有備份,也(yě)需要有監測的手段,來(lái)保證業務(wù)切換到運行正常的設備上(shàng)來(lái)。對于數據中心在線監測必不可少。在線監測包括網管的監測,服務(wù)器(qì)運行狀态的監測,空調系統的監測,機房(fáng)環境的監測等等,當發現(xiàn)異常時(shí),即使将告警通知運維人(rén)員(yuán),或者軟件自動啓用備用系統,确保數據中心繼續穩定運行。在線監測是确保數據中心無故障運行的保證,有效的在線監測可以減少數據中心故障發生(shēng)時(shí),對業務(wù)造成影響。

周期巡檢


俗話(huà)說(shuō)“防患于未然”,對于數據中心日常的周期巡檢是不可缺少的。通過周期巡檢,及時(shí)發現(xiàn)一(yī)些(xiē)運行隐患,然後排除,可以大大降低(dī)數據中心發生(shēng)嚴重故障的可能(néng)性。周期巡檢可以包括對各種設備的檢查,環境的檢查,電源、空調設備的檢查,填寫日常巡檢記錄表,檢修記錄,作(zuò)業操作(zuò)表等等。通過以往記錄的數據進行綜合分(fēn)析,一(yī)旦某些(xiē)數據有波動或者異常,應該及時(shí)采取有效措施,避免隐患引發故障。通過周期巡檢也(yě)可以對整個(gè)數據中心有個(gè)全面的了(le)解,一(yī)旦要進行系統改造或者擴容等工作(zuò),有了(le)前期這(zhè)些(xiē)巡檢數據參考,制定的改造或擴容方案才更有針對性。千萬不要以為(wèi)周期巡檢隻是記錄一(yī)些(xiē)設備運行的基本參數,通過這(zhè)些(xiē)參數可以看到整個(gè)數據中心的運行狀态。對于一(yī)個(gè)剛從事(shì)運維的新(xīn)手來(lái)說(shuō),通過周期巡檢可以迅速了(le)解到數據中心的各個(gè)環節,獨立展開維護工作(zuò)。

總結


工程文檔、業務(wù)備份、在線監測、周期巡檢是數據中心運維工作(zuò)的四個(gè)重要方面,隻有做好(hǎo)(hǎo)這(zhè)四個(gè)方面的工作(zuò),才能(néng)讓數據中心保持長期穩定運行,并能(néng)産生(shēng)良好(hǎo)(hǎo)的效益,是數據中心運維水平高低(dī)的主要體(tǐ)現(xiàn),擁有這(zhè)四大法寶,将使數據中心終身(shēn)受益。

微信掃一(yī)掃

關(guān)注昊雲訂閱号

服務(wù)項目

維保運維服務(wù)

信息系統集成服務(wù)

機房(fáng)搬遷服務(wù)

 
 
 
QQ 在線客服
QQ 在線客服
 
電話(huà):
0531-88818533
客服QQ
2061058957
1905215487