高效數據中心運維團隊的7個(gè)習慣
作(zuò)者:admin  來(lái)源:本站(zhàn)  發表時(shí)間(jiān):2016-1-5  點擊:4226

       在好(hǎo)(hǎo)萊塢大片《星際穿越》中,墨菲定律的旋律無處不在:“會出錯的事(shì)總會出錯-Anything that can go wrong , will go wrong。”數據中心基礎設施的運維團隊,面臨着同樣的挑戰:如(rú)何運行一(yī)個(gè)龐雜的機房(fáng),進行無數的主動和被動的操作(zuò),同時(shí)避免錯誤導緻的數據中心故障。全球行業專家們都認可:通過一(yī)系列的努力,可以最大程度控制潛在故障的影響範圍,保證數據中心最高效穩定的運行。

  Steve Covey為(wèi)高效人(rén)士總結了(le)7個(gè)習慣。我們基于對行業最佳實踐的觀察,總結了(le)高效數據中心運維團隊的7個(gè)習慣。

  1. 以終為(wèi)始

  以終為(wèi)始是一(yī)種以結果為(wèi)導向的思維方式,提示人(rén)們在做事(shì)情前要先明确做事(shì)情的最終目的,也(yě)就(jiù)是“不忘初心,方得始終”。數據中心的終極目标是支持業務(wù)系統的不間(jiān)斷運行。在接手一(yī)個(gè)數據中心的運維任務(wù)之前,我們首先需要明确業務(wù)連續性目标,然後才能(néng)制定相應的運維策略。

  2. 以人(rén)為(wèi)本

  70%的數據中心故障是由人(rén)為(wèi)造成的。與此同時(shí),即使有最先進的監控系統,數據中心内無論主動保養操作(zuò),還是應急反應,都還需要依賴于人(rén)員(yuán)的最終決策和操作(zuò)。所以,配備足夠的人(rén)員(yuán)、有責任心、經驗豐富的人(rén)員(yuán)、對于數據中心的安全運行至關(guān)重要。

  3. 培訓與學習

  學習是一(yī)種修煉。有一(yī)種說(shuō)法“最好(hǎo)(hǎo)的運維團隊隻不過是犯了(le)足夠的錯誤就(jiù)修煉出來(lái)的”。數據中心基礎設施牽涉到電力、暖通、弱電、消防、建築等諸多專業,對于數據中心運維團隊來(lái)說(shuō),需要學習的專業知識非常多。同時(shí),每一(yī)個(gè)數據中心的配置和特定的操作(zuò)流程都不完全相同。因此,培訓與學習應該成為(wèi)運維 團隊管理(lǐ)的一(yī)個(gè)重要組成部門。

  4. 建立管理(lǐ)體(tǐ)系

  數據中心基礎設施的運維管理(lǐ)工作(zuò)的管理(lǐ)對象包括整個(gè)龐大的基礎設施、運維團隊、服務(wù)對象(IT部門或者IDC客戶),是一(yī)項系統性很強的工作(zuò),需要建立起一(yī)個(gè)管理(lǐ)體(tǐ)系。在整個(gè)管理(lǐ)體(tǐ)系中最重要的三個(gè)方面是設備保養體(tǐ)系、與所有相關(guān)部門的溝通機制、以及支持整個(gè)數據中心生(shēng)命周期管理(lǐ)的财務(wù)預算(suàn)體(tǐ)系。

  5. 規範操作(zuò)流程

  任何規範化(huà)的企業管理(lǐ),都不可避免地需要引入流程,數據中心運維管理(lǐ)也(yě)不例外。完全基于個(gè)人(rén)經驗和判斷的操作(zuò),往往隐藏着重大的故障風(fēng)險。數據中心就(jiù)是要強化(huà)流程管理(lǐ)。任何重要的操作(zuò),必須嚴格按照流程執行。建立流程文化(huà)是數據中心規範化(huà)管理(lǐ)的一(yī)個(gè)重要環節。數據中心最重要的三類流程是标準操作(zuò)流程(SOP),維護保養操作(zuò)流程(MOP),和應急相應流程(EOP)。

  6. 動态管控

  除了(le)之前提到的管理(lǐ)體(tǐ)系和操作(zuò)流程這(zhè)些(xiē)相對靜态的工作(zuò)以外,數據中心還需要進行動态的管控。近幾年,IT負載的動态性表現(xiàn)得越來(lái)越明顯。一(yī)方面,IT設備的增加速度比較快(kuài)。新(xīn)的業務(wù)系統上(shàng)線可能(néng)導緻IT負載在短期内有較大的增加。另一(yī)方面,企業大量采用虛拟化(huà)技術以後,可能(néng)會出現(xiàn)機房(fáng)内各機櫃的IT負載在一(yī)天範圍内有較大變化(huà)的情況。基礎設施運維團隊需要針對這(zhè)種IT負載的動态性作(zuò)出相應的對策。

  7. 持續改善

  大型數據中心的出現(xiàn)隻是近幾年的事(shì)情。當數據中心超過一(yī)定規模的時(shí)候,管理(lǐ)變得複雜,已經超越原來(lái)簡單的依賴于少數運維人(rén)員(yuán)的責任心的時(shí)代,需要的是完整的管理(lǐ)思想和方法論。國内數據中心基礎設施運維體(tǐ)系的成熟度大緻處于三個(gè)等級的狀态:基礎級、成長級、文化(huà)級。

掃描二維碼添加昊雲公衆訂閱号

掃描二維碼添加昊雲公衆服務(wù)号

下(xià)條新(xīn)聞:七字訣,不再憋屈的運維

服務(wù)項目

維保運維服務(wù)

信息系統集成服務(wù)

機房(fáng)搬遷服務(wù)

 
 
 
QQ 在線客服
QQ 在線客服
 
電話(huà):
0531-88818533
客服QQ
2061058957
1905215487