監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關(guān)閉

如何建立完善的數(shù)據(jù)中心運維體系

申請免費試用、咨詢電話:400-8352-114

越來越多數(shù)據(jù)中心行業(yè)從業(yè)人員意識到一個殘酷的現(xiàn)實:人為操作失誤是造成數(shù)據(jù)中心宕機的頭號因素,而非糟糕的設計或施工。越來越多的人開始關(guān)注數(shù)據(jù)中心的運營與維護。設計、建造一個完善的數(shù)據(jù)中心只是數(shù)據(jù)中心可持續(xù)運行的第一步,公司企業(yè)、政府部門等數(shù)據(jù)中心的業(yè)主必須能夠根據(jù)其數(shù)據(jù)中心風險特性來準確描繪運維需求并設計相應的運維規(guī)劃。要做到這一點并不容易,尤其相關(guān)的經(jīng)驗和技能對于那些核心業(yè)務并非數(shù)據(jù)中心的公司來說是比較匱乏的。本文將討論數(shù)據(jù)中心運維當中應當從哪些方面入手,以幫助大家建立合理的運維體系,確保數(shù)據(jù)中心的可持續(xù)與可靠運行。
 
運維人員必須參與數(shù)據(jù)中心設計
 
如果數(shù)據(jù)中心設計的人不是最終使用的人,或者在設計階段使用者的意見沒有被充分咨詢或征求,很容易造成后期使用過程中額外的修改和改動。實際上,數(shù)據(jù)中心運維人員在實際運維中經(jīng)常遭遇這樣的情景:使用中發(fā)現(xiàn)配電柜沒有預留足夠的空開位置,造成必要的維護工序無法完成;電池柜的設計安裝未預留服務空間;建筑結(jié)構(gòu)設計使得通風裝置無法提供所需要的通風量,等等。如果在設計階段就包括運營評估的環(huán)節(jié),那這些問題就可以盡可能地避免。
 
最有效、最省錢、最高效的數(shù)據(jù)中心應當采用生命周期總擁有成本(TCO)的方式來規(guī)劃管理,以平衡投資和運營成本,進而滿足業(yè)務需求。其中很重要的一步就是根據(jù)公司具體業(yè)務需求制定設計指標和運營目標。這樣,建造的數(shù)據(jù)中心目的性更強。
 
不能僅僅依賴數(shù)據(jù)中心的設計
 
許多公司認為高級別的冗余設計可以彌補運維預算的不足,但多方的研究證明,關(guān)鍵任務環(huán)境下,人為錯誤是宕機的首要因素。為什么人們還是會忽略運維呢?主要是因為硬件的設計建設是看得見摸得著的,而運營的經(jīng)驗相對來說需要更多的時間積累。所以我們時常看到公司花費大量投資進行硬件建設,而忽略運營規(guī)劃所需的預算。很多缺乏經(jīng)驗的用戶不知從何下手時,往往會把數(shù)據(jù)中心的運維交給不具備專業(yè)知識的第三方管理。比如說,很多數(shù)據(jù)中心的運維交由辦公室建筑維護類公司,而這類公司往往并不具備操作和管理關(guān)鍵設施的技能。最大的區(qū)別在于,辦公室環(huán)境的維護修復是可以離線進行的,而關(guān)鍵設施環(huán)境下的維護是以盡可能減少宕機時間為最高信條。
 
所以無論是基礎設施管理還是數(shù)據(jù)中心運營團隊的架構(gòu)必須圍繞著一個目標:最大化正常運行時間。具體而言,與維護傳統(tǒng)設施環(huán)境相比,維護關(guān)鍵設施環(huán)境有特殊的需求。例如,要求連續(xù)運營,不許宕機,要求實現(xiàn)冗余系統(tǒng),發(fā)生故障時能主動切換,等等。無疑,滿足這些特殊需求的關(guān)鍵在于用正確的方法建立運營體系。
 
重視人才,重視培訓
 
數(shù)據(jù)中心環(huán)境下,低估人員構(gòu)成是有風險的,有可能造成緊急情況下無法恢復正常運行。合理安排人員配置,以優(yōu)化緊急狀況響應、設備維護和供應商管理。同樣,招聘并保留合適的人員至關(guān)重要。招聘具備專業(yè)技能的合格員工不是那么容易的,招聘時要通過嚴格的篩選過程,來驗證應聘人員的技術(shù)、管理和溝通能力,因為這些技能對數(shù)據(jù)中心關(guān)鍵設施的運營必不可少。當然,找到合適的人選只是第一步。
 
招募了優(yōu)秀人才還要能留住他們。過高的人員流失比例對數(shù)據(jù)中心里的大多數(shù)運營項目造成風險。提供完善的培訓和支持,營造良好的職業(yè)發(fā)展空間可以有效地保留員工。經(jīng)過系統(tǒng)培訓的員工將了解如何安全地操作和維護系統(tǒng),并知道在出現(xiàn)問題時如何處理。
 
很多情況下,設備安裝調(diào)試完成后,設備供應商或總包商會提供相關(guān)設備的培訓,但這樣的培訓往往針對具體的設備而很少全面考慮數(shù)據(jù)中心的整體運營。而接受培訓的員工又“言傳身教”,“口口相傳”地培訓其他人,這樣的培訓方式很容易使一些不正確的方法和流程成為標準化的東西。
 
因此,我們需要的是一套完整的培訓和考核體系,根據(jù)掌握的技能將人員按不同資質(zhì)資格劃分,同時提高不同層次人員的業(yè)務水準。糟糕的培訓往往是由于沒有花足夠的時間和經(jīng)費來開發(fā)培訓規(guī)劃。所謂“磨刀不誤砍柴工”,很多IT經(jīng)理們忽略了這樣一個簡單的道理。良好的培訓可以帶來正常工作時間的增加、維護成本的節(jié)約,以及人員流失的降低,所有這些收益都會遠遠抵消開發(fā)培訓規(guī)劃的成本和努力。
 
持續(xù)不斷地演練
 
任何緊急狀況下,數(shù)據(jù)中心的操作人員都應該象訓練有素的救火隊員一樣從容應對。要做到這一點,關(guān)鍵是持續(xù)不斷地安排專門時間演練。而且這樣的演練需要數(shù)據(jù)中心所有相關(guān)人士的參與,從而令每個人都明確在緊急狀況發(fā)生時應該做什么。

推薦閱讀】

IT運維管理專區(qū)

探討云計算數(shù)據(jù)中心未來發(fā)展

IT運維管理:金融數(shù)據(jù)中心未來發(fā)展方向

企業(yè)服務器虛擬化技術(shù)未來發(fā)展分析

網(wǎng)管軟件專區(qū)

本文來自互聯(lián)網(wǎng),僅供參考
發(fā)布:2007-04-15 10:39    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普重慶OA快博其他應用

重慶OA軟件 重慶OA新聞動態(tài) 重慶OA信息化 重慶OA客戶 重慶OA快博 重慶OA行業(yè)資訊 重慶軟件開發(fā)公司 重慶網(wǎng)站建設公司 重慶物業(yè)管理軟件 重慶餐飲管理軟件 重慶倉庫管理系統(tǒng) 重慶門禁系統(tǒng) 重慶微信營銷 重慶ERP 重慶監(jiān)控公司 重慶金融行業(yè)軟件 重慶B2B、B2C商城系統(tǒng)開發(fā) 重慶建筑施工項目管理系統(tǒng)開發(fā)