近日,某IDC服務商機房宕機直接導致某商業(yè)銀行業(yè)務中斷,此事引起了銀監(jiān)會的高度重視,并發(fā)布了《中國銀監(jiān)會辦公廳關于銀行業(yè)金融機構(gòu)數(shù)據(jù)中心基礎設施外包風險提示的通知》。通知指出,銀行業(yè)金融機構(gòu)要開展自查,從加強外包風險管理,加強對基礎設施主動管理,提高業(yè)務連續(xù)性管理水平等三方面采取防范和應對措施。
據(jù)了解,此次宕機事故的原因是:機房內(nèi)電力負載過高,造成配電柜開關跳閘,供電中斷,空調(diào)停止運行,生產(chǎn)機房溫度升高導致的設備宕機。
其實,類似的事件不是第一次發(fā)生了,之前中國信息通信研究院的專家就針對數(shù)據(jù)中心機房故障的原因做出過總結(jié),專家們表示,數(shù)據(jù)中心機房故障多發(fā)的原因關鍵還是在運維管理上,所謂“三分技術,七分管理”,數(shù)據(jù)中心的故障大多來自人禍。
結(jié)合事件原因及之前案例,我們不難分析,導致此次事故的很大一部分原因也是“運維管理不到位”。
首先在建設數(shù)據(jù)中心之前沒有對負載做出充分的預估,導致電閘配置不能滿足負載的需要;其次,在發(fā)生事故之后,應急處置能力不足,導致不能及時的解決突發(fā)事件;另外,機房制冷方面僅依賴空調(diào)制冷,沒有設置高溫應急措施,導致機房持續(xù)高溫。
頻繁的數(shù)據(jù)中心故障和宕機事故表明,某些數(shù)據(jù)中心在一味滿足客戶個性化需求的同時,忽略了自身運維管理能力的提升,導致數(shù)據(jù)中心可靠性降低,從而發(fā)生此類事件。而客戶在選擇數(shù)據(jù)中心的時候則存在著,不知道該如何選擇優(yōu)秀的服務商,如何去評估一個數(shù)據(jù)中心的管理能力,如何規(guī)避風險,以及如何審查服務商對合同的執(zhí)行力度。
在客戶自身無法評估數(shù)據(jù)中心服務能力的時候,來自政府或權(quán)威第三方的權(quán)威評估就顯得尤為重要。
自2014年以來,工信部一直關注著數(shù)據(jù)中心的服務能力。其下屬組織數(shù)據(jù)中心聯(lián)盟,也一直致力于推動數(shù)據(jù)中心產(chǎn)業(yè)的健康發(fā)展。為了更好的規(guī)范數(shù)據(jù)中心服務體系,提高數(shù)據(jù)中心的服務能力水平,保證數(shù)據(jù)中心客戶在選擇數(shù)據(jù)中心服務商及相應服務有充分的參考依據(jù)。同時,為了將主管單位政策落到實處,在工信部的指導下組織相關領導,技術專家以及行業(yè)用戶,完成了數(shù)據(jù)中心服務能力評價標準的編撰工作。
數(shù)據(jù)中心服務能力評價標準是從用戶視角出發(fā)的評估體系,是目前國內(nèi)最科學的一套評估體系,它能夠全面體現(xiàn)一個數(shù)據(jù)中心的整體服務能力。
通過對數(shù)據(jù)中心進行評估,不但可以很好的幫助客戶解決痛點。同時,也可以幫助數(shù)據(jù)中心服務商了解自身現(xiàn)狀,增強自身的市場競爭力,留住現(xiàn)有客戶并發(fā)展新的客戶,規(guī)避運維過程中的各類風險,為客戶提供更加優(yōu)質(zhì)的服務。
總而言之,通過科學規(guī)范的評估,可以幫助客戶認清服務商,也可以使服務商看清自己,從而減少宕機事件的發(fā)生,促進數(shù)據(jù)中心行業(yè)健康有序的發(fā)展。
來源:中國IDC圈
石家莊服務器托管 石家莊服務器租用 石家莊機柜租用 石家莊機房 |