監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

[原創(chuàng)]數(shù)據(jù)通訊故障拷問(wèn)IT服務(wù)應(yīng)急方案

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

ewaysun

昨天公網(wǎng)的服務(wù)器硬盤(pán)出現(xiàn)故障,邏輯卷Offline導(dǎo)致客戶的數(shù)據(jù)通訊無(wú)法操作。

7:00 服務(wù)臺(tái)一上班就開(kāi)始接到客戶的報(bào)修電話,在其后的時(shí)間里服務(wù)臺(tái)電話鈴聲此起彼伏,仿佛令人置身于戰(zhàn)時(shí)指揮部。話務(wù)員忙的都無(wú)暇他顧;

8:20 運(yùn)維部的主管將此問(wèn)題通知到負(fù)責(zé)服務(wù)器維護(hù)的主管;

8:30 服務(wù)器維護(hù)人員遠(yuǎn)程維護(hù)無(wú)效;

8:45 維護(hù)人員到達(dá)現(xiàn)場(chǎng)處理,發(fā)現(xiàn)硬盤(pán)故障無(wú)法運(yùn)行。采用的是更換備份機(jī)的方式;

10:30 解決服務(wù)器故障;

13:30 發(fā)現(xiàn)數(shù)據(jù)通訊之后存在1月9日的配送信息。問(wèn)題管理開(kāi)始著手解決此項(xiàng)問(wèn)題;

14:00 客戶的報(bào)修明顯減少。

從7:00至14:00故障的解決持續(xù)了7個(gè)小時(shí)。全市3000多家客戶因?yàn)榇舜蔚挠脖P(pán)故障問(wèn)題都無(wú)法進(jìn)行數(shù)據(jù)通訊。

幸運(yùn)的是我們沒(méi)有這方面的考核,否則不知道會(huì)不會(huì)因?yàn)檫@個(gè)故障和處理的時(shí)間而影響到年底的服務(wù)考評(píng)。

事件得到控制,雖然不能說(shuō)是及時(shí),但也沒(méi)造成嚴(yán)重后果。回顧這次意外,聽(tīng)到最多的是:這次硬盤(pán)故障無(wú)法預(yù)料。技術(shù)上的無(wú)法預(yù)測(cè)在所難免,但換個(gè)角度想:凡事沒(méi)有無(wú)因之果。和維護(hù)人員聊了之后,他也說(shuō)了幾個(gè)可能導(dǎo)致此次故障的因素: 

  1. 大量頻繁的讀寫(xiě)操作導(dǎo)致磁盤(pán)當(dāng)機(jī)
  2. 磁盤(pán)本身的問(wèn)題
  3. 系統(tǒng)本身的問(wèn)題
  4. 機(jī)房的環(huán)境

且不論技術(shù)方面的細(xì)節(jié),從這些因素看出根據(jù)故障產(chǎn)生的原因進(jìn)行識(shí)別和控制才是IT服務(wù)人員應(yīng)該具備的態(tài)度。而不是習(xí)慣性地認(rèn)為這些問(wèn)題根本沒(méi)法預(yù)測(cè)或者提前發(fā)現(xiàn)。雖然也不能完全通過(guò)控制故障原因來(lái)達(dá)到控制故障的目的,但是至少我們可以通過(guò)多方面的控制降低故障發(fā)生的幾率。

故障發(fā)生了,而且很緊急。從管理上應(yīng)該啟動(dòng)應(yīng)急方案,這是管理保障。也許在此需要再延伸一下對(duì)應(yīng)急方案的思考。方案有了還不夠,一定要演練!愈是責(zé)任大的應(yīng)急方案,愈是要演練。對(duì)維護(hù)人員形成一個(gè)處理的條件反射,防止突發(fā)事件發(fā)生時(shí)緊張帶來(lái)的手足無(wú)措。

最近我們內(nèi)部也搞一個(gè)留單超標(biāo)的應(yīng)急方案,自從審批通過(guò)之后,就束之高閣??磥?lái)也需要拿出來(lái)適當(dāng)?shù)?ldquo;曬曬太陽(yáng)了”。

 

發(fā)布:2007-03-25 10:06    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)文章: