基于ITIL(信息技術(shù)基礎(chǔ)架構(gòu)庫(kù),IT Infrastructure Library)的IT服務(wù)管理由服務(wù)臺(tái)、事件管理、問題管理、變更管理、配置管理、發(fā)布管理、服務(wù)級(jí)別管理組成,事件管理是整個(gè)支持系統(tǒng)中的首要環(huán)節(jié),具有應(yīng)用廣、重要性大的特點(diǎn)。目前,我國(guó)實(shí)施IT服務(wù)管理的企業(yè)中絕大部分已執(zhí)行了事件管理流程。事件管理往往以快速解決表征現(xiàn)象為目的,而不在于查找根本原因,因此,時(shí)效性成為評(píng)價(jià)企業(yè)事件管理水平的重要標(biāo)志。
事件管理是IT服務(wù)管理中的一個(gè)核心流程,提升事件管理時(shí)效性、回歸事件管理本身屬性,可以提高IT服務(wù)的質(zhì)量,有效改變目前我國(guó)企業(yè)普遍存在的重開發(fā)、輕運(yùn)維的現(xiàn)象,真正踐行以服務(wù)為導(dǎo)向的ITIL理念,通過切實(shí)有效的IT服務(wù)管理為企業(yè)創(chuàng)造價(jià)值。
一、事件管理的目的
事件是指引起或可能引起服務(wù)中斷和服務(wù)質(zhì)量下降的事件,也可以是一種為個(gè)人提供特殊服務(wù)的請(qǐng)求。事件管理是負(fù)責(zé)解決IT服務(wù)過程中的突發(fā)事件、問題以及客戶需求等內(nèi)容的運(yùn)維管理。事件管理中的事件是一個(gè)廣義的概念,不是狹義的故障,它可能是軟件、硬件問題,也可能是服務(wù)需求事件。
目前,很多公司IT運(yùn)維管理部門沒有建立事件處理的優(yōu)先級(jí)和解決時(shí)限關(guān)聯(lián),不能保障事件解決的實(shí)效性和IT資源的有效利用,事件發(fā)生后沒有明確而唯一的責(zé)任人,缺乏有效的對(duì)事件監(jiān)控和跟蹤的機(jī)制,沒有統(tǒng)一的IT服務(wù)管理應(yīng)對(duì)事件受理的界面、完整的記錄和及時(shí)反饋,缺乏事件監(jiān)控和診斷等技術(shù)工具,事件不能在技術(shù)工具的支持下得到主動(dòng)、快速處理。IT人員工作被動(dòng),只能像救火隊(duì)一樣,不知道什么時(shí)候、什么地方會(huì)出現(xiàn)“火”情,只有當(dāng)事件發(fā)生并且已造成業(yè)務(wù)影響時(shí)才能發(fā)現(xiàn)和著手處理。這種被動(dòng)“救火”不但使IT服務(wù)人員終日忙碌,也使IT服務(wù)本身質(zhì)量很難提高,導(dǎo)致IT和業(yè)務(wù)部門的滿意度都不高。因此,將IT服務(wù)管理的理念和方法應(yīng)用到
企業(yè)信息技術(shù)的服務(wù)管理中,是確保企業(yè)IT工作發(fā)揮效益的重要舉措。企業(yè)在實(shí)施IT服務(wù)管理的過程中采取的方式和進(jìn)程并不相同,有的全盤開展ITIL所有流程,有的僅從建立服務(wù)臺(tái)開始,循序漸進(jìn)。事件管理流程是服務(wù)支持中的第一項(xiàng)流程,是在IT系統(tǒng)遇到問題之后,解決問題的第一個(gè)環(huán)節(jié),與其他流程相比,它的應(yīng)用最廣、重要性最大。
事件管理的目標(biāo)就是對(duì)組織及用戶在盡可能小的影響情況下,使IT系統(tǒng)盡快恢復(fù)到服務(wù)級(jí)別協(xié)議所定義的服務(wù)級(jí)別,以確保最好的服務(wù)質(zhì)量和可用性級(jí)別。也就是說,迅速解決問題,將不利影響降到最低,提高追蹤和事件升級(jí)的效率,更好地控制整個(gè)管理過程。為了實(shí)現(xiàn)這個(gè)目的,事件管理流程必須最佳地利用資源支持業(yè)務(wù)、開發(fā)和維護(hù)有效的事件記錄以及設(shè)計(jì)和應(yīng)用統(tǒng)一的事件報(bào)告方法。事件管理側(cè)重于恢復(fù)服務(wù),為了能夠有效地解決問題,事件管理還必須對(duì)不同的事件進(jìn)行分類和排隊(duì),分類就是要分成不同的優(yōu)先級(jí),排隊(duì)就是要識(shí)別它們。因此,事件管理的主要活動(dòng)有兩個(gè),一是對(duì)事件進(jìn)行優(yōu)先級(jí)分類;二是記錄事件,把記錄下來的內(nèi)容形成一個(gè)資源庫(kù),為將來分析挖掘知識(shí)儲(chǔ)備資源。
事件管理的主要任務(wù)是及時(shí)識(shí)別并跟蹤發(fā)生的事件;對(duì)事件進(jìn)行分類并提供初步支持;對(duì)事件進(jìn)行調(diào)查分析,識(shí)別引發(fā)事件的潛在原因;解決事件并恢復(fù)服務(wù);跟蹤和監(jiān)督所有事件的解決過程,并隨時(shí)進(jìn)行溝通。因此,研究事件管理對(duì)解決目前IT運(yùn)維中存在的服務(wù)問題具有重要的意義,事件管理的時(shí)效性將直接影響整個(gè)企業(yè)的IT服務(wù)質(zhì)量和整體運(yùn)營(yíng)狀況。
二、事件管理的基本流程
事件管理流程大概如下:當(dāng)一個(gè)事件輸入的時(shí)候,首先要對(duì)事件進(jìn)行檢查、定位。檢查事件的時(shí)候要與它不斷交互,明確它的影響范圍和緊急程度,還要進(jìn)行初步的歸類評(píng)估。服務(wù)臺(tái)(ServiceDesk)是事件的唯一入口,它接收事件后,操作人員通過查閱CMDB〔配置管理數(shù)據(jù)庫(kù))進(jìn)行處理。
1.事件的查明和記錄
服務(wù)臺(tái)記錄一些標(biāo)識(shí)客戶的基本信息,如姓名、工作地點(diǎn)、電話號(hào)碼等,而事件管理記錄詳細(xì)的事件信息,如事件發(fā)生的時(shí)間、受事件影響的服務(wù)等。這樣做的目的是便于確認(rèn)事件的影響,問題管理可以根據(jù)這些信息查找事件原因,密切跟蹤事件進(jìn)展。
首先,當(dāng)用戶、服務(wù)臺(tái)工作人員或其他IT部門人員發(fā)現(xiàn)或系統(tǒng)檢測(cè)到某系統(tǒng)發(fā)生事件時(shí),就將其報(bào)告給服務(wù)臺(tái),服務(wù)臺(tái)將基本信息輸入事件數(shù)據(jù)庫(kù)并報(bào)告給事件管理人員。通常所有的事件都是先報(bào)告給服務(wù)臺(tái),再由服務(wù)臺(tái)工作人員將其輸入事件數(shù)據(jù)庫(kù),服務(wù)支持小組是不允許直接記錄事件的。
其次,事件管理人員給事件一個(gè)唯一的編號(hào)(事件單號(hào)),記錄一些基本的事件分析信息(時(shí)間、癥狀、位置、用戶、受影響服務(wù)、硬件等),并補(bǔ)充其他的事件信息(與用戶的交互信息和配置管理數(shù)據(jù)庫(kù)等。
再次,事件管理人員根據(jù)服務(wù)臺(tái)提供的信息和事件數(shù)據(jù)庫(kù)信息判斷此類事件是否與已有的事件相同或類似,如果有就更新事件信息或建立原事件的從屬記錄,并在必要時(shí)修改原事件的影響度和優(yōu)先級(jí),如果沒有則創(chuàng)建新事件記錄。最后,事件管理需要判斷事件是否嚴(yán)重,如果嚴(yán)重就先向管理層報(bào)告并告知用戶有關(guān)情況,再采取進(jìn)一步行動(dòng),如果不嚴(yán)重就直接進(jìn)入下一步的事件初步歸類和支持。
2.初步歸類和初步支持
經(jīng)過第一步的事件查明和記錄,可從用戶處獲取的事件信息基本上已得到,事件管理數(shù)據(jù)庫(kù)已經(jīng)根據(jù)這些信息進(jìn)行更新,接下來就是事件的初步歸類和初步支持。這里強(qiáng)調(diào)初步,就是為了能夠盡可能快地恢復(fù)用戶的正常工作,盡量避免或者減少事件對(duì)IT服務(wù)質(zhì)量的影響。
歸類的目的是發(fā)現(xiàn)事件原因以便采取相應(yīng)行動(dòng)。一般來說,許多事件是重復(fù)出現(xiàn)的,因此,當(dāng)某個(gè)事件再次出現(xiàn)時(shí),只需要根據(jù)已有的經(jīng)驗(yàn)和措施采取行動(dòng)即可:,當(dāng)新的事件出現(xiàn)時(shí),就有一個(gè)與其問題和知名錯(cuò)誤(知識(shí)庫(kù))相匹配的過程,如果匹配成功就可直接用已有的方案將其解決,而不需要進(jìn)一步調(diào)查,否則就要繼續(xù)進(jìn)行下面提到的其他幾個(gè)步驟。
服務(wù)臺(tái)如果沒有成功解決事件,就將事件轉(zhuǎn)交給二線、三線支持處理,然后負(fù)責(zé)記錄事件并聯(lián)系各支持小組,采取必要的措施以確保用戶滿意。如果碰到未出現(xiàn)過的事件或事件解決過程非常復(fù)雜,就必須對(duì)事件進(jìn)行調(diào)查和分析。
3.事件調(diào)查和分析
事件在第一階段和第二階段沒有圓滿解決時(shí),專家支持小組應(yīng)介入處理過程,對(duì)其進(jìn)行調(diào)查和分析。
一旦事件被分派給某個(gè)支持小組,他們應(yīng)當(dāng)完成以下工作:確認(rèn)接收事件處理任務(wù),同時(shí)指定有關(guān)日期和時(shí)間以保障正常更新事件狀態(tài)和歷史信息,經(jīng)過服務(wù)臺(tái)及時(shí)通
知客戶事件最新進(jìn)展,說明事件當(dāng)前所處的狀態(tài);盡可能快地把發(fā)現(xiàn)的權(quán)宜措施提供給服務(wù)臺(tái)和客戶;參考知名錯(cuò)誤、問題、解決方案、計(jì)劃的變更和知識(shí)庫(kù)等對(duì)事件進(jìn)行評(píng)審;必要時(shí)要求服務(wù)臺(tái)根據(jù)協(xié)議的服務(wù)級(jí)別,重新評(píng)價(jià)事件影響度和優(yōu)先級(jí),并在必要時(shí)對(duì)其進(jìn)行調(diào)整;記錄所有相關(guān)信息,包括解決方案、新增的或修改的分類;將所有相關(guān)事件的更新、花費(fèi)的時(shí)間以及處理結(jié)果反饋給服務(wù)臺(tái)以讓其終止此類事件。
【推薦閱讀】
◆ITIL的概念與管理范圍釋疑
◆老孫博客:我看ITIL在中國(guó)(一)“外來的和尚”
◆IT運(yùn)維管理與ITIL的關(guān)系
◆IT運(yùn)維管理專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考