針對各種網(wǎng)絡(luò)運維管理的難題,具有多年經(jīng)驗的網(wǎng)絡(luò)運維管理工程師為大家總結(jié)出了實戰(zhàn)秘籍,希望可以給我們?nèi)粘9ぷ鲙硪欢ǖ膸椭?/p>
第一計:重中之重--關(guān)鍵業(yè)務(wù)流程
需要監(jiān)測的關(guān)鍵業(yè)務(wù)流程包括:1、單位內(nèi)部的關(guān)鍵業(yè)務(wù)流程。如項目
管理信息系統(tǒng)、生產(chǎn)管理信息系統(tǒng)等。2、網(wǎng)絡(luò)吞吐量大的業(yè)務(wù)流程。主要是一些復(fù)雜和交互式的業(yè)務(wù)流程,資金集中管理系統(tǒng)、公文流轉(zhuǎn)系統(tǒng)等。3、對系統(tǒng)造成大的壓力,頻繁使用數(shù)據(jù)庫的業(yè)務(wù)流程。4、同其它系統(tǒng)集成的業(yè)務(wù)流程,這些集成會提高應(yīng)用失敗的風(fēng)險。
這些業(yè)務(wù)系統(tǒng)龐大而牽涉面眾多,需要一個綜合
業(yè)務(wù)管理平臺進行整體的監(jiān)測整合。好的解決方案是引進網(wǎng)管系統(tǒng),對業(yè)務(wù)系統(tǒng)是否正常運行、各項具體參數(shù)指標(biāo)是否超標(biāo)等進行精確掌控,避免或降低業(yè)務(wù)系統(tǒng)故障的發(fā)生率。
第二計:用戶體驗同系統(tǒng)性能指標(biāo)相關(guān)聯(lián)
在制定監(jiān)控策略時,應(yīng)該考慮將網(wǎng)絡(luò)中的所有網(wǎng)絡(luò)基礎(chǔ)架構(gòu)都進行集中監(jiān)測,包括對數(shù)據(jù)庫服務(wù)器、應(yīng)用服務(wù)器、路由器、交換機、防火墻的監(jiān)控,從而判斷哪里出了問題導(dǎo)致公司網(wǎng)絡(luò)暢通運行。信息服務(wù)管理網(wǎng)的網(wǎng)管工程師通過使用SiteView網(wǎng)管工具收集網(wǎng)絡(luò)運行信息,將性能數(shù)據(jù)同單位內(nèi)部用戶的體驗相結(jié)合來分析網(wǎng)絡(luò)的性能狀況,診斷系統(tǒng)瓶頸。
第三計:建立網(wǎng)絡(luò)運行基準(zhǔn)指標(biāo)并觀察趨勢
長期監(jiān)測并建立基準(zhǔn)指標(biāo)對于保持網(wǎng)絡(luò)和性能的正常性能水平是非常必要的。通過對網(wǎng)絡(luò)運行的觀察,網(wǎng)絡(luò)運維管理工程師可以知道網(wǎng)絡(luò)性能的變化和流量等指標(biāo)的運行趨勢;及時發(fā)現(xiàn)網(wǎng)絡(luò)偏離系統(tǒng)基準(zhǔn)模型時的異常狀況,分析是單一故障,還是嚴(yán)重問題的前兆,達到預(yù)警的目的,防止更嚴(yán)重問題的發(fā)生。
第四計:設(shè)計報警策略,避免警報泛濫
報警是網(wǎng)絡(luò)管理和業(yè)務(wù)系統(tǒng)最重要的功能之一,配置報警的依據(jù)是根據(jù)信息服務(wù)管理網(wǎng)的網(wǎng)絡(luò)運維管理目標(biāo),報警設(shè)置的原則:1、對影響網(wǎng)絡(luò)和業(yè)務(wù)的重要指標(biāo)設(shè)置報警;2、消除誤報和重復(fù)報警;3、報警應(yīng)該以多種方式及時發(fā)送給相應(yīng)的網(wǎng)絡(luò)運維管理工程師。
第五計:創(chuàng)建自動化、規(guī)范化事件處理程序
信息服務(wù)網(wǎng)絡(luò)運維管理工程師人員少,日常處理事務(wù)較多,他們需要在網(wǎng)絡(luò)、鏈路和系統(tǒng)運行出現(xiàn)問題時能夠有自動化、規(guī)范化的處理問題程序,快速處理各種潛在故障并且分配他們到合適的管理工程師,幫助他們提高工作效率。建立規(guī)范事件處理程序的另一個好處,是將工程師長期積累的知識和工作經(jīng)驗系統(tǒng)化和固化,達到快速定位故障的目的。
第六計:網(wǎng)絡(luò)服務(wù)質(zhì)量SLA的量化管理
提高服務(wù)質(zhì)量的第一步是設(shè)立量化指標(biāo),將其作為整個網(wǎng)絡(luò)運維管理團隊的整體目標(biāo)。信息服務(wù)管理網(wǎng)網(wǎng)絡(luò)性能管理的總體目標(biāo)包括網(wǎng)絡(luò)和設(shè)備、業(yè)務(wù)的可用性、網(wǎng)絡(luò)的吞吐量、帶寬使用百分比、網(wǎng)絡(luò)延時、CPU和MEMORY的負(fù)載,對于不同的網(wǎng)絡(luò)指標(biāo)還要根據(jù)網(wǎng)絡(luò)的上下級連接關(guān)系分解到每一個子指標(biāo),作為對網(wǎng)絡(luò)故障診斷和性能管理的依據(jù)。
第七計:制定網(wǎng)絡(luò)的升級和改進策略
網(wǎng)絡(luò)的升級和改進應(yīng)該以對現(xiàn)有網(wǎng)絡(luò)和系統(tǒng)性能數(shù)據(jù)的測量為前提,以對網(wǎng)絡(luò)整體運行的現(xiàn)狀及趨勢分析為依據(jù)。通過對單一網(wǎng)絡(luò)系統(tǒng)和整體網(wǎng)絡(luò)系統(tǒng)性能數(shù)據(jù)的比較、單一網(wǎng)絡(luò)組件和其它網(wǎng)絡(luò)組件的數(shù)據(jù)比較、系統(tǒng)負(fù)載量最大時的性能數(shù)據(jù)和一般負(fù)載時的性能數(shù)據(jù)的比較等,判斷是否需要對系統(tǒng)的局部或者整體進行升級,發(fā)現(xiàn)網(wǎng)絡(luò)系統(tǒng)性能的瓶頸,提出網(wǎng)絡(luò)系統(tǒng)改進的方法。
【編輯推薦】
◆網(wǎng)管軟件專區(qū)
◆網(wǎng)絡(luò)管理者最易犯的十大低級錯誤
◆網(wǎng)絡(luò)管理基礎(chǔ)知識:網(wǎng)路管理模式
◆學(xué)習(xí)高效網(wǎng)絡(luò)管理技巧三招五式
◆IT運維管理專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考