企業(yè)網(wǎng)絡(luò)管理是一項極富挑戰(zhàn)性的工作。局域網(wǎng)中大大小小、奇奇怪怪的故障已遠遠超出了我們的想象。筆者最近就遇到了兩起起怪異的網(wǎng)絡(luò)故障,下面還原其過程,希望對處理類似故障有所幫助。
怪異的頻繁掉線
前不久,網(wǎng)絡(luò)管理員辭職,朋友接手了公司的網(wǎng)絡(luò)管理。這是一家廣告公司,網(wǎng)絡(luò)規(guī)模不大,計算機數(shù)量大概有40臺。公司有4個部門,各部門通過一臺小型交換機連接到核心交換機。核心交換機的Uplink口連接TP-LINK寬帶路由器,路由器通過ADSL連接到Internet,網(wǎng)絡(luò)拓撲見圖1.朋友上任不到一天就遇到了網(wǎng)絡(luò)故障,具體表現(xiàn)為:企業(yè)外網(wǎng)基本上兩小時自動掉一次線,然后過一分鐘又自動連接上。這期間雖然耽誤時間只有一分鐘,但由于公司很多廣告設(shè)計都是多人在線協(xié)作完成,公司的視頻點播系統(tǒng)對網(wǎng)絡(luò)的連通性要求很高,因此,這一分鐘的掉線對公司的影響還是比較大的。
故障分析
朋友檢查了節(jié)點間的線纜連接以及員工們的計算機系統(tǒng),排除了硬件連接和病毒因素,但故障依舊。朋友找筆者幫忙。就筆者日常維護網(wǎng)絡(luò)經(jīng)驗來看,斷網(wǎng)主要由兩方面引起:本地鏈路不穩(wěn)及感染蠕蟲所致。聯(lián)系電信部門對ADSL鏈路進行檢查,排除了鏈路故障,于是將重點放到蠕蟲病毒上。
筆者把重點放在具有ARP欺騙特性的病毒上。之后,筆者和朋友詳細檢查了所有員工的計算機,沒有發(fā)現(xiàn)任何問題。同時檢測發(fā)現(xiàn),當出現(xiàn)斷線時,ARP緩存表里的網(wǎng)關(guān)MAC地址與正常上網(wǎng)時一致。這說明斷網(wǎng)并不是因為ARP欺騙引起的。
排查否定了病毒和鏈路因素。那么還有什么可能造成如此蹊蹺的網(wǎng)絡(luò)故障呢?為了更好地定位故障,筆者決定使用分割法進行分析,也就是說將網(wǎng)絡(luò)各個區(qū)域隔離開來檢查。首先,筆者關(guān)閉了大多數(shù)員工計算機,只讓一臺筆記本上網(wǎng),故障依舊??磥韱栴}不是出現(xiàn)在計算機上。難道是交換機或者路由器出現(xiàn)了問題?
接下來把筆記本直接連接路由器上網(wǎng),結(jié)果還是兩小時自動斷一次,之后又恢復(fù)連接。因此,基本可以斷定故障在路由器或線路本身。接著,用筆記本直接連接ADSL貓,在系統(tǒng)中手工建立撥號連接后撥號上網(wǎng),自動斷線問題沒有再出現(xiàn)。這說明線路是好的,ADSL貓也沒有任何問題,肯定是寬帶路由器在作祟。
故障解決
于是筆者登錄路由器進入管理界面,一一比對各個參數(shù)設(shè)置信息,結(jié)果發(fā)現(xiàn)在“網(wǎng)絡(luò)參數(shù)→WAN口設(shè)置”處的撥號設(shè)置被設(shè)置為“按需連接,在有訪問時自動連接,自動斷線等待時間15分鐘”。這就是說當有人要訪問外部Internet時寬帶路由器才會撥號上網(wǎng),而且當網(wǎng)絡(luò)需求在15分鐘之內(nèi)沒有時就會自動斷線。筆者將其修改為“自動連接,在開機和斷線后自動連接”后,經(jīng)過一段時間的測試,企業(yè)內(nèi)網(wǎng)再也沒有出現(xiàn)怪異的斷網(wǎng)現(xiàn)象。
筆者事后了解到,原來是前網(wǎng)絡(luò)管理員為泄憤修改了寬帶路由器的撥號連接設(shè)置才造成了如此蹊蹺的網(wǎng)絡(luò)故障。筆者在本次排故過程中走了不少彎路,沒有想到人才是企業(yè)網(wǎng)絡(luò)管理和網(wǎng)絡(luò)安全中最重要的因素。不過,文中通過的層層推理分析解決網(wǎng)絡(luò)故障的方法希望對大家有所幫助。
自作自受的客戶端
單位局域網(wǎng)規(guī)模相對較大,為了方便管理工作站,特意搭建了DHCP服務(wù)器,利用DHCP服務(wù)為每一臺工作站自動分配IP地址。很長一段時間里,局域網(wǎng)中所有工作站都連網(wǎng)正常,速度也比較理想。最近的某天早晨,筆者一上班,總務(wù)室的小張打電話說他們辦公室的6臺電腦都不能連接上網(wǎng)了,系統(tǒng)任務(wù)欄處的“本地連接”圖標總不斷提示本地連接受到了限制。不一會,檔案室小吳打來電話求助,故障和總務(wù)室的類似。沒辦法,親自跑一趟。
故障分析
查看總務(wù)室小李的電腦故障確實如他所述,筆者首先考慮會不會是本地工作站從DHCP服務(wù)器那里沒有獲取到合法的IP地址,從而導(dǎo)致該工作站出現(xiàn)“本地連接”受到限制的提示呢?隨機在打開命令行工具執(zhí)行“ipconfig /all”命令,該工作站獲取的IP地址竟然為“169.254.11.156”!很明顯該IP地址并不是從DHCP服務(wù)器那里得來的,而是Windows系統(tǒng)自動分配的。這么說該工作站與DHCP服務(wù)器失去了聯(lián)系。
會不會是DHCP服務(wù)器出現(xiàn)了問題呢?詢問得知,局域網(wǎng)中的其他工作站都能上網(wǎng),這說明DHCP服務(wù)器自身運行是正常的。有沒有可能是本地工作站的網(wǎng)絡(luò)連接線纜出現(xiàn)了短路或斷裂現(xiàn)象,從而導(dǎo)致本地工作站與局域網(wǎng)失去了聯(lián)系呢?于是特地找來了專門的網(wǎng)絡(luò)測試儀,對本地工作站的線纜連通性進行了現(xiàn)場測試。從測試結(jié)果來看,該網(wǎng)絡(luò)線纜完全正常。筆者又把自己的筆記本電腦連入網(wǎng)絡(luò),同時設(shè)置IP動態(tài)獲取,結(jié)果筆記本電腦能夠很快速地獲得IP,上網(wǎng)一切正常。很顯然,這條網(wǎng)絡(luò)線纜以及其所連的交換機端口都沒有問題。
既然網(wǎng)絡(luò)線纜沒有問題,交換機連接端口也沒有問題,DHCP服務(wù)器也能正常工作,看來問題肯定出在本地工作站系統(tǒng)身上。對客戶端進行殺毒和文件修復(fù)操作,經(jīng)測試故障依舊。 在確認本地工作站自身運行正常的前提下,筆者不得不再次將懷疑目光轉(zhuǎn)向DHCP服務(wù)器??紤]到DHCP服務(wù)器能夠為局域網(wǎng)中的其他工作站正常分配地址,惟獨不能給個別工作站分配地址,會不會是這些工作站先前從DHCP服務(wù)器獲得的IP地址過了租約期呢?
于是,筆者以超級管理員權(quán)限登錄到DHCP服務(wù)器,打開DHCP控制臺窗口,進入該服務(wù)器“目標作用域”屬性對話框,從中找到“地址租約”選項,并將那些租約到期的工作站全部解除鎖定,最后又重新啟動了一下DHCP服務(wù)器。接著筆者再次在小李的電腦上依次執(zhí)行“ipconfig /release”,“ipconfig /renew”釋放并重新獲得IP地址,接著執(zhí)行“ipconfig /all”發(fā)現(xiàn)IP地址還是不正確,工作站仍然不能訪問網(wǎng)絡(luò)。
這讓筆者納悶了,于是重新執(zhí)行上面的命令,系統(tǒng)提示RPC(Remote Procedure Call)服務(wù)無法調(diào)用之類的錯誤,難道客戶端的RPC服務(wù)被禁用?大家知道DHCP Client服務(wù)依存于RPC,如果其被禁用則DHCP Client服務(wù)不能啟動,就無法從DHCP服務(wù)器獲得IP.于是打開客戶端主機的“服務(wù)管理器”,發(fā)現(xiàn)“Remote Procedure Call(RPC)”服務(wù)果然被禁用,處于停止狀態(tài)(如圖2所示),原因終于找到了。
故障解決
馬上重啟RPC服務(wù),然后啟動DHCP Client服務(wù),接著執(zhí)行上面獲取IP的操作,IP成功獲得,聯(lián)網(wǎng)測試成功。其他的主機也如法炮制,這起電腦故障才算最終解決。但筆者不禁要問:為什么這兩個辦公室的電腦會出現(xiàn)類似的故障呢?詢問小李后得知,原來他在前一天從網(wǎng)上下載了一款系統(tǒng)優(yōu)化工具,用其對自己的系統(tǒng)進行了優(yōu)化,優(yōu)化過系統(tǒng)后系統(tǒng)快了不少。于是他把該軟件提供給了辦公室的同事,當然也推薦給了隔壁的檔案室,所以當?shù)诙齑蠹掖蜷_電腦時不約而同地出現(xiàn)了如上的癥狀。
本文列舉的兩起比較怪異的網(wǎng)絡(luò)故障,追蹤到最后被確認是人為造成的,不管是惡意的還是無意,都毫無例外地影響了網(wǎng)絡(luò)的正常運行。因此,企業(yè)網(wǎng)絡(luò)管理除了技術(shù)之外,制度管理必須要跟上,只有雙管齊下,才能在最大程度上避免因網(wǎng)絡(luò)故障對企業(yè)造成不必要的損失。另外,企業(yè)網(wǎng)絡(luò)管理員們在解決網(wǎng)絡(luò)故障時要避免慣性思維,突破心理定勢,少走彎路。
【推薦閱讀】
◆網(wǎng)管軟件專區(qū)
◆巧用泛普BTNM智能分析網(wǎng)管軟件解決網(wǎng)絡(luò)故障
◆一起Web服務(wù)器訪問失敗故障分析實例
◆如何解決無線網(wǎng)絡(luò)跟有線網(wǎng)絡(luò)不兼容問題
◆IT運維管理專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考