監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉

網(wǎng)管經(jīng)驗(yàn)談 服務(wù)器常見軟件故障解析

申請免費(fèi)試用、咨詢電話:400-8352-114

  服務(wù)器軟件故障是在服務(wù)器故障中占有比例最高的部份,約占70%,解決的過程必須更加深思熟慮。導(dǎo)致服務(wù)器出現(xiàn)軟件故障的原因有很多,最常見的是服務(wù)器BIOS版本太低、服務(wù)器的管理軟件或服務(wù)器的驅(qū)動程序有BUG、應(yīng)用程序有沖突及人為造成的軟件故障。下面分別舉例說明各類軟件故障的維修方法。

  有一臺HP LH6000R服務(wù)器,開機(jī)后,系統(tǒng)日志報電壓調(diào)節(jié)模塊異常(VRM)的錯誤,報錯的信息是:“Voltage Regulator Module (VRM) over/under-voltage 2.88V/0V”。從表面來看,極有可能是服務(wù)器的電壓調(diào)節(jié)模塊或其它硬件出現(xiàn)故障,極容易導(dǎo)致維護(hù)人員認(rèn)為是硬件故障。

  維護(hù)人員立刻使用其它LH6000R上的硬件來測試,發(fā)現(xiàn)即使使用新的配件,此服務(wù)器依然報VRM錯。就在一籌莫展的時候,維修工程師帶來了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),于是升級了CPU管理板塊的FIRMWARE后,服務(wù)器恢復(fù)立即正常。

  FIRMWARE升級方法是,在服務(wù)器的NAVIGATOR(導(dǎo)航光盤)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序?yàn)镕LASH.EXE,然后將從網(wǎng)上下載的LH6KC.BIN(CPU管理板的FIRMWARE)拷貝到一張DOS啟動盤上,用這張盤啟動服務(wù)器。然后在DOS下運(yùn)行”FLASH /CMC A:LH6KC.BIN”,刷新完成后重新啟動服務(wù)器后即可。這種升級方法也適合刷新系統(tǒng)BIOS等,只是FLASH命令的參數(shù)不同以及更新FIRMWARE及BIOS文件名不同,參數(shù)請參考服務(wù)器的說明。

  任何一款服務(wù)器的FIRMWARE及BIOS都會有不同的BUG,因?yàn)锽UG在所難免,所以我們不能錯誤地認(rèn)為服務(wù)器的BIOS程序就很完善,而應(yīng)該經(jīng)常更新服務(wù)器的FIRMWARE及BIOS,只是在升級之前應(yīng)該小心謹(jǐn)慎,錯誤的升級方法會導(dǎo)致嚴(yán)重的后果。

  目前流行的中高檔服務(wù)器都擁有強(qiáng)大的管理程序,為客戶提供了方便的管理途徑;服務(wù)器也擁有各種操作系統(tǒng)下的驅(qū)動程序,方便了客戶在各種操作系統(tǒng)中的使用。但是,世上任何一款程序都會有一些BUG,這些BUG將影響用戶使用。但是服務(wù)器廠商總是會在第一時間內(nèi)開發(fā)出新的程序,客戶只需要及時更新這些程序就可以避免這類故障。

  當(dāng)服務(wù)器的軟件故障為此類時,表現(xiàn)的現(xiàn)象也不盡相同。一般來說,管理程序BUG會導(dǎo)致系統(tǒng)速度變慢,CPU占用率變高,無法正常使用某些功能等;驅(qū)動程序的BUG會導(dǎo)致死機(jī)、與某些軟件有沖突,磁盤工作不穩(wěn)定等。查看管理程序是否出錯的最好的辦法就是在系統(tǒng)中首先禁止此類管理工具,再觀察服務(wù)器是否還是異常。

  由于管理工具是隨著系統(tǒng)啟動而啟動的,所以應(yīng)首先避免它的啟動。以WINDOWS NT4為例,就首先在管理工具服務(wù)中禁用某些服務(wù)器軟件服務(wù),再修改注冊表中的啟動項(xiàng)即可。如果是驅(qū)動程序有問題的話,就以安全模式進(jìn)入系統(tǒng),看是否正常。但是需要注意的是,在安全模式中,系統(tǒng)速度變慢是正常的(特別是磁盤I/O方面)。

  服務(wù)器的管理人員就應(yīng)該經(jīng)常在服務(wù)器網(wǎng)站上下載最新的管理工具程序及驅(qū)動程序。這樣會減少很大一部份軟件故障的發(fā)生。

  相比之下,軟件沖突造成的故障判斷比較困難,需要管理人員有比較豐富的經(jīng)驗(yàn)以及敏銳的觀察力。

  曾經(jīng)有一位朋友告訴我說,他有一臺浪潮的服務(wù)器無法安裝SQL SERVER 2000,已經(jīng)重裝N次NT了,排除是系統(tǒng)故障。而這唯一的服務(wù)器又將作為非常重要數(shù)據(jù)庫服務(wù)器,因此非常著急。于是我陪著朋友去了他的公司查看。這臺服務(wù)器所在的機(jī)房是非常標(biāo)準(zhǔn)、完善的機(jī)房,我檢查了這臺服務(wù)器的情況,發(fā)現(xiàn)并沒有硬件上的故障,于是排除了光驅(qū)讀盤力差的可能。

  但是,朋友刻的SQL SERVER 2000光盤引起了我的懷疑,我讓他拿出了正版的SQL SERVER安裝,結(jié)果還是不行。在安裝的過程中,沒有出現(xiàn)絲毫錯誤,可就是在運(yùn)行的時候會自動退出,沒有任何提示。但是,我在管理工具中的事件查看器的系統(tǒng)日志中卻發(fā)現(xiàn)了一條信息:windata.exe導(dǎo)致一個無效的數(shù)據(jù)溢出。Windata是朋友自己編寫的一個程序,而且是隨操作系統(tǒng)啟動而啟動的程序。我立即結(jié)束掉這個進(jìn)程后,再運(yùn)行SQL一切正常。

  對于此類軟件故障,操作員最好先查看有關(guān)的日志,看看系統(tǒng)中是否有可疑的進(jìn)程。目前的服務(wù)器無論是高端還是低端,對于SQL等標(biāo)準(zhǔn)程序的支持是相當(dāng)可靠的,所以排除的重點(diǎn)就是結(jié)束可疑進(jìn)程。

  還有一種軟件故障是人為因素造成的,它一般是人為誤操作(包括沒按操作流程的操作)、意外關(guān)機(jī)(包括電源突然不供電)或非正常關(guān)閉應(yīng)用程序造成的。

  人為誤操作因素只要加強(qiáng)管理都可以避免此類故障發(fā)生。在這里就詳細(xì)說明意外關(guān)機(jī)或非正常關(guān)閉程序造成故障的方法。

  正常關(guān)閉系統(tǒng)程序非常重要,尤其是WEB服務(wù)器。我的一個朋友就是因?yàn)闆]有正常關(guān)閉系統(tǒng)程序而經(jīng)歷了一次數(shù)據(jù)損壞甚至丟失的經(jīng)歷。我的朋友是使用的HP web hosting server appliance,因此我向他提供了一些使用規(guī)則。

  這些方法對于服務(wù)器的維護(hù)非常有效,主要包括了正確的關(guān)閉系統(tǒng)程序、怎樣避免數(shù)據(jù)丟失以及非正常關(guān)閉系統(tǒng)后的恢復(fù)方法。
 

【推薦閱讀】

網(wǎng)管軟件專區(qū)

成功網(wǎng)管員必備素質(zhì)軟件篇

網(wǎng)管基礎(chǔ)知識:如何關(guān)閉無線路由器的信號發(fā)射

合格的網(wǎng)管員必備的個人能力和技術(shù)知識

IT運(yùn)維管理專區(qū)

本文來自互聯(lián)網(wǎng),僅供參考
發(fā)布:2007-04-16 09:44    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普泛普博客其他應(yīng)用

泛普OA商務(wù)合同 泛普OA需求調(diào)研 泛普OA實(shí)施方案 泛普OA項(xiàng)目啟動 泛普網(wǎng)絡(luò)硬件配置 泛普OA部署安裝 泛普流程模板表單 OA系統(tǒng)二次開發(fā) 泛普常見問題解決 泛普OA操作手冊 泛普軟件項(xiàng)目驗(yàn)收 泛普培訓(xùn)推廣上線 泛普OA售后服務(wù) 泛普新聞 泛普期刊 泛普博客