監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 簽約案例 | 購(gòu)買價(jià)格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉

海量信息管理之戰(zhàn)

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

來源:泛普軟件

這是你難以想象的數(shù)量級(jí)。去年"創(chuàng)建、收集和復(fù)制"的數(shù)字信息已達(dá)到1,610億GB,根據(jù)最近的一份國(guó)際數(shù)據(jù)公司(IDC)報(bào)道,這個(gè)容量大約相當(dāng)于把書從地球到太陽來回堆12遍的全部容量。到2010年,IDC估計(jì),信息流量會(huì)高達(dá)9,880億GB。

在計(jì)算機(jī)產(chǎn)業(yè),數(shù)字常會(huì)被夸大,而且海量數(shù)據(jù)已不是個(gè)新問題。但今日信息的組成成分和來源已與過往不可同日而語,如來自網(wǎng)絡(luò)日志(Blog)、Wiki)、即時(shí)通信(IM)、電子郵件、電子表單、無線射頻識(shí)別(RFID)標(biāo)簽、視頻、電子商務(wù)交易、技術(shù)支援、供應(yīng)鏈等各方面的數(shù)據(jù)都大得驚人。IDC預(yù)計(jì),今年產(chǎn)生的數(shù)字信息將首次超過存儲(chǔ)容量。"當(dāng)數(shù)據(jù)容量的威脅已達(dá)到駭人聽聞的程度時(shí),我們就該有所行動(dòng)了。"IDC分析師蘇珊-費(fèi)爾德曼(Susan Feldman)認(rèn)為。

這種威脅在于過量的信息會(huì)超出公司的信息管理能力,更別提怎樣去利用它了。對(duì)此,商業(yè)科技管理者都有充分的認(rèn)識(shí)。根據(jù)"展望2007"調(diào)研顯示,網(wǎng)站門戶、數(shù)據(jù)倉(cāng)庫和數(shù)據(jù)分析工具都位列首席信息官(CIO)們2007年計(jì)劃表的首要任務(wù)里,遠(yuǎn)超過對(duì)業(yè)務(wù)應(yīng)用上的投資。在各種商業(yè)創(chuàng)新中,創(chuàng)建支持實(shí)時(shí)業(yè)務(wù)信息流程是關(guān)鍵目標(biāo),受關(guān)注程度只低于優(yōu)化業(yè)務(wù)流程。

信息管理是個(gè)總稱,目標(biāo)任務(wù)是處理不同的數(shù)據(jù)來源,它包括了好幾項(xiàng)彼此有重疊的技術(shù)領(lǐng)域:數(shù)據(jù)庫和內(nèi)容管理系統(tǒng);網(wǎng)絡(luò)存儲(chǔ)系統(tǒng);管理主數(shù)據(jù)和非結(jié)構(gòu)化內(nèi)容的服務(wù)器;提供數(shù)據(jù)概要、清理、整合的服務(wù)器;存放經(jīng)上述整理改進(jìn)了的數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫;分析內(nèi)在邏輯的商業(yè)智能工具;還有能進(jìn)行數(shù)據(jù)查詢的搜索引擎等等。

對(duì)企業(yè)而言,最重要的是如何從流入公司信息系統(tǒng)的海量信息和互聯(lián)網(wǎng)上的龐雜信息中,提取真正有用的知識(shí),并把它轉(zhuǎn)化為公司的競(jìng)爭(zhēng)優(yōu)勢(shì)。

師傅領(lǐng)入門:組織內(nèi)的應(yīng)用

摩托羅拉公司(Motorola,下稱摩托羅拉)使用一套名為"指南針"(Compass)的系統(tǒng)來管理自己的網(wǎng)站內(nèi)容,而這些內(nèi)容每隔12~14個(gè)月就會(huì)增加一倍,負(fù)責(zé)摩托羅拉企業(yè)內(nèi)容與協(xié)作平臺(tái)的高級(jí)經(jīng)理布拉德-波斯利(Brad Bosley)表示。這個(gè)數(shù)字現(xiàn)在為37TB(TeraByte,1Tera等于10的12次冪),這包括4,400個(gè)Blog、180萬份文檔,以及客戶與合作伙伴需要訪問的幾千個(gè)外網(wǎng)站點(diǎn)。摩托羅拉也會(huì)經(jīng)常歸檔過期的數(shù)據(jù),但新增的數(shù)據(jù)增長(zhǎng)迅猛:波斯利說光3月就增加了2.6TB的數(shù)據(jù)。

指南針系統(tǒng)是基于Open Text公司的Livelink企業(yè)級(jí)內(nèi)容管理系統(tǒng),它的前身是一套微軟公司(Microsoft,下稱微軟)的Office文檔管理系統(tǒng)。這套系統(tǒng)已運(yùn)行超過10年,使用者為摩托羅拉的7萬多名員工。波斯利認(rèn)為指南針的最大挑戰(zhàn)并非技術(shù)問題,而是員工們?nèi)绾卫盟?。這套系統(tǒng)由波斯利和一個(gè)6人小組運(yùn)作管理。但摩托羅拉還網(wǎng)羅了150名諳熟網(wǎng)絡(luò)的志愿者,作為IT、會(huì)計(jì)、市場(chǎng)等部門的代表,出任"知識(shí)管理倡導(dǎo)者。"他們幫助管理自己部門在指南針上的內(nèi)容,并教會(huì)其他員工如何使用它。"我們致力于使這些專家在前臺(tái)發(fā)揮作用,這樣我們就獲得底層的參與和業(yè)務(wù)精英們的推廣和幫忙。"波斯利表示。

另一個(gè)信息管理的挑戰(zhàn)是不斷攀升的期望值。Intuit公司TurboTax軟件的分析經(jīng)理克里斯-瓊斯(Chris Jones)認(rèn)為,隨著數(shù)據(jù)量的增加,公司對(duì)如何存儲(chǔ)大容量數(shù)據(jù)更為嫻熟,對(duì)它的運(yùn)用也在不斷改進(jìn)提高。

而與此同時(shí),當(dāng)公司內(nèi)部的數(shù)據(jù)架構(gòu)和技術(shù)達(dá)不到要求時(shí),人們已習(xí)慣到網(wǎng)上尋找自己需要的信息。"5年前,如果我跟別人說,這份報(bào)告要10分鐘可以準(zhǔn)備好,他們會(huì)覺得相當(dāng)不錯(cuò)了。"瓊斯回憶說,"但現(xiàn)在他們對(duì)數(shù)據(jù)的需求都以互聯(lián)網(wǎng)速度為標(biāo)準(zhǔn)了。"

實(shí)時(shí)有多實(shí)時(shí)?

問題是,實(shí)時(shí)數(shù)據(jù)訪問究竟有多"實(shí)時(shí)"呢?有23家連鎖店的美國(guó)夢(mèng)幻渡假村集團(tuán)(MGM Mirage)有一套客戶回饋程序系統(tǒng),使用的數(shù)據(jù)比實(shí)時(shí)晚12小時(shí)。他們編制這套程序的出發(fā)點(diǎn)在于:如果客戶離開拉斯維加斯一周后,才通知他們下次消費(fèi)可用的獲贈(zèng)點(diǎn)數(shù),就沒有什么意義了。

在一天內(nèi),客戶可能會(huì)使用不同的信用卡和身份證,走入多家在拉斯維加斯賭場(chǎng)地帶的Mirage飯店、酒吧、戲院和賭場(chǎng)。而使用來自國(guó)際商業(yè)機(jī)器公司(IBM)的數(shù)據(jù)集成軟件、微軟公司(Microsoft)的SQL Server數(shù)據(jù)庫和Acxiom公司(Acxiom Corporation)的數(shù)據(jù)聚合服務(wù),MGM Mirage集團(tuán)得以在隔夜后就把不同的身份整合統(tǒng)一起來,到第二天自動(dòng)更新客戶賬號(hào)上獲贈(zèng)的積分點(diǎn)數(shù)。

"你得在信息處理速度和愿意支付的投資之間進(jìn)行權(quán)衡。"首席技術(shù)官(CTO)湯姆-派克(Tom Peck)分析說,"在我們的例子里,接近實(shí)時(shí)就已足夠好了。"

2年前IBM以11億美元購(gòu)并Ascential軟件公司(Ascential Software),MGM Mirage集團(tuán)使用的數(shù)據(jù)集成技術(shù)正是來自Ascential軟件公司。在過去2年里,IBM還購(gòu)并了許多信息管理領(lǐng)域的其他公司,包括以16億美元購(gòu)并FileNet公司及其內(nèi)容管理系統(tǒng);元數(shù)據(jù)管理供應(yīng)商Unicorn公司;自然語言搜索供應(yīng)商iPhrase公司;客戶數(shù)據(jù)集成供應(yīng)商DWL公司和身份識(shí)別供應(yīng)商SRD公司。

這些技術(shù),尤其是IBM購(gòu)并Ascential軟件公司和Unicorn公司所獲得的技術(shù),將成為IBM最新產(chǎn)品--信息服務(wù)器(Information Server)的一部分,IBM信息服務(wù)器軟件包涵蓋了多種WebSphere應(yīng)用服務(wù)器產(chǎn)品,用于處理各種數(shù)據(jù)集成任務(wù),如數(shù)據(jù)源分析(WebSphere Information Analyzer),核對(duì)重復(fù)記錄(WebSphere QualityStage)和從一個(gè)數(shù)據(jù)源到另一個(gè)數(shù)據(jù)源的數(shù)據(jù)提取、轉(zhuǎn)換與加載(WebSphere DataStage)。信息服務(wù)器是IBM信息隨需應(yīng)變(Information On Demand)策略中的旗艦產(chǎn)品。隨需應(yīng)變部門總經(jīng)理安布吉-戈雅(Ambuj Goyal)表示,"我們依托信息服務(wù)器開創(chuàng)了一個(gè)新領(lǐng)域,相信以后人人都會(huì)跟進(jìn)的。"

戈雅的話說得很大,但他確實(shí)有說這話的底氣。從1982年開始他就在IBM工作,并在DB2數(shù)據(jù)庫的早期開發(fā)上貢獻(xiàn)良多。戈雅帶領(lǐng)研發(fā)隊(duì)伍開發(fā)了RS/6000 SP 超級(jí)計(jì)算機(jī)和深藍(lán)(Deep Blue)世界象棋冠軍計(jì)算機(jī)。在短暫擔(dān)任Lotus部門的總經(jīng)理后,他成為信息隨需應(yīng)變部門的帶頭人。

信息管理的一個(gè)限制因素,戈雅表示,就是目前還沒有出現(xiàn)一種基礎(chǔ)性的技術(shù)。和10年前零散而不成熟的網(wǎng)站技術(shù)一樣,信息管理也經(jīng)各種技術(shù)逐漸融合演化而成:數(shù)據(jù)提取工具、清理工具和概要工具。戈雅預(yù)測(cè),就像構(gòu)成WebSphere應(yīng)用服務(wù)器的基礎(chǔ)Java虛擬機(jī)現(xiàn)在已成為網(wǎng)站應(yīng)用開發(fā)的標(biāo)準(zhǔn)一樣,被稱為元數(shù)據(jù)總線的信息服務(wù)器基礎(chǔ)也必將成為信息管理的標(biāo)準(zhǔn)。

IBM繼續(xù)豐富它在信息管理上的產(chǎn)品組合。3月,它發(fā)布了OmniFind Analytics Edition,用于合并及分析非結(jié)構(gòu)化數(shù)據(jù)源。該軟件作為IBM最近剛升級(jí)的DB2數(shù)據(jù)倉(cāng)庫的一個(gè)模塊發(fā)布,而DB2數(shù)據(jù)倉(cāng)庫則經(jīng)常與信息服務(wù)器打包在一起。IBM的信息管理技術(shù)可不便宜:對(duì)一個(gè)大公司來說,這些組合可能要花上好幾十萬美元甚或更多。

堅(jiān)定的信徒

另一位在信息管理領(lǐng)域孜孜探索追求的IBM資深人士就是在2004年加入EMC公司的CTO杰夫-尼克(Jeff Nick)。尼克從上世紀(jì)80年代起就在IBM工作,并擁有50多項(xiàng)美國(guó)專利。他是IBM網(wǎng)格運(yùn)算(Grid Computing)技術(shù)的總設(shè)計(jì)師,在離職前,是他領(lǐng)導(dǎo)制訂IBM的按需計(jì)算策略。

尼克對(duì)信息管理技術(shù)充滿熱情。他覺得隨著信息共享程度的提高,信息管理技術(shù)的確可以改變世界,他繼續(xù)解釋道:"蘊(yùn)藏在這些信息里的很可能就是未知的新發(fā)現(xiàn)、絕癥的治療方法、我們來自哪里和將往何方等宇宙謎團(tuán)的答案。"一陣沉思后,他又補(bǔ)充說:"當(dāng)然,商業(yè)上的需求沒那么重的哲學(xué)味。"

杰夫-尼克說,我們來自哪里,我們將往何方?這還是個(gè)謎。在過去2年半里,尼克幫助EMC制訂了雄心勃勃的收購(gòu)策略,使這家公司從一個(gè)存儲(chǔ)硬件廠商變成了信息管理軟件和系統(tǒng)的領(lǐng)跑者。這幾年來EMC公司一直在兜售它的信息生命周期管理系統(tǒng)。

根據(jù)IDC的資料顯示,隨著EMC在2003年以17億美元購(gòu)并文檔管理軟件廠商Documentum公司和2005年以2.75億美元購(gòu)并數(shù)據(jù)輸入軟件廠商Captiva軟件公司(Captiva Software),EMC已成為內(nèi)容管理系統(tǒng)領(lǐng)域里首屈一指的軟件商。對(duì)那些質(zhì)疑它于一年前以21億購(gòu)并RSA安全公司(RSA Security)之后,如何把這家公司融入信息管理布局,尼克覺得答案顯而易見:一家宣稱提供一攬子信息管理平臺(tái)的技術(shù)廠商,怎么可能不提供整合的安全呢?

EMC新增的產(chǎn)品無疑豐富了它的信息管理產(chǎn)品組合,最終達(dá)到和IBM相類似的水平:Centera和Symmetrix用于數(shù)據(jù)存儲(chǔ)和訪問、Documentum和Captiva用于數(shù)據(jù)管理、RSA使它更安全,還有上萬名員工的服務(wù)團(tuán)隊(duì)提供業(yè)務(wù)幫助。尼克表示,EMC將通過自主研發(fā)和收購(gòu)的方式,繼續(xù)擴(kuò)張自己的信息管理產(chǎn)品組合。

對(duì)大型信息管理供應(yīng)商來說,要說缺少什么技術(shù)的話,可能就是企業(yè)級(jí)搜索了。由霍華德-休斯(Howard Hughes)創(chuàng)建的位于馬里蘭州的霍華德-休斯醫(yī)學(xué)中心(Howard Hughes Medical Center)管理著近1 PB(PetaByte,即1,000TB,1Peta等于10的15次冪)的研究信息??茖W(xué)計(jì)算經(jīng)理斯科特·柯林斯(Scott Collins)說,它使用了EMC的存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)和用于文件共享的網(wǎng)絡(luò)附加存儲(chǔ)(NAS)軟件。然而,搜索特定的研究數(shù)據(jù)卻絕非易事??茖W(xué)家們經(jīng)常使用PubMed,這是一個(gè)由美國(guó)國(guó)立醫(yī)學(xué)圖書館(U.S. National Library of Medicine)發(fā)布的在線醫(yī)學(xué)研究摘要和引用數(shù)據(jù)庫??铝炙菇忉屨f,因?yàn)樯虡I(yè)產(chǎn)品不能滿足該應(yīng)用特定的搜索需求,該中心正在開發(fā)自己的搜索引擎。

IBM和EMC不是唯一通過收購(gòu)豐富自己信息管理產(chǎn)品架構(gòu)的公司。

甲骨文公司(Oracle)就在最近購(gòu)并了內(nèi)容管理軟件商Stellent公司和商業(yè)智能(BI)軟件商海波龍公司(Hyperion)。Oracle擁有IBM和EMC在企業(yè)應(yīng)用程序業(yè)務(wù)上所沒有的優(yōu)勢(shì)。比如,Stellent公司的內(nèi)容管理技術(shù)就可以和Oracle購(gòu)并的另外一家企業(yè)仁科公司(PeopleSoft)的企業(yè)資源計(jì)劃(ERP)軟件整合起來,"只有Oracle可以提供對(duì)應(yīng)用中各流程內(nèi)所有信息數(shù)據(jù)的全方位訪問。"Oracle的全球技術(shù)商業(yè)部門的副總裁羅伯特-辛普(Robert Shimp)宣稱。

然而,這些都還處于展望階段,因?yàn)镺racle正努力通過Fusion Web 、服務(wù),把這些收購(gòu)來的軟件整合到一起,讓它們協(xié)同工作。這意味著以后基于Fusion版的PeopleSoft和Stellent軟件可以非常方便地搭配使用,但前提是需要進(jìn)行更多的整合工作。

Oracle已在著手改進(jìn)的一個(gè)領(lǐng)域是自己的數(shù)據(jù)庫技術(shù),這家公司耗費(fèi)了大量的工作,以使它的數(shù)據(jù)庫查詢支持自然語言查詢,也就是語義描述方式。辛普表示,預(yù)期在Oracle 11G數(shù)據(jù)庫在今年夏天發(fā)布的時(shí)候,會(huì)提供更多的語義功能。

成本問題

最近,微軟在信息管理上做了一個(gè)大動(dòng)作。這家公司最近發(fā)布的SharePoint Server 2007,它的前身SharePoint Portal 2003的定位是協(xié)同軟件,而新版本的功能則包括如企業(yè)級(jí)搜索、內(nèi)容管理和商業(yè)智能。3月,微軟在圣地亞哥舉辦的一次會(huì)議上,首席執(zhí)行官(CEO)史蒂夫-鮑爾默(Steve Ballmer)把SharePoint 2007稱為"中間層的終極操作系統(tǒng)或平臺(tái)。"

微軟SharePoint業(yè)務(wù)總裁湯姆-里茲(Tom Rizzo)解釋說,鮑爾默的意思是,信息服務(wù)器可以作為用戶桌面端信息請(qǐng)求與包含信息的網(wǎng)絡(luò)數(shù)據(jù)源之間的信息代理,這些數(shù)據(jù)源包括非結(jié)構(gòu)化內(nèi)容、數(shù)據(jù)庫、各廠商的ERP和客戶關(guān)系管理(CRM)應(yīng)用程序,當(dāng)然也包括微軟自己的Dynamics系列產(chǎn)品線。里茲認(rèn)為,"這樣信息就得到了解放,而SharePoint正是突破口。"根據(jù)SharePoint服務(wù)器從電子郵件或ERP應(yīng)用里提取出來的數(shù)字,用戶借助分析工具能分析出銷售增長(zhǎng)率的趨勢(shì)。

與往常相似,微軟最有力的競(jìng)爭(zhēng)優(yōu)勢(shì)仍是成本,它不需要在如商業(yè)智能工具、內(nèi)容管理服務(wù)器、數(shù)據(jù)集成軟件等信息管理軟件包上投入巨資,這些產(chǎn)品原本可能需要向不同廠商購(gòu)買,而且即使買回來也不能很好地協(xié)同工作。"有許多單一領(lǐng)域的廠商各自為政。"里茲總結(jié)道,"而SharePoint卻可以作為統(tǒng)一的平臺(tái),完成在公司內(nèi)部各種與效率有關(guān)的任務(wù)。"SharePoint Server 2007的定價(jià)取決于你要選購(gòu)哪些模塊,只提供企業(yè)級(jí)搜索的版本定價(jià)為5.8萬美元。

但并非人人都認(rèn)同這點(diǎn)。安全防衛(wèi)承包商BAE系統(tǒng)公司(BAE Systems)采用Autonomy公司的Idol Server實(shí)現(xiàn)企業(yè)級(jí)搜索,它可以從多種數(shù)據(jù)源抓取信息,其中包括SharePoint 2003 服務(wù)器。BAE系統(tǒng)公司知識(shí)工程師斯科特?佩特里(Scott Petri)認(rèn)為,即使是升級(jí)版的SharePoint Server也過于專用了,不太適于做企業(yè)搜索引擎。"Autonomy公司的搜索引擎對(duì)多數(shù)據(jù)庫提供更好的訪問。"他指出,"我們要找的產(chǎn)品得有更好的功能,要比SharePoint覆蓋更多類型的數(shù)據(jù)庫。"

企業(yè)搜索是信息管理至關(guān)重要的因素,但是它依然被企業(yè)忽視了。BAE系統(tǒng)公司采用Autonomy技術(shù)已經(jīng)18個(gè)月了,佩特里說,整個(gè)公司的員工都通過它搜索Office文檔和PDF文件、RSS種子文件、HTML頁面和在公司網(wǎng)絡(luò)上共享的文件。佩特里表示,他也很贊賞Autonomy技術(shù)在用戶授權(quán)和加密上的安全性。

佩特里認(rèn)為,唯一真正的挑戰(zhàn)是,要讓員工把Autonomy看成一個(gè)概念搜索引擎(Conceptual Search Engine),它有別于使用Google時(shí)基于一兩個(gè)關(guān)鍵字的搜索。在概念搜索方式里,用戶給系統(tǒng)提供的信息越多,獲得的結(jié)果就越準(zhǔn)確。

在公司的信息管理策略里,企業(yè)文化問題也不可小覷。麻省理工學(xué)院(MIT)的IT教授斯圖爾特-馬德尼克(Stuart Madnick)認(rèn)為,最大的危險(xiǎn)在于,海量信息排山倒海而來時(shí),人們卻還熟視無睹、麻痹大意。"很可能有些高層就簡(jiǎn)單粗暴地把這個(gè)問題拒之門外。"他表示,"這會(huì)錯(cuò)失良機(jī)。"

商業(yè)機(jī)會(huì)可以溜走,但不斷攀升的數(shù)字信息卻不會(huì)自己消失。(TECHTARGET)

發(fā)布:2007-04-23 10:20    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
武漢OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢

泛普武漢OA快博其他應(yīng)用

武漢OA軟件 武漢OA新聞動(dòng)態(tài) 武漢OA快博 武漢OA軟件資訊 武漢OA信息化 武漢軟件開發(fā)公司 武漢門禁系統(tǒng) 武漢物業(yè)管理軟件 武漢倉(cāng)庫管理軟件 武漢餐飲管理軟件 武漢網(wǎng)站建設(shè)公司