當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普服務(wù)體系 > 泛普博客
談數(shù)據(jù)挖掘在企業(yè)信息化中的認(rèn)識(shí)誤區(qū)
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
來源:泛普軟件一、引 言
企業(yè)信息化指的是信息技術(shù)在企業(yè)各個(gè)運(yùn)作流程中的有機(jī)應(yīng)用,這些流程包括物流、資金流、信息流、技術(shù)流、客戶流等。我國(guó)企業(yè)信息化已經(jīng)歷了3個(gè)發(fā)展階段:第一階段是辦公自動(dòng)化(OA),涌現(xiàn)和積累了大量的電子文檔;第二階段是建立了管理信息系統(tǒng)(MIS),標(biāo)志著數(shù)據(jù)庫和網(wǎng)絡(luò)的應(yīng)用;第三階段是企業(yè)資源計(jì)劃(ERP)的實(shí)施,它意味著企業(yè)業(yè)務(wù)流程的重組和自動(dòng)化。隨著科學(xué)決策在企業(yè)的廣泛應(yīng)用以及企業(yè)適應(yīng)能力和靈敏度的提高,數(shù)據(jù)挖掘和企業(yè)智能將是今后企業(yè)信息化建設(shè)的重點(diǎn)。數(shù)據(jù)挖掘是一個(gè)新興的技術(shù)領(lǐng)域。它匯聚了數(shù)據(jù)庫、人工智能、統(tǒng)計(jì)學(xué)、可視化、并行計(jì)算等不同學(xué)科。近年來受到各界的廣泛關(guān)注?,F(xiàn)代的企業(yè)日常搜集了大量資料.包括市場(chǎng)、客戶、供貨商、競(jìng)爭(zhēng)對(duì)手以及未來趨勢(shì)等重要信息。但是信息的超載與無結(jié)構(gòu)化,使得企業(yè)決策單位無法有效利用現(xiàn)存的信息,甚至使決策行為產(chǎn)生混亂與誤用。妥善地運(yùn)用數(shù)據(jù)挖掘技術(shù),從巨量的數(shù)據(jù)庫中發(fā)掘出不同的信息與知識(shí)供決策支持所用,必能產(chǎn)生企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)。但是,許多企業(yè)在信息化進(jìn)程中對(duì)數(shù)據(jù)挖掘還存在一定的認(rèn)識(shí)誤區(qū),對(duì)其角色定位還不甚清晰,這直接影響了數(shù)據(jù)挖掘技術(shù)的應(yīng)用效果。
二、數(shù)據(jù)挖掘在企業(yè)信息化中的應(yīng)用現(xiàn)狀
數(shù)據(jù)挖掘在企業(yè)中的應(yīng)用方式目前主要集中在市場(chǎng)推廣方面。如客戶特征、購(gòu)物關(guān)聯(lián)分析及客戶關(guān)系管理。世界范圍內(nèi)具有刨新性的公司都開始采用數(shù)據(jù)挖掘技術(shù)來判斷哪些是他們最有價(jià)值的客戶.并重新制定產(chǎn)品推廣策略,即把產(chǎn)品推廣給最需要的人,以用最小的花費(fèi)得到最好的銷售。在客戶特征方面.?dāng)?shù)據(jù)挖掘可以從現(xiàn)有客戶數(shù)據(jù)中找出他們的特征.再利用這些特征到潛在客戶數(shù)據(jù)庫里去篩選出可能成為客戶的名單,行銷人員就可以只針對(duì)這些名單寄發(fā)廣告數(shù)據(jù),以降低成本,提高行銷的成功率;購(gòu)物關(guān)聯(lián)分析主要是用來幫助零售業(yè)者了解客戶的消費(fèi)行為,利用數(shù)據(jù)挖掘,零售業(yè)者可以更有效地決定進(jìn)貨量或庫存量,或是如何擺設(shè)貨品,同時(shí)也可以用來評(píng)估促銷活動(dòng)的成效;在客戶關(guān)系管理中,利用數(shù)據(jù)挖掘可以由原客戶后來卻轉(zhuǎn)成競(jìng)爭(zhēng)對(duì)手的客戶群中。分析其特征,再根據(jù)分析結(jié)果到現(xiàn)有客戶資料中找出可能轉(zhuǎn)向的客戶,然后設(shè)計(jì)一些方法預(yù)防客戶流失。此外,數(shù)據(jù)挖掘還可以對(duì)銷售數(shù)據(jù)進(jìn)行深層次的分析,采掘隱含在數(shù)據(jù)中的有用信息,發(fā)現(xiàn)和把握新的市場(chǎng)機(jī)會(huì),為企業(yè)的管理決策提供科學(xué)的依據(jù)。
可見,數(shù)據(jù)挖掘主要用于企業(yè)的決策支持、客戶關(guān)系管理、市場(chǎng)分析、營(yíng)銷策略和趨勢(shì)預(yù)測(cè)等方面,它可以提供比較可靠的依據(jù),使企業(yè)的決策走向科學(xué)化,而不再單純依賴經(jīng)驗(yàn),應(yīng)用的行業(yè)包括金融業(yè)、電信業(yè)、零售商、直效行銷、制造業(yè)、醫(yī)療保健及制藥業(yè)等。在我國(guó),許多企業(yè)如電信公司、銀行等開始向數(shù)據(jù)挖掘的方向走,但由于剛起步,許多企業(yè)對(duì)數(shù)據(jù)挖掘的認(rèn)識(shí)還存在誤區(qū),對(duì)它的角色定位還不夠準(zhǔn)確。
三、企業(yè)信息化進(jìn)程中對(duì)數(shù)據(jù)挖掘的認(rèn)識(shí)誤區(qū)
1.?dāng)?shù)據(jù)挖掘可以解決企業(yè)中所有的商業(yè)信息問題
事實(shí)上,數(shù)據(jù)挖掘并非能解決企業(yè)中所有的商業(yè)信息問題,數(shù)據(jù)挖掘僅是一個(gè)工具,在挖掘信息之前仍然需要了解企業(yè)的業(yè)務(wù),理解企業(yè)的數(shù)據(jù),弄清分析方法。數(shù)據(jù)挖掘只是幫助企業(yè)更深入、更容易地分析數(shù)據(jù),它無法告訴你某個(gè)模型對(duì)企業(yè)的實(shí)際價(jià)值。因此,提及數(shù)據(jù)挖掘,企業(yè)應(yīng)首先考慮用數(shù)據(jù)挖掘解決什么樣的商業(yè)問題,是進(jìn)行客戶群體劃分、背景分析、交叉銷售,還是客戶流失性分析、客戶信用記分、欺詐發(fā)現(xiàn)等。不同的商業(yè)問題,需要用不同的方法去解決,要想真正作好數(shù)據(jù)挖掘,數(shù)據(jù)挖掘工具只是其中的一個(gè)方面,沒有哪一種數(shù)據(jù)挖掘的工具可以應(yīng)付所有的要求,所以,進(jìn)行數(shù)據(jù)挖掘首先要考慮的是,準(zhǔn)確地定義所要解決的商業(yè)問題。
2.不需要對(duì)數(shù)據(jù)進(jìn)行準(zhǔn)備和了解,就能得到好的數(shù)據(jù)挖掘結(jié)果
與傳統(tǒng)的統(tǒng)計(jì)分析相比。數(shù)據(jù)挖掘的確不用專門進(jìn)行實(shí)驗(yàn)設(shè)計(jì)和調(diào)查設(shè)計(jì)。不用為確定的目的準(zhǔn)備大量的數(shù)據(jù),因?yàn)樵谶M(jìn)行數(shù)據(jù)挖掘之前已有數(shù)據(jù)庫,其目的也是不確定的。作為一種先進(jìn)的數(shù)據(jù)信息處理技術(shù),數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析的本質(zhì)區(qū)別在于它是數(shù)據(jù)關(guān)系的一個(gè)探索過程.而且多數(shù)情況下是在沒有任何假設(shè)和前提的條件下完成的。就現(xiàn)實(shí)來看。經(jīng)過幾年的信息化建設(shè),許多大中型企業(yè)已經(jīng)建立了比較完善的客戶關(guān)系管理(CRM)、ERP、OA等基礎(chǔ)信息化系統(tǒng),這種大集中系統(tǒng)已為數(shù)據(jù)挖掘準(zhǔn)備了較為成熟的條件。但直接從數(shù)據(jù)庫中截取的數(shù)據(jù)往往是冗余的、缺失的、有噪聲的,從而直接影響數(shù)據(jù)挖掘的效果。輸入數(shù)據(jù)庫中的異常數(shù)據(jù)、不相關(guān)的字段或互相沖突的字段、數(shù)據(jù)的編碼方式等,都會(huì)對(duì)數(shù)據(jù)挖掘輸出結(jié)果的質(zhì)量產(chǎn)生影響。數(shù)據(jù)挖掘最后成功與失敗,是否有經(jīng)濟(jì)效益。數(shù)據(jù)準(zhǔn)備起到了至關(guān)重要的作用。從原始數(shù)據(jù)轉(zhuǎn)化為挖掘信息的流程如圖1所示。
圖1 數(shù)據(jù)轉(zhuǎn)化為信息的流程圖
由圖1可見,在進(jìn)行數(shù)據(jù)挖掘之前,必須要做煩瑣但卻十分重要的數(shù)據(jù)清洗和預(yù)處理工作,包括去掉冗余、彌補(bǔ)缺失值、消除噪聲等,進(jìn)而集成、存儲(chǔ)數(shù)據(jù),以充分了解數(shù)據(jù),保證數(shù)據(jù)挖掘結(jié)果的價(jià)值。
3.只要有了數(shù)據(jù)挖掘工具,就能自動(dòng)挖掘出所需要的信息
這是人們常有的一個(gè)認(rèn)識(shí)誤區(qū)。數(shù)據(jù)挖掘利用了統(tǒng)計(jì)和人工智能技術(shù)的應(yīng)用程序,它把這些高深復(fù)雜的技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,并且更專注于自己所要解決的問題。雖然如此,人們?nèi)匀恍枰浪x用的數(shù)據(jù)挖掘工具是如何工作的。換句話說,數(shù)據(jù)挖掘永遠(yuǎn)不會(huì)替代有經(jīng)驗(yàn)的商業(yè)分析師或管理人員所起的作用,它只是提供一個(gè)強(qiáng)大的工具。數(shù)據(jù)挖掘決不會(huì)在缺乏指導(dǎo)的情況下自動(dòng)地發(fā)現(xiàn)模型。數(shù)據(jù)挖掘工具要做的就是使這些模型得到的更容易、更方便,而且有根據(jù)。比如客戶關(guān)系管理,不是只設(shè)一個(gè)客服專線,更不僅僅是把一堆客戶基本數(shù)據(jù)輸入計(jì)算機(jī)。一個(gè)完整的客戶關(guān)系管理運(yùn)作機(jī)制在相關(guān)的硬軟件系統(tǒng)功能健全的支持之前,要有大量的數(shù)據(jù)準(zhǔn)備工作與分析過程推動(dòng)。
邁克爾·J·A·貝里和戈登·S·利諾夫指出,通過4種有效途徑可以實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)在企業(yè)中的專業(yè)化應(yīng)用,即:從企業(yè)外的制造商處購(gòu)買與企業(yè)商業(yè)問題配套的評(píng)分機(jī)制,購(gòu)買實(shí)施整體解決方案的數(shù)據(jù)挖掘軟件,針對(duì)特定問題聘請(qǐng)外部專家完成預(yù)測(cè)模型的建立,以及在組織內(nèi)部掌握數(shù)據(jù)挖掘技能。他們認(rèn)為,從公司長(zhǎng)遠(yuǎn)發(fā)展考慮,最后一種方法應(yīng)作為企業(yè)首選。因?yàn)檫@將促使企業(yè)把數(shù)據(jù)挖掘視為企業(yè)的法寶,并通過它將客戶關(guān)系管理推向企業(yè)戰(zhàn)略的核心。鑒于此,一個(gè)企業(yè)想要在未來的市場(chǎng)中具有競(jìng)爭(zhēng)力。必須有一些數(shù)據(jù)挖掘方面的專家,專門從事數(shù)據(jù)分析和數(shù)據(jù)挖掘工作,再同其他部門協(xié)調(diào),把挖掘出來的信息提供給決策者參考,但國(guó)內(nèi)的企業(yè)還很少有決策人員認(rèn)識(shí)到這一點(diǎn)。如果管理者沒有這方面的意識(shí),數(shù)據(jù)挖掘就很難發(fā)揮其應(yīng)有的作用,且很容易走向兩個(gè)極端:一是認(rèn)為數(shù)據(jù)挖掘沒有用處,二是認(rèn)為數(shù)據(jù)挖掘是萬能的,而得到的結(jié)果往往與初始期望相去甚遠(yuǎn)。
4.企業(yè)開發(fā)、運(yùn)用數(shù)據(jù)挖掘的結(jié)果是可以預(yù)期的
這也是企業(yè)界對(duì)數(shù)據(jù)挖掘認(rèn)識(shí)上的一個(gè)慣常誤區(qū)。實(shí)際上,企業(yè)界運(yùn)用數(shù)據(jù)挖掘要受許多因素的影響,例如,不充足的教育訓(xùn)練、不適當(dāng)?shù)闹С止ぞ摺?shù)據(jù)的無效性、過于豐富的模型、多變與具有時(shí)間性的數(shù)據(jù)、空間導(dǎo)向數(shù)據(jù)、數(shù)據(jù)的衡量性等。面對(duì)易變的環(huán)境,沒有立刻能用的現(xiàn)成的模型,數(shù)據(jù)挖掘的本質(zhì)是發(fā)現(xiàn)非預(yù)期的模式,同樣,非預(yù)期的模式要以非預(yù)期的方法來發(fā)現(xiàn),更不能期望按照程序即能成功。因此,要分析一些潛在的因素,如數(shù)據(jù)取舍、實(shí)體關(guān)系性、數(shù)量多寡、復(fù)雜性、數(shù)據(jù)質(zhì)量、可取得性、專家意見等因素,才能做好挖掘工作。此外,所有通過數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)都是相對(duì)的.是有特定前提和約束條件且面向特定領(lǐng)域的。對(duì)于數(shù)據(jù)挖掘而言,需求牽引、市場(chǎng)驅(qū)動(dòng)是永恒的,而對(duì)于企業(yè)應(yīng)用數(shù)據(jù)挖掘而言,面向客戶、講求實(shí)際才是最主要的。
5.?dāng)?shù)據(jù)挖掘是企業(yè)商業(yè)智能的核心
簡(jiǎn)而言之,商業(yè)智能是能夠幫助用戶對(duì)自身業(yè)務(wù)經(jīng)營(yíng)作出正確明智決定的工具。不可否認(rèn),數(shù)據(jù)挖掘可以增加企業(yè)智慧,提升企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì),是企業(yè)走向智能化的重要組成部分。但是一個(gè)完整的知識(shí)挖掘過程牽涉大量的規(guī)劃與準(zhǔn)備,包括理解數(shù)據(jù)、融合與核查資料、去除錯(cuò)誤或不一致的數(shù)據(jù)、發(fā)展模式與假設(shè)、實(shí)際數(shù)據(jù)挖掘工作、測(cè)試與審核所挖掘的數(shù)據(jù)、解釋與使用數(shù)據(jù)等,從這個(gè)角度看,數(shù)據(jù)挖掘只是知識(shí)發(fā)掘過程中的一個(gè)步驟而已,而達(dá)到這個(gè)步驟前還有許許多多的工作要完成。
從技術(shù)層面來看,商業(yè)智能的技術(shù)體系包括數(shù)據(jù)倉(cāng)庫、在線分析處理(OLAP)以及數(shù)據(jù)挖掘3部分。所謂數(shù)據(jù)倉(cāng)庫就是面向主題的、集成的、穩(wěn)定的、不同時(shí)間的數(shù)據(jù)集合.它提供在線分析處理或數(shù)據(jù)挖掘所需要的、整齊一致的數(shù)據(jù),用以支持經(jīng)營(yíng)管理中的決策制定過程。OLAP則是幫助分析人員、管理人員多種角度地把從原始數(shù)據(jù)中轉(zhuǎn)化出來、能夠真正為用戶所理解的、并真實(shí)反映數(shù)據(jù)特性的信息,進(jìn)行快速、一致、交互的訪問,從而獲得對(duì)數(shù)據(jù)更深入了解的一類軟件技術(shù)。而數(shù)據(jù)挖掘是一種決策支持過程,通過高度自動(dòng)化地分析企業(yè)原有的數(shù)據(jù),從中挖掘出潛在的模式,預(yù)測(cè)客戶的行為,幫助企業(yè)的決策者調(diào)整市場(chǎng)策略,減少風(fēng)險(xiǎn),作出正確的決策圈。這三者的關(guān)系如圖2所示。
圖2 數(shù)據(jù)挖掘、OLAP、數(shù)據(jù)倉(cāng)庫之間的關(guān)系示意圖
由圖2可以看出,數(shù)據(jù)倉(cāng)庫是商業(yè)智能的基礎(chǔ),它是一個(gè)環(huán)境,主要提供用于決策支持的當(dāng)前和歷史的數(shù)據(jù);OLAP屬于數(shù)據(jù)倉(cāng)庫應(yīng)用,它以數(shù)據(jù)倉(cāng)庫為基礎(chǔ),其分析結(jié)果可以為數(shù)據(jù)挖掘提供分析信息,作為挖掘的依據(jù);數(shù)據(jù)挖掘則可以拓展OLAP的深度,可以發(fā)現(xiàn)OLAP所不能發(fā)現(xiàn)的更為復(fù)雜細(xì)致的信息??梢?,只有將數(shù)據(jù)挖掘與OLAP、數(shù)據(jù)倉(cāng)庫結(jié)合起來,才能使企業(yè)的許多業(yè)務(wù)流程實(shí)現(xiàn)智能化運(yùn)作。離開了數(shù)據(jù)倉(cāng)庫和OLAP,商業(yè)智能無從實(shí)現(xiàn),因此,數(shù)據(jù)挖掘、OLAP與數(shù)據(jù)倉(cāng)庫均是企業(yè)商業(yè)智能的核心技術(shù)。
四、結(jié) 論
綜上所述,從數(shù)據(jù)中尋找知識(shí)、挖掘財(cái)富、發(fā)現(xiàn)決策依據(jù)。這是數(shù)據(jù)挖掘?qū)ζ髽I(yè)的直接貢獻(xiàn),也是企業(yè)信息化的重要體現(xiàn)。但在開發(fā)、運(yùn)用數(shù)據(jù)挖掘的過程中,應(yīng)充分認(rèn)識(shí)數(shù)據(jù)挖掘的本質(zhì)及局限性,正確地對(duì)其進(jìn)行定位,才能真正發(fā)揮數(shù)據(jù)挖掘的決策支持作用。體現(xiàn)其在企業(yè)信息化中的價(jià)值。首先,數(shù)據(jù)挖掘僅僅是一個(gè)工具,它不能包羅萬象,解決所有的商業(yè)信息問題,企業(yè)應(yīng)首先明確用數(shù)據(jù)挖掘解決什么樣的商業(yè)問題,同時(shí)還需要對(duì)企業(yè)業(yè)務(wù)的深入了解和數(shù)據(jù)分析經(jīng)驗(yàn);其次,為了保證數(shù)據(jù)挖掘結(jié)果的價(jià)值,必須要了解數(shù)據(jù),保證數(shù)據(jù)的質(zhì)量,數(shù)據(jù)挖掘最后成功與失敗。數(shù)據(jù)準(zhǔn)備起到至關(guān)重要的作用;再次,數(shù)據(jù)挖掘工具并非能自動(dòng)挖掘出所需要的信息,也不會(huì)在缺乏指導(dǎo)的情況下自動(dòng)地發(fā)現(xiàn)模型,還必須有一些數(shù)據(jù)挖掘方面的專家,專門從事數(shù)據(jù)分析和數(shù)據(jù)挖掘工作;然后,企業(yè)在應(yīng)用數(shù)據(jù)挖掘時(shí)要受許多因素的影響,故其結(jié)果并不是可以預(yù)期的,面對(duì)易變的環(huán)境,企業(yè)要分析一些潛在的因素,面向客戶、講求實(shí)際;最后,數(shù)據(jù)挖掘雖然是企業(yè)走向智能化的重要組成部分,可以說數(shù)據(jù)挖掘是目前企業(yè)信息化的高級(jí)境界,但不能說數(shù)據(jù)挖掘就是商業(yè)智能的核心所在,一個(gè)完整的知識(shí)挖掘過程牽涉大量的規(guī)劃與準(zhǔn)備,實(shí)際的數(shù)據(jù)挖掘只是較大規(guī)模商業(yè)智能過程中的一部分。只有將其與數(shù)據(jù)倉(cāng)庫、在線分析處理融合在一起,才能構(gòu)成完整的企業(yè)決策分析環(huán)境。(萬方數(shù)據(jù))
- 1別在最能吃苦的年紀(jì),選擇了安逸!
- 2OA辦公系統(tǒng)已經(jīng)成為IT市場(chǎng)的焦點(diǎn)和趨勢(shì)
- 3企業(yè)IT實(shí)施不應(yīng)忽視IT績(jī)效評(píng)估
- 4探討參數(shù)化設(shè)計(jì)在工程領(lǐng)域的應(yīng)用
- 5企業(yè)的OA系統(tǒng)從開始到成功實(shí)施有其相對(duì)繁雜的過程
- 6 最帥快遞小哥爆紅網(wǎng)絡(luò) 酷似臺(tái)灣偶像邱澤
- 7國(guó)內(nèi)OA辦公軟件真正實(shí)現(xiàn)協(xié)同了嗎,值得深思
- 8CRM:從客戶關(guān)系到客戶情感忠誠(chéng)
- 9OA系統(tǒng)可以改善原有的IT系統(tǒng)
- 10馬云再次炮轟銀行:現(xiàn)有體系不足支撐30年,期望利用互聯(lián)網(wǎng)改造銀行業(yè)
- 11網(wǎng)管軟件能給中國(guó)的企業(yè)用戶帶來什么
- 12OA辦公系統(tǒng)不僅提供一個(gè)數(shù)字化的虛擬企業(yè)環(huán)境
- 13經(jīng)濟(jì)低迷狀態(tài)下的日本連鎖管理及其對(duì)策
- 14【行業(yè)新聞】連鎖經(jīng)營(yíng)的優(yōu)勢(shì)分析
- 15三管齊下讓招商策略活起來
- 16泛普軟件給高校圖書館開發(fā)利用OA資源的建議
- 17國(guó)美路在何方
- 18白酒經(jīng)銷商如何運(yùn)作農(nóng)村市場(chǎng)
- 19辦公系統(tǒng)的革命中,最有力的推手是Web 2.0風(fēng)潮對(duì)企業(yè)的影響
- 20有梧桐樹才能吸引金鳳凰
- 21與企業(yè)利潤(rùn)相背的幾個(gè)管理現(xiàn)象
- 22海南昌江3名干部涉嫌違紀(jì)被調(diào)查
- 23陜西被逼賣處受害人家長(zhǎng)斥調(diào)查結(jié)果官官相護(hù)
- 24強(qiáng)生無淚配方賣點(diǎn)的現(xiàn)實(shí)困境
- 25OA的精髓能使他們的產(chǎn)品更好的與互相集成
- 26為什么僅有網(wǎng)絡(luò)金融和CRM系統(tǒng)是不夠的
- 27望京水環(huán)境保護(hù)外教公益講座
- 28泛普OA辦公系統(tǒng)成為實(shí)用性O(shè)A的典范
- 29支付寶無故被轉(zhuǎn)走5萬元 黑客稱為測(cè)試漏洞
- 30學(xué)生安全調(diào)查:超兩成擔(dān)心孩子網(wǎng)絡(luò)交友和性侵
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓