監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

淺析數(shù)據(jù)挖掘技術(shù)在電子病歷中的應(yīng)用

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

       在建設(shè)數(shù)字醫(yī)療的基礎(chǔ)之上,電子病歷應(yīng)運(yùn)而生,其短暫的歷史和迅速的崛起形成鮮明對(duì)比,在社會(huì)信息建設(shè)進(jìn)程中擔(dān)當(dāng)了重要角色,并回應(yīng)了強(qiáng)烈的社會(huì)醫(yī)療訴求,將醫(yī)療服務(wù)的手段和模式推向縱深。在這一短暫的本土化發(fā)展進(jìn)程中,電子病歷由簡(jiǎn)單文字紀(jì)錄載體,迅速進(jìn)化為多樣式的健康信息體系,其集成能力日益強(qiáng)大,其交換整合能力使醫(yī)療信息流通得到加強(qiáng)。在當(dāng)前醫(yī)療信息化需求的驅(qū)動(dòng)之下,電子病歷完成了系統(tǒng)搭建,使信息化滲透到臨床工作中。
       反觀電子病歷的技術(shù)發(fā)展史,立足于眼前需求的功能實(shí)現(xiàn)已經(jīng)完成:最早進(jìn)行電子病歷實(shí)踐的地區(qū)和單位,都已擁有固定的運(yùn)作經(jīng)驗(yàn),基于電子病歷的診療新流程得到確立。進(jìn)一步地,如何挖掘長(zhǎng)遠(yuǎn)價(jià)值、發(fā)揮長(zhǎng)期效益,成為電子病歷發(fā)展的下一個(gè)主題。筆者認(rèn)為,數(shù)字化醫(yī)療建設(shè)的真正意義,在于如何利用好這些長(zhǎng)期積累的數(shù)據(jù)。對(duì)數(shù)據(jù)資源的開(kāi)發(fā)利用,將使電子病歷的意義得到淋漓盡致的展現(xiàn),使其可交換性、可用性得到充分發(fā)揮。由此,電子病歷后續(xù)發(fā)展的主題,明確指向“如何進(jìn)行數(shù)據(jù)挖掘”。
1 廣義數(shù)據(jù)挖掘
1.1 數(shù)據(jù)挖掘的含義
      數(shù)據(jù)挖掘是揭示存在于數(shù)據(jù)里的模式及數(shù)據(jù)問(wèn)的關(guān)系的學(xué)科,它強(qiáng)調(diào)對(duì)大量觀測(cè)到的數(shù)據(jù)的處理。數(shù)據(jù)挖掘能夠從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)集中識(shí)別有效的、新穎的、潛在有用的、最終可理解的模式。它是一門涉及面很廣的交叉學(xué)科,涉及機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、智能數(shù)據(jù)庫(kù)、知識(shí)獲取、數(shù)據(jù)可視化、高性能計(jì)算、專家系統(tǒng)等學(xué)科。數(shù)據(jù)挖掘的成果可以用在信息管理、過(guò)程控制、科學(xué)研究、決策支持等許多方面。
1.2 數(shù)據(jù)挖掘的產(chǎn)生與發(fā)展
       數(shù)據(jù)挖掘最初脫胎于統(tǒng)計(jì)學(xué),通過(guò)計(jì)算機(jī),對(duì)大量復(fù)雜的數(shù)據(jù)集自動(dòng)進(jìn)行探索性分析。盡管數(shù)據(jù)挖掘和統(tǒng)計(jì)分析之間有明顯的聯(lián)系,迄今為止大部分的數(shù)據(jù)挖掘方法并不產(chǎn)生于統(tǒng)計(jì)學(xué)科。正因?yàn)閿?shù)據(jù)挖掘工作對(duì)商業(yè)、工業(yè)及科學(xué)研究具有極大的影響,在有需求的領(lǐng)域里,關(guān)于數(shù)據(jù)挖掘的研究總有可觀的成績(jī)。
1.3 被挖掘數(shù)據(jù)源的形式
       被挖掘的數(shù)據(jù)源有多種形式,目前可歸納的主要有:關(guān)系數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、時(shí)態(tài)數(shù)據(jù)庫(kù)、文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫(kù)、異質(zhì)數(shù)據(jù)庫(kù)、遺產(chǎn)(1egacy)數(shù)據(jù)庫(kù),以及Web數(shù)據(jù)源。簡(jiǎn)言之,大量數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,令數(shù)據(jù)存量大量增加,“數(shù)據(jù)爆炸但知識(shí)貧乏”,由此催生了數(shù)據(jù)挖掘技術(shù),以獲得海量數(shù)據(jù)背后隱藏著的知識(shí)。
2 特殊語(yǔ)境下的數(shù)據(jù)挖掘
       數(shù)據(jù)挖掘總是在某一特定知識(shí)領(lǐng)域內(nèi)進(jìn)行,具有普遍適用性的數(shù)據(jù)挖掘技術(shù)尚未出現(xiàn)。這由數(shù)據(jù)挖掘本身的難點(diǎn)決定。首先,巨量數(shù)據(jù)集的性質(zhì)非常復(fù)雜,非線性、時(shí)序性與噪音普遍存在;其次,數(shù)據(jù)分析的目標(biāo)具有多樣性,而復(fù)雜目標(biāo)無(wú)論在表述還是在處理上均與領(lǐng)域知識(shí)有關(guān);第三,在復(fù)雜目標(biāo)下,對(duì)巨量數(shù)據(jù)集的分析,目前還沒(méi)有現(xiàn)成的且滿足可計(jì)算條件的一般性理論與方法。在實(shí)際應(yīng)用中,特定知識(shí)領(lǐng)域的確認(rèn),有效回避了數(shù)據(jù)挖掘的瓶頸問(wèn)題。電子病歷的應(yīng)用就是這樣一個(gè)明證。作為特殊法律文書,病歷本身是嚴(yán)肅而確定的:知識(shí)領(lǐng)域的專注使數(shù)據(jù)噪音大量削減,使數(shù)據(jù)源形式簡(jiǎn)化,使分析目標(biāo)明確,使語(yǔ)義指代明顯,語(yǔ)義強(qiáng)度能夠有序排列。另一方面,病歷固有的格式要求和行文習(xí)慣,很好地解決了非線性問(wèn)題和時(shí)序性問(wèn)題。
      在特定知識(shí)庫(kù)、特殊語(yǔ)言環(huán)境下,廣義數(shù)據(jù)挖掘的難點(diǎn)被一一回避。因此,盡管廣義數(shù)據(jù)挖掘還有很長(zhǎng)的道路,還有諸多的分歧,但在電子病歷中,專注于臨床知識(shí)的數(shù)據(jù)挖掘應(yīng)用是合理可行的,是符合現(xiàn)實(shí)的。
3 基于結(jié)構(gòu)化采集的數(shù)據(jù)挖掘
3.1 預(yù)結(jié)構(gòu)化
      預(yù)結(jié)構(gòu)化電子病歷是繼“WORD電子病歷”之后的一大飛躍。最初,一些醫(yī)院采用WORD存儲(chǔ)電子病歷,將病歷文本予以電子存儲(chǔ),除去存儲(chǔ)和書寫方式的變化,病歷本身沒(méi)有發(fā)生任何變化。其功能展開(kāi)、數(shù)據(jù)交換、數(shù)據(jù)挖掘完全無(wú)法進(jìn)行。隨著社會(huì)信息建設(shè)要求的提高,數(shù)據(jù)應(yīng)用的意義得到重視。以WORD存儲(chǔ)電子病歷,無(wú)法對(duì)病歷數(shù)據(jù)進(jìn)行開(kāi)采和利用,只是數(shù)據(jù)垃圾的堆積。于是,電子病歷結(jié)構(gòu)化的理念在業(yè)界達(dá)成了高度一致?;诋?dāng)時(shí)的技術(shù)水平,開(kāi)發(fā)了“預(yù)結(jié)構(gòu)化”模式:在病歷中,按照醫(yī)學(xué)專業(yè)要求,將知識(shí)點(diǎn)提煉,并逐一羅列,使用醫(yī)學(xué)規(guī)范用語(yǔ)和診斷專業(yè)術(shù)語(yǔ)書寫。所生成的電子病歷,能夠被識(shí)別,從而實(shí)現(xiàn)病歷的檢索、分析和質(zhì)量控制,能夠?yàn)閷<蚁到y(tǒng)所理解,從而為教學(xué)科研提供依據(jù)。預(yù)結(jié)構(gòu)化模式的典型特征是病歷模板的應(yīng)用。病歷模板的原型是紙質(zhì)病歷中的表格病歷。借鑒表格病歷的邏輯,病歷模板提煉出了病歷記錄的必須項(xiàng)目,必須內(nèi)容, 以及必須形式。在固定的形式下,將項(xiàng)目和內(nèi)容盡數(shù)羅列,提供單選、多選的錄人形式。
       由于知識(shí)庫(kù)的支持,電子病歷模板相對(duì)靈活方便。根據(jù)前文選擇錄入的內(nèi)容,內(nèi)部邏輯自動(dòng)進(jìn)行選擇性地顯示,過(guò)濾無(wú)關(guān)項(xiàng)目。其次,病案首頁(yè)、檢驗(yàn)報(bào)告等文書的格式固定,內(nèi)容明確,預(yù)結(jié)構(gòu)化的模板完全能夠使之功能得到最大發(fā)揮。最后,病歷模板分離了存儲(chǔ),實(shí)現(xiàn)了“動(dòng)態(tài)模板”,以方便臨床工作者重復(fù)不斷地修改和完善模板,盡管如此,在實(shí)際使用中,預(yù)結(jié)構(gòu)化的模板帶有決定性的缺失。模板本身是對(duì)自然語(yǔ)言的解構(gòu),借助于醫(yī)學(xué)的確定范疇和固定形式,這一過(guò)程確實(shí)能夠圓滿實(shí)現(xiàn)。但它同時(shí)也肢解了自然語(yǔ)言的流暢性和靈活性。當(dāng)醫(yī)生需要以獨(dú)立完整的語(yǔ)言進(jìn)行描述時(shí),他們便拋棄了病歷模板。繞過(guò)病歷模板的錄入方式,使預(yù)結(jié)構(gòu)化喪失了用武之地。
3.2 后結(jié)構(gòu)化
       實(shí)踐表明,自由文本和預(yù)結(jié)構(gòu)化病歷的使用,難以滿足臨床科研數(shù)據(jù)管理與統(tǒng)計(jì)的要求,而嚴(yán)格的表格化病歷限制了臨床描述能力,為了準(zhǔn)確表述臨床行為,甚至需要另外撰寫手工病歷,遭到臨床醫(yī)生的反對(duì)。
       為了兼顧臨床和科研,后結(jié)構(gòu)化應(yīng)運(yùn)而生。后結(jié)構(gòu)化的語(yǔ)義分析模型,最終是將語(yǔ)義元素的固有關(guān)系進(jìn)行遍歷,結(jié)合語(yǔ)義強(qiáng)度等因素,對(duì)自然語(yǔ)言進(jìn)行處理?;谶@一模型,得以對(duì)純文本的病歷內(nèi)容進(jìn)行結(jié)構(gòu)化采集。在首頁(yè)、醫(yī)囑、各類檢查化驗(yàn)報(bào)告、病程記錄、護(hù)理記錄等良好的結(jié)構(gòu)化文書之外,病歷的主觀描述部分也實(shí)現(xiàn)了完全結(jié)構(gòu)化。解析自然語(yǔ)言的過(guò)程稱為“后結(jié)構(gòu)化”。與預(yù)結(jié)構(gòu)化不同,后結(jié)構(gòu)化并沒(méi)有設(shè)定采集范式,沒(méi)有設(shè)定數(shù)據(jù)的抓取結(jié)構(gòu),因而并不要求細(xì)致的填充。后結(jié)構(gòu)化技術(shù)維護(hù)了病歷描述的自然語(yǔ)境。后結(jié)構(gòu)化有兩大關(guān)鍵難點(diǎn)。首先是機(jī)器學(xué)習(xí)還相當(dāng)幼稚。在預(yù)結(jié)構(gòu)化中,由于抓取和采集的框架已經(jīng)確定,解析和計(jì)算的邏輯相對(duì)固定,因而基本不需涉及機(jī)器學(xué)習(xí)。但在后結(jié)構(gòu)化模式中,各種挖掘模式都有應(yīng)用(如回歸模式、聚類模式、關(guān)聯(lián)模式、序列模式等), 因而其規(guī)則抽取也更為復(fù)雜。作為一種機(jī)器學(xué)習(xí)方法,神經(jīng)網(wǎng)絡(luò)規(guī)則抽取的重要指標(biāo):泛化精度、保真度、可理解性,目前仍處于較低水平。其次,漢語(yǔ)言不同于依附語(yǔ)范疇的語(yǔ)言(諸如英語(yǔ)),其轉(zhuǎn)格及形式缺乏顯著標(biāo)志,給結(jié)構(gòu)化處理帶來(lái)了難度。此外,漢語(yǔ)言的詞性詞義只在特定語(yǔ)境中才能確定,同一詞語(yǔ)可支持多種表義,多種詞性,有很大的機(jī)會(huì)令算法進(jìn)入死循環(huán)。因此,關(guān)于漢語(yǔ)言的結(jié)構(gòu)化研究進(jìn)度遲緩。綜上所述,數(shù)據(jù)挖掘是電子病歷發(fā)展到相當(dāng)程度的必然要求。而在電子病歷的應(yīng)用中,實(shí)現(xiàn)數(shù)據(jù)挖掘的關(guān)鍵,即結(jié)構(gòu)化采集。盡管存在著大量難點(diǎn),但在強(qiáng)大的需求面前,結(jié)構(gòu)化研究擁有良好的發(fā)展環(huán)境,必然能獲得長(zhǎng)遠(yuǎn)的發(fā)展。
參考文獻(xiàn)
1 俞文敏.電子病歷應(yīng)用中存在的問(wèn)題及解決方案探討[J].東南國(guó)防醫(yī)藥,2006,8(1):66—67.
2 劉靜,沈蓓,黃學(xué)寧,等.電子病歷中結(jié)構(gòu)化描述內(nèi)容與??撇v模板[J].現(xiàn)代醫(yī)學(xué),2005,33(6):4]7—419.

發(fā)布:2007-04-09 11:19    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)文章:

泛普門診收費(fèi)管理系統(tǒng)其他應(yīng)用

醫(yī)院行業(yè)管理系統(tǒng) 醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件 病案管理系統(tǒng) 藥店管理系統(tǒng) 醫(yī)院his系統(tǒng) 醫(yī)院預(yù)約軟件 住院收費(fèi)管理系統(tǒng) 區(qū)域醫(yī)療衛(wèi)生信息化平臺(tái) 社區(qū)醫(yī)療管理系統(tǒng) 門診收費(fèi)管理系統(tǒng) 醫(yī)療衛(wèi)生軟件 新農(nóng)合軟件 醫(yī)院管理系統(tǒng)免費(fèi)版 免費(fèi)醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件免費(fèi)版 免費(fèi)藥店管理系統(tǒng) 醫(yī)院管理系統(tǒng)下載 醫(yī)院信息管理系統(tǒng)下載 醫(yī)藥管理軟件下載 病案管理系統(tǒng)下載 藥店管理系統(tǒng)下載 醫(yī)院his系統(tǒng)下載 醫(yī)療一體化管理系統(tǒng)下載 新農(nóng)合軟件下載 藥品管理系統(tǒng)下載