監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢(xún)管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 簽約案例 | 購(gòu)買(mǎi)價(jià)格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉

優(yōu)化SQL語(yǔ)句中的物理查詢(xún)方法分享

申請(qǐng)免費(fèi)試用、咨詢(xún)電話:400-8352-114

文章來(lái)源:泛普軟件

from tab1, tab2

where tab1.id = tab2.id and tab1.col1 = 123 and tab2.col1 = 'abc'

照你所述的執(zhí)行順序,先要tab1和tab2進(jìn)行笛卡爾乘積,再按照tab1.col1 = 123 and tab2.col1 = 'abc‘進(jìn)行篩選。這樣的話,效率豈不是很低,數(shù)據(jù)庫(kù)有這么愚蠢嗎?

我想很多人都會(huì)有這個(gè)疑問(wèn),包括我在最初學(xué)習(xí)的時(shí)候也提出過(guò)這樣的問(wèn)題。那么,我的這篇文章就結(jié)合這個(gè)問(wèn)題來(lái)討論一下SQL Server的物理查詢(xún)處理。首先我們必須明白邏輯處理和物理處理和區(qū)別,邏輯處理是指執(zhí)行一個(gè)查詢(xún)應(yīng)該產(chǎn)生什么樣的結(jié)果,那么邏輯查詢(xún)的各個(gè)階段就是這個(gè)查詢(xún)從邏輯上執(zhí)行的先后順序,依照這個(gè)先后順序就能得到正確的結(jié)果,正如我們做四則混合運(yùn)算一樣,先乘除后加減才能得到正確結(jié)果。

所以說(shuō)邏輯查詢(xún)只關(guān)心產(chǎn)生一個(gè)我們期望的、正確的結(jié)果,它并不關(guān)心產(chǎn)生這個(gè)結(jié)果需要多少的資源消耗。而物理處理就是怎么得到這個(gè)結(jié)果,這個(gè)時(shí)候才會(huì)考慮性能問(wèn)題。下面我們就討論下怎么執(zhí)行這個(gè)物理處理的。

當(dāng)一個(gè)查詢(xún)到達(dá)數(shù)據(jù)庫(kù)引擎的時(shí)候,數(shù)據(jù)庫(kù)引擎需要做的是執(zhí)行這個(gè)查詢(xún)的查詢(xún)計(jì)劃,那么這個(gè)時(shí)候就存在兩種情況,一種可能是這個(gè)查詢(xún)的查詢(xún)計(jì)劃已經(jīng)在緩存中,這種情況就直接執(zhí)行這個(gè)查詢(xún)計(jì)劃。另外一種情況就是在緩存中找不到該查詢(xún)的查詢(xún)計(jì)劃。沒(méi)有怎么辦?生成一個(gè)!怎么生成?

執(zhí)行計(jì)劃是在編譯階段生成的,編譯需要經(jīng)過(guò)三個(gè)步驟:分析、代數(shù)化(algebrization)、查詢(xún)優(yōu)化,看見(jiàn)沒(méi)有這里的查詢(xún)優(yōu)化過(guò)程就能解決上面的朋友提出的先笛卡爾集在篩選造成性能低的問(wèn)題。下面我就對(duì)這三個(gè)步驟作一個(gè)介紹。

第一步:分析是檢查語(yǔ)法并把SQL批處理轉(zhuǎn)化成分析樹(shù)的過(guò)程,如select * t1 where id in(1,2,3,4,5,6,7)在被分析樹(shù)分析后就展開(kāi)成了select * t1 where id=1 or id=2 or id=3 or id=4 or id=5 or id=6 or id=7 ,除此之外還有檢查語(yǔ)法是否正確的功能。

第二步:接下的過(guò)程是代數(shù)化(algebrization),這個(gè)階段使用SQL Server 2005的新組件algebrizer,algebrizer組件的主要功能是綁定,因此代數(shù)化過(guò)程通常稱(chēng)為綁定。這個(gè)階段是將第一步的分析樹(shù)作為輸入,生成被稱(chēng)為查詢(xún)處理器樹(shù)的輸出,用于查詢(xún)優(yōu)化。其實(shí)這個(gè)階段主要做幾個(gè)事情,

一:運(yùn)算符平展,簡(jiǎn)單的講就是把二元運(yùn)算符組合成N元運(yùn)算符,這里必須給出一個(gè)示例才能很好的解釋這個(gè)二元轉(zhuǎn)換成N元如第一步所示in操作展開(kāi)成了一連串的or運(yùn)算符,而分析器認(rèn)為這些or都是二元的,也就是說(shuō)它認(rèn)為第一個(gè)or 的左孩子是id=1,右孩子是 (id=2 or id=3 or id=4 or id=5 or id=6 or id=7 )這個(gè)表達(dá)式,而右孩子又被認(rèn)為是二元的,如此一來(lái)就必須進(jìn)行一個(gè)遞歸過(guò)程。而運(yùn)算符平展過(guò)程則將這種二元運(yùn)算組合成n元運(yùn)算符,就避免了遞歸的過(guò)程。

二:名稱(chēng)解析,這個(gè)過(guò)程其實(shí)就是檢查這個(gè)查詢(xún)中出現(xiàn)的表或者是表的列是不是在數(shù)據(jù)庫(kù)中真實(shí)存在。以及在該查詢(xún)過(guò)程中是不是可見(jiàn)的。三:類(lèi)型派生,有點(diǎn)抽象,舉個(gè)例子就能理解了,比如union查詢(xún)吧,union左右兩邊查詢(xún)結(jié)果對(duì)應(yīng)位置的數(shù)據(jù)類(lèi)型應(yīng)該是一致的。四:聚合綁定和組分綁定,執(zhí)行完這個(gè)步驟后查詢(xún)處理器樹(shù)便生成了。

第三步:查詢(xún)優(yōu)化,這個(gè)過(guò)程由查詢(xún)優(yōu)化器組件來(lái)完成的。查詢(xún)中應(yīng)該以何種順序訪問(wèn)表,使用哪種方法和使用哪個(gè)索引,應(yīng)該由哪個(gè)聯(lián)接算法等都是由查詢(xún)優(yōu)化器組件來(lái)決定的,但是這個(gè)決定也不是隨意的,它必須滿(mǎn)足的前提條件是保證最后得到的結(jié)果集必須是正確的,也就是說(shuō)該結(jié)果集必須遵循邏輯處理的各個(gè)階段所得到的結(jié)果集相同。優(yōu)化器會(huì)嘗試該查詢(xún)的許多變體,一查找成本最低的計(jì)劃。

如果優(yōu)化器分析該查詢(xún)的元數(shù)據(jù)得知只有一個(gè)可執(zhí)行的計(jì)劃,那么它就不會(huì)再?lài)L試尋求更好的計(jì)劃,這個(gè)步驟叫做細(xì)微計(jì)劃優(yōu)化。如果沒(méi)有找到細(xì)微計(jì)劃優(yōu)化,SQL Server將執(zhí)行一些簡(jiǎn)化,簡(jiǎn)化就是對(duì)自身語(yǔ)法作一些轉(zhuǎn)換,比如在聯(lián)接前計(jì)算表的where篩選器,如前一篇描述的,邏輯查詢(xún)中where篩選總是在聯(lián)接之后計(jì)算,但是先計(jì)算where篩選器在聯(lián)接同樣能得到的正確的結(jié)果,而這樣的效率往往是更高的,所以在物理處理中where往往在join前執(zhí)行的,開(kāi)篇提到的那個(gè)問(wèn)題只是讀者未理解邏輯處理和物理處理的差別而已。

到此為止,物理處理的各個(gè)步驟也做了一個(gè)簡(jiǎn)要的敘述,總結(jié)下,無(wú)論是存儲(chǔ)過(guò)程還是即席查詢(xún)都是執(zhí)行的一個(gè)查詢(xún)計(jì)劃的副本,如果這個(gè)查詢(xún)計(jì)劃不存在的話就必須經(jīng)過(guò)編譯生成一個(gè)執(zhí)行計(jì)劃,在編譯階段必須經(jīng)過(guò)分析,綁定(代數(shù)化),查詢(xún)優(yōu)化這些過(guò)程,最終得到我們需要查找的結(jié)果。關(guān)于查詢(xún)優(yōu)化組件具體是怎么優(yōu)化查詢(xún)處理器樹(shù)的,我會(huì)在以后的篇幅作詳細(xì)介紹。(51CTO)

發(fā)布:2007-04-21 11:53    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)文章:

泛普沈陽(yáng)OA行業(yè)資訊其他應(yīng)用

沈陽(yáng)OA軟件 沈陽(yáng)OA新聞動(dòng)態(tài) 沈陽(yáng)OA信息化 沈陽(yáng)OA快博 沈陽(yáng)OA行業(yè)資訊 沈陽(yáng)軟件開(kāi)發(fā)公司 沈陽(yáng)門(mén)禁系統(tǒng) 沈陽(yáng)物業(yè)管理軟件 沈陽(yáng)倉(cāng)庫(kù)管理軟件 沈陽(yáng)餐飲管理軟件 沈陽(yáng)網(wǎng)站建設(shè)公司