更新時間:2021-03-08 17:20:33 來源:動力節(jié)點 瀏覽1232次
Join是一種試圖將兩個表結合在一起的謂詞,一次只能連接2個表,表連接也可以被稱為表關聯(lián)。有多種方法可以將2個表連接起來,當然每種方法都有自己的優(yōu)缺點,每種連接類型只有在特定的條件下才會發(fā)揮出其最大優(yōu)勢。本文我們就來講一講4種Oracle表連接方式。
row source(表)之間的連接順序對于查詢的效率有非常大的影響。通過首先存取特定的表,即將該表作為驅動表,這樣可以先應用某些限制條件,從而得到一個較小的row source,使連接的效率較高,這也就是我們常說的要先執(zhí)行限制條件的原因。一般是在將表讀入內存時,應用where子句中對該表的限制條件。
目前為止,無論連接操作符如何,典型的連接類型共有3種:
排序 - - 合并連接(Sort Merge Join (SMJ) )、嵌套循環(huán)(Nested Loops (NL) )和哈希連接(Hash Join),另外,還有一種Cartesian product(笛卡爾積),一般情況下,盡量避免使用。下面我們來一一介紹這些4種Oracle表連接方式。
1、排序 - - 合并連接(Sort Merge Join, SMJ)
內部連接過程:
1) 首先生成row source1需要的數(shù)據(jù),然后對這些數(shù)據(jù)按照連接操作關聯(lián)列(如A.col3)進行排序。
2) 隨后生成row source2需要的數(shù)據(jù),然后對這些數(shù)據(jù)按照與sort source1對應的連接操作關聯(lián)列(如B.col4)進行排序。
3) 最后兩邊已排序的行被放在一起執(zhí)行合并操作,即將2個row source按照連接條件連接起來
排序是一個費時、費資源的操作,特別對于大表?;谶@個原因,SMJ經(jīng)常不是一個特別有效的連接方法,但是如果2個row source都已經(jīng)預先排序,則這種連接方法的效率也是蠻高的。
2、嵌套循環(huán)(Nested Loops, NL)
這個連接方法有驅動表(外部表)的概念。其實,該連接過程就是一個2層嵌套循環(huán),所以外層循環(huán)的次數(shù)越少越好,這也就是我們?yōu)槭裁磳⑿”砘蚍祷剌^小 row source的表作為驅動表(用于外層循環(huán))的理論依據(jù)。但是這個理論只是一般指導原則,因為遵循這個理論并不能總保證使語句產(chǎn)生的I/O次數(shù)最少。有時 不遵守這個理論依據(jù),反而會獲得更好的效率。如果使用這種方法,決定使用哪個表作為驅動表很重要。有時如果驅動表選擇不正確,將會導致語句的性能很差、很差。
3、哈希連接(Hash Join, HJ)
這種連接是在oracle 7.3以后引入的,從理論上來說比NL與SMJ更高效,而且只用在CBO優(yōu)化器中。
較小的row source被用來構建hash table與bitmap,第2個row source被用來被hansed,并與第一個row source生成的hash table進行匹配,以便進行進一步的連接。Bitmap被用來作為一種比較快的查找方法,來檢查在hash table中是否有匹配的行。特別的,當hash table比較大而不能全部容納在內存中時,這種查找方法更為有用。這種連接方法也有NL連接中所謂的驅動表的概念,被構建為hash table與bitmap的表為驅動表,當被構建的hash table與bitmap能被容納在內存中時,這種連接方式的效率極高。
4、笛卡兒乘積(Cartesian Product)
當兩個row source做連接,但是它們之間沒有關聯(lián)條件時,就會在兩個row source中做笛卡兒乘積,這通常由編寫代碼疏漏造成(即程序員忘了寫關聯(lián)條件)。笛卡爾乘積是一個表的每一行依次與另一個表中的所有行匹配。在特殊情況下我們可以使用笛卡兒乘積,如在星形連接中,除此之外,我們要盡量不使用笛卡兒乘積。
不同情況下我們采用的Oracle表連接方式也是不同的,對于非等值連接,排序——合并連接的方式效率是比較高的,而哈希連接只能用于等值連接中。如果外部表比較小,并且在內部表上有唯一索引,或有高選擇性非唯一索引時,選擇嵌套循環(huán)。在本站的Oracle教程中,對于如何選擇Oracle數(shù)據(jù)庫表連接方式有一套系統(tǒng)的方法供大家學習。