亚洲激情视频图片,ak福利视频,怡红院免费全部视频在线视频

一、引言

對(duì)數(shù)據(jù)庫(kù)索引的關(guān)注從未淡出我的們的討論，那么數(shù)據(jù)庫(kù)索引是什么樣的？聚集索引與非聚集索引有什么不同？希望本文對(duì)各位同仁有一定的幫助。有不少存疑的地方，誠(chéng)心希望各位不吝賜教指正，共同進(jìn)步。[最近首頁(yè)之爭(zhēng)沸沸揚(yáng)揚(yáng)，也不知道這個(gè)放在這合適么，苦勞？功勞？……]

二、B-Tree

我們常見的數(shù)據(jù)庫(kù)系統(tǒng)，其索引使用的數(shù)據(jù)結(jié)構(gòu)多是B-Tree或者B+Tree。例如，MsSql使用的是B+Tree，Oracle及Sysbase使用的是B-Tree。所以在最開始，簡(jiǎn)單地介紹一下B-Tree。

B-Tree不同于Binary Tree（二叉樹，最多有兩個(gè)子樹），一棵M階的B-Tree滿足以下條件：
1）每個(gè)結(jié)點(diǎn)至多有M個(gè)孩子；
2）除根結(jié)點(diǎn)和葉結(jié)點(diǎn)外，其它每個(gè)結(jié)點(diǎn)至少有M/2個(gè)孩子；
3）根結(jié)點(diǎn)至少有兩個(gè)孩子（除非該樹僅包含一個(gè)結(jié)點(diǎn)）；
4）所有葉結(jié)點(diǎn)在同一層，葉結(jié)點(diǎn)不包含任何關(guān)鍵字信息；
5）有K個(gè)關(guān)鍵字的非葉結(jié)點(diǎn)恰好包含K+1個(gè)孩子；

另外，對(duì)于一個(gè)結(jié)點(diǎn)，其內(nèi)部的關(guān)鍵字是從小到大排序的。以下是B-Tree（M=4）的樣例：

對(duì)于每個(gè)結(jié)點(diǎn)，主要包含一個(gè)關(guān)鍵字?jǐn)?shù)組Key[]，一個(gè)指針數(shù)組（指向兒子）Son[]。在B-Tree內(nèi)，查找的流程是：使用順序查找（數(shù)組長(zhǎng)度較短時(shí)）或折半查找方法查找Key[]數(shù)組，若找到關(guān)鍵字K，則返回該結(jié)點(diǎn)的地址及K在Key[]中的位置；否則，可確定K在某個(gè)Key[i]和Key[i+1]之間，則從Son[i]所指的子結(jié)點(diǎn)繼續(xù)查找，直到在某結(jié)點(diǎn)中查找成功；或直至找到葉結(jié)點(diǎn)且葉結(jié)點(diǎn)中的查找仍不成功時(shí)，查找過程失敗。

接著，我們使用以下圖片演示如何生成B-Tree（M=4，依次插入1~6）：
從圖可見，當(dāng)我們插入關(guān)鍵字4時(shí)，由于原結(jié)點(diǎn)已經(jīng)滿了，故進(jìn)行分裂，基本按一半的原則進(jìn)行分裂，然后取出中間的關(guān)鍵字2，升級(jí)（這里是成為根結(jié)點(diǎn)）。其它的依類推，就是這樣一個(gè)大概的過程。

三、數(shù)據(jù)庫(kù)索引

1．什么是索引

在數(shù)據(jù)庫(kù)中，索引的含義與日常意義上的“索引”一詞并無(wú)多大區(qū)別（想想小時(shí)候查字典），它是用于提高數(shù)據(jù)庫(kù)表數(shù)據(jù)訪問速度的數(shù)據(jù)庫(kù)對(duì)象。
A）索引可以避免全表掃描。多數(shù)查詢可以僅掃描少量索引頁(yè)及數(shù)據(jù)頁(yè)，而不是遍歷所有數(shù)據(jù)頁(yè)。
B）對(duì)于非聚集索引，有些查詢甚至可以不訪問數(shù)據(jù)頁(yè)。
C）聚集索引可以避免數(shù)據(jù)插入操作集中于表的最后一個(gè)數(shù)據(jù)頁(yè)。
D）一些情況下，索引還可用于避免排序操作。

當(dāng)然，眾所周知，雖然索引可以提高查詢速度，但是它們也會(huì)導(dǎo)致數(shù)據(jù)庫(kù)系統(tǒng)更新數(shù)據(jù)的性能下降，因?yàn)榇蟛糠謹(jǐn)?shù)據(jù)更新需要同時(shí)更新索引。

2.索引的存儲(chǔ)

一條索引記錄中包含的基本信息包括：鍵值（即你定義索引時(shí)指定的所有字段的值）+邏輯指針（指向數(shù)據(jù)頁(yè)或者另一索引頁(yè)）。

當(dāng)你為一張空表創(chuàng)建索引時(shí)，數(shù)據(jù)庫(kù)系統(tǒng)將為你分配一個(gè)索引頁(yè)，該索引頁(yè)在你插入數(shù)據(jù)前一直是空的。此頁(yè)此時(shí)既是根結(jié)點(diǎn)，也是葉結(jié)點(diǎn)。每當(dāng)你往表中插入一行數(shù)據(jù)，數(shù)據(jù)庫(kù)系統(tǒng)即向此根結(jié)點(diǎn)中插入一行索引記錄。當(dāng)根結(jié)點(diǎn)滿時(shí)，數(shù)據(jù)庫(kù)系統(tǒng)大抵按以下步驟進(jìn)行分裂：
A）創(chuàng)建兩個(gè)兒子結(jié)點(diǎn)
B）將原根結(jié)點(diǎn)中的數(shù)據(jù)近似地拆成兩半，分別寫入新的兩個(gè)兒子結(jié)點(diǎn)
C）根結(jié)點(diǎn)中加上指向兩個(gè)兒子結(jié)點(diǎn)的指針

通常狀況下，由于索引記錄僅包含索引字段值（以及4-9字節(jié)的指針），索引實(shí)體比真實(shí)的數(shù)據(jù)行要小許多，索引頁(yè)相較數(shù)據(jù)頁(yè)來說要密集許多。一個(gè)索引頁(yè)可以存儲(chǔ)數(shù)量更多的索引記錄，這意味著在索引中查找時(shí)在I/O上占很大的優(yōu)勢(shì)，理解這一點(diǎn)有助于從本質(zhì)上了解使用索引的優(yōu)勢(shì)。

3．索引的類型

A）聚集索引，表數(shù)據(jù)按照索引的順序來存儲(chǔ)的。對(duì)于聚集索引，葉子結(jié)點(diǎn)即存儲(chǔ)了真實(shí)的數(shù)據(jù)行，不再有另外單獨(dú)的數(shù)據(jù)頁(yè)。
B）非聚集索引，表數(shù)據(jù)存儲(chǔ)順序與索引順序無(wú)關(guān)。對(duì)于非聚集索引，葉結(jié)點(diǎn)包含索引字段值及指向數(shù)據(jù)頁(yè)數(shù)據(jù)行的邏輯指針，該層緊鄰數(shù)據(jù)頁(yè)，其行數(shù)量與數(shù)據(jù)表行數(shù)據(jù)量一致。

在一張表上只能創(chuàng)建一個(gè)聚集索引，因?yàn)檎鎸?shí)數(shù)據(jù)的物理順序只可能是一種。如果一張表沒有聚集索引，那么它被稱為“堆集”（Heap）。這樣的表中的數(shù)據(jù)行沒有特定的順序，所有的新行將被添加的表的末尾位置。

4．聚集索引

在聚集索引中，葉結(jié)點(diǎn)也即數(shù)據(jù)結(jié)點(diǎn)，所有數(shù)據(jù)行的存儲(chǔ)順序與索引的存儲(chǔ)順序一致。

1）聚集索引與查詢操作

如上圖，我們?cè)诿肿侄紊辖⒕奂饕?dāng)需要在根據(jù)此字段查找特定的記錄時(shí)，數(shù)據(jù)庫(kù)系統(tǒng)會(huì)根據(jù)特定的系統(tǒng)表查找的此索引的根，然后根據(jù)指針查找下一個(gè)，直到找到。例如我們要查詢“Green”，由于它介于[BenNET,Karsen]，據(jù)此我們找到了索引頁(yè)1007，在該頁(yè)中“Green”介于[Greane, Hunter]間，據(jù)此我們找到葉結(jié)點(diǎn)1133（也即數(shù)據(jù)結(jié)點(diǎn)），并最終在此頁(yè)中找以了目標(biāo)數(shù)據(jù)行。

此次查詢的IO包括3個(gè)索引頁(yè)的查詢（其中最后一次實(shí)際上是在數(shù)據(jù)頁(yè)中查詢）。這里的查找可能是從磁盤讀取(Physical Read)或是從緩存中讀取(Logical Read)，如果此表訪問頻率較高，那么索引樹中較高層的索引很可能在緩存中被找到。所以真正的IO可能小于上面的情況。

2）聚集索引與插入操作

最簡(jiǎn)單的情況下，插入操作根據(jù)索引找到對(duì)應(yīng)的數(shù)據(jù)頁(yè)，然后通過挪動(dòng)已有的記錄為新數(shù)據(jù)騰出空間，最后插入數(shù)據(jù)。

如果數(shù)據(jù)頁(yè)已滿，則需要拆分?jǐn)?shù)據(jù)頁(yè)（頁(yè)拆分是一種耗費(fèi)資源的操作，一般數(shù)據(jù)庫(kù)系統(tǒng)中會(huì)有相應(yīng)的機(jī)制要盡量減少頁(yè)拆分的次數(shù)，通常是通過為每頁(yè)預(yù)留空間來實(shí)現(xiàn)）：
A）在該使用的數(shù)據(jù)段（extent）上分配新的數(shù)據(jù)頁(yè)，如果數(shù)據(jù)段已滿，則需要分配新段。
B）調(diào)整索引指針，這需要將相應(yīng)的索引頁(yè)讀入內(nèi)存并加鎖。
C）大約有一半的數(shù)據(jù)行被歸入新的數(shù)據(jù)頁(yè)中。
D）如果表還有非聚集索引，則需要更新這些索引指向新的數(shù)據(jù)頁(yè)。

特殊情況：
A）如果新插入的一條記錄包含很大的數(shù)據(jù)，可能會(huì)分配兩個(gè)新數(shù)據(jù)頁(yè)，其中之一用來存儲(chǔ)新記錄，另一存儲(chǔ)從原頁(yè)中拆分出來的數(shù)據(jù)。
B）通常數(shù)據(jù)庫(kù)系統(tǒng)中會(huì)將重復(fù)的數(shù)據(jù)記錄存儲(chǔ)于相同的頁(yè)中。
C）類似于自增列為聚集索引的，數(shù)據(jù)庫(kù)系統(tǒng)可能并不拆分?jǐn)?shù)據(jù)頁(yè)，頁(yè)只是簡(jiǎn)單的新添數(shù)據(jù)頁(yè)。

3）聚集索引與刪除操作

刪除行將導(dǎo)致其下方的數(shù)據(jù)行向上移動(dòng)以填充刪除記錄造成的空白。

如果刪除的行是該數(shù)據(jù)頁(yè)中的最后一行，那么該數(shù)據(jù)頁(yè)將被回收，相應(yīng)的索引頁(yè)中的記錄將被刪除。如果回收的數(shù)據(jù)頁(yè)位于跟該表的其它數(shù)據(jù)頁(yè)相同的段上，那么它可能在隨后的時(shí)間內(nèi)被利用。如果該數(shù)據(jù)頁(yè)是該段的唯一一個(gè)數(shù)據(jù)頁(yè)，則該段也被回收。

對(duì)于數(shù)據(jù)的刪除操作，可能導(dǎo)致索引頁(yè)中僅有一條記錄，這時(shí)，該記錄可能會(huì)被移至鄰近的索引頁(yè)中，原索引頁(yè)將被回收，即所謂的“索引合并”。

5．非聚集索引

非聚集索引與聚集索引相比：
A）葉子結(jié)點(diǎn)并非數(shù)據(jù)結(jié)點(diǎn)
B）葉子結(jié)點(diǎn)為每一真正的數(shù)據(jù)行存儲(chǔ)一個(gè)“鍵-指針”對(duì)
C）葉子結(jié)點(diǎn)中還存儲(chǔ)了一個(gè)指針偏移量，根據(jù)頁(yè)指針及指針偏移量可以定位到具體的數(shù)據(jù)行。
D）類似的，在除葉結(jié)點(diǎn)外的其它索引結(jié)點(diǎn)，存儲(chǔ)的也是類似的內(nèi)容，只不過它是指向下一級(jí)的索引頁(yè)的。

聚集索引是一種稀疏索引，數(shù)據(jù)頁(yè)上一級(jí)的索引頁(yè)存儲(chǔ)的是頁(yè)指針，而不是行指針。而對(duì)于非聚集索引，則是密集索引，在數(shù)據(jù)頁(yè)的上一級(jí)索引頁(yè)它為每一個(gè)數(shù)據(jù)行存儲(chǔ)一條索引記錄。

對(duì)于根與中間級(jí)的索引記錄，它的結(jié)構(gòu)包括：
A）索引字段值
B）RowId（即對(duì)應(yīng)數(shù)據(jù)頁(yè)的頁(yè)指針+指針偏移量）。在高層的索引頁(yè)中包含RowId是為了當(dāng)索引允許重復(fù)值時(shí)，當(dāng)更改數(shù)據(jù)時(shí)精確定位數(shù)據(jù)行。
C）下一級(jí)索引頁(yè)的指針

對(duì)于葉子層的索引對(duì)象，它的結(jié)構(gòu)包括：
A）索引字段值
B）RowId

1）非聚集索引與查詢操作

針對(duì)上圖，如果我們同樣查找“Green”，那么一次查詢操作將包含以下IO：3個(gè)索引頁(yè)的讀取+1個(gè)數(shù)據(jù)頁(yè)的讀取。同樣，由于緩存的關(guān)系，真實(shí)的IO實(shí)際可能要小于上面列出的。

2）非聚集索引與插入操作

如果一張表包含一個(gè)非聚集索引但沒有聚集索引，則新的數(shù)據(jù)將被插入到最末一個(gè)數(shù)據(jù)頁(yè)中，然后非聚集索引將被更新。如果也包含聚集索引，該聚集索引將被用于查找新行將要處于什么位置，隨后，聚集索引、以及非聚集索引將被更新。

3）非聚集索引與刪除操作

如果在刪除命令的Where子句中包含的列上，建有非聚集索引，那么該非聚集索引將被用于查找數(shù)據(jù)行的位置，數(shù)據(jù)刪除之后，位于索引葉子上的對(duì)應(yīng)記錄也將被刪除。如果該表上有其它非聚集索引，則它們?nèi)~子結(jié)點(diǎn)上的相應(yīng)數(shù)據(jù)也要?jiǎng)h除。

如果刪除的數(shù)據(jù)是該數(shù)所頁(yè)中的唯一一條，則該頁(yè)也被回收，同時(shí)需要更新各個(gè)索引樹上的指針。

由于沒有自動(dòng)的合并功能，如果應(yīng)用程序中有頻繁的隨機(jī)刪除操作，最后可能導(dǎo)致表包含多個(gè)數(shù)據(jù)頁(yè)，但每個(gè)頁(yè)中只有少量數(shù)據(jù)。

6．索引覆蓋

索引覆蓋是這樣一種索引策略：當(dāng)某一查詢中包含的所需字段皆包含于一個(gè)索引中，此時(shí)索引將大大提高查詢性能。

包含多個(gè)字段的索引，稱為復(fù)合索引。索引最多可以包含31個(gè)字段，索引記錄最大長(zhǎng)度為600B。如果你在若干個(gè)字段上創(chuàng)建了一個(gè)復(fù)合的非聚集索引，且你的查詢中所需Select字段及Where,Order By,Group By,Having子句中所涉及的字段都包含在索引中，則只搜索索引頁(yè)即可滿足查詢，而不需要訪問數(shù)據(jù)頁(yè)。由于非聚集索引的葉結(jié)點(diǎn)包含所有數(shù)據(jù)行中的索引列值，使用這些結(jié)點(diǎn)即可返回真正的數(shù)據(jù)，這種情況稱之為“索引覆蓋”。

在索引覆蓋的情況下，包含兩種索引掃描：
A）匹配索引掃描
B）非匹配索引掃描

1）匹配索引掃描

此類索引掃描可以讓我們省去訪問數(shù)據(jù)頁(yè)的步驟，當(dāng)查詢僅返回一行數(shù)據(jù)時(shí)，性能提高是有限的，但在范圍查詢的情況下，性能提高將隨結(jié)果集數(shù)量的增長(zhǎng)而增長(zhǎng)。

針對(duì)此類掃描，索引必須包含查詢中涉及的的所有字段，另外，還需要滿足：Where子句中包含索引中的“引導(dǎo)列”（Leading Column），例如一個(gè)復(fù)合索引包含A,B,C,D四列，則A為“引導(dǎo)列”。如果Where子句中所包含列是BCD或者BD等情況，則只能使用非匹配索引掃描。

2）非配置索引掃描

正如上述，如果Where子句中不包含索引的導(dǎo)引列，那么將使用非配置索引掃描。這最終導(dǎo)致掃描索引樹上的所有葉子結(jié)點(diǎn)，當(dāng)然，它的性能通常仍強(qiáng)于掃描所有的數(shù)據(jù)頁(yè)。

[參考]
[1]http://manuals.sybase.com/onlinebooks/group-asarc/asg1200e/aseperf/@Generic__BookTextView/3358
[2] http://publib.boulder.ibm.com/infocenter/idshelp/v10/index.jsp?topic=/com.ibm.adref.doc/adref235.htm

it知識(shí)庫(kù)：漫談數(shù)據(jù)庫(kù)索引，轉(zhuǎn)載需保留來源！

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如作者信息標(biāo)記有誤，請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除，多謝。

一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

漫談數(shù)據(jù)庫(kù)索引

相關(guān)文章閱讀