本文只討論Oracle中最常見的索引,即是B-tree索引。本文中涉及的數據庫版本是Oracle8i。
一. 查看系統表中的用戶索引
在Oracle中,SYSTEM表是安裝數據庫時自動建立的,它包含數據庫的全部數據字典,存儲過程、包、函數和觸發器的定義以及系統回滾段。
一般來說,應該盡量避免在SYSTEM表中存儲非SYSTEM用戶的對象。因為這樣會帶來數據庫維護和管理的很多問題。一旦SYSTEM表損壞了,只能重新生成數據庫。我們可以用下面的語句來檢查在SYSTEM表內有沒有其他用戶的索引存在。
select count(*)
from dba_indexes
where tablespace_name = 'SYSTEM'
and owner not in ('SYS','SYSTEM')
/
二. 索引的存儲情況檢查
Oracle為數據庫中的所有數據分配邏輯結構空間。數據庫空間的單位是數據塊(block)、范圍(extent)和段(segment)。
Oracle數據塊(block)是Oracle使用和分配的最小存儲單位。它是由數據庫建立時設置的DB_BLOCK_SIZE決定的。一旦數據庫生成了,數據塊的大小不能改變。要想改變只能重新建立數據庫。(在Oracle9i中有一些不同,不過這不在本文討論的范圍內。)
Extent是由一組連續的block組成的。一個或多個extent組成一個segment。當一個segment中的所有空間被用完時,Oracle為它分配一個新的extent。
Segment是由一個或多個extent組成的。它包含某表空間中特定邏輯存儲結構的所有數據。一個段中的extent可以是不連續的,甚至可以在不同的數據文件中。
一個object只能對應于一個邏輯存儲的segment,我們通過查看該segment中的extent,可以看出相應object的存儲情況。
(1)查看索引段中extent的數量:
select segment_name, count(*)
from dba_extents
where segment_type='INDEX'
and owner=UPPER('&owner')
group by segment_name
/
(2)查看表空間內的索引的擴展情況:
select
substr(segment_name,1,20) "SEGMENT NAME",
bytes,
count(bytes)
from dba_extents
where segment_name in
( select index_name
from dba_indexes
where tablespace_name=UPPER('&表空間'))
group by segment_name,bytes
order by segment_name
/
三. 索引的選擇性
索引的選擇性是指索引列中不同值的數目與表中記錄數的比。如果一個表中有2000條記錄,表索引列有1980個不同的值,那么這個索引的選擇性就是1980/2000=0.99。
一個索引的選擇性越接近于1,這個索引的效率就越高。
如果是使用基于cost的最優化,優化器不應該使用選擇性不好的索引。如果是使用基于rule的最優化,優化器在確定執行路徑時不會考慮索引的選擇性(除非是唯一性索引),并且不得不手工優化查詢以避免使用非選擇性的索引。
確定索引的選擇性,可以有兩種方法:手工測量和自動測量。
(1)手工測量索引的選擇性
如果要根據一個表的兩列創建兩列并置索引,可以用以下方法測量索引的選擇性:
列的選擇性=不同值的數目/行的總數 /* 越接近1越好 */
select count(distinct 第一列||'%'||第二列)/count(*)
from 表名
/
如果我們知道其中一列索引的選擇性(例如其中一列是主鍵),那么我們就可以知道另一列索引的選擇性。
手工方法的優點是在創建索引前就能評估索引的選擇性。
(2)自動測量索引的選擇性
如果分析一個表,也會自動分析所有表的索引。
第一,為了確定一個表的確定性,就要分析表。
analyze table 表名
compute statistics
/
第二,確定索引里不同關鍵字的數目:
select distinct_keys
from user_indexes
where table_name='表名'
and index_name='索引名'
/
第三,確定表中行的總數:
select num_rows
from user_tables
where table_name='表名'
/
第四,索引的選擇性=索引里不同關鍵字的數目/表中行的總數:
select i.distinct_keys/t.num_rows
from
user_indexes i,
user_tables t
where i.table_name='表名'
and i.index_name='索引名'
and i.table_name=t.table_name
/
第五,可以查詢USER_TAB_COLUMNS以了解每個列的選擇性。
表中所有行在該列的不同值的數目:
select
column_name,
num_distinct
from user_tab_columns
where table_name='表名'
/
列的選擇性=NUM_DISTINCT/表中所有行的總數,查詢USER_TAB_COLUMNS有助測量每個列的選擇性,但它并不能精確地測量列的并置組合的選擇性。要想測量一組列的選擇性,需要采用手工方法或者根據這組列創建一個索引并重新分析表。