1. 查詢問題的挑戰
關系數據庫的查詢優化始終是一個重要而實際的問題,在那些以查詢為主的應用系統中,這幾乎是一個成敗攸關的問題。但迄今為止,關于這個問題的討論中所提出的種種解決方案大致可分為兩大類,即利用硬件體系結構上的優勢及DBMS對并行處理的支持能力的一類方案及完全由應用設計來處理的方案。在本文作者以前所發表的文章中曾推薦過利用臨時中介表和表更新方法和快查詢處理的策略。在同一篇文章中,我們也曾提到有可能利用程序變換支持查詢優化的想法。所有這些建議和想法都屬于應用設計類的處理辦法,這些方法從某種意義上說有一定的一般性。但是,實際應用不斷地提出這樣或那樣難而“怪”的問題,這些問題極富挑戰性,用常規方法往往要以很昂貴的系統資源為代價才有望解決。
本文的目的是向讀者介紹一種由E.Birger等人首先提出的方法,即加速查詢處理的特征函數法。這個方法適用于大多數SQL的數據庫系統,如果這類系統還包括為數不多的幾個(最少為2個)內部函數,如abs()及sign()等,則這個方法就是直接可用的了。在E.Birger等人關于這個方法的研究報告中,曾給出很多極有難度而又很典型的查詢要求及其求解辦法,其中包括分技條件查詢、求行內量的邊界值、求直方圖、表轉置、求中位值、有序集的等段截分以及去邊界值問題等。這些問題的共性是,若用常規方法求解,系統無論在存儲開銷上還是處理開銷上都很大,而某些問題(如中值)的求解還相當難。本文將重述這些有趣的查詢問題及其解決方案。同時,我們還將討論“特征函數”作為一種使能技術的其他一些應用可能。
2.特征函數及其表示
特征函數是來自點集拓撲學的一個純數學概念,集合S的特征函數定義如下:
|
在這里,任意元素x是否屬于集合S,決定函數取不同的值。同時,這里也隱含了一個前提,即任何元素的集合S為范圍的歸屬是完全確定的,不存在元素x的歸屬不明的情況。顯而易見,特征函數是一種識別(或判定)裝置。正是這一特性,使它能夠成為數據庫查詢中選擇準則的一種等價(和更有效的)替換成分。因此,我們說特征函數是加速查詢的實施技術。
為了更直接地針對數據庫查詢問題,我們將特征函數的一般形式變換成如下的“數據庫版本”:
|
文章來源于領測軟件測試網 http://www.kjueaiud.com/