變更數(shù)據(jù)捕獲 (CDC) 廣義上定義為跟蹤數(shù)據(jù)庫中的變更。跟蹤更改的目的多種多樣。嵌入式數(shù)據(jù)庫系統(tǒng)中的 CDC 可以通過幾種不同的方式實現(xiàn),這些方式有時對應(yīng)用程序是不可見的,也可以通過這些方式實現(xiàn)應(yīng)用程序用于數(shù)據(jù)共享、響應(yīng)事件和增量備份。
在嵌入式數(shù)據(jù)庫中實現(xiàn)CDC的第一個(也可能是最明顯的)是實現(xiàn)事務(wù)的ACID屬性的一部分:原子性,一致性,隔離性和持久性。將事務(wù)成功應(yīng)用于數(shù)據(jù)庫會將該數(shù)據(jù)庫從一個一致狀態(tài)移動到一個新的一致狀態(tài)。相反,不成功將事務(wù)應(yīng)用于數(shù)據(jù)庫必須將數(shù)據(jù)庫返回到在成功應(yīng)用事務(wù)之前存在的一致狀態(tài)。為了滿足這些要求,數(shù)據(jù)庫管理系統(tǒng)必須跟蹤更改。實現(xiàn)細節(jié)因數(shù)據(jù)庫系統(tǒng)而異,甚至在數(shù)據(jù)庫系統(tǒng)系列中,從純內(nèi)存中數(shù)據(jù)庫、持久內(nèi)存中數(shù)據(jù)庫以及部分或完全持久數(shù)據(jù)庫(混合數(shù)據(jù)庫)也有所不同。
對于純內(nèi)存數(shù)據(jù)庫,沒有記錄更改的事務(wù)日志。因此,在事務(wù)處于活動狀態(tài)時,更改或更改記錄的前映像都需要保存在緩沖區(qū)中,以便在事務(wù)中止時可以將數(shù)據(jù)庫還原到其事務(wù)前狀態(tài)。
對于具有持久性的內(nèi)存中數(shù)據(jù)庫,所有更改也會追加到存儲在持久性媒體上的事務(wù)日志中,該事務(wù)日志可在崩潰后重播以進行恢復(fù)。
對于持久性(基于磁盤的)數(shù)據(jù)庫,還利用事務(wù)日志記錄來優(yōu)化性能和支持從崩潰中恢復(fù)。在這種情況下,可以提供兩種形式的事務(wù)日志記錄:撤消日志記錄和預(yù)寫日志記錄 (WAL)。WAL 如上一段所述。撤消日志記錄將已更改記錄的前映像寫入事務(wù)日志文件。在發(fā)生崩潰時,UNDO 日志信息用于回滾不完整的事務(wù)(即將數(shù)據(jù)庫返回到上一個一致狀態(tài))。
CDC在某些數(shù)據(jù)庫系統(tǒng)中的另一個內(nèi)部用途是通過MVCC(多版本并發(fā)控制)實現(xiàn)樂觀并發(fā)控制。樂觀并發(fā)控制意味著應(yīng)用程序不必獲取鎖,這也意味著應(yīng)用程序永遠不必等待另一個應(yīng)用程序持有的鎖。這要求數(shù)據(jù)庫系統(tǒng)知道兩個應(yīng)用程序是否同時嘗試修改同一個數(shù)據(jù)庫對象。這是通過跟蹤提交事務(wù)時檢查的版本號來完成的(因此稱為多版本并發(fā)控制)。如果對象的版本在應(yīng)用程序獲取對象副本和應(yīng)用程序想要提交對該對象的更改之間發(fā)生了更改,則意味著另一個應(yīng)用程序首先修改了基礎(chǔ)對象,必須中止并重試此事務(wù)。MVCC 背后的理論是,這種沖突很少見,并且偶爾重試比總是必須獲取鎖并可能使用這些鎖阻止其他應(yīng)用程序更有效。
CDC 還用于需要“五個 9”可用性(即 99.999% 正常運行時間)的系統(tǒng)的高可用性 (HA) 實施中。HA 由不同的數(shù)據(jù)庫供應(yīng)商以不同的方式實現(xiàn):實時事務(wù)復(fù)制、SQL 語句復(fù)制、日志文件轉(zhuǎn)發(fā)等。有所謂的 1-safe(又名惰性、異步)和 2-safe(又名 eager、同步)實現(xiàn)。例如,實時事務(wù)復(fù)制可以是 1 安全或 2 安全(在eXtremeDB 中,我們將其稱為時間識別兩階段提交);日志轉(zhuǎn)發(fā)本質(zhì)上是 1 安全的。
CDC 可在嵌入式數(shù)據(jù)庫和/或第三方系統(tǒng)中用于可在應(yīng)用程序中使用的其他目的:開放復(fù)制、觸發(fā)器/事件通知和增量備份。
一些嵌入式數(shù)據(jù)庫系統(tǒng)實現(xiàn)復(fù)制,例如,支持高可用性和/或數(shù)據(jù)庫集群。此類系統(tǒng)使得在同一數(shù)據(jù)庫系統(tǒng)的兩個或多個實例之間復(fù)制數(shù)據(jù)或事務(wù)變得容易,但是當(dāng)需要從嵌入式數(shù)據(jù)庫復(fù)制到任何其他目標(biāo)時,它們不是解決方案。有第三方產(chǎn)品試圖填補這一空白,例如Actian DataConnect和Oracle Golden Gate?;蛘咄ㄟ^自定義提取-轉(zhuǎn)換-加載 (ETL) 解決方案,該解決方案可能對源和/或目標(biāo)數(shù)據(jù)庫中的更改敏感。
觸發(fā)器和事件通知方案是變更數(shù)據(jù)捕獲的典型用例。畢竟,觸發(fā)器是在指定表的 INSERT、UPDATE 或 DELETE 語句執(zhí)行時觸發(fā)的。換句話說,數(shù)據(jù)已經(jīng)改變,觸發(fā)器捕獲了該變化,以便周圍系統(tǒng)以某種方式采取行動。
嵌入式數(shù)據(jù)庫系統(tǒng)中變更數(shù)據(jù)捕獲的最后一個重要目的是實現(xiàn)增量備份設(shè)施。增量備份方案必須知道在上次完整快照或上次增量備份之間數(shù)據(jù)庫中發(fā)生的增量更改。
結(jié)論
變更數(shù)據(jù)捕獲是任何數(shù)據(jù)庫管理系統(tǒng)的核心。它有助于實現(xiàn)并發(fā)性和持久性、復(fù)制、觸發(fā)器/事件通知以及備份和還原的 ACID 屬性。
審核編輯:郭婷
-
嵌入式
+關(guān)注
關(guān)注
5068文章
19020瀏覽量
303308 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3765瀏覽量
64276 -
觸發(fā)器
+關(guān)注
關(guān)注
14文章
1996瀏覽量
61052
發(fā)布評論請先 登錄
相關(guān)推薦
評論