精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數據庫不使用外鍵這是為什么?

上海磐啟微電子有限公司 ? 來源:真沒什么邏輯 ? 作者:Draveness ? 2021-09-01 10:00 ? 次閱讀

當我們想要持久化地存儲數據時,使用關系型數據庫往往都是最穩妥的選擇,這不僅因為今天的關系型數據庫種類非常豐富并且穩定,還因為不同社區對關系型數據庫的支持都非常完備。我們在前面的文章中曾經分析過 為什么 MySQL 的自增主鍵不單調也不連續,這篇文章我們來分析關系型數據庫中另一個重要的概念 — 外鍵(Foreign Key)。

在關系型數據庫中,外鍵也被稱為關系鍵,它是關系型數據庫中提供關系表之間連接的多個列[^1],這一組數據列是當前關系表中的外鍵,也必須是另一個關系表中的候選鍵(Candidate Key),我們可以通過候選鍵在當前表中找到唯一的元素[^2]。在通常情況下,我們都會使用關系表中的主鍵作為其他表中的外鍵,這樣才可以滿足關系型數據庫對外鍵的約束。

外鍵不僅僅是數據庫表中的一個整數,它還提供了額外的一致性保證。因為數據庫往往是整個系統的真理之源(Source of Truth),所以保證數據的一致性和正確性非常重要,關系型數據庫雖然提供了外鍵、觸發器等特性保證一致性,但是在今天的生產環境中卻很少被使用。

引用完整性(Referential Integrity)是數據的屬性,如果數據擁有該屬性,那么數據中所有的引用都是合法的,在關系型數據庫的上下文中,這就意味著關系型數據庫中引用另一個表中的值必須存在[^3]。

ALTER TABLE posts

ADD CONSTRAINT FOREIGN KEY (author_id)

REFERENCES authors(id);

上述 SQL 語句可以向關系表中增加外鍵約束,該 SQL 語句的執行前提是 posts 表中存在 author_id 字段。從 SQL 語句中的 CONSTRAINT 關鍵字我們也能推測出外鍵不是一種數據類型,它是不同關系表之間的約束。

不使用外鍵的原因其實很簡單,MySQL、PostgreSQL 等關系型數據庫很難水平擴容,但是無狀態的服務往往都可以很容易地擴容。由于外鍵等特性需要數據庫執行額外的工作,而這些操作會占用數據庫的計算資源,所以我們可以將大部分的需求都遷移到無狀態的服務中完成以降低數據庫的工作負載。

根據更新和刪除時的行為不同,我們可以將外鍵分成 RESTRICT、CASCADE 和 SET NULL 等幾種[^4],當我們為關系表中的字段增加外鍵約束時,需要指定外鍵的類型,最常見的也就是 RESTRICT 和 CASCADE 兩種,其中 RESTRICT 為外鍵的默認類型,不同類型的外鍵會帶來不同的額外開銷,而這些額外開銷就是我們不使用外鍵的理由:

使用 RESTRICT 會在更新或者刪除記錄時對外鍵對應的記錄是否存在進行一致性檢查;

使用 CASCADE 會在更新或者刪除記錄時觸發級聯更新或者刪除操作;

注意:MySQL 中的 NO ACTION 和 RESTRICT 具有相同的語義[^5]。

接下來我們會詳細介紹關系型數據庫如何處理上述兩種不同類型的外鍵,而我們應該如何在應用中模擬這些功能。

一致性檢查

當我們使用默認的外鍵類型 RESTRICT 時,在創建、修改或者刪除記錄時都會檢查引用的合法性。想要在 MySQL 等數據庫中觸發外鍵的一致性檢查其實非常容易,假設我們的數據庫中包含 posts(id, author_id, content) 和 authors(id, name) 兩張表,在執行如下所示的操作時都會觸發數據庫對外鍵的檢查:

向 posts 表中插入數據時,檢查 author_id 是否在 authors 表中存在;

修改 posts 表中的數據時,檢查 author_id 是否在 authors 表中存在;

刪除 authors 表中的數據時,檢查 posts 中是否存在引用當前記錄的外鍵;

作為專門用于管理數據的系統,數據庫與應用服務相比能夠更好地保證完整性,而上述的這些操作都是引入外鍵帶來的額外工作,不過這也是數據庫保證數據完整性的必要代價。上述的這些分析都是理論上的定性分析,我們其實可以簡單的定量分析一下引入外鍵對性能的影響。

在這里我們在數據庫中同時創建 authors、posts 和 foreign_key_posts 三種表,如下所示,其中 posts 和 foreign_key_posts 兩個表中的列完全相同,只是 foreign_key_posts 表為 author_id 字段增加了 RESTRICT 類型的外鍵約束:

我們先在 authors 表中插入一條記錄,隨后分別在 posts 和 foreign_key_posts 中插入多條新數據列引用該條記錄,前者不會檢查外鍵的合法性,而后者會做額外的檢查。你可以在 這里 找到作者用來測試外鍵額外開銷的 Go 語言代碼[^6],經過多次基準測試,我們可以得到如下所示的結果:

BenchmarkBaseline-8 3770 309503 ns/op

BenchmarkForeignKey-8 3331 317162 ns/op

BenchmarkBaseline-8 3192 315506 ns/op

BenchmarkForeignKey-8 3381 315577 ns/op

BenchmarkBaseline-8 3298 312761 ns/op

BenchmarkForeignKey-8 3829 345342 ns/op

BenchmarkBaseline-8 3753 291642 ns/op

BenchmarkForeignKey-8 3948 325239 ns/op

作者執行了 4 次外鍵的基準測試,雖然 4 次測試的結果不是特別穩定,但是使用外鍵的用例在每次測試中都明顯弱于不使用外鍵的用例,外鍵帶來的額外開銷分別為 ~2.47%、~0.02%、~10.41% 和 ~11.52%。這里的基準測試只是一個比較簡單的定量分析,但是我們也可以從結果中看到大概的趨勢 — 外鍵的完整性檢查確實會帶來額外的性能開銷,而這些開銷在高并發的服務中需要慎重考慮。

想要在應用程序中模擬數據庫外鍵的功能其實比較容易,我們只需要遵循以下的幾個準則:

向表中插入數據或者修改表中的數據時,都應該執行額外的 SELECT 語句確保它引用的數據在數據庫中存在;

在刪除數據之前需要執行額外的 SELECT 語句檢查是否存在當前記錄的引用;

需要注意的是為了保證一致性,我們需要在事務中執行上述的查詢和修改語句,這樣才能完整模擬外鍵的功能;當我們向 posts 表中插入或者修改數據時,需要的處理相對比較簡單,我們只需要執行有限的 SELECT 語句并按照如下所示的模式執行對應的操作就可以了:

BEGINSELECT * FROM authors WHERE id = 《post.author_id》 FOR UPDATE;

-- INSERT INTO posts 。。。 / UPDATE posts 。。.END

但是如果我們要刪除 authors 表中的數據,就需要查詢所有引用 authors 數據的表;如果有 10 個表都有指向 authors 表的外鍵,我們就需要在 10 個表中查詢是否存在對應的記錄,這個過程相對比較麻煩,不過也是為了實現完整性的必要代價,不過這種模擬外鍵方法其實遠比使用外鍵更消耗資源,它不僅需要查詢關聯數據,還要通過網絡發送更多的數據包。

級聯操作

當我們在關系型數據庫中創建外鍵約束時,如果使用如下所示的 SQL 語句指定更新或者刪除記錄時使用 CASCADE 行為,那么在客戶端更新或者刪除數據時就會觸發級聯操作:

ALTER TABLE posts

ADD CONSTRAINT FOREIGN KEY (author_id)

REFERENCES authors(id)

ON UPDATE CASCADEON DELETE CASCADE;

當客戶端更新 authors 表中記錄的主鍵時,數據庫會同時更新 posts 表中所有引用該記錄的外鍵;

當客戶端刪除 authors 表中的記錄時,數據庫會刪除所有與 authors 表關聯的記錄;

不過無論是執行更新還是刪除操作,數據庫都可以保證各個關系表之間引用的一致性和合法性不會出現引用到不存在記錄的情況,與 RESTRICT 行為一樣,所有外鍵的更新和刪除行為都可以通過執行額外的檢查和操作保證數據的一致。

雖然級聯刪除的出發點也是保證數據的完整性,但是在設計關系表之間的不同關系時,我們也需要注意級聯刪除引起的數據大規模刪除的問題。當客戶端想要在數據庫中刪除 authos 表中的數據時,如果我們同時在 authors 和 posts 中指定了級聯刪除的行為,那么數據庫會同時刪除所有關聯的 posts 記錄以及與 posts 表關聯的 comments 數據。

這種涉及多級的級聯刪除行為在數據量較小的數據庫中不會導致問題,但是在數據量較大的數據庫中刪除關鍵數據可能會引起雪崩,一條記錄的刪除可能會被放大到幾十倍甚至上百倍,這些對磁盤的隨機讀寫會帶來巨大的開銷,是我們想要盡可能避免的情況。如果我們能夠較好地設計各個表之間的關系并且慎用 CASCADE 行為,這對于保證數據庫中數據的合法性有著很重要的意義,使用該特性可以避免數據庫中出現過期的、不合法的數據,但是在使用時也要合理預估可能造成的最壞情況。

手動實現數據庫的級聯刪除操作是可行的,如果我們在一個事務中按照順序刪除所有的數據,確實可以保證數據的一致性,但是這與外鍵的級聯刪除功能沒有太大的區別,反而會有更差的表現。如果我們能夠接受在一個時間窗口內的數據不一致,就可以將一個大號的刪除任務拆成多個子任務分批執行,降低對數據庫影響的峰值。

DELETE FROM posts WHERE author_id = 1 LIMIT 100;

DELETE FROM posts WHERE author_id = 1 LIMIT 100;

。。。

DELETE FROM authors WHERE id = 1;

與數據庫外鍵的 CASCADE 相比,這種方式會帶來更大的額外開銷,只是我們能降低對數據庫性能的瞬時影響。

總結

外鍵提供的幾種在更新和刪除時的不同行為都可以幫助我們保證數據庫中數據的一致性和引用合法性,但是外鍵的使用也需要數據庫承擔額外的開銷,在大多數服務都可以水平擴容的今天,高并發場景中使用外鍵確實會影響服務的吞吐量上限。在數據庫之外手動實現外鍵的功能是可能的,但是卻會帶來很多維護上的成本或者需要我們在數據一致性上做出一些妥協。我們可以從可用性、一致性幾個方面分析使用外鍵、模擬外鍵以及不使用外鍵的差異:

不使用外鍵犧牲了數據庫中數據的一致性,但是卻能夠減少數據庫的負載;

模擬外鍵將一部分工作移到了數據庫之外,我們可能需要放棄一部分一致性以獲得更高的可用性,但是為了這部分可用性,我們會付出更多的研發與維護成本,也增加了與數據庫之間的網絡通信次數;

使用外鍵保證了數據庫中數據的一致性,也將全部的計算任務全部交給了數據庫;

在大多數不需要高并發或者對一致性有較強要求的系統中,我們可以直接使用數據庫提供的外鍵幫助我們對數據進行校驗,但是在對一致性要求不高的、復雜的場景或者大規模的團隊中,不使用外鍵也確實可以為數據庫減負,而大團隊也有更多的時間和精力去設計其他的方案,例如:分布式的關系型數據庫。

當我們考慮應不應該在數據庫中使用外鍵時,需要關注的核心我們的數據庫承擔這部分計算任務后會不會影響系統的可用性,在使用時也不應該一刀切的決定用或者不用外鍵,應該根據具體的場景做決策,我們在這里介紹了兩個使用外鍵時可能遇到的問題:

RESTRICT 外鍵會在更新和刪除關系表中的數據時對外鍵約束的合法性進行檢查,保證外鍵不會引用到不存在的記錄;

CASCADE 外鍵會在更新和刪除關系表中的數據時觸發對關聯記錄的更新和刪除,在數據量較大的數據庫中可能會有數量級的放大效果;

我們在很多時候其實并不能選擇是否使用外鍵,大多數公司的 DBA 都會對數據庫系統的使用有比較明確的規定,但是我們要清楚做出使用外鍵和不使用外鍵這一抉擇的原因。到最后,我們還是來看一些比較開放的相關問題,有興趣的讀者可以仔細思考一下下面的問題:

數據庫中還有哪些特性是我們在生產環境中不會使用的?為什么?

分布式的關系型數據庫與 MySQL 等傳統數據庫有哪些區別?

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    3767

    瀏覽量

    64280
  • MySQL
    +關注

    關注

    1

    文章

    802

    瀏覽量

    26452
  • DBA
    DBA
    +關注

    關注

    0

    文章

    18

    瀏覽量

    7877
  • select
    +關注

    關注

    0

    文章

    28

    瀏覽量

    3905

原文標題:為什么數據庫不應該使用外鍵

文章出處:【微信號:gh_6a53af9e8109,微信公眾號:上海磐啟微電子有限公司】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LS10串口數據庫模塊擴SD卡功能

    LS10串口數據庫模塊擴SD卡功能
    的頭像 發表于 11-23 09:42 ?150次閱讀
    LS10串口<b class='flag-5'>數據庫</b>模塊<b class='flag-5'>外</b>擴SD卡功能

    數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

    一個運行在存儲上的SQLServer數據庫,有1000多個文件,大小幾十TB。數據庫每10天生成一個NDF文件,每個NDF幾百GB大小。數據庫包含兩個LDF文件。 存儲損壞,數據庫
    的頭像 發表于 10-31 13:21 ?145次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—通過拼接<b class='flag-5'>數據庫</b>碎片恢復SQLserver<b class='flag-5'>數據庫</b>

    數據庫可以租用嗎?完整租用流程來了

    數據庫是可以租用的,這是一種合法且便捷的數據存儲和管理方式。云數據庫是云服務提供商提供的各種服務化的關系型數據庫(如RDS)、文檔
    的頭像 發表于 10-28 09:54 ?127次閱讀

    Oracle數據恢復—異常斷電后Oracle數據庫報錯的數據恢復案例

    Oracle數據庫故障: 機房異常斷電后,Oracle數據庫報錯:“system01.dbf需要更多的恢復來保持一致性,數據庫無法打開”。數據
    的頭像 發表于 09-30 13:31 ?249次閱讀
    Oracle<b class='flag-5'>數據</b>恢復—異常斷電后Oracle<b class='flag-5'>數據庫</b>啟<b class='flag-5'>庫</b>報錯的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫出現823錯誤的數據恢復案例

    SQL Server數據庫故障: SQL Server附加數據庫出現錯誤823,附加數據庫失敗。數據庫沒有備份,無法通過備份恢復數據庫
    的頭像 發表于 09-20 11:46 ?296次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>出現823錯誤的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—raid5陣列上層Sql Server數據庫數據恢復案例

    數據庫數據恢復環境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統服務器使用。windows系統服務器內運行了Sql Server數據庫,存儲空間在操作系統層面劃分了三個邏輯分區
    的頭像 發表于 05-08 11:43 ?479次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復】Oracle數據庫ASM實例無法掛載的數據恢復案例

    oracle數據庫ASM磁盤組掉線,ASM實例不能掛載。數據庫管理員嘗試修復數據庫,但是沒有成功。
    的頭像 發表于 02-01 17:39 ?484次閱讀
    【<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復】Oracle<b class='flag-5'>數據庫</b>ASM實例無法掛載的<b class='flag-5'>數據</b>恢復案例

    無模式數據庫的利與弊

    數據管理需求日益多樣,無論是金融服務、游戲還是社交媒體行業,都要求支持實時數據處理和快速迭代,無模式數據庫因其靈活性和易用性而逐漸成為開發者的新選擇。那么,無模式數據庫到底有哪些特性呢
    的頭像 發表于 12-16 08:04 ?487次閱讀
    無模式<b class='flag-5'>數據庫</b>的利與弊

    數據庫數據恢復—未開啟binlog的Mysql數據庫數據恢復案例

    mysql數據庫數據恢復環境: 本地服務器,windows server操作系統 ,部署有mysql單實例,數據庫引擎類型為innodb,獨立表空間,無數據庫備份,未開啟binlog
    的頭像 發表于 12-08 14:18 ?1103次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—未開啟binlog的Mysql<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    關于JSON數據庫

    如何理解JSON數據庫?作為NoSQL數據庫的一種類型,JSON數據庫有哪些優勢呢?JSON數據庫如何運作,它為應用程序開發者帶來了哪些價值呢?
    的頭像 發表于 12-06 13:46 ?842次閱讀
    關于JSON<b class='flag-5'>數據庫</b>

    mysql數據庫基礎命令

    MySQL是一個流行的關系型數據庫管理系統,經常用于存儲、管理和操作數據。在本文中,我們將詳細介紹MySQL的基礎命令,并提供與每個命令相關的詳細解釋。 登錄MySQL 要登錄MySQL數據庫,可以
    的頭像 發表于 12-06 10:56 ?552次閱讀

    oracle數據庫的基本操作

    Oracle數據庫是一種關系數據庫管理系統(RDBMS),廣泛應用于企業級應用中。它具有強大的功能和靈活的配置選項,可以滿足復雜的數據處理需求。本文將介紹Oracle數據庫的基本操作,
    的頭像 發表于 12-06 10:14 ?666次閱讀

    oracle數據庫的使用方法

    Oracle數據庫是一種關系型數據庫管理系統,它由Oracle公司開發和維護。它提供了安全、可靠和高性能的數據庫管理解決方案,被廣泛應用于企業級應用和大型數據庫環境中。本文將詳細介紹O
    的頭像 發表于 12-06 10:10 ?1184次閱讀

    oracle數據庫alert日志作用

    Oracle數據庫的alert日志是數據庫引擎和實例的核心組件之一,它記錄著數據庫的運行狀況和事件。該日志對于數據庫的性能調優、問題排查和安全管理起著重要作用。本文將詳盡、詳實、細致地
    的頭像 發表于 12-06 10:08 ?1205次閱讀

    什么是JSON數據庫

    如何理解JSON數據庫?作為NoSQL數據庫的一種類型,JSON數據庫有哪些優勢呢?JSON數據庫如何運作,它為應用程序開發者帶來了哪些價值呢?文章速覽:什么是JSON什么是JSON
    的頭像 發表于 12-02 08:04 ?832次閱讀
    什么是JSON<b class='flag-5'>數據庫</b>