支持多種存儲引擎是眾所周知的MySQL特性,也是MySQL架構的關鍵優勢之一。如果能夠理解MySQL Server與存儲引擎之間是怎樣通過API交互的,將大大有利于理解MySQL的核心基礎架構。本文將首先介紹MySQL的整體邏輯架構,然后分析MySQL的存儲引擎API并介紹如何編寫自己的MySQL存儲引擎。
MySQL邏輯架構
MySQL作為一個大型的網絡程序、數據管理系統,架構非常復雜。下圖大致畫出了其邏輯架構。
Connectors
MySQL首先是一個網絡程序,其在TCP之上定義了自己的應用層協議。所以要使用MySQL,我們可以編寫代碼,跟MySQL Server建立TCP連接,之后按照其定義好的協議進行交互。當然這樣比較麻煩,比較方便的辦法是調用SDK,比如Native C API、JDBC、PHP等各語言MySQL Connector,或者通過ODBC。但通過SDK來訪問MySQL,本質上還是在TCP連接上通過MySQL協議跟MySQL進行交互。
Connection Management
每一個基于TCP的網絡服務都需要管理客戶端鏈接,MySQL也不例外。MySQL會為每一個連接綁定一個線程,之后這個連接上的所有查詢都在這個線程中執行。為了避免頻繁創建和銷毀線程帶來開銷,MySQL通常會緩存線程或者使用線程池,從而避免頻繁的創建和銷毀線程。
客戶端連接到MySQL后,在使用MySQL的功能之前,需要進行認證,認證基于用戶名、主機名、密碼。如果用了SSL或者TLS的方式進行連接,還會進行證書認證。
SQL Interface
MySQL支持DML(數據操作語言)、DDL(數據定義語言)、存儲過程、視圖、觸發器、自定義函數等多種SQL語言接口。
Parser
MySQL會解析SQL查詢,并為其創建語法樹,并根據數據字典豐富查詢語法樹,會驗證該客戶端是否具有執行該查詢的權限。創建好語法樹后,MySQL還會對SQl查詢進行語法上的優化,進行查詢重寫。
Optimizer
語法解析和查詢重寫之后,MySQL會根據語法樹和數據的統計信息對SQL進行優化,包括決定表的讀取順序、選擇合適的索引等,最終生成SQL的具體執行步驟。這些具體的執行步驟里真正的數據操作都是通過預先定義好的存儲引擎API來進行的,與具體的存儲引擎實現無關。
Caches & Buffers
MySQL內部維持著一些Cache和Buffer,比如Query Cache用來緩存一條Select語句的執行結果,如果能夠在其中找到對應的查詢結果,那么就不必再進行查詢解析、優化和執行的整個過程了。
Pluggable Storage Engine
存儲引擎的具體實現,這些存儲引擎都實現了MySQl定義好的存儲引擎API的部分或者全部。MySQL可以動態安裝或移除存儲引擎,可以有多種存儲引擎同時存在,可以為每個Table設置不同的存儲引擎。存儲引擎負責在文件系統之上,管理表的數據、索引的實際內容,同時也會管理運行時的Cache、Buffer、事務、Log等數據和功能。
MySQL 5.7.11默認支持的存儲引擎如下:
mysql> show engines; +--------------------+---------+----------------------------------------------------------------+--------------+------+------------+ | Engine | Support | Comment | Transactions | XA | Savepoints | +--------------------+---------+----------------------------------------------------------------+--------------+------+------------+ | InnoDB | DEFAULT | Supports transactions, row-level locking, and foreign keys | YES | YES | YES | | MRG_MYISAM | YES | Collection of identical MyISAM tables | NO | NO | NO | | MEMORY | YES | Hash based, stored in memory, useful for temporary tables | NO | NO | NO | | BLACKHOLE | YES | /dev/null storage engine (anything you write to it disappears) | NO | NO | NO | | MyISAM | YES | MyISAM storage engine | NO | NO | NO | | CSV | YES | CSV storage engine | NO | NO | NO | | ARCHIVE | YES | Archive storage engine | NO | NO | NO | | PERFORMANCE_SCHEMA | YES | Performance Schema | NO | NO | NO | | FEDERATED | NO | Federated MySQL storage engine | NULL | NULL | NULL | +--------------------+---------+----------------------------------------------------------------+--------------+------+------------+
File System
所有的數據,數據庫、表的定義,表的每一行的內容,索引,都是存在文件系統上,以文件的方式存在的。當然有些存儲引擎比如InnoDB,也支持不使用文件系統直接管理裸設備,但現代文件系統的實現使得這樣做沒有必要了。
在文件系統之下,可以使用本地磁盤,可以使用DAS、NAS、SAN等各種存儲系統。
存儲引擎API
MySQL定義了一系列存儲引擎API,以支持插件式存儲引擎架構。API以Handler類的虛函數的方式存在,可在代碼庫下的./sql/handler.h中查看詳細信息,可在handler類的注釋中看到描述:
/** The handler class is the interface for dynamically loadable storage engines. Do not add ifdefs and take care when adding or changing virtual functions to avoid vtable confusion Functions in this class accept and return table columns data. Two data representation formats are used: 1. TableRecordFormat - Used to pass [partial] table records to/from storage engine 2. KeyTupleFormat - used to pass index search tuples (aka "keys") to storage engine. See opt_range.cc for description of this format. TableRecordFormat ================= [Warning: this description is work in progress and may be incomplete] The table record is stored in a fixed-size buffer: record: null_bytes, column1_data, column2_data, ... //篇幅原因,略去部分內容。 */ class handler :public Sql_alloc { //篇幅原因,不列出具體代碼。讀者可直接在源碼文件./sql/handler.h中找到具體內容。 }
下面我將分類描述部分存儲引擎API。
創建、打開和關閉表
通過函數create來創建一個table:
/** *name:要創建的表的名字 *from:一個TABLE類型的結構,要創建的表的定義,跟MySQL Server已經創建好的tablename.frm文件內容是匹配的 *info:一個HA_CREATE_INFO類型的結構,包含了客戶端輸入的CREATE TABLE語句的信息 */ int create(const char *name, TABLE *form, HA_CREATE_INFO *info);
通過函數open來打開一個table:
/** mode包含以下兩種 O_RDONLY - Open read only O_RDWR - Open read/write */ int open(const char *name, int mode, int test_if_locked);
通過函數close來關閉一個table:
int close(void);
對表加鎖
當客戶端調用LOCK TABLE時,通過external_lock函數加鎖:
int ha_example::external_lock(THD *thd, int lock_type)
全表掃描
//初始化全表掃描 virtual int rnd_init (bool scan); //從表中讀取下一行 virtual int rnd_next (byte* buf);
通過索引訪問table內容
//使用索引前調用該方法 int ha_foo::index_init(uint keynr, bool sorted) //使用索引后調用該方法 int ha_foo::index_end(uint keynr, bool sorted) //讀取索引第一條內容 int ha_index_first(uchar * buf); //讀取索引下一條內容 int ha_index_next(uchar * buf); //讀取索引前一條內容 int ha_index_prev(uchar * buf); //讀取索引最后一條內容 int ha_index_last(uchar * buf); //給定一個key基于索引讀取內容 int index_read(uchar * buf, const uchar * key, uint key_len, enum ha_rkey_function find_flag)
事務處理
//開始一個事務 int my_handler::start_stmt(THD *thd, thr_lock_type lock_type) //回滾一個事務 int (*rollback)(THD *thd, bool all); //提交一個事務 int (*commit)(THD *thd, bool all);
如何編寫自己的存儲引擎
在MySQL的官方文檔上,有對于編寫自己的存儲引擎的指導文檔,鏈接如下。
作為編寫自己存儲引擎的開始,你可以查看MySQL源碼庫中的一個EXAMPLE存儲引擎,它實現了必須要實現的存儲引擎API,可以通過復制它們作為編寫我們自己存儲引擎的開始:
sed -e s/EXAMPLE/FOO/g -e s/example/foo/g ha_example.h > ha_foo.h sed -e s/EXAMPLE/FOO/g -e s/example/foo/g ha_example.cc > ha_foo.cc
審核編輯:黃飛
-
TCP
+關注
關注
8文章
1349瀏覽量
78985 -
MySQL
+關注
關注
1文章
801瀏覽量
26441
原文標題:MySQL的多存儲引擎架構
文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論