1.什么Mysql的事務?事務的四大特性?事務帶來的什么問題?
Mysql中事務的隔離級別分為四大等級:讀未提交(READ UNCOMMITTED)、讀提交 (READ COMMITTED)、可重復讀 (REPEATABLE READ)、串行化 (SERIALIZABLE)。
在Mysql中事務的四大特性主要包含:原子性(Atomicity)、一致性(Consistent)、隔離性(Isalotion)、持久性(Durable),簡稱為ACID。
原子性:是指事務的原子性操作,對數據的修改要么全部執行成功,要么全部失敗,實現事務的原子性,是基于日志的Redo/Undo機制。
一致性:是指執行事務前后的狀態要一致,可以理解為數據一致性。
隔離性:側重指事務之間相互隔離,不受影響,這個與事務設置的隔離級別有密切的關系。
持久性:則是指在一個事務提交后,這個事務的狀態會被持久化到數據庫中,也就是事務提交,對數據的新增、更新將會持久化到數據庫中。
在我的理解中:原子性、隔離性、持久性都是為了保障一致性而存在的,一致性也是最終的目的。
沒有那種隔離級別是完美的,只能根據自己的項目業務場景去評估選擇最適合的隔離級別,大部分的公司一般選擇Mysql默認的隔離級別:可重復讀。
隔離級別從:讀未提交-讀提交-可重復讀-串行化,級別越來越高,隔離也就越來越嚴實,到最后的串行化,當出現讀寫鎖沖突的時候,后面的事務只能等前面的事務完成后才能繼續訪問。
讀未提交:讀取到別的事務還沒有提交的數據,從而產生了臟讀。
讀提交:讀取別的事務已經提交的數據,從而產生不可重復讀。
可重復讀:事務開啟過程中看到的數據和事務剛開始看到的數據是一樣的,從而產生幻讀,在Mysql的中通過MVCC多版本控制的一致性視圖解決了不可重復讀問題以及通過間隙鎖解決了幻讀問題。
串行化:對于同一行記錄,若是讀寫鎖發生沖突,后面訪問的事務只能等前面的事務執行完才能繼續訪問。
舉個例子,假如有一個user表,里面有兩個字段id和age,里面有一條測試數據:(1,24),現在要執行age+1,同時有兩個事務執行:
事務1事務2
啟動事務,接著查詢age(a1)
啟動事務
查詢age(a2)
執行age=age+1
查詢age(a3)
提交事務
查詢age(a4)
提交事務
查詢age(a5)
經過上面的執行,在四種隔離級別下a1,a2,a3,a4,a5的值分別是多少?我們來認真的分析一波:
讀未提交:a1和a2因為讀的是初始值所以為24,隔離級別為讀未提交,事務2執行了age=age+1,不管事務2是否提交,那么a3、a4和a5的值都是25。
讀提交:a1和a2因為讀的是初始值所以為24,隔離級別為讀提交所以a3還是24,a4和a5因為事務2已經提交所以得到的值是25。
可重復讀:a1和a2因為讀的是初始值所以為24,可重復讀的隔離級別下,a3和a4讀取的值和事務開始的結果一樣,所以還是24,a5前一步因為已經提交事務,所以a5的值是25。
串行化:a1和a2因為讀的是初始值所以為24,串行化隔離級別下,當事務2修改數據的時候,獲取了寫鎖,事務1讀取age的值會被鎖住,所以在事務1的角度下a3和a4讀取的值為24,a5的值為25。
當你能夠分析得出這個例子下,在不同隔離級別下分析的出a1-a5的值,說明你對事務的隔離級別已經有比較深入的理解了。
2.你詳細了解過MVCC嗎?它是怎么工作的?
MVCC叫做多版本控制,實現MVCC時用到了一致性視圖,用于支持讀提交和可重復讀的實現。
對于一行數據若是想實現可重復讀取或者能夠讀取數據的另一個事務未提交前的原始值,那么必須對原始數據進行保存或者對更新操作進行保存,這樣才能夠查詢到原始值。
在Mysql的MVCC中規定每一行數據都有多個不同的版本,一個事務更新操作完后就生成一個新的版本,并不是對全部數據的全量備份,因為全量備份的代價太大了:
如圖中所示,假如三個事務更新了同一行數據,那么就會有對應的v1、v2、v3三個數據版本,每一個事務在開始的時候都獲得一個唯一的事務id(transaction id),并且是順序遞增的,并且這個事務id最后會賦值給row trx_id,這樣就形成了一個唯一的一行數據版本。
實際上版本1、版本2并非實際物理存在的,而圖中的U1和U2實際就是undo log日志(回滾日志),這v1和v2版本是根據當前v3和undo log計算出來的。
InnoDB引擎就是利用每行數據有多個版本的特性,實現了秒級創建“快照”,并不需要花費大量的是時間。
3.Mysql的InnoDB和MyISAM有什么區別?
(1)InnoDB和MyISAM都是Mysql的存儲引擎,現在MyISAM也逐漸被InnoDB給替代,主要因為InnoDB支持事務和行級鎖,MyISAM不支持事務和行級鎖,MyISAM最小鎖單位是表級。因為MyISAM不支持行級鎖,所以在并發處理能力上InnoDB會比MyISAM好。
(2) 數據的存儲上:MyISAM的索引也是由B+樹構成,但是樹的葉子結點存的是行數據的地址,查找時需要找到葉子結點的地址,再根據葉子結點地址查找數據。
InnoDB的主鍵索引的葉子結點直接就是存儲行數據,查找主鍵索引樹就能獲得數據:
若是根據非主鍵索引查找,非主鍵索引的葉子結點存儲的就是,當前索引值以及對應的主鍵的值,若是聯合索引存儲的就是聯合索引值和對應的主鍵值。
(3)數據文件構成:MyISAM有三種存儲文件分別是擴展名為:.frm(文件存儲表定義)、.MYD (MYData數據文件)、.MYI (MYIndex索引文件)。而InnoDB的表只受限于操作系統文件的大小,一般是2GB
(4)查詢區別:對于讀多寫少的業務場景,MyISAM會更加適合,而對于update和insert比較多的場景InnoDB會比較適合。
(5)coun()區別:select count() from table,MyISAM引擎會查詢已經保存好的行數,這是不加where的條件下,而InnoDB需要全表掃描一遍,InnoDB并沒有保存表的具體行數。
(6)其它的區別:InnoDB支持外鍵,但是不支持全文索引,而MyISAM不支持外鍵,支持全文索引,InnoDB的主鍵的范圍比MyISAM的大。
4.你知道執行一條查詢語句的流程嗎?
當Mysql執行一條查詢的SQl的時候大概發生了以下的步驟:
客戶端發送查詢語句給服務器。
服務器首先進行用戶名和密碼的驗證以及權限的校驗。
然后會檢查緩存中是否存在該查詢,若存在,返回緩存中存在的結果。若是不存在就進行下一步。注意:Mysql 8就把緩存這塊給砍掉了。
接著進行語法和詞法的分析,對SQl的解析、語法檢測和預處理,再由優化器生成對應的執行計劃。
Mysql的執行器根據優化器生成的執行計劃執行,調用存儲引擎的接口進行查詢。服務器將查詢的結果返回客戶端。
Mysql中語句的執行都是都是分層執行,每一層執行的任務都不同,直到最后拿到結果返回,主要分為Service層和引擎層。
在Service層中包含:連接器、分析器、優化器、執行器。引擎層以插件的形式可以兼容各種不同的存儲引擎,主要包含的有InnoDB和MyISAM兩種存儲引擎。具體的執行流程圖如下所示:
5.redo log和binlog了解過嗎?
redo log日志也叫做WAL技術(Write- Ahead Logging),他是一種先寫日志,并更新內存,最后再更新磁盤的技術,為了就是減少sql執行期間的數據庫io操作,并且更新磁盤往往是在Mysql比較閑的時候,這樣就大大減輕了Mysql的壓力。
redo log是固定大小,是物理日志,屬于InnoDB引擎的,并且寫redo log是環狀寫日志的形式:
如上圖所示:若是四組的redo log文件,一組為1G的大小,那么四組就是4G的大小,其中write pos是記錄當前的位置,有數據寫入當前位置,那么write pos就會邊寫入邊往后移。
check point記錄擦除的位置,因為redo log是固定大小,所以當redo log滿的時候,也就是write pos追上check point的時候,需要清除redo log的部分數據,清除的數據會被持久化到磁盤中,然后將check point向前移動。
redo log日志實現了即使在數據庫出現異常宕機的時候,重啟后之前的記錄也不會丟失,這就是crash-safe能力。
binlog稱為歸檔日志,是邏輯上的日志,它屬于Mysql的Server層面的日志,記錄著sql的原始邏輯,主要有兩種模式:一個是statement格式記錄的是原始的sql,而row格式則是記錄行內容。
redo log和binlog記錄的形式、內容不同,這兩者日志都能通過自己記錄的內容恢復數據。
之所以這兩個日志同時存在,是因為剛開始Mysql自帶的引擎MyISAM就沒有crash-safe功能的,并且在此之前Mysql還沒有InnoDB引擎,Mysql自帶的binlog日志只是用來歸檔日志的,所以InnoDB引擎也就通過自己redo log日志來實現crash-safe功能。
6.線上要給熱點數據表添加字段該怎么操作?
首先給表加一個字段,會導致掃描全表數據,并且會加MDL寫鎖,所以在線上操作一定要謹慎再謹慎,有可能還沒操作完就導致數據庫給搞崩了。
對于這種情況有限考慮線上的穩定的運行,加字段是其次,可以通過在alter table后設定等待的時間,若是獲取不到鎖后面在進行嘗試,并且可以選擇訪問量比較上的時間段進行獲取。
若是能獲取到鎖那是最好了,當然即使獲取到鎖也不要阻塞后面的業務語句,一切都是以業務優先為原則。
7.Msyql的索引的底層實現嗎?為什么不用有序數組、hash或者二叉樹實現索引?
Mysql的索引是一種加快查詢速度的數據結構,索引就好比書的目錄一樣能夠快速的定位你要查找的位置。
Mysql的索引底層是使用B+樹的數據結構進行實現,結構如下圖所示:
索引的一個數據頁的大小是16kb,從磁盤加載到內存中是以數據頁的大小為單位進行加載,然后供查詢操作進行查詢,若是查詢的數據不在內存中,才會從磁盤中再次加載到內存中。
索引的實現有很多,比如hash。hash是以key-value的形式進行存儲,適合于等值查詢的場景,查詢的時間復雜度為O(1),因為hash儲存并不是有序的,所以對于范圍查詢就可能要遍歷所有數據進行查詢,而且不同值的計算還會出現hash沖突,所以hash并不適合于做Mysql的索引。
有序數組在等值查詢和范圍查詢性能都是非常好的,那為什么又不用有序數組作為索引呢?因為對于數組而言作為索引更新的成本太高,新增數據要把后面的數據都往后移一位,所以也不采用有序數組作為索引的底層實現。
最后二叉樹,主要是因為二叉樹只有二叉,一個節點存儲的數據量非常有限,需要頻繁的隨機IO讀寫磁盤,若是數據量大的情況下二叉的樹高太高,嚴重影響性能,所以也不采用二叉樹進行實現。
而B+樹是多叉樹,一個數據頁的大小是16kb,在1-3的樹高就能存儲10億級以上的數據,也就是只要訪問磁盤1-3次就足夠了,并且B+樹的葉子結點上一個葉子結點有指針指向下一個葉子結點,便于范圍查詢:
8.怎么查看索引是否生效?什么情況下索引會失效呢?
查看索引是否起作用可以使用explain關鍵字,查詢后的語句中的key字段,若是使用了索引,該字段會展示索引的名字。
(1)where條件查詢中使用了or關鍵字,有可能使用了索引進行查詢也會導致索引失效,若是想使用or關鍵字,又不想索引失效,只能在or的所有列上都建立索引。
(2)條件查詢中使用like關鍵字,并且不符合最左前綴原則,會導致索引失效。
(3)條件查詢的字段是字符串,而錯誤的使用where column = 123 數字類型也會導致索引失效。
(4)對于聯合索引查詢不符合最左前綴原則,也會導致索引失效,如下所示:
alter table user add index union_index(name, age) // name左邊的列, age 右邊的列
select * from user where name = ‘lidu’ // 會用到索引
select * from user where age = 18 // 不會使用索引
(5)在where條件查詢的后面對字段進行null值判斷,會導致索引失效,解決的辦法就是可以把null改為0或者-1這些特殊的值代替:
SELECT id FROM table WHERE num is null
(6)在where子句中使用!= ,《 》這樣的符號,也會導致索引失效。
SELECT id FROM table WHERE num != 0
(7)where條件子句中=的左邊使用表達式操作或者函數操作,也會導致索引失效。
SELECT id FROM user WHERE age / 2 = 1
SELECT id FROM user WHERE SUBSTRING(name,1,2) = ‘lidu’
9.你知道有哪些種類的索引?
索引從數據結構進行劃分的分為:B+樹索引、hash索引、R-Tree索引、FULLTEXT索引。
索引從物理存儲的角度劃分為:聚族索引和非聚族索引。
從邏輯的角度分為:主鍵索引、普通索引、唯一索引、聯合索引以及空間索引。
10.你平時是怎么進行SQL優化的?
SQL的優化主要是對字段添加索引,主要包含有這四種索引(主鍵索引/唯一索引/全文索引/普通索引),以及結合具體的業務場景分析具體是使用什么索引最合理。
explain 可以幫助我們在不真正執行某個sql語句時,就執行mysql怎樣執行,這樣利用我們去分析sql指令:
id:查詢的序列號。
select_type:查詢類型。
table:查詢表名。
type:掃描方式,all表示全表掃描。
possible_keys:可是使用到的索引。
key:實際使用到的索引。
rows:該sql掃面了多少行。
Extra:sql語句額外的信息,比如排序方式
SQL優化方法
(1)對于條件查詢,首先考慮在條件where和order by后的字段建立索引。(2)避免索引失效,避免where條件后進行null值的判斷。(3)避免where后使用!=或《》操作符。(4)避免在where后面進行使用函數。(5)避免where條件后使用or關鍵字來連接。
上面的這一些都是要注意的,當然還有很多的小技巧,都有可能會導致索引的實效。
索引的種類
另一方面就是考慮到底是建立哪種索引比較合適,這里以普通索引和唯一索引進行舉例說明。
假如我們的業務場景是讀多寫少的場景,那么SQL查詢請求過來,假如數據已經在內存中,獲取到數據后就直接返回,假如數據不在內存的數據頁中,就會加載磁盤到內存中再返回,對于這種場景可能對于普通索引和唯一索引的選擇性能上并沒有明顯的區別。
但是,一般建議選擇普通索引,在寫多讀少的場景下,這兩者索引的選擇對性能的影響就比較大了,對于普通索引的的寫,不管數據是否存在于內存中,都會先寫入內存中的一小塊叫做chang buffer內存中,然后在通過后臺刷盤,一般會選擇Mysql比較閑的時候進行刷盤。
而唯一索引就不同了,因為他要確保索引的唯一性,索引寫數據的時候,假如數據不在內存中,要先從磁盤中加載數據到內存中,然后比較是否唯一,所以唯一索引就不能使用chang buffer的優化機制,會頻繁的進行隨機的磁盤IO。
11.什么是聚簇索引和非聚簇索引?
聚族索引和非聚族索引的主要區別是:聚族索引的葉子結點就是數據節點,而非聚族索引的葉子結點存儲仍然是索引節點,只不過有指向對應數據塊的指針。
區別這兩者的區別就是來對比InnoDB和MYISAM的數據結構了。假如我們有一個表原始數據如下所示:
row numbercol1col2
0998
11256
2300062
。..。..。..
9997188
9998470013
9999393
那么在MyISAM的索引中數據的儲存結構如下所示:
MyISAM以葉子結點存儲的Row number來找到對應的行數據,也就是葉子結點存儲的是行指針,這也可以發現MyISAM引擎中數據文件(.MYI)和索引文件(.MYD)是分開的,索引MyISAM的查找索引樹后,需要根據行指針二次的進行定位。
而在InnoDB的主鍵索引存儲的結構形式如下所示:
InnoDB的主鍵索引中葉子結點并不是存儲行指針,而是存儲行數據,二級索引中MyISAM也是一樣的存儲方式,InnoDB的二級索引的葉子結點則是存儲當前索引值以及對應的主鍵索引值。
InnoDB的二級索引帶來的好處就是減少了由于數據移動或者數據頁分列導致行數據的地址變了而帶來的維護二級索引的性能開銷,因為InnoDB的二級索引不需要更新行指針:
12.什么是回表?回表是怎么產生的呢?
上面說過InnoDB引擎的主鍵索引存儲的是行數據,二級索引的葉子結點存儲的是索引數據以及對應的主鍵,所以回表就是根據索引進行條件查詢,回到主鍵索引樹進行搜索的過程:
因為查詢還要回表一次,再次查詢主鍵索引樹,所以實際中應該盡量避免回表的產生。
13.怎么解決回表的問題?
解決回表問題可以建立聯合索引進行索引覆蓋,如圖所示根據name字段查詢用戶的name和sex屬性出現了回表問題:
那么我們可以建立下面這個聯合索引來解決:
create table user (
id int primary key,
name varchar(20),
sex varchar(5),
index(name, sex)
) engine = innodb;
建立了如上所示的index(name,sex)聯合索引,在二級索引的葉子結點的位置就會同時也出現sex字段的值,因為能夠獲取到要查詢的所有字段,因為就不用再回表查詢一次。
14.什么是最左前綴原則?
最左前綴原則可以是聯合索引的的最左N個字段,也可以是字符串索引的最左的M個字符。舉個例子,假如現在有一個表的原始數據如下所示:
并根據col3 ,col2的順序建立聯合索引,此時聯合索引樹結構如圖下所示:
葉子結點中首先會根據col3的字符進行排序,若是col3相等,在col3相等的值里面再對col2進行排序,假如我們要查詢where col3 like ‘Eri%’,就可以快速的定位查詢到Eric。
若是查詢條件為where col3 like ‘%se’,前面的字符不確定,表示任意字符都可以,這樣就可以導致全表掃描進行字符的比較,就會使索引失效。
15.什么是索引下推?
Mysql5.6之前是沒有索引下推這個功能,后面為了提高性能,避免不必要的回表5.6之后就有了索引下推優化的功能。
假如我們有一個用戶表,并且使用用戶的name,age兩個字段建立聯合索引,name在沒有索引下推的功能,執行下面的sql,執行的流程如下圖所示:
select * from tuser where name like ‘張%’ and age=10 and ismale=1;
當比較第一個索引字段name like ‘張%’ 就會篩選出四行數據,后面它不會再比較age值是否符合要求,直接獲取到主鍵值,然后在回表查詢,回表后再對比age、ismale是否符合條件。
從上面的數據看來其實name,age兩個字段建立的聯合索引,兩個字段的值會存儲在聯合索引樹中,可以直接對比age字段是否符合查詢的條件age=10,那么索引下推就是做了這些事:
索引下推會再次根據你的age進行比較,發現有兩條記錄不符合條件直接過濾掉,符合條件的才會進行回表查詢,這樣就減少了不必要的回表查詢。
16.主鍵使用自增ID還是UUID?能說說原因嗎?
自增ID和UUID作為主鍵的考慮主要有兩方面,一個是性能另一個就是存儲的空間大小,一般沒有特定的業務要求都不推薦使用UUID作為主鍵。
因為使用UUID作為主鍵插入并不能保證插入是有序的,有可能會涉及數據的挪動,也有可能觸發數據頁的分裂,因為一個數據頁的大小就是16KB,這樣插入數據的成本就會比較高。
而自增ID作為主鍵的話插入數據都是追加操作,不會有數據的移動以及數據頁的分裂,性能會比較好。
另一方面就是存儲空間,自增主鍵一般整形只要4個字節,長整形才占8字節的大小空間,而使用UUID作為主鍵存儲空間需要16字節的大小,會占用更多的磁盤,在二級索引中也會存出一份主鍵索引,這樣多占用消耗的空間就是兩倍,性能低,所以不推薦使用。
17.Mysql是怎么控制并發的訪問資源?
Mysql內部通過鎖機制實現對資源的并發訪問控制,保證數據的一致性,鎖機制的類型和引擎的種類有關,MyISAM中默認支持的表級鎖有兩種:共享讀鎖和獨占寫鎖。表級鎖在MyISAM和InnoDB的存儲引擎中都支持,但是InnoDB默認支持的是行鎖。
MyISAM鎖機制
Mysql中可以通過以下sql來顯示的在事務中顯式的進行加鎖和解鎖操作:
// 顯式的添加表級讀鎖
LOCK TABLE 表名 READ
// 顯示的添加表級寫鎖
LOCK TABLE 表名 WRITE
// 顯式的解鎖(當一個事務commit的時候也會自動解鎖)
unlock tables;
(1)MyISAM表級寫鎖:當一個線程獲取到表級寫鎖后,只能由該線程對表進行讀寫操作,別的線程必須等待該線程釋放鎖以后才能操作。
(2)MyISAM表級共享讀鎖:當一個線程獲取到表級讀鎖后,該線程只能讀取數據不能修改數據,其它線程也只能加讀鎖,不能加寫鎖。
InnoDB鎖機制
InnoDB和MyISAM不同的是,InnoDB支持行鎖和事務,InnoDB中除了有表鎖和行級鎖的概念,還有Gap Lock(間隙鎖)、Next-key Lock鎖,間隙鎖主要用于范圍查詢的時候,鎖住查詢的范圍,并且間隙鎖也是解決幻讀的方案。
InnoDB中的行級鎖是對索引加的鎖,在不通過索引查詢數據的時候,InnoDB就會使用表鎖。
但是通過索引查詢的時候是否使用索引,還要看Mysql的執行計劃,Mysql的優化器會判斷是一條sql執行的最佳策略。
若是Mysql覺得執行索引查詢還不如全表掃描速度快,那么Mysql就會使用全表掃描來查詢,這是即使sql語句中使用了索引,最后還是執行為全表掃描,加的是表鎖。
18.Mysql的死鎖是怎么發生的?怎么解決死鎖問題?
死鎖在InnoDB中才會出現死鎖,MyISAM是不會出現死鎖,因為MyISAM支持的是表鎖,一次性獲取了所有的鎖,其它的線程只能排隊等候。
而InnoDB默認支持行鎖,獲取鎖是分步的,并不是一次性獲取所有的鎖,因此在鎖競爭的時候就會出現死鎖的情況。
雖然InnoDB會出現死鎖,但是并不影響InnoDB成為最受歡迎的存儲引擎,MyISAM可以理解為串行化操作,讀寫有序,因此支持的并發性能低下。
(1)死鎖案例一:
舉一個例子,現在數據庫表employee中六條數據,如下所示:
其中name=ldc的有兩條數據,并且name字段為普通索引,分別是id=2和id=3的數據行,現在假設有兩個事務分別執行下面的兩條sql語句:
// session1執行
update employee set num = 2 where name =‘ldc’;
// session2執行
select * from employee where id = 2 or id =3;
其中session1執行的sql獲取的數據行是兩條數據,假設先獲取到第一個id=2的數據行,然后cpu的時間分配給了另一個事務,另一個事務執行查詢操作獲取了第二行數據也就是id=3的數據行。
當事務2繼續執行的時候獲取到id=3的數據行,鎖定了id=3的數據行,此時cpu又將時間分配給了第一個事務,第一個事務執行準備獲取第二行數據的鎖,發現已經被其他事務獲取了,它就處于等待的狀態。
當cpu把時間有分配給了第二個事務,第二個事務準備獲取第一行數據的鎖發現已經被第一個事務獲取了鎖,這樣就行了死鎖,兩個事務彼此之間相互等待。
(2)死鎖案例二
第二種死鎖情況就是當一個事務開始并且update一條id=1的數據行時,成功獲取到寫鎖,此時另一個事務執行也update另一條id=2的數據行時,也成功獲取到寫鎖(id為主鍵)。
此時cpu將時間分配給了事務一,事務一接著也是update id=2的數據行,因為事務二已經獲取到id=2數據行的鎖,所以事務已處于等待狀態。
事務二有獲取到了時間,像執行update id=1的數據行,但是此時id=1的鎖被事務一獲取到了,事務二也處于等待的狀態,因此形成了死鎖。
session1session2
begin;update t set name=‘測試’ where id=1;begin
update t set name=‘測試’ where id=2;
update t set name=‘測試’ where id=2;
等待…update t set name=‘測試’ where id=1;
等待…等待…
死鎖的解決方案
首先要解決死鎖問題,在程序的設計上,當發現程序有高并發的訪問某一個表時,盡量對該表的執行操作串行化,或者鎖升級,一次性獲取所有的鎖資源。
然后也可以設置參數innodb_lock_wait_timeout,超時時間,并且將參數innodb_deadlock_detect 打開,當發現死鎖的時候,自動回滾其中的某一個事務。
19.能說一說Mysql的主從復制嗎?
讀寫分離
實現MySQL讀寫分離的前提是我們已經將MySQL主從復制配置完畢,讀寫分離實現方式:(1)配置多數據源。(2)使用mysql的proxy中間件代理工具。
主從復制的原理
MySQL的主從復制和讀寫分離兩者有著緊密的聯系,首先要部署主從復制,只有主從復制完成了才能在此基礎上進行數據的讀寫分離。
讀寫分離的原理
讀寫分離就是只在主服務器上寫,只在從服務器上讀。基本原理是讓主數據庫處理事務性查詢,而從服務器處理select查詢。數據庫復制被用來把事務性查詢導致的變更同步到從數據庫中。
20.能說一說分庫分表嗎?怎么分?
首先為什么要分表?(1) 如果一個表的每條記錄的內容很大,那么就需要更多的IO操作,如果字段值比較大,而使用頻率相對比較低,可以將大字段移到另一張表中,當查詢不查大字段的時候,這樣就減少了I/O操作(2)如果表的數據量非常非常大,那么查詢就變的比較慢;也就是表的數據量影響查詢的性能。(3)表中的數據本來就有獨立性,例如分別記錄各個地區的數據或者不同時期的數據,特別是有些數據常用,而另外一些數據不常用。(4) 分表技術有(水平分割和垂直分割)
垂直分割
垂直分割是指數據表列的拆分,把一張列比較多的表拆分為多張表。垂直分割一般用于拆分大字段和訪問頻率低的字段,分離冷熱數據。
垂直分割比較常見:例如博客系統中的文章表,比如文章tbl_articles(id, titile, summary, content, user_id, create_time),因為文章中的內容content會比較長,放在tbl_articles中會嚴重影響表的查詢速度,所以將內容放到tbl_articles_detail(article_id, content),像文章列表只需要查詢tbl_articles中的字段即可。
垂直拆分的優點:可以使得行數據變小,在查詢時減少讀取的Block數,減少I/O次數。此外,垂直分區可以簡化表的結構,易于維護。
垂直拆分的缺點:主鍵會出現冗余,需要管理冗余列,并會引起Join操作,可以通過在應用層進行Join來解決。此外,垂直分區會讓事務變得更加復雜。
水平分割
水平拆分是指數據表行數據的拆分,表的行數超過500萬行或者單表容量超過10GB時,查詢就會變慢,這時可以把一張的表的數據拆成多張表來存放。水平分表盡可能使每張表的數據量相當,比較均勻。
水平拆分會給應用增加復雜度,它通常在查詢時需要多個表名,查詢所有數據需要union操作。在許多數據庫應用中,這種復雜性會超過它帶來的優點。
因為只要索引關鍵字不大,則在索引用于查詢時,表中增加2-3倍數據量,查詢時也就增加讀一個索引層的磁盤次數,所以水平拆分要考慮數據量的增長速度,根據實際情況決定是否需要對表進行水平拆分。
水平分割最重要的是找到分割的標準,不同的表應根據業務找出不同的標準
用戶表可以根據用戶的手機號段進行分割如user183、user150、user153、user189等,每個號段就是一張表。
用戶表也可以根據用戶的id進行分割,加入分3張表user0,user1,user2,如果用戶的id%3=0就查詢user0表,如果用戶的id%3=1就查詢user1表。
對于訂單表可以按照訂單的時間進行分表。
責任編輯:haq
-
數據庫
+關注
關注
7文章
3765瀏覽量
64276 -
MySQL
+關注
關注
1文章
802瀏覽量
26444
原文標題:面試,MySQL 搞透這 20 道就穩了
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論