今天就跟大家一起聊聊,mysql數據庫索引失效的10種場景,給曾經踩過坑,或者即將要踩坑的朋友們一個參考。
1. 準備工作
所謂空口無憑,如果我直接把索引失效的這些場景丟出來,可能沒有任何說服力。
所以,我決定建表和造數據,給大家一步步演示效果,盡量做到有理有據。
我相信,如果大家耐心的看完這篇文章,一定會有很多收獲的。
1.1 創建user表
創建一張user表,表中包含:id
、code
、age
、name
和height
字段。
CREATE TABLE `user` (
`id` int NOT NULL AUTO_INCREMENT,
`code` varchar(20) COLLATE utf8mb4_bin DEFAULT NULL,
`age` int DEFAULT '0',
`name` varchar(30) COLLATE utf8mb4_bin DEFAULT NULL,
`height` int DEFAULT '0',
`address` varchar(30) COLLATE utf8mb4_bin DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_code_age_name` (`code`,`age`,`name`),
KEY `idx_height` (`height`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin
此外,還創建了三個索引:
id
:數據庫的主鍵idx_code_age_name
:由code、age和name三個字段組成的聯合索引。idx_height
:普通索引
1.2 插入數據
為了方便給大家做演示,我特意向user表中插入了3條數據:
INSERT INTO sue.user (id, code, age, name, height) VALUES (1, '101', 21, '周星馳', 175,'香港');
INSERT INTO sue.user (id, code, age, name, height) VALUES (2, '102', 18, '周杰倫', 173,'臺灣');
INSERT INTO sue.user (id, code, age, name, height) VALUES (3, '103', 23, '蘇三', 174,'成都');
周星馳和周杰倫是我偶像,在這里自戀了一次,把他們和我放到一起了。哈哈哈。
1.3 查看數據庫版本
為了防止以后出現不必要的誤會,在這里有必要查一下當前數據庫的版本。不說版本就直接給結論,是耍流氓,哈哈哈。
select version();
查出當前的mysql版本號為:8.0.21
1.4 查看執行計劃
在mysql中,如果你想查看某條sql語句是否使用了索引,或者已建好的索引是否失效,可以通過explain
關鍵字,查看該sql語句的執行計劃,來判斷索引使用情況。
例如:
explain select * from user where id=1;
執行結果:從圖中可以看出,由于id字段是主鍵,該sql語句用到了主鍵索引
。
當然,如果你想更深入的了解explain關鍵字的用法,可以看看我的另一篇文章《explain | 索引優化的這把絕世好劍,你真的會用嗎?》,里面更為詳細的介紹。
2. 不滿足最左匹配原則
之前我已經給code、age和name這3個字段建好聯合索引
:idx_code_age_name。
該索引字段的順序是:
- code
- age
- name
如果在使用聯合索引時,沒注意最左前綴原則,很有可能導致索引失效喔,不信我們一起往下看。
2.1 哪些情況索引有效?
先看看哪些情況下,能走索引。
explain select * from user
where code='101';
explain select * from user
where code='101' and age=21
explain select * from user
where code='101' and age=21 and name='周星馳';
執行結果:上面三種情況,sql都能正常走索引。
其實還有一種比較特殊的場景:
explain select * from user
where code = '101' and name='周星馳';
執行結果:查詢條件原本的順序是:code、age、name,但這里只有code和name中間斷層了,掉了age字段,這種情況也能走code字段上的索引。
看到這里,不知道聰明的你,有沒有發現這樣一個規律:這4條sql中都有code字段,它是索引字段中的第一個字段,也就是最左邊的字段。只要有這個字段在,該sql已經就能走索引。
這就是我們所說的最左匹配原則
。
2.2 哪些情況索引失效?
前面我已經介紹過,建立了聯合索引后,在查詢條件中有哪些情況索引是有效的。
接下來,我們重點看看哪些情況下索引會失效。
explain select * from user
where age=21;
explain select * from user
where name='周星馳';
explain select * from user
where age=21 and name='周星馳';
執行結果:從圖中看出這3種情況下索引確實失效了。
說明以上3種情況不滿足最左匹配原則,說白了是因為查詢條件中,沒有包含給定字段最左邊的索引字段,即字段code。
3. 使用了select *
在《阿里巴巴開發手冊》中明確說過,查詢sql中禁止使用select *
。
那么,你知道為什么嗎?
廢話不多說,按照國際慣例先上一條sql:
explain
select * from user where name='蘇三';
執行結果:在該sql中用了select *
,從執行結果看,走了全表掃描,沒有用到任何索引,查詢效率是非常低的。
如果查詢的時候,只查我們真正需要的列,而不查所有列,結果會怎么樣?
非??焖俚膶⑸厦娴膕ql改成只查了code和name列,太easy了:
explain
select code,name from user
where name='蘇三';
執行結果:從圖中執行結果不難看出,該sql語句這次走了全索引掃描
,比全表掃描
效率更高。
其實這里用到了:覆蓋索引
。
如果select語句中的查詢列,都是索引列,那么這些列被稱為覆蓋索引。這種情況下,查詢的相關字段都能走索引,索引查詢效率相對來說更高一些。
而使用select *
查詢所有列的數據,大概率會查詢非索引列的數據,非索引列不會走索引,查詢效率非常低。
4. 索引列上有計算
介紹本章節內容前,先跟大家一起回顧一下,根據id查詢數據的sql語句:
explain select * from user where id=1;
執行結果:從圖中可以看出,由于id字段是主鍵,該sql語句用到了主鍵索引
。
但如果id列上面有計算,比如:
explain select * from user where id+1=2;
執行結果:從上圖中的執行結果,能夠非常清楚的看出,該id字段的主鍵索引,在有計算的情況下失效了。
5. 索引列用了函數
有時候我們在某條sql語句的查詢條件中,需要使用函數,比如:截取某個字段的長度。
假如現在有個需求:想查出所有身高是17開頭的人,如果sql語句寫成這樣:
explain select * from user where height=17;
該sql語句確實用到了普通索引:但該sql語句肯定是有問題的,因為它只能查出身高正好等于17的,但對于174這種情況,它沒辦法查出來。
為了滿足上面的要求,我們需要把sql語句稍稍改造了一下:
explain select * from user where SUBSTR(height,1,2)=17;
這時需要用到SUBSTR
函數,用它截取了height字段的前面兩位字符,從第一個字符開始。
執行結果:你有沒有發現,在使用該函數之后,該sql語句竟然走了全表掃描,索引失效了。
6. 字段類型不同
在sql語句中因為字段類型不同,而導致索引失效的問題,很容易遇到,可能是我們日常工作中最容易忽略的問題。
到底怎么回事呢?
請大家注意觀察一下t_user表中的code字段,它是varchar
字符類型的。
在sql語句中查詢數據時,查詢條件我們可以寫成這樣:
explain
select * from user where code="101";
執行結果:從上圖中看到,該code字段走了索引。
溫馨提醒一下,查詢字符字段時,用雙引號
“
和單引號'
都可以。
但如果你在寫sql時,不小心把引號弄掉了,把sql語句變成了:
explain
select * from user where code=101;
執行結果:你會驚奇的發現,該sql語句竟然變成了全表掃描。因為少寫了引號,這種小小的失誤,竟然讓code字段上的索引失效了。
這時你心里可能有一萬個為什么,其中有一個肯定是:為什么索引會失效呢?
答:因為code字段的類型是varchar,而傳參的類型是int,兩種類型不同。
此外,還有一個有趣的現象,如果int類型的height字段,在查詢時加了引號條件,卻還可以走索引:
explain select * from user
where height='175';
執行結果:從圖中看出該sql語句確實走了索引。int類型的參數,不管在查詢時加沒加引號,都能走索引。
這是變魔術嗎?這不科學呀。
答:mysql發現如果是int
類型字段作為查詢條件時,它會自動將該字段的傳參進行隱式轉換
,把字符串轉換成int類型。
mysql會把上面列子中的字符串175,轉換成數字175,所以仍然能走索引。
接下來,看一個更有趣的sql語句:
select 1 + '1';
它的執行結果是2,還是11呢?
好吧,不賣關子了,直接公布答案執行結果是2。
mysql自動把字符串1,轉換成了int類型的1,然后變成了:1+1=2。
但如果你確實想拼接字符串該怎么辦?
答:可以使用concat
關鍵字。
具體拼接sql如下:
select concat(1,'1');
接下來,關鍵問題來了:為什么字符串類型的字段,傳入了int類型的參數時索引會失效呢?
答:根據mysql官網上解釋,字符串'1'、' 1 '、'1a'都能轉換成int類型的1,也就是說可能會出現多個字符串,對應一個int類型參數的情況。那么,mysql怎么知道該把int類型的1轉換成哪種字符串,用哪個索引快速查值?
感興趣的小伙伴可以再看看官方文檔:https://dev.mysql.com/doc/refman/8.0/en/type-conversion.html
7. like左邊包含%
模糊查詢,在我們日常的工作中,使用頻率還是比較高的。
比如現在有個需求:想查詢姓李的同學有哪些?
使用like
語句可以很快的實現:
select * from user where name like '李%';
但如果like用的不好,就可能會出現性能問題,因為有時候它的索引會失效。
不信,我們一起往下看。
目前like查詢主要有三種情況:
- like '%a'
- like 'a%'
- like '%a%'
假如現在有個需求:想查出所有code是10開頭的用戶。
這個需求太簡單了吧,sql語句如下:
explain select * from user
where code like '10%';
執行結果:圖中看出這種%
在10
右邊時走了索引。
而如果把需求改了:想出現出所有code是1結尾的用戶。
查詢sql語句改為:
explain select * from user
where code like '%1';
執行結果:從圖中看出這種%
在1
左邊時,code字段上索引失效了,該sql變成了全表掃描。
此外,如果出現以下sql:
explain select * from user
where code like '%1%';
該sql語句的索引也會失效。
下面用一句話總結一下規律:當like
語句中的%
,出現在查詢條件的左邊時,索引會失效。
那么,為什么會出現這種現象呢?
答:其實很好理解,索引就像字典中的目錄。一般目錄是按字母或者拼音從小到大,從左到右排序,是有順序的。
我們在查目錄時,通常會先從左邊第一個字母進行匹對,如果相同,再匹對左邊第二個字母,如果再相同匹對其他的字母,以此類推。
通過這種方式我們能快速鎖定一個具體的目錄,或者縮小目錄的范圍。
但如果你硬要跟目錄的設計反著來,先從字典目錄右邊匹配第一個字母,這畫面你可以自行腦補一下,你眼中可能只剩下絕望了,哈哈。
8. 列對比
上面的內容都是常規需求,接下來,來點不一樣的。
假如我們現在有這樣一個需求:過濾出表中某兩列值相同的記錄。比如user表中id字段和height字段,查詢出這兩個字段中值相同的記錄。
這個需求很簡單,sql可以這樣寫:
explain select * from user
where id=height
執行結果:意不意外,驚不驚喜?索引失效了。
為什么會出現這種結果?
id字段本身是有主鍵索引的,同時height字段也建了普通索引的,并且兩個字段都是int類型,類型是一樣的。
但如果把兩個單獨建了索引的列,用來做列對比時索引會失效。
感興趣的朋友可以找我私聊。
9. 使用or關鍵字
我們平時在寫查詢sql時,使用or
關鍵字的場景非常多,但如果你稍不注意,就可能讓已有的索引失效。
不信一起往下面看。
某天你遇到這樣一個需求:想查一下id=1或者height=175的用戶。
你三下五除二就把sql寫好了:
explain select * from user
where id=1 or height='175';
執行結果:沒錯,這次確實走了索引,恭喜被你蒙對了,因為剛好id和height字段都建了索引。
但接下來的一個夜黑風高的晚上,需求改了:除了前面的查詢條件之后,還想加一個address='成都'。
這還不簡單,sql走起:
explain select * from user
where id=1 or height='175' or address='成都';
執行結果:結果悲劇了,之前的索引都失效了。
你可能一臉懵逼,為什么?我做了什么?
答:因為你最后加的address字段沒有加索引,從而導致其他字段的索引都失效了。
注意:如果使用了
or
關鍵字,那么它前面和后面的字段都要加索引,不然所有的索引都會失效,這是一個大坑。
10. not in和not exists
在我們日常工作中用得也比較多的,還有范圍查詢,常見的有:
- in
- exists
- not in
- not exists
- between and
今天重點聊聊前面四種。
10.1 in關鍵字
假如我們想查出height在某些范圍之內的用戶,這時sql語句可以這樣寫:
explain select * from user
where height in (173,174,175,176);
執行結果:從圖中可以看出,sql語句中用in
關鍵字是走了索引的。
10.2 exists關鍵字
有時候使用in
關鍵字時性能不好,這時就能用exists
關鍵字優化sql了,該關鍵字能達到in關鍵字相同的效果:
explain select * from user t1
where exists (select 1 from user t2 where t2.height=173 and t1.id=t2.id)
執行結果:從圖中可以看出,用exists
關鍵字同樣走了索引。
10.3 not in關鍵字
上面演示的兩個例子是正向的范圍,即在某些范圍之內。
那么反向的范圍,即不在某些范圍之內,能走索引不?
話不多說,先看看使用not in
的情況:
explain select * from user
where height not in (173,174,175,176);
執行結果:你沒看錯,索引失效了。
看如果現在需求改了:想查一下id不等于1、2、3的用戶有哪些,這時sql語句可以改成這樣:
explain select * from user
where id not in (173,174,175,176);
執行結果:你可能會驚奇的發現,主鍵字段中使用not in關鍵字查詢數據范圍,任然可以走索引。而普通索引字段使用了not in關鍵字查詢數據范圍,索引會失效。
10.4 not exists關鍵字
除此之外,如果sql語句中使用not exists
時,索引也會失效。具體sql語句如下:
explain select * from user t1
where not exists (select 1 from user t2 where t2.height=173 and t1.id=t2.id)
執行結果:從圖中看出sql語句中使用not exists關鍵后,t1表走了全表掃描,并沒有走索引。
11. order by的坑
在sql語句中,對查詢結果進行排序是非常常見的需求,一般情況下我們用關鍵字:order by
就能搞定。
但我始終覺得order by挺難用的,它跟where
或者limit
關鍵字有很多千絲萬縷的聯系,一不小心就會出問題。
Let go
11.1 哪些情況走索引?
首先當然要溫柔一點,一起看看order by的哪些情況可以走索引。
我之前說過,在code、age和name這3個字段上,已經建了聯合索引:idx_code_age_name。
11.1.1 滿足最左匹配原則
order by后面的條件,也要遵循聯合索引的最左匹配原則。具體有以下sql:
explain select * from user
order by code limit 100;
explain select * from user
order by code,age limit 100;
explain select * from user
order by code,age,name limit 100;
執行結果:從圖中看出這3條sql都能夠正常走索引。
除了遵循最左匹配原則之外,有個非常關鍵的地方是,后面還是加了limit
關鍵字,如果不加它索引會失效。
11.1.2 配合where一起使用
order by還能配合where一起遵循最左匹配原則。
explain select * from user
where code='101'
order by age;
執行結果:code是聯合索引的第一個字段,在where中使用了,而age是聯合索引的第二個字段,在order by中接著使用。
假如中間斷層了,sql語句變成這樣,執行結果會是什么呢?
explain select * from user
where code='101'
order by name;
執行結果:雖說name是聯合索引的第三個字段,但根據最左匹配原則,該sql語句依然能走索引,因為最左邊的第一個字段code,在where中使用了。只不過order by的時候,排序效率比較低,需要走一次filesort
排序罷了。
11.1.3 相同的排序
order by后面如果包含了聯合索引的多個排序字段,只要它們的排序規律是相同的(要么同時升序,要么同時降序),也可以走索引。
具體sql如下:
explain select * from user
order by code desc,age desc limit 100;
執行結果:該示例中order by后面的code和age字段都用了降序,所以依然走了索引。
11.1.4 兩者都有
如果某個聯合索引字段,在where和order by中都有,結果會怎么樣?
explain select * from user
where code='101'
order by code, name;
執行結果:code字段在where和order by中都有,對于這種情況,從圖中的結果看出,還是能走了索引的。
11.2 哪些情況不走索引?
前面介紹的都是正面的用法,是為了讓大家更容易接受下面反面的用法。
好了,接下來,重點聊聊order by的哪些情況下不走索引?
11.2.1 沒加where或limit
如果order by語句中沒有加where或limit關鍵字,該sql語句將不會走索引。
explain select * from user
order by code, name;
執行結果:從圖中看出索引真的失效了。
11.2.2 對不同的索引做order by
前面介紹的基本都是聯合索引,這一個索引的情況。但如果對多個索引進行order by,結果會怎么樣呢?
explain select * from user
order by code, height limit 100;
執行結果:從圖中看出索引也失效了。
11.2.3 不滿足最左匹配原則
前面已經介紹過,order by如果滿足最左匹配原則,還是會走索引。下面看看,不滿足最左匹配原則的情況:
explain select * from user
order by name limit 100;
執行結果:name字段是聯合索引的第三個字段,從圖中看出如果order by不滿足最左匹配原則,確實不會走索引。
11.2.4 不同的排序
前面已經介紹過,如果order by后面有一個聯合索引的多個字段,它們具有相同排序規則,那么會走索引。
但如果它們有不同的排序規則呢?
explain select * from user
order by code asc,age desc limit 100;
執行結果:從圖中看出,盡管order by后面的code和age字段遵循了最左匹配原則,但由于一個字段是用的升序,另一個字段用的降序,最終會導致索引失效。
-
數據庫
+關注
關注
7文章
3767瀏覽量
64279 -
MySQL
+關注
關注
1文章
802瀏覽量
26452 -
索引
+關注
關注
0文章
59瀏覽量
10465 -
select
+關注
關注
0文章
28瀏覽量
3905
發布評論請先 登錄
相關推薦
評論