索引規(guī)約
1. 【強(qiáng)制】業(yè)務(wù)上具有唯一特性的字段,即使是組合字段,也必須建成唯一索引。
說(shuō)明:不要以為唯一索引影響了 insert 速度,這個(gè)速度損耗可以忽略,但提高查找速度是明顯的 ; 另外,即使在應(yīng)用層做了非常完善的校驗(yàn)和控制,只要沒有唯一索引,根據(jù)墨菲定律,必然有臟數(shù)據(jù)產(chǎn)生。
2. 【強(qiáng)制】 超過(guò)三個(gè)表禁止 join 。需要 join 的字段,數(shù)據(jù)類型保持絕對(duì)一致 ; 多表關(guān)聯(lián)查詢時(shí),保證被關(guān)聯(lián)的字段需要有索引。
說(shuō)明:即使雙表 join 也要注意表索引、 SQL 性能。
3. 【強(qiáng)制】在 varchar 字段上建立索引時(shí),必須指定索引長(zhǎng)度,沒必要對(duì)全字段建立索引,根據(jù)實(shí)際文本區(qū)分度決定索引長(zhǎng)度。
說(shuō)明:索引的長(zhǎng)度與區(qū)分度是一對(duì)矛盾體,一般對(duì)字符串類型數(shù)據(jù),長(zhǎng)度為 20 的索引,區(qū)分度會(huì)高達(dá) 90%以上,可以使用 count(distinct left( 列名, 索引長(zhǎng)度 )) / count( * ) 的區(qū)分度來(lái)確定。
4. 【強(qiáng)制】頁(yè)面搜索嚴(yán)禁左模糊或者全模糊,如果需要請(qǐng)走搜索引擎來(lái)解決。
說(shuō)明:索引文件具有 B - Tree 的最左前綴匹配特性,如果左邊的值未確定,那么無(wú)法使用此索引。
5. 【推薦】如果有 order by 的場(chǎng)景,請(qǐng)注意利用索引的有序性。 order by 最后的字段是組合索引的一部分,并且放在索引組合順序的最后,避免出現(xiàn) file _ sort 的情況,影響查詢性能。
正例: where a =? and b =? order by c; 索引: a _ b _ c
反例:索引中有范圍查找,那么索引有序性無(wú)法利用,如: WHERE a >10 ORDER BY b; 索引a _ b 無(wú)法排序。
6. 【推薦】利用覆蓋索引來(lái)進(jìn)行查詢操作,來(lái)避免回表操作。
說(shuō)明:如果一本書需要知道第 11 章是什么標(biāo)題,會(huì)翻開第 11 章對(duì)應(yīng)的那一頁(yè)嗎?目錄瀏覽一下就好,這個(gè)目錄就是起到覆蓋索引的作用。
正例:能夠建立索引的種類:主鍵索引、唯一索引、普通索引,而覆蓋索引是一種查詢的一種效果,用 explain 的結(jié)果, extra 列會(huì)出現(xiàn): using index 。
7. 【推薦】利用延遲關(guān)聯(lián)或者子查詢優(yōu)化超多分頁(yè)場(chǎng)景。
說(shuō)明: MySQL 并不是跳過(guò) offset 行,而是取 offset + N 行,然后返回放棄前 offset 行,返回N 行,那當(dāng) offset 特別大的時(shí)候,效率就非常的低下,要么控制返回的總頁(yè)數(shù),要么對(duì)超過(guò)特定閾值的頁(yè)數(shù)進(jìn)行 SQL 改寫。
正例:先快速定位需要獲取的 id 段,然后再關(guān)聯(lián):
SELECT a.* FROM 表 1 a, (select id from 表 1 where 條件 LIMIT 100000,20 ) b where a.id=b.id
8. 【推薦】 SQL 性能優(yōu)化的目標(biāo):至少要達(dá)到 range 級(jí)別,要求是 ref 級(jí)別,如果可以是 consts
最好。
說(shuō)明:
1 )consts 單表中最多只有一個(gè)匹配行 ( 主鍵或者唯一索引 ) ,在優(yōu)化階段即可讀取到數(shù)據(jù)。
2 )ref 指的是使用普通的索引 (normal index) 。
3 )range 對(duì)索引進(jìn)行范圍檢索。
反例: explain 表的結(jié)果, type = index ,索引物理文件全掃描,速度非常慢,這個(gè) index 級(jí)別比較 range 還低,與全表掃描是小巫見大巫。
9. 【推薦】建組合索引的時(shí)候,區(qū)分度最高的在最左邊。
正例:如果 where a =? and b =? , a 列的幾乎接近于唯一值,那么只需要單建 idx _ a 索引即可。
說(shuō)明:存在非等號(hào)和等號(hào)混合判斷條件時(shí),在建索引時(shí),請(qǐng)把等號(hào)條件的列前置。如: where a >?and b =? 那么即使 a 的區(qū)分度更高,也必須把 b 放在索引的最前列。
10. 【參考】創(chuàng)建索引時(shí)避免有如下極端誤解:
1 ) 誤認(rèn)為一個(gè)查詢就需要建一個(gè)索引。
2 ) 誤認(rèn)為索引會(huì)消耗空間、嚴(yán)重拖慢更新和新增速度。
3 ) 誤認(rèn)為唯一索引一律需要在應(yīng)用層通過(guò)“先查后插”方式解決。