2. 解析與優(yōu)化
服務器收到客戶端傳來的請求之后,還需要經過查詢緩存、詞法語法解析和預處理、查詢優(yōu)化的處理。
2.1 查詢緩存
如果我們兩次都執(zhí)行同一條查詢指令,第二次的響應時間會不會比第一次的響應時間短一些?
之前使用過Redis緩存工具的讀者應該會有這個很自然的想法,MySQL收到查詢請求之后應該先到緩存中查看一下,看一下之前是不是執(zhí)行過這條指令。如果緩存命中,則直接返回結果;否則重新進行查詢,然后加入緩存。
MySQL確實內部自帶了一個緩存模塊。
現(xiàn)在有一張500W行且沒有添加索引的數(shù)據(jù)表,我執(zhí)行以下命令兩次,第二次會不會變得很快?
SELECT * FROM t_user WHERE user_name = '蟬沐風'
并不會!說明緩存沒有生效,為什么?MySQL默認是關閉自身的緩存功能的,查看一下query_cache_type
變量設置。
mysql> show variables like 'query_cache_type';
+------------------------------+---------+
| Variable_name | Value |
+------------------------------+---------+
| query_cache_type | OFF |
+------------------------------+---------+
默認關閉就意味著不推薦,MySQL為什么不推薦用戶使用自己的緩存功能呢?
- MySQL自帶的緩存系統(tǒng)應用場景非常有限,它要求SQL語句必須一模一樣,多一個空格,變一個大小寫都被認為是兩條不同的SQL語句
- 緩存失效非常頻繁。只要一個表的數(shù)據(jù)有任何修改,針對該表的所有緩存都會失效。對于更新頻繁的數(shù)據(jù)表而言,緩存命中率非常低!
所以緩存的功能還是交給專業(yè)的ORM框架(比如MyBatis默認開啟一級緩存)或者獨立的緩存服務Redis更加適合。
MySQL8.0已經徹底移除了緩存功能
2.2 解析器 & 預處理器(Parser & Preprocessor)
現(xiàn)在跳過緩存這一步了,接下來需要做什么了?
如果我隨便在客戶端終端里輸入一個字符串chanmufeng
,服務器返回了一個1064的錯誤
mysql> chanmufeng;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'chanmufeng' at line 1
服務器是怎么判斷出我的輸入是錯誤的呢?這就是MySQL的Parser解析器的作用了,它主要包含兩步,分別是詞法解析和語法分析。
2.2.1 詞法解析
以下面的SQL語句為例
SELECT * FROM t_user WHERE user_name = '蟬沐風' AND age > 3;
分析器先會做“詞法分析”,就是把一條完整的SQL語句打碎成一個個單詞,比如一條簡單的SQL語句,會打碎成8個符號,每個符號是什么類型,從哪里開始到哪里結束。
MySQL 從你輸入的SELECT
這個關鍵字識別出來,這是一個查詢語句。它也要把字符串t_user
識 別成“表名 t_user”,把字符串user_name
識別成“列 user_name"。
2.2.2 語法分析
做完詞法解析,接下來需要做語法分析了。
根據(jù)詞法分析的結果,語法分析器會根據(jù)語法規(guī)則,判斷你輸入的這個 SQL 語句是否滿足 MySQL 語法,比如單引號是否閉合,關鍵詞拼寫是否正確等。
解析器會根據(jù)SQL語句生成一個數(shù)據(jù)結構,這個數(shù)據(jù)結構我們成為解析樹。
我故意拼錯了SELECT
關鍵字,MySQL報了語法錯誤,就是在語法分析這一步。
mysql> ELECT * FROM t_user WHERE user_name = '蟬沐風' AND age > 3;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'ELECT * FROM t_user WHERE user_name = '蟬沐風'' at line 1
詞法語法分析是一個非常基礎的功能,Java 的編譯器、百度搜索引擎如果要識別語句,必須也要有詞法語法分析功能。
任何數(shù)據(jù)庫的中間件,要解析 SQL完成路由功能,也必須要有詞法和語法分析功能,比如 Mycat,Sharding-JDBC(用到了Druid Parser)等都是如此。在市面上也有很多的開源的詞法解析的工具,比如 LEX,Yacc等。
2.2.3 預處理器
如果我們寫了一條語法和詞法都沒有問題的SQL,但是字段名和表名卻不存在,這個錯誤是在哪一個階段爆出的呢?
詞法解析和語法分析是無法知道數(shù)據(jù)庫里有什么表,有哪些字段的。要知道這些信息還需要解析階段的另一個工具——預處理器。
它會檢查生成的解析樹,解決解析器無法解析的語義。比如,它會檢查表和列名是否存在,檢查名字和別名,保證沒有歧義。預處理之后得到一個新的解析樹。
本質上,解析和預處理是一個編譯過程,涉及到詞法解析、語法和語義分析,更多細節(jié)我們不會探究,感興趣的讀者可以看一下編譯原理方面的書籍。
2.3 查詢優(yōu)化器(Optimizer)與查詢執(zhí)行計劃
到了這一步,MySQL終于知道我們想查詢的表和列以及相應的搜索條件了,是不是可以直接進行查詢了?
還不行。MySQL作者擔心我們寫的SQL太垃圾,所以有設計出一個叫做查詢優(yōu)化器的東東,輔助我們提高查詢效率。
2.3.1 什么是查詢優(yōu)化器?
一條 SQL語句是不是只有一種執(zhí)行方式?或者說數(shù)據(jù)庫最終執(zhí)行的 SQL是不是就是我們發(fā)送的 SQL?
不是。一條 SQL 語句是可以有很多種執(zhí)行方式的,最終返回相同的結果,他們是等價的。
舉一個非常簡單的例子,比如你執(zhí)行下面這樣的語句:
SELECT * FROM t1, t2 WHERE t1.id = 10 AND t2.id = 20
- 既可以先從表 t1 里面取出 id=10 的記錄,再根據(jù) id 值關聯(lián)到表 t2,再判斷 t2 里面 id 的值是否等于 20。
- 也可以先從表 t2 里面取出 id=20 的記錄,再根據(jù) id 值關聯(lián)到表 t1,再判斷 t1 里面 id 的值是否等于 10。
這兩種執(zhí)行方法的邏輯結果是一樣的,但是執(zhí)行的效率會有不同,如果有這么多種執(zhí)行方式,這些執(zhí)行方式怎么得到的?最終選擇哪一種去執(zhí)行?根據(jù)什么判斷標準去選擇?
這個就是 MySQL的查詢優(yōu)化器的模塊(Optimizer)的工作。
查詢優(yōu)化器的目的就是根據(jù)解析樹生成不同的執(zhí)行計劃(Execution Plan),然后選擇一種最優(yōu)的執(zhí)行計劃,MySQL 里面使用的是基于開銷(cost)的優(yōu)化器,哪種執(zhí)行計劃開銷最小,就用哪種。
2.3.2 優(yōu)化器究竟做了什么?
舉兩個簡單的例子∶
- 當我們對多張表進行關聯(lián)查詢的時候,以哪個表的數(shù)據(jù)作為基準表。
- 有多個索引可以使用的時候,選擇哪個索引。
實際上,對于每一種數(shù)據(jù)庫來說,優(yōu)化器的模塊都是必不可少的,他們通過復雜的算法實現(xiàn)盡可能優(yōu)化查詢效率。
往細節(jié)上說,查詢優(yōu)化器主要做了下面幾方面的優(yōu)化:
- 子查詢優(yōu)化
- 等價謂詞重寫
- 條件化簡
- 外連接消除
- 嵌套連接消除
- 連接消除
- 語義優(yōu)化
本文不會對優(yōu)化的細節(jié)展開講解,大家先對MySQL的整體架構有所了解就可以了,具體細節(jié)之后單獨開篇介紹
但是優(yōu)化器也不是萬能的,如果SQL語句寫得實在太垃圾,再牛的優(yōu)化器也救不了你了。因此大家在編寫SQL語句的時候還是要有意識地進行優(yōu)化。
2.3.3 執(zhí)行計劃
優(yōu)化完之后,得到一個什么東西呢?優(yōu)化器最終會把解析樹變成一個查詢執(zhí)行計劃。
查詢執(zhí)行計劃展示了接下來執(zhí)行查詢的具體方式,比如多張表關聯(lián)查詢,先查詢哪張表,在執(zhí)行查詢的時候有多個索引可以使用,實際上該使用哪些索引。
MySQL提供了一個查看執(zhí)行計劃的工具。我們在 SQL語句前面加上 EXPLAIN
就可以看到執(zhí)行計劃的信息。
mysql> EXPLAIN SELECT * FROM t_user WHERE user_name = '';
+----+-------------+--------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+--------+------------+------+---------------+------+---------+------+------+----------+-------------+
| 1 | SIMPLE | t_user | NULL | ALL | NULL | NULL | NULL | NULL | 1 | 100.00 | Using where |
+----+-------------+--------+------------+------+---------------+------+---------+------+------+----------+-------------+
如果要得到更加詳細的信息,還可以用FORMAT=JSON
,或者開啟optimizer trace
。
mysql> EXPLAIN FORMAT=JSON SELECT * FROM t_user WHERE user_name = '';
文本不會帶大家詳細了解執(zhí)行計劃的每一個參數(shù),內容很龐雜,大家先對MySQL的整體架構有所了解就可以了,具體細節(jié)之后單獨開篇介紹
-
服務器
+關注
關注
12文章
9295瀏覽量
85876 -
TCP
+關注
關注
8文章
1378瀏覽量
79199 -
MySQL
+關注
關注
1文章
829瀏覽量
26677
發(fā)布評論請先 登錄
相關推薦
評論