你會從哪些維度進行MySQL性能優化?你會怎么回答?
所謂的性能優化,一般針對的是MySQL查詢的優化。既然是優化查詢,我們自然要先知道查詢操作要經過哪些環節,然后思考可以在哪些環節進行優化。
下面從5個角度介紹一下MySQL優化的一些策略。
image-20220405204100602
1. 連接配置優化
處理連接是MySQL客戶端和MySQL服務端親熱的第一步,第一步都邁不好,也就別談后來的故事了。
既然連接是雙方的事情,我們自然從服務端和客戶端兩個方面來進行優化嘍。
1.1 服務端配置
服務端需要做的就是盡可能地多接受客戶端的連接,或許你遇到過error 1040: Too many connections
的錯誤?就是服務端的胸懷不夠寬廣導致的,格局太小!
我們可以從兩個方面解決連接數不夠的問題:
- 增加可用連接數,修改環境變量
max_connections
,默認情況下服務端的最大連接數為151
個
mysql> show variables like 'max_connections';
+-----------------+-------+
| Variable_name | Value |
+-----------------+-------+
| max_connections | 151 |
+-----------------+-------+
1 row in set (0.01 sec)
- 及時釋放不活動的連接,系統默認的客戶端超時時間是28800秒(8小時),我們可以把這個值調小一點
mysql> show variables like 'wait_timeout';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| wait_timeout | 28800 |
+---------------+-------+
1 row in set (0.01 sec)
MySQL有非常多的配置參數,并且大部分參數都提供了默認值,默認值是MySQL作者經過精心設計的,完全可以滿足大部分情況的需求,不建議在不清楚參數含義的情況下貿然修改。
1.2 客戶端優化
客戶端能做的就是盡量減少和服務端建立連接的次數,已經建立的連接能湊合用就湊合用,別每次執行個SQL語句都創建個新連接,服務端和客戶端的資源都吃不消啊。
解決的方案就是使用連接池來復用連接。
常見的數據庫連接池有DBCP
、C3P0
、阿里的Druid
、Hikari
,前兩者用得很少了,后兩者目前如日中天。
但是需要注意的是連接池并不是越大越好,比如Druid
的默認最大連接池大小是8,Hikari
默認最大連接池大小是10,盲目地加大連接池的大小,系統執行效率反而有可能降低。為什么?
對于每一個連接,服務端會創建一個單獨的線程去處理,連接數越多,服務端創建的線程自然也就越多。而線程數超過CPU個數的情況下,CPU勢必要通過分配時間片的方式進行線程的上下文切換,頻繁的上下文切換會造成很大的性能開銷。
Hikari官方給出了一個PostgreSQL
數據庫連接池大小的建議值公式,CPU核心數*2+1
。假設服務器的CPU核心數是4,把連接池設置成9就可以了。這種公式在一定程度上對其他數據庫也是適用的,大家面試的時候可以吹一吹。
2. 架構優化
2.1 使用緩存
系統中難免會出現一些比較慢的查詢,這些查詢要么是數據量大,要么是查詢復雜(關聯的表多或者是計算復雜),使得查詢會長時間占用連接。
如果這種數據的實效性不是特別強(不是每時每刻都會變化,例如每日報表),我們可以把此類數據放入緩存系統中,在數據的緩存有效期內,直接從緩存系統中獲取數據,這樣就可以減輕數據庫的壓力并提升查詢效率。
緩存的使用
2.2 讀寫分離(集群、主從復制)
項目的初期,數據庫通常都是運行在一臺服務器上的,用戶的所有讀寫請求會直接作用到這臺數據庫服務器,單臺服務器承擔的并發量畢竟是有限的。
針對這個問題,我們可以同時使用多臺數據庫服務器,將其中一臺設置為為小組長,稱之為master
節點,其余節點作為組員,叫做slave
。用戶寫數據只往master
節點寫,而讀的請求分攤到各個slave
節點上。這個方案叫做 讀寫分離 。給組長加上組員組成的小團體起個名字,叫 集群 。
這就是集群
注:很多開發者不滿
master-slave
這種具有侵犯性的詞匯(因為他們認為會聯想到種族歧視、黑人奴隸等),所以發起了一項更名運動。受此影響MySQL也會逐漸停用
master
、slave
等術語,轉而用source
和replica
替代,大家碰到的時候明白即可。
使用集群必然面臨一個問題,就是多個節點之間怎么保持數據的一致性。畢竟寫請求只往master
節點上發送了,只有master
節點的數據是最新數據,怎么把對master
節點的寫操作也同步到各個slave
節點上呢?
主從復制技術來了!我在一條SQL更新語句是如何執行的?中粗淺地介紹了一下binlog日志,我直接搬過來了。
binlog
是實現MySQL主從復制功能的核心組件。master
節點會將所有的寫操作記錄到binlog中,slave
節點會有專門的I/O線程讀取master
節點的binlog,將寫操作同步到當前所在的slave
節點。
主從復制
這種集群的架構對減輕主數據庫服務器的壓力有非常好的效果,但是隨著業務數據越來越多,如果某張表的數據量急劇增加,單表的查詢性能就會大幅下降,而這個問題是讀寫分離也無法解決的,畢竟所有節點存放的是一模一樣的數據啊,單表查詢性能差,說的自然也是所有節點性能都差。
這時我們可以把單個節點的數據分散到多個節點上進行存儲,這就是 分庫分表 。
2.3 分庫分表
分庫分表中的節點的含義比較寬泛,要是把數據庫作為節點,那就是分庫;如果把單張表作為節點,那就是分表。
大家都知道分庫分表分成垂直分庫、垂直分表、水平分庫和水平分表,但是每次都記不住這些概念,我就給大家詳細說一說,幫助大家理解。
2.3.1 垂直分庫
垂直分庫
在單體數據庫的基礎上垂直切幾刀,按照業務邏輯拆分成不同的數據庫,這就是垂直分庫啦。
垂直分庫
2.3.2 垂直分表
垂直分表
垂直分表就是在單表的基礎上垂直切一刀(或幾刀),將一個表的多個字短拆成若干個小表,這種操作需要根據具體業務來進行判斷,通常會把經常使用的字段(熱字段)分成一個表,不經常使用或者不立即使用的字段(冷字段)分成一個表,提升查詢速度。
垂直分表
拿上圖舉例:通常情況下商品的詳情信息都比較長,而且查看商品列表時往往不需要立即展示商品詳情(一般都是點擊詳情按鈕才會進行顯示),而是會將商品更重要的信息(價格等)展示出來,按照這個業務邏輯,我們將原來的商品表做了垂直分表。
2.3.3 水平分表
把單張表的數據按照一定的規則(行話叫分片規則)保存到多個數據表上,橫著給數據表來一刀(或幾刀),就是水平分表了。
水平分表
水平分表
2.3.4 水平分庫
水平分庫就是對單個數據庫水平切一刀,往往伴隨著水平分表。
水平分庫
水平分庫
2.3.5 總結
水平分,主要是為了解決存儲的瓶頸;垂直分,主要是為了減輕并發壓力。
2.4 消息隊列削峰
通常情況下,用戶的請求會直接訪問數據庫,如果同一時刻在線用戶數量非常龐大,極有可能壓垮數據庫(參考明星出軌或公布戀情時微博的狀態)。
這種情況下可以通過使用消息隊列降低數據庫的壓力,不管同時有多少個用戶請求,先存入消息隊列,然后系統有條不紊地從消息隊列中消費請求。
隊列削峰
-
數據
+關注
關注
8文章
7139瀏覽量
89574 -
服務器
+關注
關注
12文章
9303瀏覽量
86061 -
MySQL
+關注
關注
1文章
829瀏覽量
26742 -
服務端
+關注
關注
0文章
66瀏覽量
7056
發布評論請先 登錄
相關推薦
評論