******** 摘要********
MySQL是目前主流的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),目前在全球被廣泛地應(yīng)用。由于其開(kāi)源、體積小、速度快、成本低、安全性高,因此許多網(wǎng)站選擇MySQL作為數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)數(shù)據(jù)。
****以前在運(yùn)維數(shù)據(jù)庫(kù)過(guò)程中經(jīng)常會(huì)遇到這樣的困擾:沒(méi)有工具快速切換集群主庫(kù),如果切換主庫(kù),需要DBA手動(dòng)修改從庫(kù)指向,修改元信息等。所以今天給大家介紹一款工具M(jìn)HA,可以實(shí)現(xiàn)需求快速上線(xiàn),不影響當(dāng)前架構(gòu),整個(gè)切換全部自動(dòng)化處理,方便DBA使用,例如檢查,操作,展示等。
在 MySQL(5.5 及以下)傳統(tǒng)復(fù)制的時(shí)代,MHA(Master High Availability)在 MySQL 高可用應(yīng)用中非常成熟。在 MySQL(5.6)及 GTID 時(shí)代開(kāi)啟以后,MHA 沒(méi)有隨之進(jìn)行進(jìn)一步的更新,但是很多互聯(lián)網(wǎng)公司依然在沿用這個(gè)技術(shù)。因此本文給出了MHA的簡(jiǎn)單介紹。
2
MHA簡(jiǎn)介
【 什么是MHA 】
****MHA目前在MySQL高可用方面是一個(gè)相對(duì)成熟的解決方案,它由日本DeNA公司youshimaton開(kāi)發(fā),是一套優(yōu)秀的作為MySQL高可用性環(huán)境下故障切換和主從提升的高可用軟件。在MySQL故障切換過(guò)程中,MHA能做到在0~30秒之內(nèi)自動(dòng)完成數(shù)據(jù)庫(kù)的故障切換操作,并且在進(jìn)行故障切換的過(guò)程中,MHA能在最大程度上保證數(shù)據(jù)的一致性,以達(dá)到真正意義上的高可用。
目前MHA主要支持一主多從的架構(gòu),在搭建MHA時(shí)至少要有一個(gè)Master主庫(kù)和兩個(gè)Slave從庫(kù),MHA架構(gòu)支持任何存儲(chǔ)引擎。
****該軟件由兩部分組成:MHA Manager(管理節(jié)點(diǎn))和MHA Node(數(shù)據(jù)節(jié)點(diǎn))。MHA Manager可以單獨(dú)部署在一臺(tái)獨(dú)立的機(jī)器上管理多個(gè)master-slave集群,也可以部署在一臺(tái)slave節(jié)點(diǎn)上。MHA Node運(yùn)行在每臺(tái)MySQL服務(wù)器上,MHA Manager會(huì)定時(shí)探測(cè)集群中的master節(jié)點(diǎn),當(dāng)master出現(xiàn)故障時(shí),它可以自動(dòng)將最新數(shù)據(jù)的slave提升為新的master,然后將所有其他的slave重新指向新的master。整個(gè)故障轉(zhuǎn)移過(guò)程對(duì)應(yīng)用程序完全透明。
【 MHA優(yōu)勢(shì) 】
- 不影響服務(wù)器性能,易安裝,不改變現(xiàn)有部署
- 故障切換(實(shí)現(xiàn)自動(dòng)故障檢測(cè)和故障轉(zhuǎn)移,通常在30秒以?xún)?nèi))
- 數(shù)據(jù)一致性保證
- 不需要對(duì)當(dāng)前mysql環(huán)境做重大修改
- 不需要添加額外的服務(wù)器(僅一臺(tái)manager就可管理上百個(gè)replication)
- ****性能優(yōu)秀,可工作在半同步復(fù)制和異步復(fù)制,當(dāng)監(jiān)控mysql狀態(tài)時(shí),僅需要每隔N秒向master發(fā)送ping包(默認(rèn)3秒),所以對(duì)性能無(wú)影響。你可以理解為MHA的性能和簡(jiǎn)單的主從復(fù)制框架性能一樣
- ****只要replication支持的存儲(chǔ)引擎mha都支持
【 MHA組成 】
MHA軟件由兩部分組成,Manager工具包和Node工具包,具體的說(shuō)明如下。
Manager工具包主要包括以下幾個(gè)工具:
- masterha_check_ssh 檢查MHA的SSH配置狀況
- masterha_check_repl 檢查MySQL復(fù)制狀況
- masterha_manger 啟動(dòng)MHA
- masterha_check_status 檢測(cè)當(dāng)前MHA運(yùn)行狀態(tài)
- masterha_master_monitor 檢測(cè)master是否宕機(jī)
- masterha_master_switch 控制故障轉(zhuǎn)移(自動(dòng)或者手動(dòng))
- masterha_conf_host 添加或刪除配置的server信息
Node工具包(這些工具通常由MHA Manager的腳本觸發(fā),無(wú)需人為操作)主要包括以下幾個(gè)工具:
- save_binary_logs 保存和復(fù)制master的二進(jìn)制日志
- apply_diff_relay_logs 識(shí)別差異的中繼日志事件并將其差異的事件應(yīng)用于其他的slave
- filter_mysqlbinlog 去除不必要的ROLLBACK事件
- purge_relay_logs 清除中繼日志(不會(huì)阻塞SQL線(xiàn)程)
【 MHA版本選擇 】
從MHA的0.56版本開(kāi)始,也支持基于GTID的故障切換。MHA會(huì)自動(dòng)檢測(cè)mysqld是否在GTID運(yùn)行,如果GTID開(kāi)啟,MHA就實(shí)現(xiàn)帶GTID的故障切換,如果沒(méi)有啟用,MHA就使用基于relay log的故障切換。
3MHA實(shí)現(xiàn)
【 工作流程 】
- 從宕機(jī)崩潰的master保存二進(jìn)制日志事件(binlog events);
- 識(shí)別含有最新更新的slave;
- 應(yīng)用差異的中繼日志(relay log)到其他的slave;
- 應(yīng)用從master保存的二進(jìn)制日志事件(binlog events);
- 提升一個(gè)slave為新的master;
- 使其他的slave連接新的master進(jìn)行復(fù)制。
【 MHA架構(gòu) 】
中控機(jī)管理工具,用于管理mha部署、主從切換等;****
****mha管理工具,支持部署、更新配置文件、目錄等開(kāi)關(guān)。manager收集切換日志、集群互信、檢查ssh、repl狀態(tài)、配置文件一致性等。
【 核心腳本工作原理介紹 】
1) masterha_manager
mha啟動(dòng)腳本為masterha_manager,可選參數(shù)為remove_dead_master_conf、manger_log、ignore_last_failover。
masterha_manager主要流程為:
1.調(diào)用MasterMonitor,監(jiān)控MySQL master狀態(tài);
2.發(fā)現(xiàn)master狀態(tài)異常后,調(diào)用MasterFailover進(jìn)行切換;
3.manager通過(guò)monitor監(jiān)測(cè)master狀態(tài),一旦獲得返回值,則表明monitor狀態(tài)異常。通過(guò)判斷exit_code確定是否應(yīng)切換。
4.檢測(cè)通過(guò)后,調(diào)用MasterFailover進(jìn)執(zhí)行切換操作。
具體流程如下:
2) MasterMonitor
MasterHA_Manager調(diào)用MasterMonitor的main方法對(duì)MySQL進(jìn)行監(jiān)控。
具體流程圖如下:
核心方法是一個(gè)死循環(huán),不斷調(diào)用wait_until_master_is_dead方法監(jiān)測(cè)主庫(kù)狀態(tài)。wait_until_master_is_dead方法的返回值中,exit_code有的值有四種,分別是0、1、20、retry。其中只有當(dāng)exit_code=MHA::ManagerConst::MASTER_DEAD_RC,也就是20時(shí),后續(xù)才會(huì)調(diào)用failover方法。
wait_until_master_is_dead方法中,核心方法是調(diào)用wait_until_master_is_unreachable方法并處理其返回值。邏輯關(guān)系如下:
拿到wait_until_master_is_unreachable的返回值后,會(huì)再次根據(jù)配置文件探活,確認(rèn)主庫(kù)連接失敗后,根據(jù)配置文件檢測(cè)slave狀態(tài)和數(shù)量,有合適新主庫(kù)后,exit_code返回20,否則返回0或者1。
wait_until_master_is_unreachable方法的返回值有三個(gè),分別是ret、dead_master和ssh_reachable。該方法的邏輯如下:
wait_until_master_is_unreachable調(diào)用MHA::ServerManager對(duì)主庫(kù)進(jìn)行實(shí)時(shí)檢測(cè),包括deadservers、aliveservers、aliveslaves等。如果啟用GTID,則檢查binlog server,否則進(jìn)行ssh和slave版本檢測(cè)。
后續(xù)使用MHA::HealthCheck對(duì)主庫(kù)進(jìn)行ping檢查。檢查確認(rèn)主庫(kù)的確不可達(dá)后,返回func_rc, current_master, ssh_reachable。
4
總結(jié)
MHA 由日本 DeNA 公司 youshimaton 開(kāi)發(fā),他認(rèn)為在 GTID 環(huán)境下MHA 存在的價(jià)值不大,MHA 最近一次發(fā)版是 2018 年。現(xiàn)如今使用 MySQL 已離不開(kāi) GTID ,無(wú)論是從功能、性能角度,還是從維護(hù)角度,GTID 能具備更優(yōu)異的表現(xiàn)。但是無(wú)論是什么技術(shù),他的核心原理都是可以自動(dòng)將最新數(shù)據(jù)的Slave提升為新的 Master,然后將所有其他的Slave重新指向新的Master。整個(gè)故障轉(zhuǎn)移過(guò)程對(duì)應(yīng)用程序是完全透明的,因此MHA的時(shí)代是值得被大家了解和記憶的。
-
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
3845瀏覽量
64594 -
MySQL
+關(guān)注
關(guān)注
1文章
829瀏覽量
26677 -
存儲(chǔ)數(shù)據(jù)
+關(guān)注
關(guān)注
0文章
89瀏覽量
14142
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論