MHA高可用集群

it2024-12-08 64

MHA高可用集群

MHA概述工作原理实现过程mysql5.7注意

MHA概述

MHA（Master High Availability）目前在MySQL高可用方面是一个相对成熟的解决方案，它由日本DeNA公司youshimaton（现就职于Facebook公司）开发，是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中，MHA能做到在0~30秒之内自动完成数据库的故障切换操作，并且在进行故障切换的过程中，MHA能在最大程度上保证数据的一致性，以达到真正意义上的高可用。

工作原理

MHA工作原理总结为以下几条：（1）从宕机崩溃的master保存二进制日志事件（binlog events）; （2）识别含有最新更新的slave; （3）应用差异的中继日志(relay log) 到其他slave; （4）应用从master保存的二进制日志事件(binlog events); （5）提升一个slave为新master; （6）使用其他的slave连接新的master进行复制。目前高可用方案可以一定程度上实现数据库的高可用，在进行高可用方案选择时，主要是看业务还有对数据一致性方面的要求。最后出于对数据库的高可用和数据一致性的要求，推荐使用MHA架构。

实现过程

需要4台虚拟机，一台主一台主从一台从还有一台MHA 首先把时间同步一下不然会出错

ntpdate ntp1.aliyun.com

MySQL数据库安装完成后进入master的主配置文件

[root@Mysql1 ~]# cat /etc/my.cnf [mysqld] server-id = 1 ##id号不能相同 log_bin = master-bin ##开启二进制日志文件 log-slave-updates = true ##允许其他主机进行同步

主从服务器设置

[root@Mysql2 ~]# vim /etc/my.cnf server-id = 2 ##修改id号 log_bin = master-bin ##也开启二进制文件，因为主挂掉之后需要转到主从上，所以要开启 relay-log = relay-log-bin ##开启中继日志文件 relay-log-index = slave-relay-bin.index ##生成索引

Mysql1、Mysql2、Mysql3 分别做两个软链接，然后启动mysql

[root@Mysql1 ~]# ln -s /usr/local/mysql/bin/mysql /usr/sbin/ [root@Mysql1 ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/ systemctl restart mysqld

配置 MySQL 一主两从 MySQL 主从配置相对比较简单。需要注意的是授权。步骤如下：在所有数据库节点上授权两个用户，一个是从库同步使用，另外一个是 manager 使用。

mysql> grant replication slave on *.* to 'myslave'@'20.0.0.%' identified by '123456'; ##开启同步允许所有数据库表用过myslave准许的那个网段密码进行访问 mysql> grant all privileges on *.* to 'mha'@'20.0.0..%' identified by 'manager'; ##所有权限放开给通过manager准许的那个网段 mysql> flush privileges; ##刷新

可能两个主从\库通过主机名连接不上主库，所以所有数据库加上下面的授权。

mysql> grant all privileges on *.* to 'mha'@'Mysql1' identified by 'manager'; mysql> grant all privileges on *.* to 'mha'@'Mysql2' identified by 'manager'; mysql> grant all privileges on *.* to 'mha'@'Mysql3' identified by 'manager';

在master上查看二进制文件和同步点

mysql> show master status; +-------------------+----------+--------------+------------------+-------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +-------------------+----------+--------------+------------------+-------------------+ | master-bin.000001 | 1373 | | | | +-------------------+----------+--------------+------------------+-------------------+ 接下来在主从\从上分别添加master的信息 mysql> change master to master_host='20.0.0.25',master_user='myslave',master_password='123456',master_log_file='master-bin.000001',master_log_pos=1373; mysql> start slave; 查看有没有双yes mysql> show slave status\G; Slave_IO_Running: Yes Slave_SQL_Running: Yes 之后设置为只读模式 mysql> set global read_only=1; 配置完成之后建议flushprivileges;刷新一下以免出现问题

配置完成之后就去设置MHA 首先安装 epel 源，需要perl扩展包然后装依赖环境

[root@MHA-manager ~]# yum install epel-release --nogpgcheck -y yum install -y perl-DBD-MySQL \ perl-Config-Tiny \ perl-Log-Dispatch \ perl-Parallel-ForkManager \ perl-ExtUtils-CBuilder \ perl-ExtUtils-MakeMaker \ perl-CPAN

这里选择的是0.57的版本不管是manager还是主从都需要安装node

[root@Mysql1 ~]# tar zxvf mha4mysql-node-0.57.tar.gz [root@Mysql1 ~]# cd mha4mysql-node-0.57 [root@Mysql1 mha4mysql-node-0.57]# perl Makefile.PL [root@Mysql1 mha4mysql-node-0.57]# make [root@Mysql1 mha4mysql-node-0.57]# make install

manager 上安装 manager 组件（！注意：一定要先安装node 组件才能安装manager 组件）

[root@MHA-manager ~]# tar zxvf mha4MHA-manager-0.57.tar.gz [root@MHA-manager ~]# cd mha4MHA-manager-0.57 [root@MHA-manager mha4MHA-manager-0.57]# perl Makefile.PL [root@MHA-manager mha4MHA-manager-0.57]# make [root@MHA-manager mha4MHA-manager-0.57]# make install

ls进入usr/local/bin下看会自动生成文件

masterha_check_ssh 检查 MHA 的 SSH 配置状况 masterha_check_repl 检查 MySQL 复制状况 masterha_manger 启动 manager的脚本 masterha_check_status 检测当前 MHA 运行状态 masterha_master_monitor 检测 master 是否宕机 masterha_master_switch 控制故障转移（自动或者手动） masterha_conf_host 添加或删除配置的 server 信息 masterha_stop 关闭manager

node也会生成文件脚本（无需操作）

save_binary_logs 保存和复制 master 的二进制日志 apply_diff_relay_logs 识别差异的中继日志事件并将其差异的事件应用于其他的 slave filter_mysqlbinlog 去除不必要的 ROLLBACK 事件（MHA 已不再使用这个工具） purge_relay_logs 清除中继日志（不会阻塞 SQL 线程）

配置无密码认证

在 manager 上配置到所有数据库节点的无密码认证 [root@MHA-manager ~]# ssh-keygen -t rsa //一路按回车键 [root@MHA-manager ~]# ssh-copy-id 20.0.0.25 [root@MHA-manager ~]# ssh-copy-id 20.0.0.26 [root@MHA-manager ~]# ssh-copy-id 20.0.0.27

master和主从需要配置其他2台的地址就行

配置 MHA

在 manager 节点上复制相关脚本到/usr/local/bin 目录。 [root@MHA-manager ~]# cp -ra /root/mha4mysql-manager-0.57/samples/scripts /usr/local/bin //拷贝后会有四个执行文件 [root@atlas ~]# ll /usr/local/bin/scripts/ -rwxr-xr-x 1 mysql mysql 3648 10 月 31 2015 master_ip_failover #自动切换时 VIP 管理的脚本 -rwxr-xr-x 1 mysql mysql 9872 10 月 25 09:07 master_ip_online_change #在线切换时 vip 的管理 -rwxr-xr-x 1 mysql mysql 11867 10 月 31 2015 power_manager #故障发生后关闭主机的脚本 -rwxr-xr-x 1 mysql mysql 1360 10 月 31 2015 send_report #因故障切换后发送报警的脚本

复制上述的自动切换时 VIP 管理的脚本到/usr/local/bin 目录，这里使用脚本管理 VIP

[root@MHA-manager ~]# cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin 修改内容如下：（删除原有内容，直接复制） [root@MHA-manager ~]#vim /usr/local/bin/master_ip_failover #############################添加内容部################################## my $vip = '20.0.0.200'; my $brdc = '20.0.0.255'; my $ifdev = 'ens33'; my $key = '1'; my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip"; my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down"; my $exit_code = 0; #my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;"; #my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key"; #########################################################################

创建 MHA 软件目录并拷贝配置文件。

[root@MHA-manager ~]# mkdir /etc/masterha [root@MHA-manager ~]# cp /root/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha/ [root@MHA-manager ~]# vim /etc/masterha/app1.cnf [server default] manager_log=/var/log/masterha/app1/manager.log ##manager工作目录 manager_workdir=/var/log/masterha/app1#manager日志 master_binlog_dir=/usr/local/mysql/data#master保存binlog的位置，这里的路径要与master里配置的binlog的路径一致，以便mha能找到 master_ip_failover_script=/usr/local/bin/master_ip_failover#设置自动failover时候的切换脚本，也就是上边的哪个脚本 master_ip_online_change_script=/usr/local/bin/master_ip_online_change#设置手动切换时候的切换脚本 password=manager#设置mysql中root用户的密码，这个密码是前文中创建监控用户的那个密码 user=mha#设置监控用户root ping_interval=1#设置监控主库，发送ping包的时间间隔，默认是3秒，尝试三次没有回应的时候自动进行railover remote_workdir=/tmp#设置远端mysql在发生切换时binlog的保存位置 repl_user=myslave repl_password=123456#设置复制用户的密码 repl_user=myslave#设置复制用户的用户 secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.195.130 -s 192.168.195.131 shutdown_script=""#设置故障发生后关闭故障主机脚本（该脚本的主要作用是关闭主机放在发生脑裂,这里没有使用） ssh_user=root#设置ssh的登录用户名 ##重要## [server1] hostname=20.0.0.25 port=3306 [server2] candidate_master=1##设置为候选master，如果设置该参数以后，发生主从切换以后将会将此从库提升为主库，即使这个主库不是集群中事件最新的slave check_repl_delay=0##默认情况下如果一个slave落后master 100M的relay logs的话，MHA将不会选择该slave作为一个新的master，因为对于这个slave的恢复需要花费很长时间，通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时，这个参数对于设置了candidate_master=1的主机非常有用，因为这个候选主在切换的过程中一定是新的master hostname=20.0.0.26 port=3306 [server3] hostname=20.0.0.27 port=3306

测试 ssh 无密码认证，如果正常最后会输出 successfully

[root@MHA-manager ~]# masterha_check_ssh -conf=/etc/masterha/app1.cnf Oce Nov 21 19:40:22 2020 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping. Oce Nov 21 19:40:22 2020 - [info] Reading application default configuration from /etc/masterha/app1.cnf.. Oce Nov 21 19:40:22 2020 - [info] Reading server configuration from /etc/masterha/app1.cnf.. Oce Nov 21 19:40:22 2020 - [info] Starting SSH connection tests.. Oce Nov 21 19:40:22 2020 - [debug] Oce Nov 21 19:40:222020 - [debug] Connecting via SSH from root@20.0.0.25(20.0.0.25:22) to root@20.0.0.26(20.0.0.26:22).. Oce Nov 21 19:40:22 2020 - [debug] ok.

mysql5.7注意

请注释/etc/my.cnf 中【client】下 #default-character-set=utf8 在所有数据库中建立以下指令软连接 ln -s /usr/local/mysql/bin/mysql /usr/sbin/ ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/ 之后测试主的把他变成down

▽pp1: MySQL Master failover 20.0.0.25(20.0.0.25:3306) to 20.0.0.26(20.0.0.26:3306) succeeded Master 20.0.0.25(20.0.0.25:3306) is down! ▽pp1: MySQL Master failover 20.0.0.25(20.0.0.25:3306) to 20.0.0.26(20.0.0.26:3306) succeeded Master 20.0.0.25(20.0.0.25:3306) is down! Check MHA Manager logs at localhost.localdomain:/var/log/masterha/app1/manager.log for details.

开启监控看看情况

Started automated(non-interactive) failover. Invalidated master IP address on 20.0.0.25(20.0.0.25:3306) The latest slave 20.0.0.26(20.0.0.26:3306) has all relay logs for recovery. Selected 20.0.0.26(20.0.0.26:3306) as a new master. 20.0.0.26(20.0.0.26:3306): OK: Applying all logs succeeded. 20.0.0.26(20.0.0.26:3306): OK: Activated master IP address. 20.0.0.27(20.0.0.27:3306): This host has the latest relay log events. Generating relay diff files from the latest slave succeeded. 20.0.0.27(20.0.0.27:3306): OK: Applying all logs succeeded. Slave started, replicating from 20.0.0.26(20.0.0.26:3306) 20.0.0.26(20.0.0.26:3306): Resetting slave info succeeded. Master failover to 20.0.0.26(20.0.0.26:3306) completed successfully.

最新回复(0)