理论+实验 详解MySQL

it2025-05-04  25

目录

一 MHA概述1.1 MHA简介1.2 MHA组成1.2.1 MHA Manager(管理节点)1.2.2 MHA Node(数据节点) 1.3 MHA特点1.4 MHA形成原因 二 MHA实验2.1 实验环境2.2 实验拓扑图2.3 实验目的2.4 案例实现思路2.5 实验步骤2.5.1 所有mysql服务器设置名称和域名解析2.5.2 安装mysql数据库(这里用的是5.6版本)2.5.3 配置MySQL一主两从2.5.4 安装MHA软件2.5.5配置无密码认证2.5.6 配置 MHA2.5.7 测试 ssh 无密码认证,以及mysql主从连接2.5.8 配置虚拟IP,启动MHA2.5.9 模拟master故障切换以及故障修复

一 MHA概述

1.1 MHA简介

●日本DeNA公司 youshimaton(现就职于 Facebook公司)开发 ●一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件 ●支持故障切换 ●在MySQL故障切换过程中,MHA能做到在0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换的过程中,MHA能在最大程度上保证数据的一致性,以达到真正意义上的高可用 ●MHA还提供在线主库切换的功能,能够安全地切换当前运行的主库到一个新的主库中(通过将从库提升为主库),大概0.5-2秒内即可完成

1.2 MHA组成

1.2.1 MHA Manager(管理节点)

●用来接收外部信号,监控下方数据节点的工作状态

1.2.2 MHA Node(数据节点)

●工作的单位,负责具体的工作

1.3 MHA特点

●自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据的不丢失 ●使用 MySQL55的半同步复制,可以大大降低数据丢失的风险

1.4 MHA形成原因

●传统mysql主从架构存在单点故障的问题 ●传统架构中,只有一个mysql主服务器,所以当出现单点故障的时候,整个服务器群集就会瘫痪掉 ●为了解决这种情况,我们需要在主服务器宕机的时候,重新建立一台主服务器,负责监控等工作

二 MHA实验

2.1 实验环境

●服务器 CentOS7.4(64 位) MHA-manager/20.0.0.15 管理节点,安装 node 组件 安装 manager 组件 ●服务器 CentOS7.4(64 位) Mysql1/20.0.0.11 Master 节点,安装 node 组件 ●服务器 CentOS7.4(64 位) Mysql2/20.0.0.12 Slave 节点,安装 node 组件 ●服务器 CentOS7.4(64 位) Mysql3/20.0.0.13 Slave 节点,安装 node 组件

2.2 实验拓扑图

2.3 实验目的

●通过MHA监控MySQL数据库,在故障时自动进行切换,不影响业务 ●当主库失效时,备选主库自动成为主库

2.4 案例实现思路

1) 安装 MySQL 数据库 2) 配置 MySQL 一主两从 3) 安装 MHA 软件 4) 配置无密码认证 5) 配置 MySQL MHA 高可用 6) 模拟 master 故障切换

2.5 实验步骤

2.5.1 所有mysql服务器设置名称和域名解析

root@localhost ~]# hostnamectl set-hostname mysql1 [root@localhost ~]# su [root@mysql1 ~]# vi /etc/hosts 20.0.0.11 mysql1 20.0.0.12 mysql2 20.0.0.13 mysql3 同理得:mysql2 mysql3

2.5.2 安装mysql数据库(这里用的是5.6版本)

1. 安装编译依赖的环境 [root@Mysql1 ~]# yum -y install ncurses-devel gcc-c++ perl-Module-Install 2. 安装 gmake 编译软件 [root@Mysql1 ~]# tar zxvf cmake-2.8.6.tar.gz [root@Mysql1 ~]# cd cmake-2.8.6 [root@Mysql1 cmake-2.8.6]# ./configure [root@Mysql1 cmake-2.8.6]# gmake && gmake install 3. 安装 MySQL 数据库 [root@mysql1 cmake-2.8.6]# cd [root@Mysql1 ~]# tar -zxvf mysql-5.6.36.tar.gz [root@Mysql1 ~]# cd mysql-5.6.36 cmake -DCMAKE_INSTALL_PREFIX=/usr/local/mysql \ -DDEFAULT_CHARSET=utf8 \ -DDEFAULT_COLLATION=utf8_general_ci \ -DWITH_EXTRA_CHARSETS=all \ -DSYSCONFDIR=/etc [root@Mysql1 mysql-5.6.36]# make && make install [root@Mysql1 mysql-5.6.36]# cp support-files/my-default.cnf /etc/my.cnf [root@Mysql1 mysql-5.6.36]# cp support-files/mysql.server /etc/rc.d/init.d/mysqld [root@Mysql1 mysql-5.6.36]# cd [root@Mysql1 ~]# chmod +x /etc/rc.d/init.d/mysqld [root@Mysql1 ~]# chkconfig --add mysqld [root@Mysql1 ~]# echo "PATH=$PATH:/usr/local/mysql/bin" >> /etc/profile [root@Mysql1 ~]# source /etc/profile [root@Mysql1 ~]# groupadd mysql [root@Mysql1 ~]# useradd -M -s /sbin/nologin mysql -g mysql [root@Mysql1 ~]# chown -R mysql.mysql /usr/local/mysql [root@Mysql1 ~]# mkdir -p /data/mysql /usr/local/mysql/scripts/mysql_install_db \ --basedir=/usr/local/mysql \ --datadir=/usr/local/mysql/data \ --user=mysql #########################注意################### [root@mysql3 ~]# /usr/local/mysql/scripts/mysql_install_db \ > --basedir=/usr/local/mysql \ > --datadir=/usr/local/mysql/data \ > --user=mysql bash: /usr/local/mysql/scripts/mysql_install_db: /usr/bin/perl: bad interpreter: No such file or directory #################解决方法####################### yum -y install autoconf 同理安装mysql2,mysql3

2.5.3 配置MySQL一主两从

1. 修改 Master 的主配置文件/etc/my.cnf 文件,三台服务器的 server-id 不能一样 [root@Mysql1 ~]# cat /etc/my.cnf [client] port = 3306 #default-character-set=utf8 socket = /usr/local/mysql/mysql.sock [mysql] port = 3306 default-character-set=utf8 socket = /usr/local/mysql/mysql.sock [mysqld] user = mysql basedir = /usr/local/mysql datadir = /usr/local/mysql/data port = 3306 character_set_server=utf8 pid-file = /usr/local/mysql/mysqld.pid socket = /usr/local/mysql/mysql.sock server-id = 1 #########以下添加内容############ [mysqld] server-id = 1 log_bin = master-bin log-slave-updates = true 配置从服务器: 在/etc/my.cnf 中修改或者增加下面内容。 [root@Mysql2 ~]# vim /etc/my.cnf server-id = 2 log_bin = master-bin relay-log = relay-log-bin relay-log-index = slave-relay-bin.index ##第三台和第二台一样 server-id = 3 2. Mysql1、Mysql2、Mysql3 分别做两个软链接 [root@Mysql1 ~]# ln -s /usr/local/mysql/bin/mysql /usr/sbin/ [root@Mysql1 ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/ 3. Mysql1、Mysql2、Mysql3 启动 MySQL。 [root@Mysql1 ~]# /usr/local/mysql/bin/mysqld_safe --user=mysql & 4. 配置 MySQL 一主两从 ##MySQL 主从配置相对比较简单。需要注意的是授权。步骤如下: 在所有数据库节点上授权两个用户,一个是从库同步使用,另外一个是 manager 使用。 mysql> grant replication slave on *.* to 'myslave'@'20.0.0.%' identified by '123'; mysql> grant all privileges on *.* to 'mha'@'20.0.0.%' identified by 'manager'; mysql> flush privileges; 5. 下面三条授权按理论是不用添加的,但是做案例实验环境时候通过 MHA 检查MySQL 主从有报错, 报两个从库通过主机名连接不上主库,所以所有数据库加上下面的授权。 mysql> grant all privileges on *.* to 'mha'@'Mysql1' identified by 'manager'; mysql> grant all privileges on *.* to 'mha'@'Mysql2' identified by 'manager'; mysql> grant all privileges on *.* to 'mha'@'Mysql3' identified by 'manager'; mysql> flush privileges; 6. 在 Mysql1 主机上查看二进制文件和同步点 mysql> show master status; +-------------------+----------+--------------+------------------+-------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +-------------------+----------+--------------+------------------+-------------------+ | master-bin.000001 | 1205 | | | | +-------------------+----------+--------------+------------------+-------------------+ 7. 接下来在 Mysql2 和 Mysql3 分别执行同步。 mysql> change master to master_host='20.0.0.11',master_user='myslave',master_password='123',master_log_file='master-bin.000001',master_log_pos=1205; mysql> start slave; 8. 查看 IO 和 SQL 线程都是 yes 代表同步是否正常。 mysql> show slave status\G; Slave_IO_Running: Yes Slave_SQL_Running: Yes 必须设置两个从库为只读模式: mysql> set global read_only=1; 9. 验证主从复制功能 主库: mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | test | +--------------------+ 4 rows in set (0.00 sec) mysql> create database ceshi; Query OK, 1 row affected (0.00 sec) 从库: mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | ceshi | | mysql | | performance_schema | | test | +--------------------+ 5 rows in set (0.00 sec)

2.5.4 安装MHA软件

1. 设置名称 [root@localhost ~]# hostnamectl set-hostname MHA-manager [root@localhost ~]# su 2. 把本地源换成线网源(mysql服务器也要换) [root@mha-manager ~]# mv /etc/yum.repos.d/local.repo /etc/yum.repos.d/local.repo.bak [root@mha-manager ~]# cp /etc/yum.repos.d/backup/CentOS-Base.repo /etc/yum.repos.d/local.repo 3. 所有服务器上都安装 MHA 依赖的环境,首先安装 epel 源。 [root@mha-manager ~]# yum -y install epel-release --nogpgcheck yum install -y perl-DBD-MySQL \ perl-Config-Tiny \ perl-Log-Dispatch \ perl-Parallel-ForkManager \ perl-ExtUtils-CBuilder \ perl-ExtUtils-MakeMaker \ perl-CPAN 4. 安装node组件 注意: MHA 软件包对于每个操作系统版本不一样,这里 CentOS7.4 必须选择 0.57 版本, 在<注意:所有服务器>上必须先安装 node 组件,最后在 MHA-manager 节点上安装 manager 组件,因为 manager 依赖 node 组件,下面都是在 Mysql1 上操作演示安装 node 组件。 [root@Mysql1 ~]# tar zxvf mha4mysql-node-0.57.tar.gz [root@Mysql1 ~]# cd mha4mysql-node-0.57 [root@Mysql1 mha4mysql-node-0.57]# perl Makefile.PL [root@Mysql1 mha4mysql-node-0.57]# make [root@Mysql1 mha4mysql-node-0.57]# make install 5. 在 MHA-manager 上安装 manager 组件(!注意:一定要先安装node 组件才能安装manager 组件) [root@mha-manager mha4mysql-node-0.57]# cd [root@mha-manager ~]# tar zxvf mha4mysql-manager-0.57.tar.gz [root@mha-manager ~]# cd mha4MHA-manager-0.57 [root@mha-manager mha4MHA-manager-0.57]# perl Makefile.PL [root@mha-manager mha4MHA-manager-0.57]# make [root@mha-manager mha4MHA-manager-0.57]# make install manager 安装后在/usr/local/bin 下面会生成几个工具,主要包括以下几个: masterha_check_ssh 检查 MHA 的 SSH 配置状况 masterha_check_repl 检查 MySQL 复制状况 masterha_manger 启动 manager的脚本 masterha_check_status 检测当前 MHA 运行状态 masterha_master_monitor 检测 master 是否宕机 masterha_master_switch 控制故障转移(自动或者手动) masterha_conf_host 添加或删除配置的 server 信息 masterha_stop 关闭manager 6. node 安装后也会在/usr/local/bin 下面会生成几个脚本(这些工具通常由 MHA Manager 的脚本触发,无需人为操作)主要如下: save_binary_logs 保存和复制 master 的二进制日志 apply_diff_relay_logs 识别差异的中继日志事件并将其差异的事件应用于其他的 slave filter_mysqlbinlog 去除不必要的 ROLLBACK 事件(MHA 已不再使用这个工具) purge_relay_logs 清除中继日志(不会阻塞 SQL 线程)

2.5.5配置无密码认证

1. 在 manager 上配置到所有数据库节点的无密码认证 [root@mha-manager ~]# ssh-keygen -t rsa //一路按回车键 [root@mha-manager ~]# ssh-copy-id 20.0.0.11 //yes, 远程登录虚拟机的密码 Abc123 [root@mha-manager ~]# ssh-copy-id 20.0.0.12 [root@mha-manager ~]# ssh-copy-id 20.0.0.13 2. 在 Mysql1 上配置到数据库节点Mysql2和Mysql3的无密码认证 [root@Mysql1 ~]# ssh-keygen -t rsa [root@Mysql1 ~]# ssh-copy-id 20.0.0.12 [root@Mysql1 ~]# ssh-copy-id 20.0.0.13 3. 在 Mysql2 上配置到数据库节点Mysql1和Mysql3的无密码认证 [root@Mysql2 ~]# ssh-keygen -t rsa [root@Mysql2 ~]# ssh-copy-id 20.0.0.11 [root@Mysql2 ~]# ssh-copy-id 20.0.0.13 4. 在 Mysql3 上配置到数据库节点Mysql1和Mysql2的无密码认证 [root@Mysql3 ~]# ssh-keygen -t rsa [root@Mysql3 ~]# ssh-copy-id 20.0.0.11 [root@Mysql3 ~]# ssh-copy-id 20.0.0.12

2.5.6 配置 MHA

1. 在 manager 节点上复制相关脚本到/usr/local/bin 目录。 [root@mha-manager ~]# cp -ra /root/mha4mysql-manager-0.57/samples/scripts/ /usr/local/bin/ //拷贝后会有四个执行文件 [root@atlas ~]# ll /usr/local/bin/scripts/ 总用量 32 -rwxr-xr-x 1 mysql mysql 3648 5 月 31 2015 master_ip_failover #自动切换时 VIP 管理的脚本 -rwxr-xr-x 1 mysql mysql 9872 5 月 25 09:07 master_ip_online_change #在线切换时 vip 的管理 -rwxr-xr-x 1 mysql mysql 11867 5 月 31 2015 power_manager #故障发生后关闭主机的脚本 -rwxr-xr-x 1 mysql mysql 1360 5 月 31 2015 send_report #因故障切换后发送报警的脚本 2. 复制上述的自动切换时 VIP 管理的脚本到/usr/local/bin 目录,这里使用脚本管理 VIP, [root@mha-manager ~]# cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin 3. 修改内容如下:(删除原有内容,直接复制) [root@mha-manager ~]#vim /usr/local/bin/master_ip_failover #!/usr/bin/env perl use strict; use warnings FATAL => 'all'; use Getopt::Long; my ( $command, $ssh_user, $orig_master_host, $orig_master_ip, $orig_master_port, $new_master_host, $new_master_ip, $new_master_port ); #############################添加内容部分######################################### my $vip = '20.0.0.200'; my $brdc = '20.0.0.255'; my $ifdev = 'ens33'; my $key = '1'; my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip"; my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down"; my $exit_code = 0; #my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;"; #my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key"; ################################################################################## GetOptions( 'command=s' => \$command, 'ssh_user=s' => \$ssh_user, 'orig_master_host=s' => \$orig_master_host, 'orig_master_ip=s' => \$orig_master_ip, 'orig_master_port=i' => \$orig_master_port, 'new_master_host=s' => \$new_master_host, 'new_master_ip=s' => \$new_master_ip, 'new_master_port=i' => \$new_master_port, ); exit &main(); sub main { print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n"; if ( $command eq "stop" || $command eq "stopssh" ) { my $exit_code = 1; eval { print "Disabling the VIP on old master: $orig_master_host \n"; &stop_vip(); $exit_code = 0; }; if ($@) { warn "Got Error: $@\n"; exit $exit_code; } exit $exit_code; } elsif ( $command eq "start" ) { my $exit_code = 10; eval { print "Enabling the VIP - $vip on the new master - $new_master_host \n"; &start_vip(); $exit_code = 0; }; if ($@) { warn $@; exit $exit_code; } exit $exit_code; } elsif ( $command eq "status" ) { print "Checking the Status of the script.. OK \n"; exit 0; } else { &usage(); exit 1; } } sub start_vip() { `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`; } #A simple system call that disable the VIP on the old_master sub stop_vip() { `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`; } sub usage { print "Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n"; } 4. 创建 MHA 软件目录并拷贝配置文件。 [root@mha-manager ~]# mkdir /etc/masterha [root@mha-manager ~]# cp /root/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha/ [root@mha-manager ~]# vim /etc/masterha/app1.cnf [server default] manager_workdir=/var/log/masterha/app1.log               ##manager工作目录 manager_log=/var/log/masterha/app1/manager.log            #manager日志 master_binlog_dir=/usr/local/mysql/data/                #master保存binlog的位置,这里的路径要与master里配置的binlog的路径一致,以便mha能找到 #master_ip_failover_script= /usr/local/bin/master_ip_failover    #设置自动failover时候的切换脚本,也就是上边的哪个脚本 master_ip_online_change_script= /usr/local/bin/master_ip_online_change  #设置手动切换时候的切换脚本 password=manager      #设置mysql中root用户的密码,这个密码是前文中创建监控用户的那个密码 user=mha        #设置监控用户root ping_interval=1      #设置监控主库,发送ping包的时间间隔,默认是3秒,尝试三次没有回应的时候自动进行railover remote_workdir=/tmp    #设置远端mysql在发生切换时binlog的保存位置 repl_password=123        #设置复制用户的密码 repl_user=myslave           #设置复制用户的用户 report_script=/usr/local/send_report      //设置发生切换后发送的报警的脚本 secondary_check_script=/usr/local/bin/masterha_secondary_check -s 20.0.0.12 -s 20.0.0.13 shutdown_script=""  #设置故障发生后关闭故障主机脚本(该脚本的主要作用是关闭主机放在发生脑裂,这里没有使用) ssh_user=root      #设置ssh的登录用户名 [server1] hostname=20.0.0.11 port=3306 [server2] hostname=20.0.0.12 port=3306 candidate_master=1    #//设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave check_repl_delay=0    #默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master [server3] hostname=20.0.0.13 port=3306

2.5.7 测试 ssh 无密码认证,以及mysql主从连接

1. 测试ssh无密码认证 [root@mha-manager ~]# masterha_check_ssh -conf=/etc/masterha/app1.cnf ...... Wed Oct 21 22:00:33 2020 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping. Wed Oct 21 22:00:33 2020 - [info] Reading application default configuration from /etc/masterha/app1.cnf.. Wed Oct 21 22:00:33 2020 - [info] Reading server configuration from /etc/masterha/app1.cnf.. Wed Oct 21 22:00:33 2020 - [info] Starting SSH connection tests.. Wed Oct 21 22:00:34 2020 - [debug] Wed Oct 21 22:00:33 2020 - [debug] Connecting via SSH from root@20.0.0.11(20.0.0.11:22) to root@20.0.0.12(20.0.0.12:22).. Wed Oct 21 22:00:33 2020 - [debug] ok. Wed Oct 21 22:00:33 2020 - [debug] Connecting via SSH from root@20.0.0.11(20.0.0.11:22) to root@20.0.0.13(20.0.0.13:22).. Wed Oct 21 22:00:33 2020 - [debug] ok. Wed Oct 21 22:00:34 2020 - [debug] Wed Oct 21 22:00:33 2020 - [debug] Connecting via SSH from root@20.0.0.12(20.0.0.12:22) to root@20.0.0.11(20.0.0.11:22).. Wed Oct 21 22:00:34 2020 - [debug] ok. Wed Oct 21 22:00:34 2020 - [debug] Connecting via SSH from root@20.0.0.12(20.0.0.12:22) to root@20.0.0.13(20.0.0.13:22).. Wed Oct 21 22:00:34 2020 - [debug] ok. Wed Oct 21 22:00:35 2020 - [debug] Wed Oct 21 22:00:34 2020 - [debug] Connecting via SSH from root@20.0.0.13(20.0.0.13:22) to root@20.0.0.11(20.0.0.11:22).. Wed Oct 21 22:00:34 2020 - [debug] ok. Wed Oct 21 22:00:34 2020 - [debug] Connecting via SSH from root@20.0.0.13(20.0.0.13:22) to root@20.0.0.12(20.0.0.12:22).. Wed Oct 21 22:00:35 2020 - [debug] ok. Wed Oct 21 22:00:35 2020 - [info] All SSH connection tests passed successfully 2. 测试mysql主从连接 [root@mha-manager ~]# masterha_check_repl -conf=/etc/masterha/app1.cnf ...... Wed Oct 21 22:00:51 2020 - [info] Checking replication health on 20.0.0.12.. Wed Oct 21 22:00:51 2020 - [info] ok. Wed Oct 21 22:00:51 2020 - [info] Checking replication health on 20.0.0.13.. Wed Oct 21 22:00:51 2020 - [info] ok. Wed Oct 21 22:00:51 2020 - [info] Checking master_ip_failover_script status: Wed Oct 21 22:00:51 2020 - [info] /usr/local/bin/master_ip_failover --command=status --ssh_user=root --orig_master_host=20.0.0.11 --orig_master_ip=20.0.0.11 --orig_master_port=3306 IN SCRIPT TEST====/sbin/ifconfig ens33:1 down==/sbin/ifconfig ens33:1 20.0.0.200=== Checking the Status of the script.. OK Wed Oct 21 22:00:51 2020 - [info] OK. Wed Oct 21 22:00:51 2020 - [warning] shutdown_script is not defined. Wed Oct 21 22:00:51 2020 - [info] Got exit code 0 (Not master dead). MySQL Replication Health is OK.

2.5.8 配置虚拟IP,启动MHA

1. 开启虚拟IP ##注意:第一次配置需要去master上手动开启虚拟IP [root@Mysql1 ~]# /sbin/ifconfig ens33:1 20.0.0.200/24 2. 启动 MHA [root@mha-manager ~]# nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 & [1] 6124 ##说明## --remove_dead_master_conf 该参数代表当发生主从切换后,老的主库的 ip 将会从配置文件中移除。 --manger_log 日志存放位置。 --ignore_last_failover 在缺省情况下,如果 MHA 检测到连续发生宕机,且两次宕机间 隔不足 8 小时的话,则不会进行 Failover,之所以这样限制是为了避免 ping-pong 效应。该 参数代表忽略上次 MHA 触发切换产生的文件,默认情况下,MHA 发生切换后会在日志记 目录,也就是上面设置的日志 app1.failover.complete 文件,下次再次切换的时候如果发现 该目录下存在该文件将不允许触发切换,除非在第一次切换后收到删除该文件,为了方便, 这里设置为–ignore_last_failover。 3. 查看 MHA 状态,可以看到当前的 master 是 Mysql1 节点。 [root@mha-manager ~]# masterha_check_status --conf=/etc/masterha/app1.cnf app1 (pid:6124) is running(0:PING_OK), master:20.0.0.11 4. 查看 MHA 日志,也以看到当前的 master 是 192.168.8.134,如下所示。 [root@mha-manager ~]# cat /var/log/masterha/app1/manager.log Wed Oct 21 20:11:32 2020 - [info] Checking master_ip_failover_script status: Wed Oct 21 20:11:32 2020 - [info] /usr/local/bin/master_ip_failover --command=status --ssh_user=root --orig_master_host=20.0.0.11 --orig_master_ip=20.0.0.11 --orig_master_port=3306 IN SCRIPT TEST====/sbin/ifconfig ens33:1 down==/sbin/ifconfig ens33:1 20.0.0.200=== Checking the Status of the script.. OK Wed Oct 21 20:11:32 2020 - [info] OK. Wed Oct 21 20:11:32 2020 - [warning] shutdown_script is not defined. Wed Oct 21 20:11:32 2020 - [info] Set master ping interval 1 seconds. Wed Oct 21 20:11:32 2020 - [info] Set secondary check script: /usr/local/bin/masterha_secondary_check -s 20.0.0.12 -s 20.0.0.13 Wed Oct 21 20:11:32 2020 - [info] Starting ping health check on 20.0.0.11(20.0.0.11:3306).. Wed Oct 21 20:11:32 2020 - [info] Ping(SELECT) succeeded, waiting until MySQL doesn't respond 5. 查看 Mysql1 的 VIP 地址 192.168.8.200 是否存在?,这个 VIP 地址不会因为 manager 节点停止 MHA 服务而消失。 [root@Mysql1 ~]# ifconfig ens33: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 192.168.195.129 netmask 255.255.255.0 broadcast 192.168.195.255 inet6 fe80::be3f:d090:5539:5db1 prefixlen 64 scopeid 0x20<link> ether 00:0c:29:70:4f:5b txqueuelen 1000 (Ethernet) RX packets 968912 bytes 200636579 (191.3 MiB) RX errors 0 dropped 0 overruns 0 frame 0 TX packets 1197148 bytes 142066822 (135.4 MiB) TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 ens33:1: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 192.168.195.200 netmask 255.255.255.0 broadcast 192.168.195.255 ether 00:0c:29:70:4f:5b txqueuelen 1000 (Ethernet)

2.5.9 模拟master故障切换以及故障修复

1. 启用监控观察日志记录 [root@mha-manager ~]#tailf /var/log/masterha/app1/manager.log //启用监控观察日志记录 [root@mysql1 ~]# systemctl stop mysqld 2. mysql2查看虚拟IP [root@mysql2 ~]# ifconfig ens33: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 20.0.0.12 netmask 255.255.255.0 broadcast 20.0.0.255 inet6 fe80::6bf:6128:3bdd:270c prefixlen 64 scopeid 0x20<link> ether 00:0c:29:67:50:bb txqueuelen 1000 (Ethernet) RX packets 56057 bytes 67473086 (64.3 MiB) RX errors 0 dropped 0 overruns 0 frame 0 TX packets 20190 bytes 5646674 (5.3 MiB) TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 ens33:1: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 inet 20.0.0.200 netmask 255.0.0.0 broadcast 20.255.255.255 ether 00:0c:29:67:50:bb txqueuelen 1000 (Ethernet) lo: flags=73<UP,LOOPBACK,RUNNING> mtu 65536 inet 127.0.0.1 netmask 255.0.0.0 inet6 ::1 prefixlen 128 scopeid 0x10<host> loop txqueuelen 1 (Local Loopback) RX packets 146 bytes 12415 (12.1 KiB) RX errors 0 dropped 0 overruns 0 frame 0 TX packets 146 bytes 12415 (12.1 KiB) TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0 3. 故障修复步骤: ##修复db [root@mysql1 ~]# /etc/init.d/mysqld start ##修复主从 mysql> change master to master_host='20.0.0.12',master_user='myslave',master_password='123',master_log_file='master-bin.000001',master_log_pos=717; Query OK, 0 rows affected, 2 warnings (0.01 sec) mysql> start slave; Query OK, 0 rows affected (0.00 sec) ##修改配置文件(再把这个记录添加进去,因为它检测掉失效时候会自动消失) 在MHA-manager服务器上 vi /etc/masterha/app1.cnf [server1] //把这段再加上去 hostname=20.0.0.11 port=3306 ##启动manager(在manager那台机器上) nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 & (dos2unix /usr/local/bin/master_ip_failover 解决中英字不兼容报错的问题) ##测试一下主从同步功能 在mysql2上创建一个ceshi2数据库 mysql> create database ceshi2; Query OK, 1 row affected (0.00 sec) mysql1: mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | ceshi | | ceshi2 | | mysql | | performance_schema | | test | +--------------------+ 6 rows in set (0.00 sec) mysql3: mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | ceshi | | ceshi2 | | mysql | | performance_schema | | test | +--------------------+ 6 rows in set (0.00 sec) //表示mysql1服务器修复成功
最新回复(0)