时间:2021-10-06 09:08:33 | 栏目:Mysql | 点击:次
在关闭mysql server的时候,可能会由于关闭的方式而出现各种问题。下面的一些步骤,可以减少问题的发生。
在一些特殊环境下,slave节点可能会尝试从错误的位置(position)进行启动。为了减少这种风险,要先停止io thread,从而不接收新的事件信息。
mysql> stop slave io_thread;
等sql thread应用完所有的events之后,也将sql thread停掉。
mysql> show slave status\G mysql> stop slave sql_thread;
这样io thread和sql thread就可以处于一致性位置,这样relay log就只是包含被执行过的events,relay_log_info_repository中的位置信息也是最新的。
对于开启了多线程复制的slave,确保在关闭复制之前,已经填充了gaps
mysql> stop slave; mysql> start slave until sql_after_mts_gaps; #应用完relay log中的gap mysql> show slave status\G #要确保在之前已经停掉了sql_thread mysql> stop slave ;
1分钟内可以发生很多事,在关闭时,innodb必须回滚未提交的事务。事务回滚的代价是非常昂贵的,可能会花费很长时间。任何事务回滚都可能意味着数据丢失,因此理想情况下关闭时没有打开任何事务。
如果关闭的是读写的数据库,写操作应该提前路由到其他节点。如果必须关闭还在接收事务的数据库,下面的查询会输出运行时间大于60秒的会话信息。根据这些信息再决定下一步:
mysql> SELECT trx_id, trx_started, (NOW() - trx_started) trx_duration_seconds, id processlist_id, user, IF(LEFT(HOST, (LOCATE(':', host) - 1)) = '', host, LEFT(HOST, (LOCATE(':', host) - 1))) host, command, time, REPLACE(SUBSTRING(info,1,25),'\n','') info_25 FROM information_schema.innodb_trx JOIN information_schema.processlist ON innodb_trx.trx_mysql_thread_id = processlist.id WHERE (NOW() - trx_started) > 60 ORDER BY trx_started; +--------+---------------------+----------------------+----------------+------+-----------+---------+------+---------------------------+ | trx_id | trx_started | trx_duration_seconds | processlist_id | user | host | command | time | info_25 | +--------+---------------------+----------------------+----------------+------+-----------+---------+------+---------------------------+ | 511239 | 2020-04-22 16:52:23 | 2754 | 3515 | dba | localhost | Sleep | 1101 | NULL | | 511240 | 2020-04-22 16:53:44 | 74 | 3553 | root | localhost | Query | 38 | update t1 set name="test" | +--------+---------------------+----------------------+----------------+------+-----------+---------+------+---------------------------+ 2 rows in set (0.00 sec)
mysql要断开连接并关闭了。我们可以手动帮助mysql一下。
使用pt-kill查看并杀死活跃和睡眠状态的连接。这时应该不会有新的写连接进来。我们只是处理读的连接。
pt-kill --host="localhost" --victims="all" --interval=10 --ignore-user="pmm|orchestrator" --busy-time=1 --idle-time=1 --print [--kill]
这里可以选择性地排除某些用户建立的连接。
SET GLOBAL innodb_fast_shutdown=0; SET GLOBAL innodb_max_dirty_pages_pct=0; SET GLOBAL innodb_change_buffering='none';
disable掉innodb_fast_shutdown可能会使得关闭过程花费几分钟甚至个把小时,因为需要等待undo log的purge和changebuffer的merge。
为了加速关闭,设置innodb_max_dirty_pages_pct=0并监控下面查询的结果。期望值是0,但并不总是能保证,如果mysql中还有活动的话。那么,查出的结果不再继续变小的话,就可以继续下一步了:
SHOW GLOBAL STATUS LIKE '%dirty%';
如果使用了pmm监控,可以查看“innodb change buffer”的图示。
SET GLOBAL innodb_buffer_pool_dump_pct=75; SET GLOBAL innodb_buffer_pool_dump_now=ON;
mysql> SHOW STATUS LIKE 'Innodb_buffer_pool_dump_status'; +--------------------------------+--------------------------------------------------+ | Variable_name | Value | +--------------------------------+--------------------------------------------------+ | Innodb_buffer_pool_dump_status | Buffer pool(s) dump completed at 200429 14:04:47 | +--------------------------------+--------------------------------------------------+ 1 row in set (0.01 sec)
启动的时候,要想加载转储出的内容,要检查一下参数innodb_buffer_pool_load_at_startup的配置。
FLUSH LOGS;
现在,就可以关闭mysql了。
大多时候,我们只是执行stop命令,MySQL关闭并重启都是很正常的。偶尔也会遇到一些问题。