一文详解MySQL主从同步原理
1. MySQL主从同步实现方式
MySQL主从同步是基于Bin Log实现的,而Bin Log记录的是原始SQL语句。
Bin Log共有三种日志格式,可以binlog_format配置参数指定。
参数值 | 含义 |
---|---|
Statement | 记录原始SQL语句,会导致更新时间与原库不一致。 比如 update_time=now() |
Row | 记录每行数据的变化,保证了数据与原库一致,缺点是数据量较大。 |
Mixed | Statement和Row的混合模式,默认采用Statement模式,涉及日期、函数相关的时候采用Row模式,既减少了数据量,又保证了数据一致性。 |
常见的主从同步架构有一主多从、双主多从
2. MySQL主从同步的作用
- 读写分离,提升数据库性能
- 容灾恢复,主服务器不可用时,从服务器提供服务,提高可用性
- 冗余备份,主服务器数据损坏丢失,从服务器保留备份
一主多从架构
一般是主库负责所有读写请求,而从库只负责容灾恢复和冗余备份。
如果做了读写分离的话,主库负责写请求,从库负责读请求,可以提升数据库性能。
双主多从架构
一般是主库1负责所有读写请求,主库2不对外提供服务,只用来容灾恢复。
相比一主多从架构,双主多从架构可以减少宕机时间,更快恢复数据库可用状态。
3. 主动同步的原理
- 当主库数据发生变更时,写入本地Bin Log文件
- 从库IO线程发起dump主库Bin Log文件的请求
- 主库IO线程推送Bin Log文件到从库中
- 从库IO线程把Bin Log内容写入本地的Relay Log文件中
- 从库SQL线程读取Relay Log文件内容
- 从库SQL线程重新执行一遍SQL语句
4. 主从同步延迟问题
主从同步最常遇到的问题就是主从同步延迟,可以通过在从库上执行show slave status命令查看延迟时间,Seconds_Behind_Master表示延迟的秒数。
主从同步延迟的原因有哪些?
从库机器性能较差:
主库负责所有读写请求,从库只用来备份,会用性能较差的机器,执行时间自然较慢。
从库压力更大:
- 读写分离后,主库负责写请求,从库负责读请求。
- 互联网应用一般读请求更多,所以从库读压力更大,占用更多CPU资源。
网络延迟:
当主库的Bin Log文件往从库上发送时,可能产生网络延迟,也会导致从库数据跟不上。
主库有大事务:
当主库上有个大事务需要执行5分钟,把Bin Log文件发送到从库,从库至少也需要执行5分钟,所以这时候从库就出现了5分钟的延迟。
主从同步延迟的解决方案?
从库机器性能较差:
把从库换成跟主库同等规格的机器。
从库压力更大:
多搞几台从库,分担读请求压力。
网络延迟:
联系运维或者云服务提供商解决。
主库有大事务:
把大事务分割成小事务执行,大事务不但会产生从库延迟,还可能产生死锁,降低数据库并发性能,所以尽量少用大事务。
5. 如何提升主从同步性能
从库开启多线程复制
就是在主从同步的最后两步使用多线程,修改配置 slave_parallel_workers=4,代表开启4个复制线程。
修改同步模式,改为异步
主从同步共有三种复制方式:
全同步复制:
当主库执行完一个事务,并且所有从库都执行完该事务后,才给客户端返回成功。
半同步复制:
至少有一个从库执行完成后,就给客户端返回成功。
异步复制:
主库执行完后,立即返回成功,不关心从库是否执行完成。
如果对数据安全性要求没那么高,可以把同步模式改成半同步复制或者异步复制。
修改从库Bin Log配置
修改sync_binlog配置:
sync_binlog=0 ,表示写binlog不立即刷新磁盘,由系统决定什么时候刷新磁盘。
sync_binlog=1,每次写binlog都刷新磁盘,安全性高,性能差。
sync_binlog=N,写N次binlog才刷新磁盘。
从库对数据安全性要求没那么高,可以设置sync_binlog=0。
修改innodb_flush_log_at_trx_commit配置:
innodb_flush_log_at_trx_commit=0,每隔一秒钟,把事务日志刷新到磁盘。
innodb_flush_log_at_trx_commit=1,每次事务都刷新到磁盘。
innodb_flush_log_at_trx_commit=2,每次事务都不主动刷新磁盘,由系统决定什么时候刷新磁盘。
从库对数据安全性要求没那么高,可以设置innodb_flush_log_at_trx_commit=2。
知识点总结
到此这篇关于一文详解MySQL主从同步原理的文章就介绍到这了,更多相关MySQL主从同步原理内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!