概念
脏页
脏页指的是buffer pool中的数据页被修改后,导致内存中的缓存页和磁盘上的数据页不一致。这时候buffer pool的页就是脏页。
脏页落盘机制
修改数据时,首先修改缓冲池中的页,然后再以一定频率刷新到磁盘上。脏页从缓冲池刷新到磁盘的操作,并不是在每次发生更新时就触发,而是通过checkpoint机制刷新回磁盘。
redo log的问题
我们知道redolog能保证事务的持久性,但redolog也不是万能的。redolog可能会出现一些问题:
- 1.缓冲池不是无限大的,也就是说不能一直存储数据,而不去刷新磁盘。
- 2.redolog是循环使用的,也不是无限大的,redolog写满了怎么办?
- 3.当数据库运行了较长时间,这时候宕机了,就需要重新应用redolog进行恢复,这个过程会非常耗时,恢复成本非常高。
因此checkpoint机制就可以解决上面的三个问题。
1.缓冲池不够用的时候,将脏页刷新到磁盘。
2.重做日志不够用时,将脏页刷到磁盘。
3.缩短恢复的时间
checkpoint机制
缓冲池空间不足时
当缓冲池中空间无法存放新读取的页,这个时候innodb就会使用LRU算法进行淘汰。如果将要淘汰的页是脏页,就需要强制执行checkpoint,将脏页刷新到磁盘。
缩短数据库恢复时间
当数据库发生宕机时,数据库不需要重做所有的日志,因此checkpoint之前的页已经刷回磁盘了,只需要针对checkpoint之后的redolog进行恢复即可,减少恢复时间。
重做日志写满时
日志组:MySQL为了优化磁盘持久化的开销,会有一个组提交机制(group commit)。innodb引擎至少有一个重做日志文件组,每个文件组下面至少有2个redolog文件。
查看事务日志组相关参数:
show variables like '%innodb_log_group%';
./表示MySQL数据目录为事务日志组目录。
查看事务日志组中事务日志文件的个数的参数,默认2个:
show variables like '%innodb_log_files%';
日志组中每个重做日志大小一致。单个文件默认大小48M,最大值512G。最大值512G是组内文件大小的总和,不是的单个文件大小:
show variables like '%innodb_log_file_size%';
所谓redolog不可用,就是redolog file都写满的时候。当然redolog不是都有用的,有部分是可重用的部分。数据库宕机恢复后不会恢复这部分。
innodb以环形方式写入重做日志。
write pos:表示日志当前记录的位置,当ib_logfile_4写满后,会从ib_logfile_1的头开始记录;
check point:表示将日志记录的修改写进磁盘,完成数据落盘后,checkpoint会将日志上相关记录擦除掉;
即write pos → check point之间的部分是redo log空着的部分,用于新的记录;check point → write pos之间的部分是待落盘的数据修改记录。
如果write pos追上了check point表示写满,这时候无法再执行新的更新,得停下来先擦掉一些记录,把checkpoint推进一下。
check point种类
- sharp checkpoint:强制落盘。把内存中所有脏页都执行落盘操作。只有当数据库关闭前才会执行。
- fuzzy checkpoint:模糊落盘。把一部分脏页执行落盘操作,分为四种:
1)master thread checkpoint:主线程定时将脏页写入磁盘,每秒或每10s执行一次。
2)FLUSH_LRU_LIST:当buffer pool即将有脏页被换出时,执行落盘。
3)Async/Sync Flush checkpoint:当redo log接近写满时执行落盘:
a.当redo log超过75%小于90%时会执行异步落盘;
b.当redo log超过90%,会执行同步落盘操作。会阻塞写操作。
4)Dirty Page too much checkpoint:如果buffer pool中脏页太多,脏页率超过75%执行落盘。
总结
checkpoint所做的事情,就是将缓冲池中脏页刷回磁盘。
每次刷新多少脏页到磁盘,每次从哪里取脏页,以及什么时间触发触发checkpoint,都是由checkpoint机制负责的。