图解MVCC多版本并发控制

目录
*   1-理解mvcc前奏 undo-log 版本链是什么
*   2-基于 undo-log 多版本链条实现的readview是什么样的
*   3-基于readview机制实现的rc隔离级别
*   4-基于readview机制实现的rr隔离级别
*   总结

前言

现在已经知道了sql四种隔离级别分别为 RU、RC、RR和串行化。

而我们熟悉的MySQL的默认隔离级别是第三种 RR（可重复读）。相对于SQL标准的RR，MySQL的RR是基于MVCC机制实现的，在此隔离级别下，是可以防止脏写、脏读、不可重复读和幻读。

那MVCC是什么样的一种机制呢？

其实MVCC是 multi-version concurrent control（多版本并发控制）的缩写，是基于undo log 多版本链条 + ReadView机制来实现。

下面说说MVCC机制的实现和基于MVCC实现的RC和RR。

1. 理解mvcc前奏，undo log 版本链是什么？

关于undo log我们之前也讲过。每条数据都有两个隐藏字段，分别是trx_id和roll_pointer。trx_id就是最近更新这条数据的事务id，roll_pointer就是指向更新这个事务之前生成的undo log。

假设事务A（id=50）插入了一条数据，插入的值为A，那么，对应的trx_id为50，roll_pointer指向一个空的undo log，因为之前是没有这条数据。

图 1-1

接着事务B过来更新了一下这条数据，把值改成了B值，事务B的id为60，rooll_pointer指向这个实际的undo log回滚日志：

图 1-2

这条undo log就记录了事务B的事务id，修改后的值B以及roll_pointer指向的是它修改前的undo log

接着事务C又来修改一下这个值为值C，所对应的事务id为70，如图所示：

图 1-3

这里可以看到roll_pointer指向了本次修改之前的undo log，并且和事务A的undo log也串联了起来。

所以这里可以清楚的了解到，每次修改数据都会更新trx_id和roll_pointer这两个字段，同时之前的多个数据快照对应的undo log，会通过roll_pointer指针串联起来，形成的一个版本链。

2. 基于 undo log 多版本链条实现的ReadView是什么样的？

当执行一个事务时，就生成一个ReadView，里面包含几个部分：

m_ids: 此时有哪些事务在MySQL中执行还没提交的
min_trx_id：m_ids里面最小的值
max_trx_id: MySQL下一个要生成的事务id，就是最大事务id
creator_trx_id：当前事务的id

下面通过一个例子理解ReadView的用处。

假设数据库里已经存在了一条数据，由之前的事务插入的，其事务id为32，初始值为原始值。

图 2-1

接下来，有两个事务 A 和 B 并发过来执行。事务A的事务id为45，事务B的事务id为59。事务B要更新这行数据，事务A要查询这行数据。

图 2-2

现在事务A开启了一个ReadView，在这个ReadView里面，m_ids包含了事务A和事务B的两个id，45和59，然后min_trx_id是45，max_trx_id是60，creator_trx_id是当前开启事务的id 45，就是事务A。

图 2-3

现在事务A进行第一次查询，首先会走一个判断，判断一下这行数据的trx_id是否小于ReadView的min_trx_id，此时，发现trx_id是32，是小于ReadView里的min_trx_id（45），说明事务A开始之前，修改这行数据的事务早就提交了，所以是可以查到这行数据的。

图 2-4

接着事务B过来修改这行数据，把原始值改成了值B，然后这行数据的trx_id就变成了59，同时roll_pointer指向修改之前生成的undo log 。

图 2-5

这个时候事务A再次查询，会发现这行数据的trx_id是59，是大于ReadView里的min_trx_id(45)，同时小于max_trx_id（60）的。说明更新这条数据的事务有可能存在ReadView的m_ids中，然后判断m_ids里面是否存在trx_id=59的事务，刚好m_ids里面是存在59这个事务id，证实是跟自己同一时段并发执行的事务，该数据不能查询。

图 2-6

既然这行数据不能查询，应该返回什么数据？

这时就会顺着这条数据的roll_pointer的undo log日志链条往下找，就会找到最近的一条trx_id=32的undo log。说明这个undo log版本必然是在事务A开启之前就执行提交的。

看到这里，就体会到了undo log版本链条的作用了，通过保存快照链条，让你快速读到之前的快照值。

通过以上 undo log版本链条 + ReadView 就可以保证了事务A不会读到并发执行的事务B更新的值。

接着看，假设事务A自己更新了这行数据，改成值A，trx_id更新为45，同时保存之前事务B修改的值得快照

图 2-7

此时事务A再来查询这行数据，发现trx_id=45,与ReadView里的creator_trx_id(45)是一致的，说明这是自己修改的这行数据，当然可以被查询到。

图 2-8

接着在事务A执行事务期间，突然开启了一个事务C，事务id为78，然后更新了这行数据为值C，并提交了。

图 2-9

这个时候事务A再去查询这行数，发现trx_id=78，大于ReadView中的max_trx_id，说明事务A执行期间，有另外一个事务更新了数据，所以并不能查询到。

图 2-10

然后顺着undo log 版本链条往下找，查询到自己修改过的值。

通过undo log版本链条 + ReadView 这套机制，我们知道了在事务开启之后，只可以读到事务开始之前或者此事务自己修改的数据。这样，就可以实现多个事务并发执行时候的数据隔离。

3. 基于ReadView机制实现的RC隔离级别

已提交读隔离级别，说明在事务运行期间，其他事务执行并且提交了，你就可以都到别的事务更新的数据，所以会出现不可重复读和幻读的问题。

RC隔离级别的核心就是，每次发起一次查询，都重新生成一个ReadView。

假设现在有两个事务对同意一行数据并发执行，分别是事务A和事务B，事务A是查询数据，事务id是50；事务B是更新数据，事务id是70。

现在事务A发起查询，开启一个ReadView。因为事务B是并发执行的，所以ReadView中的结构为：

图 3-1

所以，此时无论事务B如何修改数据并提交事务，事务A都无法读取到事务B修改的值。原因也很简单，事务B的事务id存在ReadView的m_ids的活跃事务列表中。

那如何才能让事务A可以读到事务B更新并提交事务的值呢？

那就是每次查询，都重新开启一个ReadView。

现在假设事务B已经把该行的数据改成了值B，并且提交了。事务A再次进行查询，重启生成一个ReadView。此次生成的ReadView中，数据库内活跃的事务只有事务A了。

图 3-2

此时事务A再次基于ReadView判断，发现这条数据的trx_id=70，虽然在min_trx_id与max_trx_id范围之间，但是并不在m_ids列表内。说明事务B在生成本次ReadView之前已经提交。

因为是在生成ReadView之前就提交的事务，说明事务A就可以查询到事务B修改过得值。从而实现已提交读。

图 3-3

所以，已提交读隔离级别关键的地方在于，每次查询都生成新的ReadView。

4. 基于ReadView机制实现的RR隔离级别

接下来将要讲的是MySQL中的默认隔离级别可重复读，是如何同时避免不可重复读和幻读。

可重复读隔离级别，顾名思义，就是一个事务读同一条数据，无论读多少次，都是同一个值。别的事务就算修改数据提交后，也无法读到它的值。同时，如果别的事务插入一些新的数据，也是无法读到，就可以避免不可重复读和幻读了。

假设数据库已经存在一条数据，此时事务A和事务B同时执行，事务A的id是60，事务B的id是70

图 4-1

此时事务A发起了一个查询，且第一次查询就会生成一个ReadView

图 4-2

事务A基于ReadView去查这条数据，发现trx_id=50是小于min_trx_id的，说明是执行事务A之前就已经提交了的事务插入的，所以可以查到这条数据。

图 4-3

此时事务B过来更新这行数据，把该值改成了值B，同时生成一个undo log，且事务B提交了。

图 4-4

但这个时候，就算事务B已经提交了，在ReadView里面的m_ids中也是存在事务B的事务id，m_ids记录的是执行事务A的时候其他也正在执行的事务的id，并不是说提交了就不存在于m_ids中，除非跟RC隔离级别一样，再生成一个新的ReadView。

所以事务A再次去查询这行数据时，因为m_ids列表中有事务B的事务id，说明事务B也是数据库的活跃事务，就算事务B提交了并不会读取到值B，而实顺着undo log版本链条找到相应的值。

图 4-5

看到这里，就可以清晰的了解到，是如何通过ReadView去避免不可重复读的问题。

那如果是插入数据可能导致的幻读呢？

假设事务A先用”select * from table where id > 10“来查询，此时可能查到的数据只有原始值这条数据。

图 4-6

现在有一个事务C插入了一条数据，然后提交了。

图 4-7

接着事务A再次查询，会发现符合条件的数据有两天，一条是原始值，一条是值C。

但根据ReadView进行判断发现，值C的trx_id=80，比max_trx_id（71）要大。说明是自己发起查询之后，这个事务才开启的，所以此时这条数据是不能查询的。

图 4-8

所以本次查询，事务A还是只能查询到一条数据。

这样看来，在依托ReadView这个机制下,事务A也就不会产生幻读的情况。

看到这里相信大家也就明白基于ReadView机制，RR隔离级别是如何避免不可重复读和幻读的了。

总结

通过一系列篇章和底层原则的分析，大家都明白数据库的脏写、脏读、不可重复读和幻读问题怎样产生的。

而MySQL又是如何基于undo log多版本链条 + ReadView机制这套机制，实现的RR隔离级别来避免脏写、脏读、不可重复读和幻读问题。

注明：

学习笔记总结于公棕号：儒猿技术窝。感兴趣的同学可以前往关注。

最后编辑于：2021.04.26 09:52:37

禁止转载，如需转载请通过简信或评论联系作者。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,905评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,140评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,791评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,483评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,476评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,516评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,905评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,560评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,778评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,557评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,635评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,338评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,925评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,898评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,142评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,818评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,347评论 2赞 342

图解MVCC多版本并发控制

前言

1. 理解mvcc前奏，undo log 版本链是什么？

2. 基于 undo log 多版本链条实现的ReadView是什么样的？

3. 基于ReadView机制实现的RC隔离级别

4. 基于ReadView机制实现的RR隔离级别

总结

推荐阅读更多精彩内容