数据页结构

一、页如果按类型划分的话,常见的有数据页(保存 B+ 树节点)系统页、 Undo 页和事务数据页 等。数据页是我们最常使用的页。
二、数据页的划分

数据页的16KB大小的存储空间被划分为七个部分,分别是文件头(FileHeader)、页头(Page Header)、最大最小记录(Infimum+supremum)、用户记录(User Records)、空闲空间(Free Space)、页目录(PageDirectory)和文件尾(File Tailer)。


数据页

image.png
三、数据页的文件头和文件尾
文件头和文件尾
校验和(FIL_PAGE_SPACE_OR_CHKSUM)

每当一个页面在内存中修改了,在同步之前就要把它的校验和算出来,因为FileHeader在页面的前边,所以校验和会被首先同步到磁盘,当完全写完时,校验和也会被写到页的尾部,如果完全同步成功,则页的首部和尾部的校验和应该是一致的。如果写了一半儿断电了,那么在File Header中的校验和就代表着已经修改过的页,而在FileTrailer中的校验和代表着原先的页,二者不同则意味着同步中间出了错。这里,校验方式就是采用 Hash 算法进行校验。

四、空闲空间、用户记录和最大最小记录
CREATE TABLE person (
    id INT,
    NAME VARCHAR ( 10 ),
age INT,
PRIMARY KEY ( id )) charset = ascii ROW_FORMAT = Compact
INSERT INTO `person` (`id`, `NAME`, `age`) VALUES (1, '张三', 10);
INSERT INTO .`person` (`id`, `NAME`, `age`) VALUES (2, '李四', 20);
INSERT INTO `person` (`id`, `NAME`, `age`) VALUES (3, '王五', 30);
用户记录和最大最小记录的头信息 compact行格式

查看行格式 select @@innodb_default_row_format

1、变长字段长度列表
2、NULL值列表
3、记录头信息
记录头及数据
3.1 Delete_mask

标记当前记录是否被删除,占用一个二进制位。
值为0:代表记录并没有被删除
值为1:代表记录被删除了
这些被删除的记录之所以不立即从磁盘上移除,是因为移除它们之后其他的记录会重新排序,导致性能消耗,所以只是打一个删除标记,所有被删除的记录会组成一个所谓的垃圾链表,在这个链表中的记录占用的空间被称为可重用空间,之后如果有新插入的记录,可能把这些被删除的记录占用的存储空间覆盖掉。

3.2 Min_rec_mask

B+树的每层非叶子节点中的最小记录都会被添加该标记,min_rec_mask值为1。(目录项中的记录min_rec_mask为1;用户记录中的min_rec_mask为0)

3.3 Record_type

0表示用户记录
1表示目录项
2表示最小记录
3表示最大记录

3.3 Heap_no

当前记录在本页中的位置,heap_no为0代表最小记录,heap_no为1代表最大记录,说明最小记录和最大记录比较靠前。

3.4 N_owned

表示当前页目录最大记录拥有的记录数量。

3.5 Next_record

表示当前记录到下一条记录的地址偏移量。从当前记录偏移多少个字节便是下一条记录的真实数据。

4、用户记录
五、页目录和页面头部
1.页目录

在页中,记录是以单向链表的形式进行存储的。单向链表的特点就是插入、删除非常方便,但是检索效率不高,最差的情况下需要遍历链表上的所有节点才能完成检索。所以在页结构中专门设计了页目录这个模块,专门给记录做一个目录,通过二分查找法的方式进行检索,提升效率。
假设现在有一条查询语句:
select * from page_demo where c1 = 3;
根据主键查找页中的某条记录,如何实现快速查找呢?
方式一
顺序查找:从 Infimum 记录(最小记录)开始,沿着链表一直往后找,数据量非常大的时候,性能非常差。
方式二
使用页目录,二分法查找。
将所有的记录分成若干个组,这些记录中包含最小记录和最大记录,但不包括被标记为删除的记录。
第 1 组只有一条记录,最小记录所在的组。最后一组,也就是最大记录所在的分组,会有 1-8 条记录。其他分组,会有 4-8 条记录。【这样做的好处是除了第 1 组外,其余组的记录数会尽量平分】。
每个组中的最后一条记录的头信息中会存储该组中一共有多少条记录,来作为 n_owned 字段的值。
页目录用来存储最后一条记录的地址偏移量,这些地址偏移量会按照顺序存储起来,每组的地址偏移量也被称为槽(Slot),每个槽相当于指针指向了不同组的最后一条记录。
假设现在的 page_demo 表中正常的记录共有 6 条,InnoDB 会把它们分成两组,第一组中只有一个最小记录,第二组中是剩余的 5 条记录。分组后:


image.png

上图的槽位:
槽 0:指向的是最小记录的地址偏移量。
槽 1:指向的是最大记录的地址偏移量。

2.页面头部

为了能得到一个数据页中存储的记录的状态信息,比如:
本页中已经存储了多少条记录?
第一条记录的地址是什么?
页目录中存储了多少个槽?…
特意在页中定义了一个叫 Page Header 的部分,这个部分占用固定的 56 个字节,专门存储各种状态信息。


页面头部
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容

  • 不同类型的页简介 前边我们简单提了一下页的概念,它是InnoDB管理存储空间的基本单位,一个页的大小一般是16KB...
    tracy_668阅读 1,147评论 1 6
  • Mysql--InnoDB数据页结构 页 1.页是innodb管理存储空间的基本单位 2.一般大小是16kb 3....
    简书徐小耳阅读 2,454评论 1 1
  • 原文链接 - InnoDB数据页结构 页是MySQL管理存储空间的基本单位,一个页的大小一般是16KB,并且记录其...
    wpf_register阅读 382评论 0 1
  • 1. 数据页的结构 1个数据页默认为16KB数据页 一个页共有7个部分数据页结构 用户记录都是通过空闲空间中的来...
    亚西阅读 432评论 0 0
  • 页是 InnoDB 管理存储空间的基本单位,InnoDB 为了不同的目的设计了不同类型的页,比如,这里我们讨论的是...
    wayyyy阅读 285评论 0 0