详解MYSQL表空间

表空间文件

表空间文件结构

行格式

Compact 行格式

变长字段列表

NULL值列表

记录头信息

列数据

溢出页

数据页

当我们使用MYSQL存储数据时，数据是如何被组织起来的？索引又是如何组织的？在本文我们将会解答这些问题。

表空间文件

当我们建立一个表后，会生成两个文件：.frm文件，.ibd文件（实际上每个存储引擎下生成的文件不同，本文主要以 InnoDB为例）。假设建立一个名为 test 表，会生成这两个文件：

test.frm  
test.ibd

.frm 文件用于存储表结构定义的文件。包含了表的列定义、索引定义、约束条件以及其他与表结构相关的元数据信息。

.ibd 文件用于存储表的数据和索引，包含了表的实际数据行以及各种索引数据结构。也叫做表空间文件。

表空间文件负责了实际数据的存储。

表空间文件结构

表空间文件的由以下部分组成：段（Segment），区（Extent），页（Page），行（Row）

段（Segment）：

表空间文件由各种段组成，如数据段，索引段，回滚段等。

数据段：存储表的数据，负责实际数据的存储，存储的是B+树索引的叶子节点。

索引段：存储B+树的索引节点，也就是非叶子节点。

回滚段：回滚段实际就是 undolog的存储结构，主要用于存储 undo log 以及管理与事务回滚相关的信息。

区（Extent）：

区的存在实际上是为了便于顺序IO，提高IO的效率。

在 InnoDB 中以 B+树的形式组织数据，无论有没有建立索引，都会默认为主键（如何没有主键会有隐藏主键字段）建立B+索引。

在B+索引的每个节点都是一个页，一个页的大小为 16 KB，而B+树的每一层的节点都会链接为双向链表，使得每一层节点之间逻辑连续，但在物理上并不连续，这就会导致在搜索时会产生大量的随机IO（随机IO速度远小于顺序IO）。

为了解决这一点，MYSQL在有大量数据的表空间时分配空间时会以区为单位分配，一个区的小为 1 MB，远大于一个页的大小，这样同一层节点不仅在逻辑上连续也在物理上连续，搜索时也就不是随机IO而为顺序IO，提升了IO效率。

页（Page）：

InnoDB中一个页的大小为 16 KB，页是InnoDB管理资源的最小单位，读取和写入数据时都是页为单位,也就是说即使只读取/写入一行数据也会读取/写入一整个页，实际上这是一种提升IO效率的方式，感兴趣的读者可以搜索一下局部性原理与MYSQL的BufferPool。

页的类型有很多种：数据页，溢出页，undolog页等等,在下文我们会详细解释。

行（Row）：

数据库的记录以行为单位存储，不同的格式有不同的存储结构，下面我们来详细了解行的格式。

行格式

在MYSQL中常见的行格式有很多种：

Compact 行格式
- 这是 MySQL 5.0 版本开始引入的默认行格式。它采用了紧凑的存储方式，对于固定长度的字段，会按照定义的顺序依次存储，节省了存储空间。对于可变长度的字段，会在记录的开头使用额外的字节来记录每个可变长度字段的长度。
- 适用于大多数常规的数据库表，尤其是包含较多固定长度字段的表，能够有效地利用存储空间，提高查询效率。
Redundant 行格式
- 是 MySQL 5.0 之前的默认行格式。它的存储方式相对简单，每行记录都包含了一些固定的头部信息和字段数据。与 Compact 行格式相比，Redundant 行格式在存储可变长度字段时，使用了更多的空间来记录字段长度信息，因此会占用更多的存储空间。
- 主要用于与旧版本的 MySQL 兼容。如果数据库中存在一些历史表，并且对兼容性有要求，可能会使用 Redundant 行格式。
Dynamic 行格式
- 从 MySQL 5.7 版本开始引入。它与 Compact 行格式类似，但对于可变长度字段的存储方式有所不同。Dynamic 行格式会将长度超过一定阈值的可变长度字段存储在数据页的外部，只在数据页中保留一个指向外部存储位置的指针，这样可以减少数据页中碎片的产生，提高数据页的利用率。
- 特别适用于包含大文本字段（如 VARCHAR、TEXT 等）或 BLOB 类型字段的表。当这些字段的值较大时，使用 Dynamic 行格式可以有效地避免数据页的分裂和碎片问题，提高数据库的性能。
Compressed 行格式
- 同样是在 MySQL 5.7 版本引入。这种行格式在存储数据时会对数据进行压缩，以减少存储空间的占用。它使用了 zlib 压缩算法对数据页进行压缩，从而可以大大降低数据在磁盘上的存储量。
- 适用于对存储空间要求较高的场景，如数据仓库或一些需要长期保存大量历史数据的数据库。通过压缩数据，可以减少磁盘 I/O 操作，提高查询性能，同时也降低了存储成本。

Compact 行格式

本文我们主要了解Compact 行格式,Compact 行格式由四部分组成：变长字段列表，NULL值列表，记录头信息，行数据。

变长字段列表

在MYSQL中存在一些变长字段，比如VARCHAR，TEXT。这些字段的长度并不固定，但长度都记录在变长字段列表中。

变长字段的长度信息会按照列的逆序存储在变长字段列表中。每个变长字段的长度使用 1 个或 2 个字节来表示，具体取决于字段的最大长度和实际长度：

字段最大长度小于等于 255 字节：使用 1 个字节来存储该字段的实际长度。
字段最大长度大于 255 字节：当实际长度小于 128 字节时，使用 1 个字节存储；当实际长度大于等于 128 字节时，使用 2 个字节存储。

假设有下面一张表

CREATE TABLE test_table (col1 VARCHAR(10),col2 VARCHAR(200),col3 VARCHAR(300)
);

当插入一行数据 ('abc', 'defghijklmnopqrst', 'uvwxyz') 时，变长字段列表的存储情况如下：

col3 的实际长度为 6 字节，由于其最大长度 300 大于 255 且实际长度小于 128，所以用 1 个字节存储长度 6。
col2 的实际长度为 18 字节，同理用 1 个字节存储长度 18。
col1 的实际长度为 3 字节，其最大长度 10 小于等于 255，用 1 个字节存储长度 3。

实际存储情况如下：

这里需要注意如果变长字段为NULL值，变长字段列表不会记录该列的长度信息。

NULL值列表

NULL值列表用于标识行数据中的NULL值，为了节约空间列数据并不存储NULL值，而是由NULL值列表标识是否为NULL。NULL值列表以位为基本单位，一个位标记一个允许为NULL值的列。

二进制位的值为1时，代表该列的值为NULL。
二进制位的值为0时，代表该列的值不为NULL。

NULL值列表的长度是按照字节进行存储，不足一个字节会补足到一个字节。比如，若表中只有 3 个可允许为NULL的列，NULL值列表仍然会占用 1 个字节（8 位），只是高 5 位没有实际意义。与变长列表相同，NULL值列表也是倒序存储。

假设有一个表 test_table 包含三列 col1、col2、col3，且都允许为 NULL：

CREATE TABLE test_table (col1 INT NULL,col2 VARCHAR(10) NULL,col3 DECIMAL(10, 2) NULL
);

当插入一行数据，其中 col1 和 col2 为 NULL，col3 有值时，NULL值列表如下：

实际上变长字段列表与NULL值列表并不是任何表中都存在，如果表中所有列都被定义为 NOT NULL，即不允许存储 NULL 值，那么就不会有 NULL 值列表。同理如果表中所有列都是固定长度的数据类型，那么就不需要变长字段列表。

记录头信息

记录头信息存储的是数据记录的一些元数据，主要有以下数据：

名称	长度	说明
`预留位1`	1	目前未使用
`预留位2`	1	目前未使用
`delete_mask`	1	删除标记位，值为 1 表示该记录已被删除，但还未被真正从磁盘中移除，属于逻辑删除。后续会通过页合并等操作进行物理删除。
`min_rec_mask`	1	仅在 B+ 树的非叶子节点中使用，用于标记该记录是否为最小的记录。
`n_owned`	4	表示该记录拥有的记录数。InnoDB 为了提高记录查找效率，会将页中的记录分组，每组记录有一个带头记录，`n_owned` 记录了带头记录所在组的记录数量。
`heap_no`	13	表示该记录在页中的堆（Heap）中的位置编号。在 InnoDB 中，新插入的记录会按照一定规则分配一个 `heap_no` 编号。
`record_type`	3	记录类型，常见取值及含义如下： 0：普通记录 1：B+ 树非叶子节点记录 2：Infimum 记录（页中最小的虚拟记录） 3：Supremum 记录（页中最大的虚拟记录）
`next_record`	16	指向下一条记录的相对偏移量。通过 `next_record` 可以将页中的记录串联成一个单向链表，方便进行记录的遍历和查找。