行溢出的临界点
那发生行溢出
的临界点是什么呢?也就是说在列存储多少字节的数据时就会发生行溢出
?
MySQL
中规定一个页中至少存放两行记录,至于为什么这么规定我们之后再说,现在看一下这个规定造成的影响。以上边的varchar_size_demo
表为例,它只有一个列c
,我们往这个表中插入两条记录,每条记录最少插入多少字节的数据才会行溢出
的现象呢?这得分析一下页中的空间都是如何利用的。
-
每个页除了存放我们的记录以外,也需要存储一些额外的信息,乱七八糟的额外信息加起来需要
132
个字节的空间(现在只要知道这个数字就好了),其他的空间都可以被用来存储记录。 -
每个记录需要的额外信息是
27
字节。这27个字节包括下边这些部分:
- 2个字节用于存储真实数据的长度
- 1个字节用于存储列是否是NULL值
- 5个字节大小的头信息
- 6个字节的
row_id
列 - 6个字节的
transaction_id
列 - 7个字节的
roll_pointer
列
假设一个列中存储的数据字节数为n,设计MySQL
的大叔规定如果该列不发生溢出的现象,就需要满足下边这个式子:
132 + 2×(27 + n) < 16384
求解这个式子得出的解是:n < 8099
。也就是说如果一个列中存储的数据小于8099
个字节,那么该列就不会成为溢出列
,否则该列就需要成为溢出列
。不过这个8099
个字节的结论只是针对只有一个列的varchar_size_demo
表来说的,如果表中有多个列,那上边的式子和结论都需要改一改了,所以重点就是:你不用关注这个临界点是什么,只要知道如果我们一条记录的某个列中存储的数据占用的字节数非常多时,该列就可能成为溢出列
。
varchar最多存储多少字符
VARCHAR(M)最多能存储的数据
我们知道对于VARCHAR(M)
类型的列最多可以占用65535
个字节。其中的M
代表该类型最多存储的字符数量,如果我们使用ascii
字符集的话,一个字符就代表一个字节,我们看看VARCHAR(65535)
是否可用:
mysql> CREATE TABLE varchar_size_demo(
-> c VARCHAR(65535)
-> ) CHARSET=ascii ROW_FORMAT=Compact;
ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. This includes storage overhead, check the manual. You have to change some columns to TEXT or BLOBs
mysql>
从报错信息里可以看出,MySQL
对一条记录占用的最大存储空间是有限制的,除了BLOB
或者TEXT
类型的列之外,其他所有的列(不包括隐藏列和记录头信息)占用的字节长度加起来不能超过65535
个字节。所以MySQL
服务器建议我们把存储类型改为TEXT
或者BLOB
的类型。这个65535
个字节除了列本身的数据之外,还包括一些其他的数据(storage overhead
),比如说我们为了存储一个VARCHAR(M)
类型的列,其实需要占用3部分存储空间:
- 真实数据
- 真实数据占用字节的长度
NULL
值标识,如果该列有NOT NULL
属性则可以没有这部分存储空间
如果该VARCHAR
类型的列没有NOT NULL
属性,那最多只能存储65532
个字节的数据,因为真实数据的长度可能占用2个字节,NULL
值标识需要占用1个字节:
mysql> CREATE TABLE varchar_size_demo(
-> c VARCHAR(65532)
-> ) CHARSET=ascii ROW_FORMAT=Compact;
Query OK, 0 rows affected (0.02 sec)
如果VARCHAR
类型的列有NOT NULL
属性,那最多只能存储65533
个字节的数据,因为真实数据的长度可能占用2个字节,不需要NULL
值标识:
摘抄自 《MySQL是怎样运行的》