基于MySQL在磁盘上存储NULL值
1 为何不能直接存个NULL?
NULL值列表,一行数据里可能有的字段值是NULL,比如nickname字段,允许为NULL,存储时,如果没赋值,这字段值就是NULL。
假设这个字段的NULL值在磁盘存储时,就是按“NULL”字符串存储的,是不是很浪费存储空间而且还奇怪?
2 到底怎么存储?
不通过字符串,而是通过二进制bit位存储,一行数据里假设有多个字段的值都是NULL,那么这多个字段的NULL,就会以bit位形式存放在NULL值列表。
如下表:
CREATE TABLE customer ( name VARCHAR(10) NOT NULL, address VARCHAR(20), gender CHAR(1), job VARCHAR(30), school VARCHAR(50) ) ROW_FORMAT=COMPACT;
有4个变长字段,还有个定长字段,name
声明NOT NULL
,其他4个字段都可能NULL
如下一行数据怎么存储在磁盘呢:
jack NULL m NULL xx_school
有俩字段都是NULL
3 一行数据的磁盘存储格式
思考上面那个表里的那行案例数据,在磁盘上如何存储呢,因为他有多个变长字段,还有多个字段允许为NULL。首先我们先回顾一下,一行数据在磁盘上的存储格式应该是下面这样的:
变长字段长度列表 NULL值列表 头信息 column1=value1 column2=value2 ... columnN=valueN
4个变长字段,逆序先放school字段的长度,再放job、address、name几个字段的值长度?
但要区分一个问题,若这变长字段值为NULL,就不用在变长字段长度列表里存放他的值长度,所以在上面那行数据,只有name和school两个变长字段有值,把他们的长度按照逆序放在变长字段长度列表即可:
0x09 0x04 NULL值列表 头信息 column1=value1 column2=value2 ... columnN=valueN
所有允许值为NULL的字段,不是说值就得是NULL,只要是允许为NULL的字段,每个字段都有个二进制bit位值:
- bit值是1说明是NULL
- bit值是0说明不是NULL
比如上面4个字段都允许为NULL,每个人都会有一个bit位,这一行数据的值是
jack NULL m NULL xx_school
其中2个字段是null,2个字段不是null,所以4个bit位应该是:1010
但实际放在NULL值列表时,按逆序放,所以NULL值列表里放的:0101,整体这一行数据如下:
0x09 0x04 0101 头信息 column1=value1 column2=value2 ... columnN=valueN
实际NULL值列表存放时,一般起码8个bit位的倍数,不足8个bit位就高位补0,所以实际存放如下:
0x09 0x04 00000101 头信息 column1=value1 column2=value2 ... columnN=valueN
4 如何读磁盘的一行数据?
磁盘数据存储格式:
0x09 0x04 00000101 头信息 column1=value1 column2=value2 ... columnN=valueN
先读:
- 变长字段长度列表
就知道有几个变长字段
- NULL值列表
哪些变长字段是NULL:
从变长字段长度列表中解析出不为NULL的变长字段的值长度,然后也知道哪些字段是NULL。根据这些信息,就能从实际的列值存储区域里,把你每个字段的值读取出来了。
- 变长字段值,就按值长度读取,若为NULL,就知道他是个NULL,没有值存储
- 定长字段,按定长长度读取