Mysql版本众多,每个版本支持的数据类型繁多且不一样,本篇文章中主要基于MySQL Community Server 5.7.22介绍常用的数据类型,包括其特点以及区别。
MySQL数据类型
正确的定义表结构:数据类型、字段长度,对于数据库性能至关重要。
MySQL的数据类型大致可分三类:
- 数值类型
- 字符串(字符)类型
- 日期和时间类型
数值类型
MySQL支持所有标准SQL数值数据类型。
这些类型包括严格数值数据类型(INTEGER、SMALLINT、DECIMAL和NUMERIC),以及近似数值数据类型(FLOAT、REAL和DOUBLE PRECISION)。
关键字INT是INTEGER的同义词,关键字DEC是DECIMAL的同义词。
BIT数据类型保存位字段值,并且支持MyISAM、MEMORY、InnoDB和BDB表。
作为SQL标准的扩展,MySQL也支持整数类型TINYINT、MEDIUMINT和BIGINT。下面的表显示了需要的每个整数类型的存储和范围。
类型 | 大小 | 范围(有符号) | 范围(无符号) | 用途 |
---|---|---|---|---|
TINYINT | 1 字节 | (-128,127) | (0,255) | 小整数值 |
SMALLINT | 2 字节 | (-32 768,32 767) | (0,65 535) | 大整数值 |
MEDIUMINT | 3 字节 | (-8 388 608,8 388 607) | (0,16 777 215) | 大整数值 |
INT或INTEGER | 4 字节 | (-2 147 483 648,2 147 483 647) | (0,4 294 967 295) | 大整数值 |
BIGINT | 8 字节 | (-9,223,372,036,854,775,808,9 223 372 036 854 775 807) | (0,18 446 744 073 709 551 615) | 极大整数值 |
FLOAT | 4 字节 | (-3.402 823 466 E+38,-1.175 494 351 E-38),0,(1.175 494 351 E-38,3.402 823 466 351 E+38) | 0,(1.175 494 351 E-38,3.402 823 466 E+38) | 单精度 浮点数值 |
DOUBLE | 8 字节 | (-1.797 693 134 862 315 7 E+308,-2.225 073 858 507 201 4 E-308),0,(2.225 073 858 507 201 4 E-308,1.797 693 134 862 315 7 E+308) | 0,(2.225 073 858 507 201 4 E-308,1.797 693 134 862 315 7 E+308) | 双精度 浮点数值 |
DECIMAL | 对DECIMAL(M,D) ,如果M>D,为M+2否则为D+2 | 依赖于M和D的值 | 依赖于M和D的值 | 小数值 |
根据上表,对于表结构的列字段数据类型选型一定要精确匹配,能够节省存储空间,体现设计的严谨。比如订单状态,可以使用TINYINT类型。
DECIMAL-Fixed-Point Types (Exact Value):当需要明确表示数值精度时,就需要使用DECIMAL,比如货币数据,金钱是无法四舍五入近似处理的数据。比如薪资,存款。
FlOAT/DOUBLE-Floating-Point Types (Approximate Value):浮点类型大多数用于近似处理场景。
Type | Storage(Bytes) | Precision |
---|---|---|
FLOAT | 4 | 23 |
DOUBLE | 8 | 53 |
字符串类型
类型 | 大小 | 用途 |
---|---|---|
CHAR | 0-255字节 | 定长字符串 |
VARCHAR | 0-65535 字节 | 变长字符串 |
TINYBLOB | 0-255字节 | 不超过 255 个字符的二进制字符串 |
TINYTEXT | 0-255字节 | 短文本字符串 |
BLOB | 0-65 535字节 | 二进制形式的长文本数据 |
TEXT | 0-65 535字节 | 长文本数据 |
MEDIUMBLOB | 0-16 777 215字节 | 二进制形式的中等长度文本数据 |
MEDIUMTEXT | 0-16 777 215字节 | 中等长度文本数据 |
LONGBLOB | 0-4 294 967 295字节 | 二进制形式的极大文本数据 |
LONGTEXT | 0-4 294 967 295字节 | 极大文本数据 |
ENUM | 枚举类型,只允许插入枚举的数据或者空值 | |
JSON | 可以直接存储JSON类型数据,并能基于key值查找 |
CHAR与VARCHAR
CHAR和VARCHAR类型十分相似,都是存储字符。但是从底层检索和存储角度分析,表现又不一样,且最大长度和尾部遗留空间是否保留的策略上表现也不尽相同,下面列出他们的相同点和不同点:
- 相同点
- 都是存储字符类型数据
- 类型申明时,都指定长度
- 不同点
- 表示的长度范围不一。CHAR能表示0-255长度的字符, VARCHAR可以表示0-65535长度
- CHAR申明后,存储数据时长度是固定的,长度不足时从右边补空格。VARCHAR申明后,存储时长度是可变的, VARCHAR最大有效长度取决于行数据的大小和字符集, VARCHAR在存储时有额外的1-2byte用来表示存储的数据的字节个数
- CAHR在检索时,将去除后面的空格
在非严格模式下,对于超过列申明长度的CHAR或者VARCHAR,mysql会截取以适合其申明的长度进行存储。
关于 varchar,有的说最大长度是 255,也有的说是 65535,查阅很多资料后发现是这样的:varchar 类型在 5.0.3 以下的版本中的最大长度限制为 255,而在 5.0.3 及以上的版本中,varchar 数据类型的长度支持到了 65535,也就是说可以存放 65532 个字节(注意是字节而不是字符!)的数据(起始位和结束位占去了3个字节),也就是说,在 5.0.3 以下版本中需要使用固定的 TEXT 或 BLOB 格式存放的数据可以在高版本中使用可变长的 varchar 来存放,这样就能有效的减少数据库文件的大小。
BINARY 和 VARBINARY
BINARY 和 VARBINARY 类似于 CHAR 和 VARCHAR,不同的是它们包含二进制字符串而不要非二进制字符串。也就是说,它们包含字节字符串而不是字符字符串。这说明它们没有字符集,并且排序和比较基于列值字节的数值值。
BLOG 和 TEXT
BLOB 是一个二进制大对象,存储String的二进制,比如图片二进制字节。有 4 种 BLOB 类型:TINYBLOB、BLOB、MEDIUMBLOB 和 LONGBLOB。它们区别在于可容纳存储范围不同。
TEXT存储文本,text 不可以有默认值,其最大长度是 2 的 16 次方-1。有 4 种 TEXT 类型:TINYTEXT、TEXT、MEDIUMTEXT 和 LONGTEXT。对应的这 4 种 BLOB 类型,可存储的最大长度不同,可根据实际情况选择。
JSON
在MySQL5.7.8之后开始支持一种可高效获取JSON文本中数据的原生JSON类型,该类型具有以下优点:
- JSON数据有效性检查:BLOB类型无法在数据库层做这样的约束性检查
- 查询性能的提升:查询不需要遍历所有字符串才能找到数据
- 支持索引:通过虚拟列的功能可以对JSON中的部分数据进行索引
另外,系统对JSON格式做了一些限制:
- JSON文本的最大长度取决有系统常量:max_allowed_packet。该值仅在服务器进行存储的时候进行限制,在内存中进行计算的时候是允许超过该值的。
- JSON列不可有默认值
- JSON列与其他二进制类型列一样是无法创建索引。但是可以从JSON列中所存储的文本中某些表列值进行创建索引。MySQL最优控制器同样在通过JSON表达创建的索引中进行查询。
ENUM 枚举类型
枚举在常量列表数据中可能会使用,主要是为了提高性能。
mysql> alter table test add address enum("beijing","shanghai");
Query OK, 0 rows affected (0.02 sec)
上面想test表中加入一个字段address,并且提供两个枚举值,如果新插入的数据不在枚举的值范围内,则会插入失败,当然,上面的写法默认允许null值,所以,插入null值也可以,下面限定了不为空,所以,只能插入枚举值
mysql> alter table test add address enum("beijing","shanghai") not null;
Query OK, 0 rows affected (0.02 sec)
CHAR 、VARCHAR、TEXT 应用场景总结
- 经常变化的字段用 VARCHAR
- 知道固定长度的用 CHAR
- 超过 255 字符的只能用 VARCHAR 或者 TEXT
- 能用 VARCHAR 的地方不用 TEXT
- 尽量用 VARCHAR
日期和时间类型
每个时间类型有一个有效值范围和一个"零"值,当指定不合法的即MySQL不能表示的值时使用"零"值。
类型 | 大小 (字节) | 范围 | 格式 | 用途 |
---|---|---|---|---|
DATE | 3 | 1000-01-01/9999-12-31 | YYYY-MM-DD | 日期值 |
TIME | 3 | '-838:59:59'/'838:59:59' | HH:MM:SS | 时间值或持续时间 |
YEAR | 1 | 1901/2155 | YYYY | 年份值 |
DATETIME | 8 | 1000-01-01 00:00:00/9999-12-31 23:59:59 | YYYY-MM-DD HH:MM:SS | 混合日期和时间值 |
TIMESTAMP | 4 | 1970-01-01 00:00:00/2038结束时间是第 2147483647 秒,北京时间 2038-1-19 11:14:07,格林尼治时间 2038年1月19日 凌晨 03:14:07 | YYYYMMDD HHMMSS | 混合日期和时间值,时间戳 |
- DATE表示日期,无时间部分。mysql检索和展示日期使用'YYYY-MM-DD'格式,范围在:'1000-01-01' to '9999-12-31'。
- DATETIME表示日期时间,既有日期部分又有时间部分。mysql检索和展示日期时间使用'YYYY-MM-DD HH:MM:SS'格式,范围在:'1000-01-01 00:00:00' to '9999-12-31 23:59:59'。
- TIMESTAMP表示时间戳,既有日期也有时间部分。范围在:1970-01-01 00:00:01' UTC to '2038-01-19 03:14:07' UTC。由此可以看出DATETIME和TIMESTAMP的区别在于时间表示的范围上。除此,mysql在存储TIMESTAMP类型时将TIMESTAMP值从当前时区转换到UTC时区,检索时再将其从UTC转换到当前时区。这个时区设置是基于数据库连接的。默认情况下,每个连接的时区被设置为server端的时区,也可以单独设置连接的时区。所以如果改变连接的时区,检索时获取到的TIMESTAMP将表现不同。
- TIME表示时间。mysql检索和展示时使用'HH:MM:SS'格式或者HHH:MM:SS,范围在:'-838:59:59' to '838:59:59'。TIME类型不仅可以表示一天中的时间点,还可以表示过去的时间或者间隔的时间段,所以可以是三位H。
字节长度与编码
MySQL 5.0 以上的版本:
1、一个汉字占多少长度与编码有关:
UTF-8:一个汉字=3个字节
GBK:一个汉字=2个字节
2、varchar(n) 表示 n 个字符,无论汉字和英文,Mysql 都能存入 n 个字符,仅是实际字节长度有所区别
3、MySQL 检查长度,可用 SQL 语言来查看:
select LENGTH(fieldname) from tablename