Mysql 分区 - 走看看

zoukankan html css js c++ java

Mysql 分区
mysql 从5.1开始支持分区，分区的话又可以分为水平分区跟垂直分区

水平分区（根据列属性按行分）

水平分区的几种模式：
- Range（范围） – 这种模式允许DBA将数据划分不同范围。例如DBA可以将一个表通过年份划分成三个分区，80年代（1980's）的数据，90年代（1990's）的数据以及任何在2000年（包括2000年）后的数据。
- Hash（哈希） – 这中模式允许DBA通过对表的一个或多个列的Hash Key进行计算，最后通过这个Hash码不同数值对应的数据区域进行分区，。例如DBA可以建立一个对表主键进行分区的表。
- Key（键值） – 上面Hash模式的一种延伸，这里的Hash Key是MySQL系统产生的。
- List（预定义列表） – 这种模式允许系统通过DBA定义的列表的值所对应的行数据进行分割。例如：DBA建立了一个横跨三个分区的表，分别根据2000年2001年和2002年值所对应的数据。
- Composite（复合模式） - 很神秘吧，哈哈，其实是以上模式的组合使用而已，就不解释了。举例：在初始化已经进行了Range范围分区的表上，我们可以对其中一个分区再进行hash哈希分区。
垂直分区（按列分）
举个简单例子：一个包含了大text和BLOB列的表，这些text和BLOB列又不经常被访问，这时候就要把这些不经常使用的text和BLOB了划分到另一个分区，在保证它们数据相关性的同时还能提高访问速度。

Partition by 分区算法 (分区参数) 分区选项
(*分区所参与的字段必须为主键的一部分)

例子：
CREATE TABLE `customer` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT 'ID', `init_time` datetime NOT NULL COMMENT '时间', PRIMARY KEY (`id`,`init_time`), ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='客户表' /*!50100 PARTITION BY RANGE (YEAR(init_time)) SUBPARTITION BY HASH (MONTH((init_time))) SUBPARTITIONS 12 (PARTITION p0 VALUES LESS THAN (2020) ENGINE = InnoDB, PARTITION p1 VALUES LESS THAN (2021) ENGINE = InnoDB, PARTITION p2 VALUES LESS THAN MAXVALUE ENGINE = InnoDB) */;
分析：

上面 50100 是 mysql 的特有的注释，就是 mysql 可以执行的意思，表示 mysql 版本在 5.0.1以上才能执行

1、/*...*/ 是注释，mysql不会执行。
2、mysql对标准sql进行了扩展，包含了一些自己的特性。
3、/*!...*/ 是一种特殊的注释，其他的数据库产品当然不会执行。mysql特殊处理，会选择性的执行。可以认为是：预编译中的条件编译。
4、特别注意 50100，它表示5.01.00 版本或者更高的版本，才执行。

主分区按年份进行分区，总共3个，子分区按月份进行分区，总共12个

或者：
ALTER TABLE `customer` PARTITION BY RANGE (YEAR(init_time)) PARTITIONS 3 SUBPARTITION BY HASH (MONTH((init_time))) SUBPARTITIONS 12 ( #子分区按月分成12个 PARTITION `p0` VALUES LESS THAN (2020),#19年 PARTITION `p1` VALUES LESS THAN (2021),#20年 PARTITION `p2` VALUES LESS THAN (MAXVALUE)#21年后 );
修改分区：
#拆分增加分区：将p2拆分成p2和p3 ALTER TABLE customer REORGANIZE PARTITION p2 INTO ( PARTITION p2 VALUES LESS THAN (2022), PARTITION p3 VALUES LESS THAN (MAXVALUE) );
报错解决：
报错：A PRIMARY KEY must include all columns in the table’s partitioning function 意思是说分区的字段必须是要包含在主键当中。所以当我们在使用日期进行分区的时候,就需要将日期字段包含到主键当中去, 查看表分区数据量： SELECT PARTITION_NAME,SUBPARTITION_NAME,TABLE_ROWS FROM INFORMATION_SCHEMA.PARTITIONS WHERE TABLE_NAME = 'customer';
备注：

1、分区和分表的区别就是，数据迁移麻烦点，分表可以一张表一张表慢慢迁移，就是分表的多张表可以同时迁移，分区只能慢慢导出

2、还有就是如果不是按照id主键分，按照时间等字段分，就是加到主键列里，这样id没有唯一限制，需要代码层次的限制唯一性，主键列表有唯一性，但是单个id没有唯一性，如果按照主键id分就不会有这个问题

3、分区是把数据分成一个个分区文件，从而减小数据文件大小，减少数据查询的量
查看全文

相关阅读:
java操作FTP的一些工具方法
 原生态jdbc的应用技术
 shell脚本重启应用
 性能优化，定时批量入库支持类设计
 linux从零搭建Elasticsearch单机版安装02
linux从零搭建Elasticsearch之JAVA环境01
JMX端口开放配置
 druid配置logback日志记录慢sql以及应用数据源监控开启
 java实现BS预览功能
 假分页

原文地址：https://www.cnblogs.com/lyc94620/p/10764126.html