zoukankan      html  css  js  c++  java
  • mysql03

    分库分表

    数据切分

    通过某种特定的条件,将我们存放在同一个数据库中的数据分散存放到多个数据库(主机)上面,以达到分散单台设备负载的效果。 

    数据的切分(Sharding)根据其切分规则的类型,可以分为两种切分模式。一种是按照不同的表(或者
    Schema)来切分到不同的数据库(主机)之上,这种切可以称之为数据的垂直(纵向)切分;另外一种则是根据
    表中的数据的逻辑关系,将同一个表中的数据按照某种条件拆分到多台数据库(主机)上面,这种切分称之为数
    据的水平(横向)切分。

    垂直切分

    一个数据库由很多表的构成,每个表对应着不同的业务,垂直切分是指按照业务将表进行分类,分布到不同
    的数据库上面,这样也就将数据或者说压力分担到不同的库上面


    系统被切分成了,用户,订单交易,支付几个模块。
    一个架构设计较好的应用系统,其总体功能肯定是由很多个功能模块所组成的,而每一个功能模块所需要的
    数据对应到数据库中就是一个或者多个表。而在架构设计中,各个功能模块相互之间的交互点越统一越少,系统
    的耦合度就越低,系统各个模块的维护性以及扩展性也就越好。这样的系统,实现数据的垂直切分也就越容易。

     

    优点

    拆分后业务清晰,拆分规则明确。
    系统之间整合或扩展容易。
    数据维护简单。

    缺点

    部分业务表无法 join,只能通过接口方式解决,提高了系统复杂度。
    受每种业务不同的限制存在单库性能瓶颈,不易数据扩展跟性能提高。
    事务处理复杂。

     水平切分

    相对于垂直拆分,水平拆分不是将表做分类,而是按照某个字段的某种规则来分散到多个库之中,每个表中
    包含一部分数据。简单来说,我们可以将数据的水平切分理解为是按照数据行的切分,就是将表中的某些行切分
    到一个数据库,而另外的某些行又切分到其他的数据库中

     拆分数据就需要定义分片规则。关系型数据库是行列的二维模型,拆分的第一原则是找到拆分维度。

    比如:
    从会员的角度来分析,商户订单交易类系统中查询会员某天某月某个订单,那么就需要按照会员结合日期来拆
    分,不同的数据按照会员 ID 做分组,这样所有的数据查询 join 都会在单库内解决;

    如果从商户的角度来讲,要查询某个商家某天所有的订单数,就需要按照商户 ID 做拆分;但是如果系统既想按会员拆分,又想按商家数据,则会有一定的困难。如何找到合适的分片规则需要综合考虑衡量。


    几种典型的分片规则包括:
    按照用户 ID 求模,将数据分散到不同的数据库,具有相同数据用户的数据都被分散到一个库中。

      userid%5 = 0 ,userid%5 = 1 , userid %5 =2 ,userid %5 =3 ,userid %5 =4


    按照日期,将不同月甚至日的数据分散到不同的库中。
    按照某个特定的字段求摸,或者根据特定范围段分散到不同的库中

    优点

     拆分规则抽象好,join 操作基本可以数据库做。
    不存在单库大数据,高并发的性能瓶颈。
    应用端改造较少。
    提高了系统的稳定性跟负载能力。

     缺点

    拆分规则难以抽象。
    分片事务一致性难以解决。
    数据多次扩展难度跟维护量极大。
    跨库 join 性能较差

     物理切分(表分区)

    mysql数据存储位置 /var/lib/mysql

    innoDB (共享表空间,独享表空间)
    frm 结构文件
    ibd 数据文件

    MyISAM
    frm 结构文件
    myd 数据文件
    myi 索引文件

    查看表空间设置
    show variables like '%innodb_file_per_table%'

    set global innodb_file_per_table=off

    拆分策略

    Range 范围
    List 值
    Hash 取模
    Key

    range

     1 构建数据
     2 
     3 create table t_base(id int primary key auto_increment,name varchar(10));
     4 insert into t_base(name) values ('hello');
     5 
     6 insert into t_base(name) select name from t_base;
     7 .......
     8 
     9 Records: 524312  Duplicates: 0  Warnings: 0
    10 
    11 
    12 
    13 create table t_range(id int primary key auto_increment,name varchar(10)) partition by range(id) (
    14 partition p0 values less than (100000),
    15 partition p1 values less than (200000),
    16 partition p2 values less than (300000),
    17 partition p3 values less than (400000),
    18 partition p4 values less than maxvalue
    19 );
    20 
    21 
    22 insert into t_range (name) select name from t_base;
    23 
    24 >select * from t_range limit 1;
    25 1 hello
    26 
    27 alter table t_range drop partition p0;
    28 
    29 >select * from t_range limit 1;
    30 10000  hello

    list分区

     1 create table t_list ( id int primary key ,name varchar(10) )
     2 partition by list(id) (
     3 partition p0 values in (1,2,3),
     4 partition p1 values in (4,5,6)
     5 );
     6 
     7 insert into t_list(id,name) values (1,'zhangsan');
     8 
     9 select * from t_list;
    10 1 zhangsan
    11 
    12 alter table t_list drop partition p0;
    13 
    14 select * from t_list;
    15 Empty set

    hash

    1 create table t_hash(id int primary key auto_increment,name varchar(10))
    2 partition by hash(id) partition 4;

  • 相关阅读:
    git 更新代码
    jmeter 线程组之间传递动态变化的变量值
    MYSQL 使用存储过程批量更新表数据
    linux查看日志中特定字符串以及前后信息内容命令
    导出表结构 字段说明
    转 awk统计nginx每天访问最高的接口
    MySQL 同一字段匹配多个值
    Can't connect to local MySQL server through socket '/opt/lampp/var/mysql/mysql.sock' (2)
    转 Xshell ssh长时间连接不掉线设置
    Vs.net 常用命令行
  • 原文地址:https://www.cnblogs.com/quyangyang/p/11422522.html
Copyright © 2011-2022 走看看