zoukankan      html  css  js  c++  java
  • 分库分表理论概述

    1.什么是分库分表

    一个库一个表 拆分为 N个库N个表
    分为垂直拆分,水平拆分

    2.为什么要分库分表

    随着业务发展,表的数量,以及单表数据量越来越大,而由于无法分布式部署(部分数据库支持),单台服务器资源(cpu 内存,IO)的限制,导致数据操作开销大,查询慢,因此需要进行分库分表,提高数据查询速度。
    常见优化策略:
    更换数据库(缓存)
    SQL 索引 字段 优化
    分区
    读写分离
    分库分表

    3.读写分离

    master-slave模式,mastr负责更新操作,slave负责查询操作。

    4.分库分表常见方式

    垂直拆分:

    根据字段拆分

    垂直分库:

    按照业务划分,将不同业务数据单独拆分成一个库。“微服务治理”做法类似,每个微服务单独使用一个库。


    垂直分库
    垂直分表

    如果单表字段过多,可以通过"大表拆小表"方式将不常用或者字段长度较大的表
    拆分到扩展表中,mysql是按照数据页进行存储的,如果单行数据过大,会导致数据跨页,造成额外的性能开销。


    垂直分表
    垂直拆分优点:
    • 业务系统解耦。
    • 与微服务治理类似,便于集中管理,监控,扩展
    • 高并发情况下提升IO,数据库连接数,单机硬件资源瓶颈
    垂直拆分缺点:
    • 多表join只能通过应用程序解决,加大开发复杂度
    • 分布式事务处理复杂
    • 单表数据总量无法解决(水平切分处理)
    水平拆分

    将一个表中的数据以某一个字段(取模),拆分到多个表中(根据内容拆分

    水平拆分
    水平拆分的优点:
    • 使单表的数量保持在一定数量,提高查询性能
    • 切分后表结构相同,程序改动小
    水平拆分的缺点:
    • 数据扩容
    • 分片规则难以抽象(不同的库,难以固定某个字段拆分,比如商品可以商品IDhash到某个库中,订单表需要根据用户IDhash到某个库中)
    • 分布式事务,部分业务无法关联join

    5.分库分表带来的问题

    • 分布式事务
    • 表join
      -分布式全局唯一Id(twitter开源的 snowFlake)

    6.分库分表算法

    取模

    通过 某一个字段进行hash userId%3 =1 则分配到1库。可以使数据均匀分布,避免数据热点问题。数据扩容是明显的缺点,可以采用 一致性hash 算法

    范围

    比如按月 按省分配

    预定义

    1亿数据 每个库存100万数据,可以预先创建10个库。

    7.常用的中间件

    分为两种类型:
    Proxy代理:
    mycat(重)、mysql-proxy atlas、sharding-proxy(sharding-sphere )

    Proxy代理

    jdbc直连:
    TDDL(淘宝 半开源) 、sharding-jdbc(sharding-sphere )

    jdbc直连


    作者:3517a85fd522
    链接:https://www.jianshu.com/p/658bc9151e7b
    来源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
  • 相关阅读:
    Python进阶开发之元类编程
    django相关网站
    Ubuntu下vim中文乱码
    django自定义用户表
    C# webbrowser遍历网页元素
    Delphi SetParent 嵌入其他应用程序
    C# DataGirdview手动添加数据,导出txt文件并自动对齐
    C# SetParent将其他程序嵌入自己的程序
    Delphi如何找到出错行的行数!!
    Delphi StringGrid控件的用法
  • 原文地址:https://www.cnblogs.com/zouhong/p/13034653.html
Copyright © 2011-2022 走看看