为什么要分库、分表、读写分离?
现在大型的电子商务系统,在数据库层面大都采用读写分离技术,就是一个Master数据库,多个Slave数据库。
Master库负责数据更新,Slave库当然负责非实时数据查询。
因为在实际的应用中,数据库都是读多写少(读取数据的频率高,更新数据的频率相对较少),而读取数据通常耗时比较长,
占用数据库服务器的CPU较多,从而影响用户体验。
我们通常的做法就是把查询从主库中抽取出来,采用多个从库,使用负载均衡,减轻每个从库的查询压力。
采用读写分离技术的目标:有效减轻Master库的压力,又可以把用户查询数据的请求分发到不同的Slave库,从而保证系统的健壮性。
我们看下采用读写分离的背景。随着网站的业务不断扩展,数据不断增加,用户越来越多,数据库的压力也就越来越大,采用传统的方式,
比如:数据库或者SQL的优化基本已达不到要求,这个时候可以采用读写分离的策 略来改变现状。
常见实现读写分离的方法:
1、开发在代码中写死 【指定insert、delete、update这三种操作,连接的是主库。select操作,连接的是从库】
具体到开发中,如何方便的实现读写分离呢?目前常用的有两种方式:
(1)第一种方式是我们最常用的方式,就是定义2个数据库连接,一个是MasterDataSource,另一个是SlaveDataSource。
更新数据时我们读取MasterDataSource,查询数据时我们读取SlaveDataSource。这种方式很简单,我就不赘述了。
String MasterDataSource="192.168.1.2";
String SlaveDataSource="192.168.1.3";
String TargetDataSource;
if(oper=insert or delete or update)
{
TargetDataSource=MasterDataSource;
}
else
{
TargetDataSource=SlaveDataSource;
}
(2)第二种方式动态数据源切换,就是在程序运行时,把数据源动态织入到程序中,从而选择读取主库还是从库。
主要使用的技术是:annotation,Spring AOP,反射。
2、Atlas
3、cobar
4、TDDL
5、mysql-proxy
6、阿米巴
Atlas是由 Qihoo 360, Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。
它在MySQL官方推出的MySQL-Proxy 0.8.2版本的基础上,修改了大量bug,添加了很多功能特性。
目前该项目在360公司内部得到了广泛应用,很多MySQL业务已经接入了Atlas平台,每天承载的读写请求数达几十亿条。
主要功能:
* 读写分离
* 从库负载均衡
* IP过滤
* SQL语句黑白名单
* 自动分表
Q & A
-------------------
Q: 是否支持多字符集?
A: 这是我们对原版MySQL-Proxy的第一项改进,符合国情是必须的
Q: 自动读写分离挺好,但有时候我写完马上就想读,万一主从同步延迟怎么办?
A: SQL语句前增加 /*master*/ 就可以将读请求强制发往主库
Q: 主库宕机,读操作受影响么?
A: 在atlas中是不会的! 能问这样的问题, 说明你用过官方的mysql-proxy, 很遗憾官方版本并未解决这个问题
Q: 检测后端DB状态会阻塞正常请求么?
A: 不会, atlas中检测线程是异步进行检测的,即使有db宕机,也不会阻塞主流程。在atlas中没有什么异常会让主流程阻塞! 同上,官方版本也会让你失望
Q: 想下线一台DB, 又不想停掉mysql server, 怎么办?
A: 可以通过管理接口手动上下线后端db, atlas会优先考虑管理员的意愿
Q: 想给集群中增加一台DB, 不想影响线上正常访问可以吗?
A: 通过管理接口可以轻松实现
Q: 相比官方mysql-proxy, atlas还有哪些改进?
A: 这实在是个难以回答的问题,性能,稳定性,可靠性,易维护性,我们做过几十项的改进,下面会尽量列一些较大的改动
VS 官方MySQL-Proxy
-------------------
1. 将主流程中所有Lua代码改为纯C实现,Lua仅用在管理接口
2. 重写网络模型、线程模型
3. 实现了真正意义的连接池
4. 优化了锁机制,性能提高数十倍
......
附名字来源:
Atlas,希腊神话中双肩撑天的巨人,普罗米修斯的兄弟,最高大强壮的神之一,因反抗宙斯失败而被罚顶天。我们期望这个系统能够脚踏后端DB,为前端应用撑起一片天。
二、配置文件示例
-------------------
[mysql-proxy] #不需要改
plugins = admin, proxy #Atlas加载的模块名称,不需要改
admin-username = user #管理接口的用户名
admin-password = pwd #管理接口的密码
admin-lua-script = /usr/local/mysql-proxy/lib/mysql-proxy/lua/admin.lua #实现管理接口的Lua脚本所在路径
proxy-backend-addresses = 127.0.0.1:3306 #Atlas后端连接的MySQL主库的IP和端口,可设置多项,用逗号分隔
proxy-read-only-backend-addresses = 127.0.0.1:3305@2 #Atlas后端连接的MySQL从库的IP和端口,2代表权重,用来作负载均衡,若省略则默认为1,可设置多项,用逗号分隔
daemon = false #设置Atlas的运行方式,设为true时为守护进程方式,设为false时为前台方式,一般开发调试时设为false,线上运行时设为true
keepalive = false #设置Atlas的运行方式,设为true时Atlas会启动两个进程,一个为monitor,一个为worker,monitor在worker意外退出后会自动将其重启,设为false时只有worker,没有monitor,一般开发调试时设为false,线上运行时设为true
event-threads = 4 #工作线程数,推荐设置与系统的CPU核数相等
log-level = message #日志级别,分为message、warning、critical、error、debug五个级别
log-path = /usr/local/mysql-proxy/log #日志存放的路径
instance = test #实例名称,用于同一台机器上多个Atlas实例间的区分
proxy-address = 0.0.0.0:1234 #Atlas监听的工作接口IP和端口
admin-address = 0.0.0.0:2345 #Atlas监听的管理接口IP和端口
min-idle-connections = 128 #连接池的最小空闲连接数,可根据业务请求量大小适当调大或调小
tables = person.mt.id.3 #分表设置,此例中person为库名,mt为表名,id为分表字段,3为子表数量,可设置多项,以逗号分隔
pwds = user1:+jKsgB3YAG8=, user2:GS+tr4TPgqc= #用户名与其对应的加密过的密码,密码使用加密程序encrypt加密,此设置项用于多个用户名同时访问同一个Atlas实例的情况,若只有一个用户名则不需要设置该项
charset = utf8 #默认字符集,若不设置该项,则默认字符集为latin1
三、编译安装
-------------------
依赖:glib(2.32.0以上)、libevent(1.4以上)、Lua(5.1以上)、OpenSSL(0.9.8以上)
./bootstrap.sh #可能需要修改其中的路径
make
sudo make install
四、启动与停止
-------------------
进入PREFIX/conf目录,编辑instance.conf,此处instance的实际名称应与其中instance设置项相同,其他设置项含义见第二节。
启动:
PREFIX/bin/mysql-proxyd instance start
停止:
PREFIX/bin/mysql-proxyd instance stop
重启:
PREFIX/bin/mysql-proxyd instance restart
查看运行状态:
PREFIX/bin/mysql-proxyd instance status