应用优化
在实际生产环境中,由于数据库本身的性能局限,必须要对前台的应用进行一些优化,来降低数据库的访问压力。
使用连接池
对于访问数据库来说,建立连接的代价是比较昂贵的,因为频繁的创建关闭连接,是比较耗费资源的,有必要建立数据库连接池,以提高访问的性能。
减少对 MySQL 的访问
1、避免对数据进行重复检索
在编写应用代码时,需要能够理清对数据库的访问逻辑。能够一次连接就获取到结果的,就不用两次连接,这样可以大大减少对数据库无用的重复请求。
select id , name from tb_book;
select id , status from tb_book;
-- 优化:
select id, name , status from tb_book;
2、增加cache层
可以在应用中增加缓存层来达到减轻数据库负担的目的。因此可以将部分数据从数据库中抽取出来放到应用端以文本方式存储, 或者使用框架(Mybatis、Hibernate)提供的一级缓存/二级缓存,或者使用redis数据库来缓存数据 。
缓存层有很多种,也有很多实现方式,只要能达到降低数据库的负担又能满足应用需求就可以。
3、负载均衡
负载均衡是应用中使用非常普遍的一种优化方法,它的机制就是利用某种均衡算法,将固定的负载量分布到不同的服务器上, 以此来降低单台服务器的负载,达到优化的效果。
-
利用 MySQL 复制分流查询
通过 MySQL 的主从复制,实现读写分离,使增删改操作走主节点,查询操作走从节点,从而可以降低单台服务器的读写压力。
-
采用分布式数据库架构
分布式数据库架构适合大数据量、负载高的情况,它有良好的拓展性和高可用性。通过在多台服务器之间分布数据,可以实现在多台服务器之间的负载均衡,提高访问效率。
MySQL 中查询缓存优化
概述
开启 Mysql 的查询缓存,当执行完全相同的 SQL 语句的时候,服务器就会直接从缓存中读取结果,当数据被修改,之前的缓存会失效,修改比较频繁的表不适合做查询缓存。
操作流程
- 客户端发送一条查询给服务器;
- 服务器先会检查查询缓存,如果命中了缓存,则立即返回存储在缓存中的结果。否则进入下一阶段;
- 服务器端进行SQL解析、预处理,再由优化器生成对应的执行计划;
- MySQL根据优化器生成的执行计划,调用存储引擎的API来执行查询;
- 将结果返回给客户端。
查询缓存配置
-
查看当前的 MySQL 数据库是否支持查询缓存:
SHOW VARIABLES LIKE 'have_query_cache';
-
查看当前 MySQL 是否开启了查询缓存 :
SHOW VARIABLES LIKE 'query_cache_type';
-
查看查询缓存的占用大小 :
SHOW VARIABLES LIKE 'query_cache_size';
-
查看查询缓存的状态变量:
SHOW STATUS LIKE 'Qcache%';
各个变量的含义如下:
参数 含义 Qcache_free_blocks 查询缓存中的可用内存块数 Qcache_free_memory 查询缓存的可用内存量 Qcache_hits 查询缓存命中数 Qcache_inserts 添加到查询缓存的查询数 Qcache_lowmen_prunes 由于内存不足而从查询缓存中删除的查询数 Qcache_not_cached 非缓存查询的数量(由于 query_cache_type 设置而无法缓存或未缓存) Qcache_queries_in_cache 查询缓存中注册的查询数 Qcache_total_blocks 查询缓存中的块总数
开启查询缓存
MySQL 的查询缓存默认是关闭的,需要在 /usr/my.cnf 配置中手动配置参数 query_cache_type = 1
,来开启查询缓存。配置完毕之后,重启服务既可生效。
query_cache_type 该参数的可取值有三个 :
值 | 含义 |
---|---|
OFF 或 0 | 查询缓存功能关闭 |
ON 或 1 | 查询缓存功能打开,SELECT的结果符合缓存条件即会缓存,否则,不予缓存,显式指定 SQL_NO_CACHE,不予缓存 |
DEMAND 或 2 | 查询缓存功能按需进行,显式指定 SQL_CACHE 的SELECT语句才会缓存;其它均不予缓存 |
查询缓存 SELECT 选项
可以在 SELECT 语句中指定两个与查询缓存相关的选项 :
SQL_CACHE:如果查询结果是可缓存的,并且 query_cache_type 系统变量的值为 ON 或 DEMAND ,则缓存查询结果 。
SQL_NO_CACHE:服务器不使用查询缓存。它既不检查查询缓存,也不检查结果是否已缓存,也不缓存查询结果。
SELECT SQL_CACHE id, name FROM customer;
SELECT SQL_NO_CACHE id, name FROM customer;
查询缓存失效的情况
-
SQL 语句不一致的情况。 要想命中查询缓存,查询的 SQL 语句必须一致。
-
当查询语句中有一些参数不确定时,则不会缓存。如: now() , current_date() , curdate() , curtime() , rand() , uuid() , user() , database() 。
SQL1 : select * from tb_item where updatetime < now() limit 1; SQL2 : select user(); SQL3 : select database();
-
不使用任何表查询语句。
select 'A';
-
查询 mysql、 information_schema 或 performance_schema 数据库中的表时,不会走查询缓存。
-
在存储的函数,触发器或事件的主体内执行的查询。
-
如果表更改,则使用该表的所有高速缓存查询都将变为无效并从高速缓存中删除。这包括使用
MERGE
映射到已更改表的表的查询。一个表可以被许多类型的语句,如被改变 INSERT, UPDATE, DELETE, TRUNCATE TABLE, ALTER TABLE, DROP TABLE,或 DROP DATABASE 。
MySQL 内存管理及优化
内存优化原则
-
将尽量多的内存分配给 MySQL 做缓存,但要给操作系统和其他程序预留足够内存。
-
MyISAM 存储引擎的数据文件读取依赖于操作系统自身的 IO 缓存,因此,如果有 MyISAM表,就要预留更多的内存给操作系统做 IO 缓存。
-
排序区、连接区等缓存是分配给每个数据库会话(session)专用的,其默认值的设置要根据最大连接数合理分配,如果设置太大,不但浪费资源,而且在并发连接较高时会导致物理内存耗尽。
MyISAM 内存优化
MyISAM 存储引擎使用 key_buffer 缓存索引块,加速 MyISAM 索引的读写速度。对于 MyISAM表的数据块,MySQL 没有特别的缓存机制,完全依赖于操作系统的 IO 缓存。
-
key_buffer_size
key_buffer_size 决定 MyISAM 索引块缓存区的大小,直接影响到 MyISAM 表的存取效率。可以在MySQL参数文件中设置 key_buffer_size 的值,对于一般 MyISAM 数据库,建议至少将 1/4 可用内存分配给 key_buffer_size。
在 /usr/my.cnf 中做配置:
key_buffer_size=512M
-
read_buffer_size
如果需要经常顺序扫描 MyISAM 表,可以通过增大 read_buffer_size 的值来改善性能。但需要注意的是 read_buffer_size 是每个session独占的,如果默认值设置太大,就会造成内存浪费。
-
read_rnd_buffer_size
对于需要做排序的 MyISAM 表的查询,如带有 order by 子句的 SQL,适当增加 read_rnd_buffer_size 的值,可以改善此类的 SQL 性能。但需要注意的是 read_rnd_buffer_size 是每个session独占的,如果默认值设置太大,就会造成内存浪费。
InnoDB 内存优化
InnoDB 用一块内存区做 IO 缓存池,该缓存池不仅用来缓存 InnoDB 的索引块,而且也用来缓存 InnoDB 的数据块。
-
innodb_buffer_pool_size
该变量决定了 InnoDB 存储引擎表数据和索引数据的最大缓存区大小。在保证操作系统及其他程序有足够内存可用的情况下,innodb_buffer_pool_size 的值越大,缓存命中率越高,访问 InnoDB 表需要的磁盘 I/O 就越少,性能也就越高。
innodb_buffer_pool_size=512M
-
innodb_log_buffer_size
决定了 InnoDB 重做日志缓存的大小,对于可能产生大量更新记录的大事务,增加innodb_log_buffer_size 的大小,可以避免 InnoDB 在事务提交前就执行不必要的日志写入磁盘操作。
innodb_log_buffer_size=10M
MySQL 并发参数调整
从实现上来说,MySQL Server 是多线程结构,包括后台线程和客户服务线程。多线程可以有效利用服务器资源,提高数据库的并发性能。在 MySQL 中,控制并发连接和线程的主要参数包括 max_connections、back_log、thread_cache_size、table_open_cahce。
-
max_connections
采用 max_connections 控制允许连接到 MySQL 数据库的最大数量,默认值是 151。如果状态变量 connection_errors_max_connections 不为零,并且一直增长,则说明不断有连接请求因数据库连接数已达到允许最大值而失败,这是可以考虑增大 max_connections 的值。
MySQL 最大可支持的连接数,取决于很多因素,包括给定操作系统平台的线程库的质量、内存大小、每个连接的负荷、CPU的处理速度,期望的响应时间等,需要根据服务器性能进行评估设定。
-
back_log
back_log 参数控制 MySQL 监听 TCP 端口时设置的积压请求栈大小。如果MySql的连接数达到max_connections 时,新来的请求将会被存在堆栈中,以等待某一连接释放资源,该堆栈的数量即 back_log,如果等待连接的数量超过 back_log,将不被授予连接资源,将会报错。
5.6.6 版本之前默认值为 50,之后的版本默认为 50+(max_connections / 5),但最大不超过900。
如果需要数据库在较短的时间内处理大量连接请求, 可以考虑适当增大back_log 的值。
-
table_open_cache
该参数用来控制所有 SQL 语句执行线程可打开表缓存的数量, 而在执行SQL语句时,每一个SQL 执行线程至少要打开 1 个表缓存。
该参数的值应该根据设置的最大连接数 max_connections 以及每个连接执行关联查询中涉及的表的最大数量来设定:max_connections x N ;
-
thread_cache_size
为了加快连接数据库的速度,MySQL 会缓存一定数量的客户服务线程以备重用,通过参数 thread_cache_size 可控制 MySQL 缓存客户服务线程的数量。
-
innodb_lock_wait_timeout
该参数是用来设置 InnoDB 事务等待行锁的时间,默认值是50ms , 可以根据需要进行动态设置。
- 对于需要快速反馈的业务系统来说,可以将行锁的等待时间调小,以避免事务长时间挂起;
- 对于后台运行的批量处理程序来说, 可以将行锁的等待时间调大, 以避免发生大的回滚操作。