zoukankan      html  css  js  c++  java
  • mysql数据库优化

    1.mysq 数据优化可以从以下几方面进行优化:

     1、sql及索引优化。 

    2 数据库表结构,根据数据设计查询最优的表结构。

     3,系统配置优化,对打开文件数和安全的限制。 

    4、硬件,选择最适合数据库的cpu,更快的IO,更大的内存,cpu不是越多越好, IO并不能减少锁的机制,也就是不能减少阻塞,所以说硬件的优化成本越高,效果最差。

     2.sql语句优化

    2-1数据准备

    访问http://dev.mysql.com/doc/index-other.html

    下载,解压是两个sql文件 

     使用navicat执行两个sql文件,先执行schema.sql,然后执行data.sql,主要不需要自己建立数据库,自动创建

    2-2 MySQL慢查日志的开启方式和存储格式

    查看是否打开慢查询日志:

    show variables like 'slow_query_log';

    如果查到是off, 说明没有开启该功能, 使用如下命令开启:

    set global slow_query_log=on;

    查看是否将没有建立索引的查询列入慢查询记录:

    show variables like '%log%';

    显示的结果中有一项"log_queries_not_using_indexes"值为off, 说明没有开启, 使用下面的命令开启:

    set global log_queries_not_using_indexes=on;

    查看慢查询时间设置:

    show variables like 'long_query_time';

    显示的值为"0.00000"则表示要将所有查询记录到日志.

    设置慢查询时间设置:

    set global long_query_time=0;

    设置为零则记录所有查询信息. 

    使用如下命令查看查询日志的文件位置:

    show variables like 'slow%';

    可以看到有一项"slow_query_log_file"的值为"G:mysql-8.0.19-winx64dataDESKTOP-91QBBK9-slow.log", 这就是慢查询日志文件的存放位置.

    2-3 MySQL慢查日志分析工具之mysqldumpslow

    mysqldumpslow工具的使用:

    1. mysqldumpslow -t  3 慢查询日志文件路径  | more   //表示使用mysqldumpslow工具分析3条慢查询语句

    2. 报表内容:

      Count:执行的行数

      Time: 执行的时间

      Lock: 锁定时间

      Rows: 行数

      服务器信息

      SQL内容等

    因为我安装的是mysql 8,发现在mysql bin目录下是没有mysqldumpslow.exe文件,解决方法如下

    https://blog.csdn.net/stevendbaguo/article/details/47128531

    安装完成后

     

     代表可以用了

     然后我们打开G:Perlcjlog目录

    打开text文件,查询访问

     不会的话参考windows下使用MYSQL的mysqldumpslow进行慢日志分析

    https://blog.csdn.net/qq_31879707/article/details/79501222

    2.4MySQL慢查日志分析工具之pt-query-digest

    因为我是window,所以需要下载pt-query-digest,然后把该文件扔到mysql的bin目录下

    安装教程

    https://blog.csdn.net/hansonjan/article/details/103856370

    命令行

     打开bbb.txt就可以查看

    2.5如何通过慢查日志发现有问题的SQL

    2-6 通过explain查询和分析SQL的执行计划

    2.6.1max

    如何分析SQL查询:

    explain返回各列的含义

    table:显示这一行的数据是关于哪张表的

    type:这是重要的列,显示连接使用了何种类型。从最好的到最差的连接类型为const/eq_reg/ref/range/index和ALL

    possiable_keys:显示可能应用在这张表中的索引。如果为空,没有可能的索引。

    key:实际使用的索引。如果为Null,则没有使用索引。

    key_len:使用的索引的长度,在不损失精确性的情况下,长度越短越好。

    ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。

    rows:MYSQL认为必须检查的用来返回请求数据的行数。

    mysql中explain的type的解释https://blog.csdn.net/dennis211/article/details/78170079

     2.7count()和max()的优化

    EXPLAIN select MAX(payment_date) from payMENT

     给支付时间列建立索引

    create index idx_paydate on payMENT(payment_date);

     再做查询看看

     翻译解决为选择已优化的表

    2.6.2count

    需求:countz() 在同一条SQL中同时查询出2006和2007年电影的数量

    错误示范

     正常情况下我们只能分两次查询

    select count(*)  from film where release_year=2006;
    select count(*) from film where release_year=2007;

    优化后如下

    select count(*) from film where release_year=2007 or release_year=2006 group by release_year ORDER BY release_year;

    结果,因为没有release_year=2007的情况,所以只能显示一条数据

     我们修改数据库中一条数据为2007

     再做刚刚的查询

     发现能够查询出来,但是不知道是哪个年份

    继续优化

    select count(release_year='2006' or null) as '2006年电影数量',count(release_year='2007' or null)as '2007年电影数量' from film;

     这里区分一下count(*)和count(字段的区别),两者是不一样的

    创建counts表

    新增表数据

     

     

     

     2.8子查询优化

     新增表counts2

     插入一条数据

     sql

    select id from counts where  id in (select id from counts2  );

    优化sql

    select c.id from counts c JOIN  counts2 c2 on  c.id=c2.id

    存在问题,如果counts表和counts2表中数据是一对多的关系呢

    在counts2表中新增一条数据id=1

    因为此时是一对多的关系,如果我们还是用上面的查询sql,就会出现多条数据

     

     继续优化sql

    select DISTINCT c.id from counts c JOIN  counts2 c2 on  c.id=c2.id

    2.9GROUP BY优化

    需求:查询演员表演了多少电影

    sql如下

    EXPLAIN SELECT actor.first_name,actor.last_name,COUNT(*)
    FROM sakila.film_actor INNER JOIN sakila.actor USING(actor_id)
    GROUP BY film_actor.actor_id

     耗时

     优化

    EXPLAIN SELECT actor.first_name,actor.last_name,c.cnt
    FROM sakila.actor INNER JOIN (SELECT actor_id,count(*)
    AS cnt FROM sakila.film_actor GROUP BY actor_id)
    as c USING (actor_id)

     耗时

     2.10limit查询的优化

    limit常用于分页处理,时常会伴随order by从句使用,因此大多时候会使用Filesorts这样会造成大量的io问题

    分页sql:

    select  film_id , description from sakila.film order by title limit 500,10

     优化1.使用有索引的列或主键进行order by操作

    EXPLAIN select  film_id , description from sakila.film order by film_id limit 500,10

     继续优化2.记录上次返回的主键,在下次查询时使用主键过滤

    select film_id,description from sakila.film where film_id >500 and film_id<=510 order by film_id limit 1,10;

    注意使用这种方式有一个限制,就是主键一定要顺序排序和连续的,如果主键出现空缺可能会导致最终页面上显示的列表不足5条,解决办法是附加一列,保证这一列是自增的并增加索引就可以了

    3.索引优化

    3.1如何选择合适的列建立索引

    选择合适的索引列

    1.在where,group by,order by,on从句中出现的列

    2.索引字段越小越好(因为数据库的存储单位是页,一页中能存下的数据越多越好 )

    3.离散度大的列放在联合索引前面

    select count(distinct customer_id), count(distinct staff_id) from payment;

    是index(sftaff_id,customer_id)好?还是index(customer_id,staff_id)好呢?

     判断某一列的离散度:select count(distinct 字段名)from 表名;返回的结果值越大,说明离散度越大,建立联合索引时,应该放到前面;

     3.2索引优化sql的方法

    去除重复索引

     冗余索引

     优化方案

     3.3索引维护的方法

    没什么好讲的,视频讲的拉的一笔

    4.数据库结构优化

    4.1选择合适的数据类型

    使用int来存储日期时间

     

     创建表语句

    CREATE TABLE test(id INT auto_increment not NULL
    ,timestr int ,PRIMARY KEY(id));

    插入表语句

    INSERT INTO test(timestr) VALUES (UNIX_TIMESTAMP('2020-07-16'));

    查询表语句

    select  FROM_UNIXTIME(timestr) from test

    查询结果

     使用bigint来存储IP地址,最多使用8个字节,如果使用varchar来存储的话最多得15个字节

     建表sql

    CREATE TABLE SESSIONs(id INT auto_increment not NULL,
    ipaddress BIGINT,PRIMARY key(id));

    新增sql

    insert into SESSIONs(ipaddress) VALUES(INET_ATON('192.168.56.100'));

    查询sql

    select INET_NTOA(ipaddress) from SESSIONs

    查询结果

     4.2数据库表的范式化优化

    表的范式化即数据库设计的规范化:数据表不存在非关键字段对任意关键字段的传递函数依赖,则符合第三范式。

    可以将一张数据表进行拆分,来满足第三范式的要求。

    设计表的时候符合范式化是为了:减少数据冗余、减少表的插入、更新、删除异常

    设计表的时候使用反范式化是为了:以空间换时间、增强代码的可编程性和可维护性

    不符合第三范式要求的表存在以下问题:

    1.数据冗余:(分类、分类描述)对于每一个商品都会进行记录

    2.数据插入异常

    3.数据更新异常

    4.数据删除异常

     解决方案(表拆分)

     4.3数据库反范式化优化

    反范式化:为了查询效率的考虑,把原本符合第三范式的表适当增加冗余,以达到优化查询效率的目的。以空间换取时间的操作

    例子:

     sql:

     优化:

     sql:

     4.4数据库表的垂直拆分

    表垂直拆分 1.不经常用得放在同一个表中 2.经常用得放在同一个表中 3.大的字段单独放在一个表中

     例子

     拆分

     

     4.5数据库表的水平拆分

    1. 表的垂直拆分:将表中的不常用的列和大字段的列拆分到另外一个表或者多个表中,减少表的宽度;

    2. 表的水平拆分:主要是解决数据量过大的问题,水平拆分每个表的表结构都是完全一致的(当单表的数据大于一亿时,尽管加了索引,还是会比较慢);

    3. 水平拆分方法:对id进行hash运算(取模),如果拆分为5个表,则使用mod(id)取出0-4个值,针对不同的hashID吧数据存到不同的表中;

    例子:

     解决

  • 相关阅读:
    store 加载异常处理与加载信息提示
    jQuery和ExtJS的timeOut超时问题和event事件处理问题
    Virtualbox虚拟机安装CentOS6.5图文详细教程
    虚拟机
    20180104 wdcp中的mysql重启不成功
    MySQL取得某一范围随机数(MySQL随机数)
    安装lszrz,用于上传文件
    cpu占用高 20180108
    怎么实时查看mysql当前连接数
    数据库SQL优化大总结之 百万级数据库优化方案
  • 原文地址:https://www.cnblogs.com/cj8357475/p/13304233.html
Copyright © 2011-2022 走看看