Mysql复习

zoukankan html css js c++ java

Mysql复习

想想基本上也一年多没有写复杂sql了！不写复杂sql的原因，一方面是为了减少复杂的笛卡尔积运算，节省数据库机器的资源；第二方面是为了让大部分数据尽量也命中缓存，如果是复杂的多表sql的话，一次更新操作可能就会将所有相关表的数据缓存失效掉！

这次由于一个小型的春运项目，有同事写出了慢查询，导致系统半天无法进行有效访问！

趁着这次sql优化，重新复习一下关于mysql的知识！

将会从explain、profile、数据库引擎、日志信息进行再分析！

Explain：

熟悉sql的同学都知道，一般小系统的话，我们为了省事提高人效，往往会使用复杂sql编写，这样能更快的开发，但是一不注意就容易写出效率奇慢的sql！笔者尤其非常感谢刚毕业时候的老大，第一项工作就将公司当时最复杂的一条sql交由我去处理，记得当时将sql折行之后语句有250行左右，当然毫无疑问这条sql也是非常慢的，所以也花了很长时间去优化，尤其是对于一个刚毕业的来说！庆幸，当时学了不少关于优化的东西，也对sql熟悉了不少，有点底子！

优化sql，少不了这个sql利器，信息不多，但是能帮我们分析出一些问题来。

首先，我们要知道要优化的表的数据结构，看下每个字段的数据类型；可以使用desc命令，在一条sql的排序中使用，同时也可以放在sql的最前边，如果后边跟的是表名，则会显示出该表字段的数据类型等信息

desc tablename;

或者我么可以使用show方法，查看创建该表时候的语句，

Show create table tablename;

这里也就确认保障了，如果添加了索引，比如某个只存储数据类型的字段，但是使用了varchar类型，当我们使用数字进行检索的时候，但是已经建立了索引，我们就利用不上索引了，所以索引的使用也必须保证同数据类型。

当存在一个慢sql的时候，可以使用explain关键字查看他的查询情况与阻塞情况等，

实际上，我们要有一个定式，就是尽量使用小数据的表，此处使用了大数据的表去关联，所以首先看到type类型是All全表扫描，而且rows扫描了近4万行。

1、需以小表为主进行查询；

2、In的使用，尤其是文档上说的，（摘自网络：

If the inner and outer queries return M and N rows, respectively, the execution time becomes on the order of O(M×N), rather than O(M+N) as it would be for an uncorrelated subquery.

An implication is that an IN subquery can be much slower than a query written using an IN(value_list) construct that lists the same values that the subquery would return.

）；说是使用这种方式，会以o（m*n）的复杂度进行计算，而不是以o(m + n)，其实感觉还是比较容易理解的，可以想一下笛卡尔积的排列组合；数据库先从子表查询，然后依次对in内的数据扫描；

改造方式，我们后续再说！现在首先要分析explain。

可以看到进行过explain后的语句出现了10列2行的信息，分别对应着两张表的操作情况。

Select_type：每个查询语句中的类型，表示一个复杂度；

一般有simple、primary（包含复杂查询）、dependent、subquery（包含子查询）、union、dependent（依赖外层查询数据）、device（与dependent类似，只是表达了在驱动表后的查询），大概就记得这些吧。

Type：访问的类型，分别有all、 index（遍历索引的树）, range（比如查找某一范围内的）, ref（索引不唯一）, eq_ref（性能更好的主键索引与唯一性索引）, const（大概就是指where条件中指定的某值）, system（说是const的特殊，表中只有一行的情况）, null（这种级别算是索引优先之后，又优先了排序级别吧），性能一次升高。全表扫描肯定是优先避免的；

Possible_key：表示可以使用的索引，索引类型有：主键索引、唯一性索引、普通索引、联合索引、全文索引；

Key：表示实际可以使用的索引；

Key_len：表示索引的字节长度；

Ref：连接匹配条件，同时是在索引上的关联；

Rows：不用多说，这个是扫描了的数据行；

Extra：这个就比较多了，而且比较重要。有些说法是“十分重要的信息，但是并不显示”。存在的值为，using index（覆盖索引，被指定的列，非*）、 using where（检索索引后再过滤字段，并非只要有where的就有该值）、using temporary（临时表存储，尽量避免）、using filesort（无法利用索引的文件索引）、using join buffer（不仅join但凡连表操作中，存储引擎为了优化会使用join_buffer，提示了注意是否需要索引优化。有一篇文章比较容易理解：https://www.cnblogs.com/shengdimaya/p/7123069.html）、impossible where（没有符合条件的行）、select tables optimized away（利用索引从聚合函数返回仅一行）、index merge（包括using union等，表示多个索引的使用）；

基本上，大致的sql信息展示出来了，具体的没有展示，但是对于使用端来说是足够的。

好了，根据上面的慢sql，我们来优化一下，首先就是改成小表为主驱动表；其次就是看他的ref信息类型能否更优；第三，不采用in关键字，尝试使用join级联；第四，查看扫描的数据行数；

好了，再看一下，不再是全表扫描了，而且扫描行数只有19行，ref相关的索引也利用上了，毫无疑问性能会好很多。

篇章二

前边的explain用于分析逻辑问题没有问题，接下来是性能问题，我们比较常用的是Show profiles；该命令，用于追踪执行sql过程中资源消耗的情况！

关于profiles这个工具，分析的东西就非常细致了，具体到内存，cpu的使用情况，同时包括cpu在sql执行的各个过程所用的时间。

如果将一下开启流程，那也太没意思了，但是笔者记忆力不是很好，擅长的东西总是比较容易遗忘，所以还是记录一下吧。

1、查看是否开启 show variables like ‘%profiling%’;如果看到profiling=ON则为开启，否则需要手动开启；

2、没有开启，则开启 set profiling=1;

3、执行要分析的sql

4、使用show profiles;可以显示所有查询语句、持续时间、与查询id号；

5、选取一个id，如选择3，进行分析，输入show profile all for query 3;

6、该命令也可以不适用all命令 show profile for query;

可以从概况中看到对应该sql执行过程，而且看的出来在哪个过程比较耗时

毫无疑问，基本上耗时都在网络上，所以每次sql的传输，尽量减少数据量；

7、同样如果查看cpu的状况的话，可以使用show profile cpu for query X；等等。

基本上使用explain与profile两个工具的命令，就能确认sql的性能问题。

篇章三

关于mysql的日志！

show variables like '%dir%'; 可以查看对应文件存放在什么目录！

show variables like '%slow_query_log_file%'; 查看慢查询日志文件位置

show variables like '%general_log%'; 查看普通sql日志位置、开启否

show variables like '%log_error%'; 查看错误日志信息

set global general_log=ON; 开启通用日志开关

set global log_output='file,table'; 设置日志输出方式，可单独设置为file或table

select * from mysql.general_log; 以数据表的形式查看普通日志；

show variables like '%dir%'; 查看mysql相关的数据位置；

开启binlog（主从复制、日志回复等），

#log_bin=ON

#log_bin_basename=C:ProgramDataMySQLMySQL Server 5.7Datainlog

#log_bin_index=C:ProgramDataMySQLMySQL Server 5.7Datainlog.index

#also this : log-bin=C:ProgramDataMySQLMySQL Server 5.7Datainlog

#server-id=123454

修改后，service mysqld restart，重启mysql服务

等等......

篇章四

数据库的存储引擎、数据库存储文件不同格式的用处！

数据库存储文件不同格式的用处：

通过show variables like ‘%dir%’;找到数据库存储数据的位置；

C:ProgramDataMySQLMySQL Server 5.7Data

随便查看一个数据库文件夹内的文件，发现有以下几种格式、

简述这几种文件格式的用处：

*.frm：描述了表的结构

*.ibd：InnoDB引擎开启的独立表空间，存放该表的数据和索引的文件

*.MYD：保存了表的数据记录

*.MYI：是表的索引

*.opt：存储当前数据库的默认字符集和字符校验规则

数据库的存储引擎：

show engines;可以查看数据库的存储引擎！能看到很多引擎的方式：

一般，对于业界用的比较多的也就四种：InnoDB、MyISAM、MEMORY、MRG_MYISAM

InnoDB：具有提交、回滚和崩溃恢复能力的事务安全，对比MyISAM引擎，写的处理效率会差一些，并且会占用更多的磁盘空间以保留数据和索引。

MyISAM：不支持事务、也不支持外键，优势是访问速度快；

MEMORY：使用存在于内存中的内容来创建表，毫无疑问容易丢失；

MRG_MYISAM：本身并没有数据，是Myisam的组合；

一般，我们创建库、表的时候就指定了数据库的引擎，而且现在由于es、mongodb等nosql的出现，除了innodb，其他类型的引擎方式很少被用到，除非在一些不在意性能的系统上还存在。

修改数据库引擎的话，可以修改配置文件my.cnf.

在[mysqld]后面添加default-storage-engine=InnoDB，重启服务

后续再扩展其他mysql的知识！

查看全文

相关阅读:
KAFKA基础（四）：Kafka架构深入(2)Kafka 生产者
 逆向工程，调试Hello World ！程序（更新中）
关于网络初级基础知识总结
 真！阿里P10整理的Java面试宝典，学了60％成功砍下了P8级Offer，真爽！
【专升本计算机】甘肃省2020年专升本计算机测试题
 真！阿里P10整理的Java面试宝典，学了60％成功砍下了P8级Offer，真爽！
python利用numpy存取文件
 泛在网技术考点整理
 [Python图像处理] 三十二.傅里叶变换（图像去噪）与霍夫变换（特征识别）万字详细总结
 汉诺塔问题

原文地址：https://www.cnblogs.com/kevinfuture/p/8536273.html

篇章二

篇章三

篇章四