zoukankan      html  css  js  c++  java
  • mysql三层体系

    Mysql:是单进程多线程数据库。

    MySQL分层:

    mysql分三层:网络连接层, sql层, 存储引擎层,而网络连接层与sql层合称server层,故mysql又分server层合储存引擎层。

    第一层:
    处理网络链接,链接的网络认证。当客户端链接到服务器的时候,每个客户端链接都有一个线程,这个链接的查询只会在该线程中执行。

    第二层:是SQL的查询解析,分析,和优化,缓存以及所有的内置函数,所有存储引擎的功能都在这一层实现,比如存储过程。MySQL在解析SQL的时候,会在服务器层创建解析树,然后通过查询重写,决定表的读取顺序,以及选择合适的索引等等。虽然优化策略是服务器层决定的,但是统计信息是存储引擎层提供的。

    第三层:存储引擎层,存储引擎负责MySQL中数据的存储和提取,存储引擎不会互相通信。

     

    第1层网络连接层介绍:网络连接层主要有连接池和线程池。

    网络连接层的作用:

     连接与线程处理,比如连接处理、授权认证、安全等。(通信协议,线程,验证)


    mysql的连接管理方式:

    Mysql-Server同时支持3种连接管理方式,包括No-Threads,One-Thread-Per-Connection和Pool-Threads。
    No-Threads:表示处理连接使用主线程处理,不额外创建线程,这种方式主要用于调试;
    One-Thread-Per-Connection:是线程池出现以前最常用的方式,为每一个连接创建一个线程服务;
    Pool-Threads:则是线程池方式。

    为什么有连接池和线程池?

     每创建一个新的会话(或链接),mysql内部创建一个新的用户线程来提供服务,当连接被销毁,线程也被销毁.即一个连接有一个线程.这种创建链接和销毁链接都会消耗cpu性能.为了降低这种消耗,有了连接池和线程池.

    连接池(connection pool):

    连接池:在客户端部署。客户端创建预先创建一定的连接,利用这些连接服务于客户端所有的DB请求。如果某一个时刻,空闲的连接数小于DB的请求数,则需要将请求排队,等待空闲连接处理。通过连接池可以复用连接,避免连接的频繁创建和释放,从而减少请求的平均响应时间,并且在请求繁忙时,通过请求排队,可以缓冲应用对DB的冲击。当连接断开,连接将回归连接池。

    线程池(thread pool):

     线程池:在服务器端部署。通过创建一定数量的线程服务DB请求,有了线程池,当有了新连接,可以直接从线程池里拿线程,断开时,也不销毁线程,而是回放进线程池。与一个线程服务一个连接的方式对比,线程池服务的最小单位是语句,即一个线程可以对应多个活跃的连接。通过线程池,可以将server端的服务线程数控制在一定的范围,减少了系统资源的竞争和线程上下切换带来的消耗,同时也避免出现高连接数导致的高并发问题。
    说明:在mysql社区版无线程池功能. 在第三方perconadb 和mysql商业版有其功能.

    线程池带来的问题1:调度死锁(解决方法是添加优先级队列)

    引入线程池解决了多线程高并发的问题,但也带来一个隐患。假设,A,B两个事务被分配到不同的group中执行,A事务已经开始,并且持有锁,但由于A所在的group比较繁忙,导致A执行一条语句后,不能立即获得调度执行;而B事务依赖A事务释放锁资源,虽然B事务可以被调度起来,但由于无法获得锁资源,导致仍然需要等待,这就是所谓的调度死锁。由于一个group会同时处理多个连接,但多个连接不是对等的。比如,有的连接是第一次发送请求;而有的连接对应的事务已经开启,并且持有了部分锁资源。为了减少锁资源争用,后者显然应该比前者优先处理,以达到尽早释放锁资源的目的。因此在group里面,可以添加一个优先级队列,将已经持有锁的连接,或者已经开启的事务的连接发起的请求放入优先队列,工作线程首先从优先队列获取任务执行。

    线程池带来的问题2:大查询处理解决方法是设置thread_pool_oversubscribe

    某个group里面的连接都是大查询,那么group里面的工作线程数很快就会达到thread_pool_oversubscribe参数设置值,对于后续的连接请求,则会响应不及时(没有更多的连接来处理),这时候group就发生了stall。通过前面分析知道,timer线程会定期检查这种情况,并创建一个新的worker线程来处理请求。如果长查询来源于业务请求,则此时所有group都面临这种问题,此时主机可能会由于负载过大,导致hang住的情况。这种情况线程池本身无能为力,因为源头可能是烂SQL并发,或者SQL没有走对执行计划导致,通过其他方法,比如SQL高低水位限流或者SQL过滤手段可以应急处理。但是,还有另外一种情况,就是dump任务。很多下游依赖于数据库的原始数据,通常通过dump命令将数据拉到下游,而这种dump任务通常都是耗时比较长,所以也可以认为是大查询。如果dump任务集中在一个group内,并导致其他正常业务请求无法立即响应,这个是不能容忍的,因为此时数据库并没有压力,只是因为采用了线程池策略,才导致了请求响应不及时,为了解决这个问题,我们将group中处理dump任务的线程不计入thread_pool_oversubscribe累计值,避免上述问题。

    连接池和线程池说明:

    连接池主要用来管理客户端的连接,避免重复的连接/断开操作,是将空闲的连接缓存起来,可以复用。从而减少了连接mysql server/断开mysql server的开销与成本,从而提升性能。

    但是mysql的连接池不能获取mysql server的查询处理能力以及当前的负载情况。

    线程池:线程池的操作是在mysql server端,并且设计就是用来管理当前并发的连接和查询。

    thread pool到底能够提升多少性能?

    根据Oracle Mysql官方的性能测试:

    在并发达到128个连接以后.没有线程池的Mysql性能会迅速降低。使用线程池以后,性能不会出现波动,会一直保持在较好的状态运行。

    在读写模式下,128个连接以后,有线程池的Mysql比没有线程池的Mysql性能高出60倍。

    在只读模式下,512个连接以后,有线程池的Mysql比没有线程池的Mysql性能高出18倍。

    什么时候可以考虑使用thread_pool?

     show global status like '%threads_running%';其值是mysql server当前并发执行语句的数量,如果这个值一直保持在40左右的区间,那么可以考虑使用thread pool。

    如果你使用了innodb_thread_concurrency参数来控制并发的事物量,那么使用线程池将会获得更好的效果。

    如果你的工作是有很多短连接组成的,那么使用线程池是有益的。

     

    第2层sql处理层(SQL Layer):主要有SQL Interface、Parser、Optimizer、Cache和Buffer

    Sql层功能:
    功能:解析器,授权,优化器,查询执行,查询高速缓存,查询日志记录,跨存储引擎功能。

    1.解析器:解析SQL语法,形成语法树

    2.授权:SQL的权限验证  *.*对于指定的库和表

    3.优化器:CBO(基于成本的优化),根据统计信息--> SQL改写 --->执行计划(即选哪种算法执行)

    sql层处理数据流程:

    用户传入sql-----查询缓存(命中缓存可直接返回结果)----解析器(生成sql解析树)----预处理器(可能sql等价改写)-----查询优化器(生成sql执行计划)----查询执行引擎----结果返回给用户。

     

    SQL接口:(SQL Interface)

     功能:接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface


    解析器:(Parser)--生成sql解析树

    SQL命令传递到解析器的时候会被解析器验证和解析(进行语义和语法的分析,分解成数据结构,如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的 ),生成sql解析树。解析器是由Lex和YACC实现的,是一个很长的脚本。

     

    查询优化器:(Optimizer) --生成执行计划

     SQL语句在查询之前会使用查询优化器对查询进行优化,根据客户端请求的 query 语句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个 query 语句的结果,即执行计划。查询优化器使用选取-投影-联接策略生成执行计划。

    选取-投影-联接:

    用一个例子就可以理解: select uid,name from user where gender = 1;

    这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行gender过滤。

    这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤。

    将这两个查询条件联接起来生成最终查询结果。

     

    查询缓存功能(Cache和Buffer):(建议关闭)

    当执行sql的时候,sql第一次被执行,然后再次执行的时候如果相同的sql,可以不进行解析,直接返回结果,提高查询效率.

    关闭查询缓存:query_cache_type = 0    query_cache_size = 0

    局限性比较大,任何查询结果有变更,都需要进行更新,对于mysql性能影响比较严重,整个更新过程的锁颗粒度的比较高,还持有全局锁,效率很低.

    建议:是否使用查询缓存,不用.(在mysql8.0里没了查询缓存功能.)

    问题:如何计算和提高查询缓存命中率?

     

    第3层储存引擎层(StorEngine Layer):

    储存引擎层功能:

    存储引擎,也称为表类型,真正的负责了MySQL中数据的存储和提取,储存引擎层由多种存储引擎共同组成。它们负责存储和获取所有存储在MySQL中的数据。就像Linux众多的文件系统 一样。每个存储引擎都有自己的优点和缺陷。服务器是通过存储引擎API来与它们交互的。存储引擎不能解析SQL,互相之间也不能通信。仅仅是简单的响应服务器 的请求。存储引擎不会互相通信。不同的存储引擎采用不同的技术(存储机制、索引机制、锁定机制)存储数据。
    MySQL的存储引擎是插件式的,也就是说,用户可以随时切换MySQL的存储引擎:针对表或针对库都可(通过SQL语句命令)。MySQL集合了多种引擎:MyISAM、InnoDB、BDB、Merge、Memory等,默认的是InnoDB。

    储存引擎层说明:

    1、根据上层获取数据的方法(执行计划),将数据提取出来。

    2、重新再交给SQL层。

    3、是MYSQL数据库的核心,关系到数据库性能。

    4、存储引擎是基于表的,而不是数据库。

    常见的MySQL的存储引擎及特点:

     存储引擎                   特点

    InnoDB          持事务安全。但是对比MyISAM引擎,写的处效率会差些

    MyISAM          支持事务,插速度般innodb快一些

    Memory          数据存储于内存之中

    CSV            数据存储为CSV件格式,不进转换

    查看mysql储存引擎:

    mysql> show plugins;           ---查看插件及其状态
    mysql> show engines;          ---查看目前支持的储存引擎


    InnoDB和MyISAM区别:

     InnoDB                                                                                MyISAM

    索引组织表                              堆表

    锁                                  表锁

    物理结构不同,数据索引在起(.frm)       物理结构不同,数据索引分开(.MYD .MYI)

    支持事务                             不支持事务

    支持外键                             不支持外键

    MVCC多版本控制                           

    INNODB缓存索引和数据                     MyISAM只缓存索引块

    说明:

     通过对开关binlog先后的测试发现,其实MySIAM的插性能要好于INNODB,这和MySIAM不支持事务,锁开销也较有关。 但是MySiam的表锁让该引擎不能在并发下工作,因为会造成的锁冲突。在线业务OLTP业务,强烈不建议使MySIAM的存储引擎,并发效率很低。

    创建表时指定储存引擎:

    create table test1

    (

    id int,

    name varchar(11)

    )engine=innodb;


     create table test2

    (

    id int,

    name varchar(11)

    )engine=myisam ;

     


    InnoDB的物理存储结构:

     test1.frm        #表结构文件

    test1.ibd   #表数据文件(存储数据和索引)

    MySIAM的物理存储结构:

     test2.frm        #表结构文件

    test2.MYD   #表数据文件

    test2.MYI   #表索引文件

    修改MyISAM表结构到InnoDB表:

     alter table test2 engine = innodb;

    show create table test2G;

    Create Table: CREATE TABLE `test2` (

    `id` int(11) DEFAULT NULL,

    `name` varchar(11) DEFAULT NULL

    ) ENGINE=InnoDB DEFAULT CHARSET=utf8


    注意: MySQL 的系统表, user 等不能转化为 InnoDB 格式,他们必须采用 MyISAM 格式!!

     

  • 相关阅读:
    Spring Security demo
    applicationContext-XXX.xml和XXX-servlet.xml的区别
    搜索意图识别浅析
    如何配置使用Dnsmasq
    机器学习十大算法之EM算法
    如何利用OpenSSL生成证书
    11月13日晚直播预告 | 关于数据可视化,网易大数据资深专家将在这里告诉你
    漫话中文分词
    10分钟快速构建汽车零售看板
    聊一聊整车厂的那些事——售后配件业务
  • 原文地址:https://www.cnblogs.com/lbg-database/p/10108393.html
Copyright © 2011-2022 走看看