zoukankan      html  css  js  c++  java
  • mysql数据库基础

    1 内连接与外连接

      内连接(inner join)与外连接的区别是内连接仅仅筛选匹配中的数据,而外连接会选出其他不匹配的数据。具体使用内链接还是外连接 看业务和习惯吧。

      

    2 子查询

      当进行查询时候,需要的条件是另外一个select语句的结果,这时候需要用到子查询,关键字是 in , not in, = , !=, exists ,not exists等

      

       如果子查询结果只有一条 ,也可以使用 = 代替in 

      

      有些情况,子查询可以转化为表连接,转表连接可以优化子查询。

      

    3   union , union all

         作用都是合并结果集,union 是union all后的结果进行一次distinct 去除重复记录的结果。

    4  mysql数据类型

      数值  在定义数值字段时,会有一个宽度 如int(5),这个宽度是配合zerofile使用的,意思是当数据宽度不足5的时候 在数字前面使用0填充。

      字符

        char与varchar的区别,char 会删除尾部的空格而varchar不会,char是固定长度的字符类型,varchar是可变长的字符类型。

        

         该如何选择字符串类型? 对于常用的InnoDB引擎,建议使用varchar,对于InnoDB 数据表 内部存储格式没有区分固定长度和可变长度列(所有数据行都使用指向数据列值的头指针),因此本质上 使用固定长度的char 不一定比可变长度的varchar性能要好,主要性

        能因素还是数据行的存储总量。

      TEXT 与BLOB

        这两种主要用于存储大文本的,区别是 TEXT 只能保存字符数据  如文章或者日记,BLOB 用来存二进制数据 如照片 视频等等。这两种类型会造成一定的性能问题

     5  mysql各种运算的优先级,实际工作中 可以直接使用(),将需要优先的操作括起来

      

    6  mysql函数

      常用函数有 字符串函数,数值函数 ,日期和时间函数,流程函数等等。下面看看流程函数语法

      

      

    7  两种主要存储引擎的比较

      InnoDB  支持事务,效率比MyISAM低一些,锁等级是行锁。

      MyISAM  不支持事务,效率比较高,锁等级锁表锁。

    8  浮点数(float,double)与定点数(decimal)

      对于浮点数 当插入数据的精度超过定义的实际精度,会自动被四舍五入然后插入数据库

      对于定点数 定点数实际是一字符串的形式存放的,所以可以精确的存放数据

      

      使用浮点数可能出现误差,上面可以看出来, 所以尽量使用decimal

     9  sql优化

      1 定位执行效率低的sql语句,使用--log-slow-queries[=file_name]选项启动时,mysql会写入一个所有包含 执行时间超过long_query_time秒的日志文件。

      2 使用以上步骤查询到效率低的sql语句之后,通过explain或者desc命令获取mysql的执行计划,执行计划包括执行过程中 表如何连接和连接的顺序等等信息。

      

      输出字段解释

      select_type  查询类型 SAMPLE(简单表,即不使用表连接或者子查询), PRIMARY(主查询,即外层查询),UNION(UNION中的第二个,或者后面的子查询),SUBQUERY(子查询中的第一个select)

      table   输出结果集的表 

      type 访问类型 性能从差到好依次是 ALL < index < range < ref < eq_ref < const,system < NULL  

        ALL 全表扫描(mysql遍历全表来查找匹配行),index (mysql遍历整个索引来查询匹配行),range(索引范围查找,常见于 < <= > >= between等),ref (使用非唯一索引扫描或唯一索引的前缀扫描 返回某个单独值的记录行),eq_ref (类似于 ref,区别:百度),const,system (单表中最多有一个结果行 速度很快,如根据主键或者unique key 来查询),NULL (不扫描表或者索引就得到结果 , 如select 1 from test)

      possible_keys      可能使用到的索引

      key                实际使用的索引

      key_len    使用到的索引字段的长度                  

      rows     扫描行的数量 

      Extra      执行计划的说明

      3 通过show profile来分析sql  这个有点复杂呀我日, 参考https://blog.csdn.net/taojin12/article/details/81349112

      4 通过trace分析优化器分析mysql执行器的行为 这个也有点难 参考https://blog.csdn.net/taojin12/article/details/81489234  

      5 索引 主要使用的索引就是BTREE索引 其他索引不讨论

      mysql中使用索引的典型场景

        1 匹配最左前缀 ,最左前缀原则可以说是mysql中B-TREE索引使用的首要原则。

        假设一个联合索引包含三列(col1 ,clo2 clo3), 那么可以使用 col1,(col1 + col2),(clo1 +col2 +clo3),(col1 + col3)查询利用到,对于(col2) ,(col2,col3)则不会用到

        

        2  全值匹配:和索引中的所有列进行匹配

        3 匹配值的范围查询,多索引的值进行范围查找 如cusomer_id > 11 and customer_id < 100

        

        4 进对索引列进行查询 ,当需要查询的列都在索引的字段时 查询效率更高, 下面的Extra部分变成了 Using index ,意味着 直接访问索引就足够取数据了 不需要通过索引再去表查询

        

        5 匹配列前缀 仅仅使用索引的第一列 并且只包含第一列的开头一部分进行查找。User where 表示需要通过索引回表查询数据。

        

      存在索引 但是不能使用索引的主要典型场景

        1 以%开头的like查询不会使用索引 (这个可以使用全文索引来解决类似全文检索问题)

        2 数据类型出现了隐式转换的时候不会使用索引,

        

        3 联合索引的情况下,假设 查询条件不包含索引的最左列部分(不满足最左前缀原则), 不会使用符合索引。

        4 用or 分开的条件 如果or前的条件列有索引 而后面的列无索引 ,那么涉及到的索引都不会被用到

        

        常见的sql优化

        1 批量的insert操作,这样可以减少客户端与数据库之间的连接,关闭 等消耗,比多个单insert 插入快很多,当然 也需要结合jdbc的批处理技术 一起使用。

        

        2 优化order by 

          数据脚本文件是 http://downloads.mysql.com/docs/sakila-db.zip

          mysql 有两种排序方式,第一种是通过有序索引顺序扫描直接返回有序数据,这种操作效率很高

          

          第二种是对返回的数据进行排序,这也叫Filesort排序,所有不是通过索引直接返回排序结果的排序都叫Filesort排序,排序操作有可能是使用磁盘文件 也可能是临时表 具体取决于mysql服务器的排序参数。

            根据以上的两种方式描述,我们的优化目标是 尽量减少额外的排序,通过索引返回有序的数据,where 和order by使用相同的索引 并且order by的顺序和索引的顺序相同 ,并且尽量都是升序或者降序 否是会出现filesort。

         3 优化group by

          默认情况下,mysql对所有 group by col1 ,clo2 ...的字段排序,这与查询中 指定order by clo1,col2...相似。 因此如果显式包含一个相同order by 子句,则对执行性能无影响。 

          

          第一个使用filesort ,第二个不使用filesort,使用filesort的时候 往往是比较消耗时间的。

          4 优化嵌套查询

            mysql4 .1开始支持子查询,子查询可以一次性的完成很多逻辑上需要多个步骤的sql操作,同时也可以避免事务或者表锁死,但是有些情况下可以使用表连接查询来替代子查询。连接查询之所以比子查询效率高,是因为mysql无需在内存中建立临时表来完成逻辑上需要两个步骤的查询。

          

          可以看到index_subquery 调整为了ref。效率更好一点。

          5 优化OR条件查询

          如果要利用索引,那么 or之间的条件都必须用到索引才行,如果没索引 可以考虑加索引。

          6 优化分页查询  limit比较头疼,比如 limit 1000,20 mysql 需要排序出前1020条记录,然后仅仅需要返回1001条到1020条记录,前面1000条记录都会被抛弃,随着数据量越来越大 所消耗的时间会越来越长,查询和排序的代价都非常高。

          第一种优化思路,增加上一页的最后一行主键id值,比如 15640 ,

          

          

          可以看的出来,这种方法不是一个很完美的解决方法,它要求主键有序,对于非主键有序(比如uuid)的场景不适用。另外这个这个查询结果依赖于上一页的结果 那假设用户想从第2页跳到第100页呢? 谁来提供第99页的最后一行主键id值?

          第二种思路,使用主键来做 这个地方先去网上搜一下吧

    10 优化表结构

      主要 冷热数据分离 ,数据适当冗余 以及使用中间表

     11 mysql 锁

      表锁:表锁有两种模式:共享读锁,独占写锁。mysql 在执行select前 会自动给表加读锁,在执行 uddate delete insert之前 会自动给表加写锁。

        共享读锁不会阻塞其他用户的读请求,但是会阻塞对同一个表的写请求。

        独占写锁即会阻塞其他用户的读请求,也会阻塞写请求。

      InnoDB 锁

          

       

         

  • 相关阅读:
    从书上学的东西(顺带总结一发)
    网上讲的好的知识点汇总
    土地征用题解(兼斜率优化详解)
    Blocks题解(区间dp)
    高精度模板汇总
    动态规划总结
    异或序列(题解)(莫队)
    小Z的袜子(题解)(莫队)
    小B的询问(题解)(莫队)
    凸包模板——Graham扫描法
  • 原文地址:https://www.cnblogs.com/tjqBlog/p/10251065.html
Copyright © 2011-2022 走看看