zoukankan      html  css  js  c++  java
  • 理解MySQL数据库覆盖索引 (转)

    http://www.cnblogs.com/zl0372/articles/mysql_32.html

    话说有这么一个表:

    复制代码
    CREATE TABLE `user_group` ( 
      `id` int(11) NOT NULL auto_increment, 
      `uid` int(11) NOT NULL, 
      `group_id` int(11) NOT NULL, 
      PRIMARY KEY  (`id`), 
      KEY `uid` (`uid`), 
      KEY `group_id` (`group_id`), 
    ) ENGINE=InnoDB AUTO_INCREMENT=750366 DEFAULT CHARSET=utf8
    复制代码

    看AUTO_INCREMENT就知道数据并不多,75万条。然后是一条简单的查询:

    SELECT SQL_NO_CACHE uid FROM user_group WHERE group_id = 245;

    很简单对不对?怪异的地方在于:

      如果换成MyISAM做存储引擎的时候,查询耗时只需要0.01s,用InnoDB却会是0.15s左右

      如果只是就这么点差距其实不是什么大不了的事,但是真实的业务需求比这个复杂,造成的差距也很大:MyISAM只需要0.12s,InnoDB则需要2.2s.,最终定位到问题症结是在这条SQL。

      Explain的结果是:

    +----+-------------+------------+------+---------------+----------+---------+-------+------+-------+ 
    | id | select_type | table      | type | possible_keys | key      | key_len | ref   | rows | Extra | 
    +----+-------------+------------+------+---------------+----------+---------+-------+------+-------+ 
    |  1 | SIMPLE      | user_group | ref  | group_id      | group_id | 4       | const | 5544 |       | 
    +----+-------------+------------+------+---------------+----------+---------+-------+------+-------+

    看起来已经用上索引了,而这条SQL语句已经简单到让我无法再优化了。最后请前同事Gaston诊断了一下,他认为:数据分布上,group_id相同的比较多,uid散列的比较均匀,加索引的效果一般,但是还是建议我试着加了一个多列索引:

    ALTER TABLE user_group ADD INDEX group_id_uid (group_id, uid);

    然后,不可思议的事情发生了……这句SQL查询的性能发生了巨大的提升,居然已经可以跑到0.00s左右了。经过优化的SQL再结合真实的业务需求,也从之前2.2s下降到0.05s。

    再Explain一次:

    +----+-------------+------------+------+-----------------------+--------------+---------+-------+------+-------------+ 
    | id | select_type | table      | type | possible_keys         | key          | key_len | ref   | rows | Extra       | 
    +----+-------------+------------+------+-----------------------+--------------+---------+-------+------+-------------+ 
    |  1 | SIMPLE      | user_group | ref  | group_id,group_id_uid | group_id_uid | 4       | const | 5378 | Using index | 
    +----+-------------+------------+------+-----------------------+--------------+---------+-------+------+-------------+

    原来是这种叫覆盖索引(covering index),MySQL只需要通过索引就可以返回查询所需要的数据,而不必在查到索引之后再去查询数据,所以那是相当的快!!但是同时也要求所查询的字段必须被索引所覆盖到,在Explain的时候,输出的Extra信息中如果有“Using Index”,就表示这条查询使用了覆盖索引。

    不过,还有一个无法解释的问题就是,不用覆盖索引的情况下,为什么用MyISAM就快那么多,而InnoDB就慢这么多呢?求真相……

    原文出处:http://xiaobin.net/201109/strange-sql-performance-problem/

  • 相关阅读:
    一步步学习SPD2010--第十三章节--管理SP Server环境的Web内容(2)--理解SP Server2010的Web内容管理
    一步步学习SPD2010--第十三章节--管理SP Server环境的Web内容(1)--创建一个发布网站
    一步步学习SPD2010--第十三章节--管理SP Server环境的Web内容
    一步步学习SPD2010--第十二章节--理解可用性和可接入性(8)--关键点
    亚马逊推自家云备份产品,第三方云备份厂商压力山大 中国存储网
    几何概率模型是什么
    宋浩《概率论与数理统计》笔记---1..1.1-1.1.3、概率论基本概念
    机器学习疑难---1、什么是多元线性回归
    最大似然估计线性回归实例
    Hopfield神经网络 简介
  • 原文地址:https://www.cnblogs.com/quietwalk/p/7371418.html
Copyright © 2011-2022 走看看