zoukankan      html  css  js  c++  java
  • 为数据库建立索引(转自51cto.com)

    为数据库建立索引

    2005-12-02 17:12 ChinaITLab 我要评论(2) 字号:T | T
    一键收藏,随时查看,分享好友!

    本文介绍如何为数据库建立索引

    AD: 2013云计算架构师峰会精彩课程曝光

    最普通的情况,是为出现在where子句的字段建一个索引。为方便讲述,我们先建立一个如下的表。 
    CREATE TABLE mytable ( 
     id serial primary key, 
     category_id int not null default 0, 
     user_id int not null default 0, 
     adddate int not null default 0 
    ); 
    如果你在查询时常用类似以下的语句: 
     SELECT * FROM mytable WHERE category_id=1; 
    最直接的应对之道,是为category_id建立一个简单的索引: 
     CREATE INDEX mytable_categoryid 
     ON mytable (category_id); 
    OK.如果你有不止一个选择条件呢?例如: 
     SELECT * FROM mytable WHERE category_id=1 AND user_id=2; 
    你的第一反应可能是,再给user_id建立一个索引。不好,这不是一个最佳的方法。你可以建立多重的索引。 
    CREATE INDEX mytable_categoryid_userid ON mytable (category_id,user_id); 
    注意到我在命名时的习惯了吗?我使用"表名_字段1名_字段2名"的方式。你很快就会知道我为什么这样做了。 
    现在你已经为适当的字段建立了索引,不过,还是有点不放心吧,你可能会问,数据库会真正用到这些索引吗?测试一下就OK,对于大多数的数据库来说,这是很容易的,只要使用EXPLAIN命令: 
    EXPLAIN 
     SELECT * FROM mytable 
    WHERE category_id=1 AND user_id=2; 
     This is what Postgres 7.1 returns (exactly as I expected) 
     NOTICE: QUERY PLAN: 
     Index Scan using mytable_categoryid_userid on 
     mytable (cost=0.00..2.02 rows=1 width=16) 
    EXPLAIN 
    以上是postgres的数据,可以看到该数据库在查询的时候使用了一个索引(一个好开始),而且它使用的是我创建的第二个索引。看到我上面命名的好处了吧,你马上知道它使用适当的索引了。

    接着,来个稍微复杂一点的,如果有个ORDER BY字句呢?不管你信不信,大多数的数据库在使用order by的时候,都将会从索引中受益。 
     SELECT * FROM mytable 
    WHERE category_id=1 AND user_id=2 
     ORDER BY adddate DESC;

    很简单,就象为where字句中的字段建立一个索引一样,也为ORDER BY的字句中的字段建立一个索引: 
     CREATE INDEX mytable_categoryid_userid_adddate 
     ON mytable (category_id,user_id,adddate); 
     注意: "mytable_categoryid_userid_adddate" 将会被截短为 
    "mytable_categoryid_userid_addda" 
     CREATE 
     EXPLAIN SELECT * FROM mytable 
    WHERE category_id=1 AND user_id=2 
     ORDER BY adddate DESC; 
     NOTICE: QUERY PLAN: 
     Sort (cost=2.03..2.03 rows=1 width=16) 
    -> Index Scan using mytable_categoryid_userid_addda 
     on mytable (cost=0.00..2.02 rows=1 width=16) 
     EXPLAIN 
    看看EXPLAIN的输出,数据库多做了一个我们没有要求的排序,这下知道性能如何受损了吧,看来我们对于数据库的自身运作是有点过于乐观了,那么,给数据库多一点提示吧。 
    为了跳过排序这一步,我们并不需要其它另外的索引,只要将查询语句稍微改一下。这里用的是postgres,我们将给该数据库一个额外的提示--在ORDER BY语句中,加入where语句中的字段。这只是一个技术上的处理,并不是必须的,因为实际上在另外两个字段上,并不会有任何的排序操作,不过如果加入,postgres将会知道哪些是它应该做的。 
     EXPLAIN SELECT * FROM mytable 
    WHERE category_id=1 AND user_id=2 
     ORDER BY category_id DESC,user_id DESC,adddate DESC; 
     NOTICE: QUERY PLAN: 
     Index Scan Backward using 
    mytable_categoryid_userid_addda on mytable 
     (cost=0.00..2.02 rows=1 width=16) 
     EXPLAIN 
    现在使用我们料想的索引了,而且它还挺聪明,知道可以从索引后面开始读,从而避免了任何的排序。 
    以上说得细了一点,不过如果你的数据库非常巨大,并且每日的页面请求达上百万算,我想你会获益良多的。不过,如果你要做更为复杂的查询呢,例如将多张表结合起来查询,特别是where限制字句中的字段是来自不止一个表格时,应该怎样处理呢?我通常都尽量避免这种做法,因为这样数据库要将各个表中的东西都结合起来,然后再排除那些不合适的行,搞不好开销会很大。 
    如果不能避免,你应该查看每张要结合起来的表,并且使用以上的策略来建立索引,然后再用EXPLAIN命令验证一下是否使用了你料想中的索引。如果是的话,就OK。不是的话,你可能要建立临时的表来将他们结合在一起,并且使用适当的索引。 
    要注意的是,建立太多的索引将会影响更新和插入的速度,因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格,就没有必要为一个很少使用的where字句单独建立索引了,对于比较小的表,排序的开销不会很大,也没有必要建立另外的索引。 
    以上介绍的只是一些十分基本的东西,其实里面的学问也不少,单凭EXPLAIN我们是不能判定该方法是否就是最优化的,每个数据库都有自己的一些优化器,虽然可能还不太完善,但是它们都会在查询时对比过哪种方式较快,在某些情况下,建立索引的话也未必会快,例如索引放在一个不连续的存储空间时,这会增加读磁盘的负担,因此,哪个是最优,应该通过实际的使用环境来检验。 
    在刚开始的时候,如果表不大,没有必要作索引,我的意见是在需要的时候才作索引,也可用一些命令来优化表,例如MySQL可用"OPTIMIZE TABLE"。 
    综上所述,在如何为数据库建立恰当的索引方面,你应该有一些基本的概念了。

  • 相关阅读:
    [MacOS]Sublime text3 安装(一)
    [RHEL8]开启BBR
    PAT Advanced 1136 A Delayed Palindrome (20分)
    PAT Advanced 1144 The Missing Number (20分)
    PAT Advanced 1041 Be Unique (20分)
    PAT Advanced 1025 PAT Ranking (25分)
    PAT Advanced 1022 Digital Library (30分)
    PAT Advanced 1019 General Palindromic Number (20分)
    PAT Advanced 1011 World Cup Betting (20分)
    PAT Advanced 1102 Invert a Binary Tree (25分)
  • 原文地址:https://www.cnblogs.com/weizizhe/p/3367956.html
Copyright © 2011-2022 走看看