zoukankan      html  css  js  c++  java
  • MySQL学习笔记(三)—索引

    一、概述

    1.基本概念

          在大型数据库中,一张表中要容纳几万、几十万,甚至几百万的的数据,而当这些表与其他表连接后,所得到的新的数据数目更是要大大超出原来的表。当用户检索这么大量的数据时,经常会感觉慢。这个时候要提高数据库的检索性能,就必须要用到索引。给表追加合适的索引能极大的改善数据检索的效率,提供数据库性能。

         索引是在存储引擎中实现的,因此每种存储引擎的索引都不一定完全相同,而且每种存储引擎也不一定支持所有的索引类型。

         所有存储引擎支持每个表至多16个索引,总索引长度至多为256字节。

         MySql中的索引的存储类型有两种: B-Tree和Hash,MyISAM和InnoDB存储引擎只支持B-Tree索引。Memory和Heap可以支持Hash和B-Tree索引。

         为表设置索引是要付出代价的:

         (1)增加了数据库的存储空间。

         (2)插入和修改数据时要花费较多的时间(因为索引的位置也要随之变动)。

    2.索引的优缺点

    (1)优点

    a: 通过创建唯一索引,保证数据库表每行数据的唯一性。

    b: 大大加快数据查询速度。

    c: 在使用分组和排序进行数据查询时,可以显著减少查询中分组和排序的时间。

    (2)缺点

    a: 维护索引需要耗费数据库资源。

    b: 索引需要占用磁盘空间,索引文件可能比数据文件更快达到最大文件尺寸。

    c: 当对表的数据进行增删改的时候,因为要维护索引,速度会受到影响。

          索引是建立在数据库表中的某些列的上面。在创建索引的时候,应该考虑在哪些列上可以创建索引,在哪些列上不能创建索引。一般来说,应该在这些列上创建索引。

    a: 在经常需要搜索的列上,可以加快搜索的速度;

    b: 在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;

    c: 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;

    d: 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;

    e: 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

    f: 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。

    一般来说,不应该创建索引的的这些列具有下列特点

    a: 对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。

    b: 对于那些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。

    c: 对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少。

    d: 当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。

    二、索引的分类

    1.普通索引

         这是最基本的索引,它没有任何限制,比如上文中为title字段创建的索引就是一个普通索引,MyIASM中默认的BTREE类型的索引,也是我们大多数情况下用到的索引。

    #直接创建索引
    CREATE INDEX index_name ON TABLE (COLUMN(length));
    
    #修改表结构的方式添加索引
    ALTER TABLE table_name ADD INDEX index_name ON (COLUMN(length));
    
    #创建表的时候同时创建索引
    CREATE TABLE `table` (
    	`id` INT (11) NOT NULL AUTO_INCREMENT,
    	`title` CHAR (255) CHARACTER
    SET utf8 COLLATE utf8_general_ci NOT NULL,
     `content` text CHARACTER
    SET utf8 COLLATE utf8_general_ci NULL,
     `time` INT (10) NULL DEFAULT NULL,
     PRIMARY KEY (`id`),
     INDEX index_name (title(length))
    );
    
    #删除索引
    DROP INDEX index_name ON TABLE;

    2.唯一索引

         唯一索引是不允许其中任何两行具有相同索引值的索引。

         索引列的值必须唯一,但允许有空值,注意和主键不同。    

         当现有数据中存在重复的键值时,大多数数据库不允许将新创建的唯一索引与表一起保存。数据库还可能防止添加将在表中创建重复键值的新数据。例如,如果在employee表中职员的姓(lname)上创建了唯一索引,则任何两个员工都不能同姓。

    #创建唯一索引
    CREATE UNIQUE INDEX indexName ON TABLE (COLUMN);
    
    #修改表结构
    ALTER TABLE table_name ADD UNIQUE indexName ON (COLUMN);
    
    #创建表的时候直接指定
    CREATE TABLE `table` (
    	`id` INT (11) NOT NULL AUTO_INCREMENT,
    	`title` CHAR (255) CHARACTER
    SET utf8 COLLATE utf8_general_ci NOT NULL,
     `content` text CHARACTER
    SET utf8 COLLATE utf8_general_ci NULL,
     `time` INT (10) NULL DEFAULT NULL,
     PRIMARY KEY (`id`),
     UNIQUE indexName (title)
    );

    3.全文索引

         FULLTEXT索引可以用于全文搜索。只有MYISAM存储引擎支持FULLTEXT索引,并且只支持CHAR、VARCHAR和TEXT类型。

    #创建表的适合添加全文索引
    CREATE TABLE `table` (
    	`id` INT (11) NOT NULL AUTO_INCREMENT,
    	`title` CHAR (255) CHARACTER
    SET utf8 COLLATE utf8_general_ci NOT NULL,
     `content` text CHARACTER
    SET utf8 COLLATE utf8_general_ci NULL,
     `time` INT (10) NULL DEFAULT NULL,
     PRIMARY KEY (`id`),
     FULLTEXT (content)
    );
    
    #修改表结构添加全文索引
    ALTER TABLE article ADD FULLTEXT index_content (content);
    
    #直接创建索引
    CREATE FULLTEXT INDEX index_content ON article (content);

    4.复合索引

         联合索引又叫复合索引。对于复合索引:Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是最左侧部分。例如索引是key index (a,b,c). 可以支持a | a,b| a,b,c 3种组合进行查找,但不支持 b,c进行查找 .当最左侧字段是常量引用时,索引就十分有效。

         利用索引中的附加列,您可以缩小搜索的范围,但使用一个具有两列的索引 不同于使用两个单独的索引。复合索引的结构与电话簿类似,人名由姓和名构成,电话簿首先按姓氏对进行排序,然后按名字对有相同姓氏的人进行排序。如果您知 道姓,电话簿将非常有用;如果您知道姓和名,电话簿则更为有用,但如果您只知道名不姓,电话簿将没有用处。
    所以说创建复合索引时,应该仔细考虑列的顺序。对索引中的所有列执行搜索或仅对前几列执行搜索时,复合索引非常有用;仅对后面的任意列执行搜索时,复合索引则没有用处.

         image

    ALTER TABLE article ADD INDEX index_titme_time (title(50), time(10));

    建立这样的组合索引,其实是相当于分别建立了下面两组组合索引:

    –title,time

    –title

         为什么没有time这样的组合索引呢?这是因为MySQL组合索引“最左前缀”的结果。简单的理解就是只从最左面的开始组合。并不是只要包含这两列的查询都会用到该组合索引,如下面的几个SQL所示:

    #会使用到上面的索引
    SELECT * FROM article WHREE title='测试' AND time=1234567890;
    SELECT * FROM article WHREE utitle='测试';
    
    #不会使用上面的索引
    SELECT * FROM article WHREE time=1234567890;
  • 相关阅读:
    写给QA/软件测试新人
    互联网产品线上故障管理规范
    爬了世纪佳缘后发现了一个秘密,世纪佳缘找对象靠谱吗?
    网传美团今年应届生年薪 35w+,严重倒挂老员工,为什么互联网大厂校招的薪资一年比一年高?...
    MySQL大表优化方案
    步入AI领域2年连升3级,我只是找对了学习方法而已……
    BZOJ 4008 亚瑟王(概率DP 奥妙重重)
    BZOJ 4318 OSU! (概率DP)
    BZOJ 3812 主旋律 (状压DP+容斥) + NOIP模拟赛 巨神兵(obelisk)(状压DP)
    BZOJ 4145 [AMPPZ2014]The Prices (状压DP)
  • 原文地址:https://www.cnblogs.com/yangang2013/p/5677665.html
Copyright © 2011-2022 走看看