zoukankan      html  css  js  c++  java
  • 大话程序猿眼中的聚集索引和非聚集索引

     博客园将不进行维护,转站到我的个人博文:地址


        OS:这里对聚集所以和非聚集所以的概念说明就不叙述了。
        身为程序猿,在平时的开发中,数据的操作是经常要做的事情,大多数公司是没有DBA的,程序开发人员的在操作数据的时候根本不会去看SQL语句执行的效率,所以就时常的遇到大数据的情况下查询数据库总会遇到各种缓慢Loading的情况。
        从用户的角度来说,我裤子都脱了,你给我看这个?
        从技术的角度来说,我他么这么流弊,怎么可以让查询这么卡。
        因此,作为程序猿的我们,在没有DBA的情况下,要掌握最基本的加快数据库查询的意识和技能;
        
        直接上实例,动态说明,有图有真相,简单粗暴。
        这里我们先创建一张表:   
        
     CREATE TABLE [dbo].[Student](
     [ID] [INT] IDENTITY(1,1) NOT NULL,
     [Name] [NVARCHAR](50) NOT NULL,
     [Age] [INT] NOT NULL,
     [Height] [INT] NOT NULL,
     [Address] [NVARCHAR](100) NULL,
     [Class] [NVARCHAR](50) NOT NULL,
     [EntranceDateTime] [DATETIME] NOT NULL,
     CONSTRAINT [PK_Student] PRIMARY KEY CLUSTERED
    (
     [ID] ASC
    )WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
    ) ON [PRIMARY]
     
    GO
     
    ALTER TABLE [dbo].[Student] ADD CONSTRAINT [DF_Student_EntranceDateTime] DEFAULT (GETDATE()) FOR [EntranceDateTime]
    GO

      往表里插入 500万数据:

     
    DECLARE @i INT;
    SET @i=1;
    WHILE(@i<5000001)BEGIN
     
    INSERT INTO dbo.Student(Name,Age,Height,[Address],Class,EntranceDateTime)
    VALUES('yang_'+CONVERT(NVARCHAR(10),@i),RAND()*10+7,RAND()*100+50,'厦门土豪小区1座'+CONVERT(NVARCHAR(10),CONVERT(INT,RAND()*100+1))+'号',CONVERT(NVARCHAR(10),CONVERT(INT,RAND()*6+1))+'年级',GETDATE())
    SET @i=@i+1;
    END
     
    1.合理的使用索引提高查询速度
            查询表里,所有年龄为10的名字,如图:
     
    从图中可以看出,使用了聚集索引扫描,逻辑读取55057次
     
     
    添加索引:
    CREATE NONCLUSTERED INDEX [IX_Student_Age_Name] ON [dbo].[Student]
    (
     [Age] ASC
    )
    INCLUDE ( [Name]) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
    GO 、
     
     
    很明显的看出来,查询优化器使用了索引查找,逻辑读取次数变少为:2411,很可观。
    (在执行计划中看到索引查找,就是说明索引被使用到了,如果出现索引扫描就说明索引没有被使用到)
    这里注意:
        误区:我添加了索引查询速度就一定比表扫描来得快,并且索引一定会被使用
        我的总结理解:一,索引不一定比扫描快,在数据量少的情况下,使用表扫描会比索引来得快,二,添加了索引不一定会被使用,首先要知道sqlserver在执行语句的时候会选择最优耗能少的方案去执行,在索引无法达到最高效的情况下,就不会被使用到。
    比如:
            下面的查询操作,就没有使用到索引了,而是使用到了聚集索引扫描
         
      
           出现上面的情况是为什么呢?
           因为我创建的索引里,只有覆盖了Name字段,现在我查询的是Address字段,不在索引的覆盖中,那么查询优化器在执行语句的时候就没有使用到了索引,选择了开销更小的聚集索引扫描
            
            但是我就是这么任性,要强制要求使用索引来查询,结果如截图: 
     
          这个结果就很明显了,逻辑读次数,和扫描次数多了很多。计划里也给了提示,让我们索引覆盖Address字段
    2.合理的使用聚集索引
        我们在添加表的主键的时候就会默认的将主键添加为聚集索引,但是并不是聚集索引就一定要是主键字段,一张表就只能添加一个聚集索引,所以合理的利用聚集索引的特性,可以很大的提高查询速度。
        一般我们都是在自增的ID设置为主键,但是又很少会对ID进行查询操作,更多的会对表中的其他字段进行查询,比如:时间字段。
        这个时候就可以将聚集索引加到时间字段里,你会发现整个查询就会高效很多。
     
    3,4,5,6
    未完待续。。。
     
    -----------------------------------[我只是美丽的分割线]-----------------------------------------
    索引的优缺点
        优点: 加快访问速度, 加强行的唯一性
        缺点: 带索引的表在数据库中需要更多的存储空间,操纵数据的命令需要更长的处理时间,因为它们需要对索引进行更新
     
    创建索引的指导原则
    请按照下列标准选择建立索引的列:
            该列用于频繁搜索
            该列用于对数据进行排序
    请不要使用下面的列创建索引:
            列中仅包含几个不同的值。
            表中仅包含几行。为小型表创建索引可能不太划算,因为SQL Server在索引中搜索数据所花的时间比在表中逐行搜索所花的时间更长
     
     
    假设我们在Col1列上创建了单列索引,可以在以下谓词上进行索引查找:
     
    Ø [Col1] = 3.14
     
    Ø [Col1] > 100
     
    Ø [Col1] BETWEEN 0 AND 99
     
    Ø [Col1] LIKE 'abc%'
     
    Ø [Col1] IN (2, 3, 5, 7)
     
    然而,在以下谓词上将不能使用索引查找:
     
    Ø ABS([Col1]) = 1
     
    Ø [Col1] + 1 = 9
     
    Ø [Col1] LIKE '%abc'
    -----------------------------------[我只是美丽的分割线]-----------------------------------------
  • 相关阅读:
    我的第一个作业
    团队任务3:第一次冲刺
    课后作业3:个人项目(词频统计及其效能分析)
    课后作业2:个人项目
    一切的开始,从未有过的改变——课后作业1:准备
    Fiddler 添加IP显示、响应时间功能
    Jmeter所有结果分析
    云盘资源爬取利器 fmv
    python 中的 sys , os 模块用法总结
    Python 编写登录接口
  • 原文地址:https://www.cnblogs.com/SFLYQ/p/4381414.html
Copyright © 2011-2022 走看看