zoukankan      html  css  js  c++  java
  • 关于数据库优化1——关于count(1),count(*),和count(列名)的区别,和关于表中字段顺序的问题

    1.关于count(1),count(*),和count(列名)的区别

      相信大家总是在工作中,或者是学习中对于count()的到底怎么用更快。一直有很大的疑问,有的人说count(*)更快,也有的人说count(列名)更快,那到底是谁更快,我将会在本文中详细介绍一下到底是count(1),count(*)和count(列明)的区别,和更适合的使用场景。   

      往常在工作中有人会说count(1)比count(*)会快,或者相反,首先这个结论肯定是错的,实际上count(1)和count(*)并没有区别

      接下来,我们来对比一下count(*)和count(列)到底谁更快一些

      首先我们执行以下sql,来看一下执行效率(下面sql针对的是ORACLE数据库,大致逻辑为先删除t别,然后在根据dba_objects创建t表,在更新t表根据rownum)

     1 drop table t purge;
     2 create table t as select * from dba_objects;
     3 --alter table T modify object_id  null;
     4 update t set object_id =rownum ;
     5 set timing on 
     6 set linesize 1000
     7 set autotrace on --开启跟踪
     8 
     9 select count(*) from t;
    10 /
    11 select count(object_id) from t;
    12 /

      然后咱们分别看一下“select count(*) from t”和“select count(object_id) from t语句的执行计划。(执行计划是指sql的一个执行顺序和耗费的资源,耗费的资源越少越快,如果在plsql中,使用F8可以查看sql的执行计划)

      

      

      通过我们执行sql的实验来说,count(*)和count(列)消耗的资源是一样的,说面他们是一样快的,但是真的是这样么。那么咱们接着以下的实验。

      这次咱们给object_id这一列加一个索引试一下。我们执行一下索引sql

    1 create index idx_object_id on t(object_id);
    2 select count(*) from t;
    3 /
    4 
    5 
    6 select count(object_id) from t;
    7 /

      然后我们在分别看一下两条sql的执行计划

      

      

      通过我们建完索引后。突然发现count(列)变快了好多,但是count(*)还是和以前一样的。这说明了count(列)可以用到索引,而count(*)不行,但是真的这样么,咱们在往下看。

      接下来我们给object_id这个字段加上不可为空条件。我们执行以下sql

    1 create index idx_object_id on t(object_id);
    2 select count(*) from t;
    3 /
    4 
    5 
    6 select count(object_id) from t;
    7 /

      接下来我们在来看一下count(*)的执行计划

      

      现在count(*)和count(列)一样快了,由此我们得出了这个结论:count(列)和count(*)其实一样快,如果索引列是非空的,count(*)可用到索引,此时一样快。

      总结:但是真的结论是这样的么。其实不然。其实在数据库中count(*)和count(列)根本就是不等价的,count(*)是针对于全表的而count(列)是针对于某一列的,如果此列值为空的话,count(列)是不会统计这一行的。所以两者根本没有可比性,性能比较首先要考虑写法等价,这两个语句根本就不等价。也就失去了去比较的意义!!!


    2.关于表中字段顺序的问题

      首先我们建一张有25个字段的表并加入数据在进行count(*)和count(列)比较。由于建表语句和插入语句和上面雷同。就不贴出代码了。

           然后我们分别执行count(*)和count每一列的操作来看一下到底谁更快一些,由于执行计划太多,就不一一贴图了。我整理了一个excel来给大家看一下执行的结果

      

      经过实验我们看出,count(列)越往后。我们的执行效率越慢。所以,我们得出以下结论:

            1.列的偏移量决定性能,列越靠后,访问的开销越大

          2.由于count(*)的算法与列偏移量无关,所以count(*)最快。

      总结:所以我们在开发设计中。越常用的列,要放在靠前的位置。而cout(*)和count(列)是两个不等价的用法,所以无法比较哪个性能更好,在实际的sql优化场景中要根据当时的业务场景再去考虑是使用count(*)还是count(列)(其中的区别上文有提到)。

      

      

      

      

      

      

    这些观点只代表自己观点,本人写的东西只是自己在工作或者生活中遇到的问题和大家分享一下,方便自己和大家的查阅,目前博客主要更新两大类。在用微服务中遇到的问题,技术的整理和数据库优化方面。以后还会增加其他板块。如有错误的地方请联系博主会及时更正。
  • 相关阅读:
    为什么C++(感谢waterwalk翻译)
    容器操作笔记
    如此理解面向对象编程
    C++初学者小细节(不定时更新)
    Sales_item 专题
    10步让你成为更优秀的程序员
    C++ PRIMER 笔记
    C++ 异常处理
    透明度 rgba 和 opacity 的区别
    盒模型
  • 原文地址:https://www.cnblogs.com/Caucasian/p/7041061.html
Copyright © 2011-2022 走看看