zoukankan      html  css  js  c++  java
  • sql语句的group by 与 inner join

    一.理解group by和聚合函数

     

      先来看下表1,表名为test:

     

    表1

      执行如下SQL语句:

    1
    2
    SELECT name FROM test
    GROUP BY name

      你应该很容易知道运行的结果,没错,就是下表2:

     

    表2

      可是为了能够更好的理解“group by”多个列“和”聚合函数“的应用,我建议在思考的过程中,由表1到表2的过程中,增加一个虚构的中间表:虚拟表3。下面说说如何来思考上面SQL语句执行情况:

    1.FROM test:该句执行后,应该结果和表1一样,就是原来的表。

    2.FROM test Group BY name:该句执行后,我们想象生成了虚拟表3,如下所图所示,生成过程是这样的:group by name,那么找name那一列,具有相同name值的行,合并成一行,如对于name值为aa的,那么<1 aa 2>与<2 aa 3>两行合并成1行,所有的id值和number值写到一个单元格里面。

     

    3.接下来就要针对虚拟表3执行Select语句了:

    (1)如果执行select *的话,那么返回的结果应该是虚拟表3,可是id和number中有的单元格里面的内容是多个值的,而关系数据库就是基于关系的,单元格中是不允许有多个值的,所以你看,执行select * 语句就报错了。

    (2)我们再看name列,每个单元格只有一个数据,所以我们select name的话,就没有问题了。为什么name列每个单元格只有一个值呢,因为我们就是用name列来group by的。

    (3)那么对于id和number里面的单元格有多个数据的情况怎么办呢?答案就是用聚合函数,聚合函数就用来输入多个数据,输出一个数据的。如cout(id),sum(number),而每个聚合函数的输入就是每一个多数据的单元格。

    (4)例如我们执行select name,sum(number) from test group by name,那么sum就对虚拟表3的number列的每个单元格进行sum操作,例如对name为aa的那一行的number列执行sum操作,即2+3,返回5,最后执行结果如下:

     (5)group by 多个字段该怎么理解呢:如group by name,number,我们可以把name和number 看成一个整体字段,以他们整体来进行分组的。如下图

    (6)接下来就可以配合select和聚合函数进行操作了。如执行select name,sum(id) from test group by name,number,结果如下图:

    实际的例子,如下两表

    下面这个sql语句

    --.统计每个系的学生人数。
    SELECT Sdept 系别,COUNT(*) 人数
    FROM student 
    WHERE Sdept IN(SELECT DISTINCT Sdept FROM student) 
    GROUP BY Sdept              


    --.统计每门课程的修课人数和考试最高分。
    SELECT Cname 课程名,COUNT(*) 修课人数,MAX(Grade) 考试最高分
    FROM SC,course
    WHERE SC.Cno IN(SELECT DISTINCT Cno FROM SC ) AND course.Cno=SC.Cno
    GROUP BY course.Cname            //group by一定要加的,且其后可跟多个列

    二. inner join 与 where子句有什么区别?

    1 WHERE子句中使用的连接语句,在数据库语言中,被称为隐性连接。INNER JOIN……ON子句产生的连接称为显性连接。(其他JOIN参数也是显性连接)WHERE和INNER JOIN产生的连接关系,没有本质区别,结果也一样。但是!隐性连接随着数据库语言的规范和发展,已经逐渐被淘汰,比较新的数据库语言基本上已经抛弃了隐性连接,全部采用显性连接了。 
      2无论怎么连接,都可以用join子句,但是连接同一个表的时候,注意要定义别名,否则产生错误! 
      a> inner join:理解为“有效连接”,两张表中都有的数据才会显示left join:理解为“有左显示”,比如on a.field=b.field,则显示a表中存在的全部数据及a\b中都有的数据,A中有、B没有的数据以null显示 
      b> right join:理解为“有右显示”,比如on a.field=b.field,则显示B表中存在的全部数据及a\b中都有的数据,B中有、A没有的数据以null显示 
      c> full join:理解为“全连接”,两张表中所有数据都显示,实际就是inner+(left-inner)+(right-inner) 
      3 join可以分主次表 外联接有三种类型:完全外联,左联,右联. 
      完全外联包含两张表的所有记录. 
      左联是以左边的表为主,右边的为辅,右联则相反 
      4一般要使得数据库查询语句性能好点遵循一下原则: 
      在做表与表的连接查询时,大表在前,小表在后 
      不使用表别名,通过字段前缀区分不同表中的字段 
      查询条件中的限制条件要写在表连接条件前 
       尽量使用索引的字段做为查询条件 

    另附一个sql学习推荐https://www.zhihu.com/question/19552975

  • 相关阅读:
    javascript定义
    JavaScript学习笔记
    PostgreSQL数据库配置
    python 时间戳转时间 timestamp to time
    WebGIS:Vue+Flask+PostGIS+Geoserver开发环境配置
    GeoServer环境配置
    Vue前端环境配置
    Flask后端环境配置
    1.顺序表
    汇编语法--AT&T VS. intel
  • 原文地址:https://www.cnblogs.com/wangshaowei/p/9299797.html
Copyright © 2011-2022 走看看