zoukankan      html  css  js  c++  java
  • 【MySQL】汇总数据

    第12章 汇总数据

    学习什么是SQL的聚集函数以及如何利用它们汇总表的数据

    简单记录 - MySQL必知必会 - [英]Ben Forta

    聚集函数 汇总数据

    1、聚集函数

    我们经常需要汇总数据而不用把它们实际检索出来,为此MySQL提供了专门的函数。使用这些函数,MySQL查询可用于检索数据,以便分析和报表生成。实际想要的是汇总信息

    为方便这种类型的检索,MySQL给出了5个聚集函数,见下所示。这些函数能进行汇总信息。

    SQL聚集函数

    函数   				说明
    AVG()				返回某列的平均值
    COUNT()				返回某列的行数
    MAX()				返回某列的最大值
    MIN()				返回某列的最小
    SUM()				返回某列之和 
    

    avg()、count()、max()、min()、sum()

    聚集函数(aggregate function):

    运行在行组上,计算和返回单个值的函数。

    以下是各函数的使用说明。

    1.1、AVG()函数 avg()

    AVG()通过对表中行数计数并计算特定列值之和,求得该列的平均值

    AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。特定列值之和 / 计数行数 = 求得该列的平均值

    AVG()

    下面的例子使用AVG()返回products表中所有产品的平均价格:

    mysql> SELECT AVG(prod_price) AS avg_price FROM products;
    +-----------+
    | avg_price |
    +-----------+
    | 16.133571 |
    +-----------+
    1 row in set (0.01 sec)
    
    mysql>
    

    AVG(prod_price) AS avg_price avg_price是一个别名。

    AVG()也可以用来确定特定列或行的平均值。(不只是某列所有行的平均值),加个条件来过滤。

    下面的例子返回特定供应商所提供产品的平均价格:

    mysql> SELECT AVG(prod_price) AS avg_price FROM products WHERE vend_id = 1003;
    +-----------+
    | avg_price |
    +-----------+
    | 13.212857 |
    +-----------+
    1 row in set (0.00 sec)
    
    mysql> SELECT vend_id,prod_price FROM products WHERE vend_id = 1003;
    +---------+------------+
    | vend_id | prod_price |
    +---------+------------+
    |    1003 |      13.00 |
    |    1003 |      10.00 |
    |    1003 |       2.50 |
    |    1003 |      50.00 |
    |    1003 |       4.49 |
    |    1003 |       2.50 |
    |    1003 |      10.00 |
    +---------+------------+
    7 rows in set (0.00 sec)
    
    mysql>
    

    多了个WHERE子句。此WHERE子句仅过滤出vend_id为1003的产品,因此avg_price中返回的值只是该供应商的产品的平均值。

    AVG()只用于单个列,只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。avg(列名),avg(列名)...

    注意:NULL值 AVG()函数忽略列值为NULL的行。不计算。

    1.2、COUNT()函数 count()

    COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。COUNT()函数有两种使用方式。

    • 使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。COUNT(*) 统计所有的行的数目
    • 使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。COUNT()技术忽略NULL

    下面的例子返回customers表中客户的总数:

    mysql> SELECT COUNT(*) AS num_cust FROM customers;
    +----------+
    | num_cust |
    +----------+
    |        5 |
    +----------+
    1 row in set (0.00 sec)
    
    mysql> SELECT * FROM customers;
    +---------+----------------+---------------------+-----------+------------+----------+--------------+--------------+---------------------+
    | cust_id | cust_name      | cust_address        | cust_city | cust_state | cust_zip | cust_country | cust_contact | cust_email          |
    +---------+----------------+---------------------+-----------+------------+----------+--------------+--------------+---------------------+
    |   10001 | Coyote Inc.    | 200 Maple Lane      | Detroit   | MI         | 44444    | USA          | Y Lee        | ylee@coyote.com     |
    |   10002 | Mouse House    | 333 Fromage Lane    | Columbus  | OH         | 43333    | USA          | Jerry Mouse  | NULL                |
    |   10003 | Wascals        | 1 Sunny Place       | Muncie    | IN         | 42222    | USA          | Jim Jones    | rabbit@wascally.com |
    |   10004 | Yosemite Place | 829 Riverside Drive | Phoenix   | AZ         | 88888    | USA          | Y Sam        | sam@yosemite.com    |
    |   10005 | E Fudd         | 4545 53rd Street    | Chicago   | IL         | 54545    | USA          | E Fudd       | NULL                |
    +---------+----------------+---------------------+-----------+------------+----------+--------------+--------------+---------------------+
    5 rows in set (0.00 sec)
    
    mysql>
    

    SELECT COUNT(*) AS num_cust FROM customers;利用COUNT(*)对所有行计数,不管行中各列有什么值,计数值在num_cust中返回。

    下面的例子只对具有电子邮件地址的客户计数:

    mysql> SELECT COUNT(cust_email) AS num_cust FROM customers;
    +----------+
    | num_cust |
    +----------+
    |        3 |
    +----------+
    1 row in set (0.00 sec)
    
    mysql>
    

    分析这条SELECT语句使用COUNT(cust_email)cust_email列中有值的行进行计数。在此例子中,cust_email的计数为3(表示5个客户中只有3个客户有电子邮件地址,2个没有电子邮件地址)。

    注意:NULL值 如果指定列名,则指定列的值为空的行被COUNT()函数忽略,但如果COUNT()函数中用的是星号(*),则不忽略。

    1.3、 MAX()函数 max()

    MAX()返回指定列中的最大值。MAX()要求指定列名,如下所示:

    mysql> SELECT MAX(prod_price) AS max_price FROM products;
    +-----------+
    | max_price |
    +-----------+
    |     55.00 |
    +-----------+
    1 row in set (0.01 sec)
    
    mysql> SELECT prod_price FROM products;
    +------------+
    | prod_price |
    +------------+
    |       5.99 |
    |       9.99 |
    |      14.99 |
    |      13.00 |
    |      10.00 |
    |       2.50 |
    |       3.42 |
    |      35.00 |
    |      55.00 |
    |       8.99 |
    |      50.00 |
    |       4.49 |
    |       2.50 |
    |      10.00 |
    +------------+
    14 rows in set (0.00 sec)
    
    mysql>
    

    这里,MAX()返回products表中最贵的物品的价格。SELECT MAX(prod_price) AS max_price FROM最高的物品的价格。

    提示:对非数值数据使用MAX()

    虽然MAX()一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。

    mysql> SELECT MAX(prod_name) FROM products;
    +----------------+
    | MAX(prod_name) |
    +----------------+
    | TNT (5 sticks) |
    +----------------+
    1 row in set (0.00 sec)
    
    mysql> SELECT prod_name FROM products;
    +----------------+
    | prod_name      |
    +----------------+
    | .5 ton anvil   |
    | 1 ton anvil    |
    | 2 ton anvil    |
    | Detonator      |
    | Bird seed      |
    | Carrots        |
    | Fuses          |
    | JetPack 1000   |
    | JetPack 2000   |
    | Oil can        |
    | Safe           |
    | Sling          |
    | TNT (1 stick)  |
    | TNT (5 sticks) |
    +----------------+
    14 rows in set (0.00 sec)
    
    mysql>
    

    确实max()参数为字符串时返回的是最后一个。

    NULL值 MAX()函数忽略列值为NULL的行。

    1.4、MIN()函数 min()

    MIN()的功能正好与MAX()功能相反,它返回指定列的最小值。与MAX()一样,MIN()要求指定列名,例子如下所示:

    mysql> SELECT prod_price FROM products;
    +------------+
    | prod_price |
    +------------+
    |       5.99 |
    |       9.99 |
    |      14.99 |
    |      13.00 |
    |      10.00 |
    |       2.50 |
    |       3.42 |
    |      35.00 |
    |      55.00 |
    |       8.99 |
    |      50.00 |
    |       4.49 |
    |       2.50 |
    |      10.00 |
    +------------+
    14 rows in set (0.00 sec)
    
    mysql> SELECT MIN(prod_price) AS min_price FROM products;
    +-----------+
    | min_price |
    +-----------+
    |      2.50 |
    +-----------+
    1 row in set (0.00 sec)
    
    mysql>
    
    

    其中MIN()返回products表中最便宜物品的价格。

    对非数值数据使用MIN() MIN()函数与MAX()函数类似,MySQL允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,如果数据按相应的列排序,则MIN()返回最前面的行。

    例子如下:

    mysql> SELECT min(prod_name) FROM products;
    +----------------+
    | min(prod_name) |
    +----------------+
    | .5 ton anvil   |
    +----------------+
    1 row in set (0.00 sec)
    
    mysql> SELECT prod_name FROM products;
    +----------------+
    | prod_name      |
    +----------------+
    | .5 ton anvil   |
    | 1 ton anvil    |
    | 2 ton anvil    |
    | Detonator      |
    | Bird seed      |
    | Carrots        |
    | Fuses          |
    | JetPack 1000   |
    | JetPack 2000   |
    | Oil can        |
    | Safe           |
    | Sling          |
    | TNT (1 stick)  |
    | TNT (5 sticks) |
    +----------------+
    14 rows in set (0.00 sec)
    
    mysql>
    

    NULL值 MIN()函数忽略列值为NULL的行。

    1.5、SUM()函数 sum()

    SUM()用来返回指定列值的和(总计)

    下面举一个例子,orderitems表包含订单中实际的物品,每个物品有相应的数量(quantity)。可如下检索所订购物品的总数(所有quantity值之和):

    mysql> SELECT SUM(quantity) AS items_ordered FROM orderitems WHERE order_num = 20005;
    +---------------+
    | items_ordered |
    +---------------+
    |            19 |
    +---------------+
    1 row in set (0.00 sec)
    
    mysql>
    

    SELECT SUM(quantity) AS items_ordered FROM orderitems WHERE order_num = 20005;函数SUM(quantity)返回订单中所有物品数量之和,WHERE子句保证只统计某个物品订单中的物品。

    SUM()也可以用来合计计算值。在下面的例子中,合计每项物品的item_price*quantity,得出总的订单金额:

    mysql> SELECT SUM(item_price*quantity) AS total_price FROM orderitems WHERE order_num = 20005;
    +-------------+
    | total_price |
    +-------------+
    |      149.87 |
    +-------------+
    1 row in set (0.00 sec)
    
    mysql>
    

    SELECT SUM(item_price*quantity) AS total_price FROM orderitems WHERE order_num = 20005;函数SUM(item_price*quantity)返回订单中所有物品价钱之和,WHERE子句同样保证只统计某个物品订单中的物品。

    在多个列上进行计算

    如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。- + * /

    NULL值 SUM()函数忽略列值为NULL的行。

    2、 聚集不同值

    聚集函数的DISTINCT的使用。distinct

    以上5个聚集函数都可以如下使用:

    • 对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为);
    • 只包含不同的值,指定DISTINCT参数。

    ALL为默认

    ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。

    下面的例子使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的SELECT语句相同,但使用了DISTINCT参数,因此平均值只考虑各个不同的价格(重复的去掉):

    mysql> SELECT AVG(DISTINCT prod_price) AS avg_price FROM products WHERE vend_id = 1003;
    +-----------+
    | avg_price |
    +-----------+
    | 15.998000 |
    +-----------+
    1 row in set (0.01 sec)
    
    mysql>
    

    可以看到,SELECT AVG(DISTINCT prod_price) AS avg_price FROM products WHERE vend_id = 1003;在使用了DISTINCT后,此例子中的avg_price比较高,因为有多个物品具有相同的较低价格。排除它们提升了平均价格。

    注意

    如果指定列名,则DISTINCT只能用于COUNT()。

    DISTINCT不能用于COUNT(*),因此不允许使用COUNT(DISTINCT),否则会产生错误。

    mysql> SELECT COUNT(DISTINCT prod_price)  FROM products WHERE vend_id = 1003;
    +----------------------------+
    | COUNT(DISTINCT prod_price) |
    +----------------------------+
    |                          5 |
    +----------------------------+
    1 row in set (0.01 sec)
    
    mysql> SELECT prod_price  FROM products WHERE vend_id = 1003;
    +------------+
    | prod_price |
    +------------+
    |      13.00 |
    |      10.00 |
    |       2.50 |
    |      50.00 |
    |       4.49 |
    |       2.50 |
    |      10.00 |
    +------------+
    7 rows in set (0.00 sec)
    
    mysql> SELECT COUNT(prod_price)  FROM products WHERE vend_id = 1003;
    +-------------------+
    | COUNT(prod_price) |
    +-------------------+
    |                 7 |
    +-------------------+
    1 row in set (0.00 sec)
    
    mysql> SELECT COUNT(DISTINCT )  FROM products WHERE vend_id = 1003;
    ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near ')  FROM products WHERE vend_id = 1003' at line 1
    mysql>
    

    类似地,DISTINCT必须使用列名,不能用于计算或表达式。

    将DISTINCT用于MIN()和MAX() 虽然DISTINCT从技术上可用于MIN()和MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否包含不同值都是相同的。

    distinct 去掉重复值。

    3、组合聚集函数

    目前为止的所有聚集函数例子都只涉及单个函数。但实际上SELECT语句可根据需要包含多个聚集函数。请看下面的例子:统计products表中物品的数目,产品价格的最低、最高以及平均值

    mysql> SELECT COUNT(*) AS num_items,MIN(prod_price) AS price_min,MAX(prod_price) AS price_max,AVG(prod_price) AS price_avg FROM products;
    +-----------+-----------+-----------+-----------+
    | num_items | price_min | price_max | price_avg |
    +-----------+-----------+-----------+-----------+
    |        14 |      2.50 |     55.00 | 16.133571 |
    +-----------+-----------+-----------+-----------+
    1 row in set (0.00 sec)
    
    mysql>
    

    MIN(prod_price) AS price_min

    ... AS 别名 取别名 在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做并非不合法,但使用唯一的名字会使你的SQL更易于理解和使用(以及将来容易排除故障)。

    4、小结

    聚集函数用来汇总数据。MySQL支持一系列聚集函数,可以用多种方法使用它们以返回所需的结果。这些函数是高效设计的,它们返回结果一般比在自己的客户机应用程序中计算要快得多。毕竟MySQL是数据库管理系统,用来处理数据的。

    AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。

    COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。COUNT()函数有两种使用方式。

    • 使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。COUNT(*) 统计所有的行的数目
    • 使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。COUNT()技术忽略NULL。

    MAX()返回指定列中的最大值。MAX()要求指定列名。

    MIN()的功能正好与MAX()功能相反,它返回指定列的最小值。与MAX()一样,MIN()要求指定列名。

    SUM()用来返回指定列值的和(总计)

    聚集函数的DISTINCT的使用。distinct

    以上5个聚集函数都可以如下使用:

    • 对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为);
    • 只包含不同的值,指定DISTINCT参数。

    distinct 去掉重复值。

    组合聚集函数使用。

  • 相关阅读:
    python-MongoDB 非关系型数据库
    python-爬虫-Beautifulsoup模块
    python-flask-路由匹配源码分析
    python-flask-配置文件的源码分析
    python-爬虫-selenium模块
    python-flask-请求源码流程
    python-爬虫
    iOS开发——创建你自己的Framework
    手把手教你封装下载管理器
    AFNetwork 作用和用法详解
  • 原文地址:https://www.cnblogs.com/liuawen/p/12854055.html
Copyright © 2011-2022 走看看