zoukankan      html  css  js  c++  java
  • mysql 必知必会整理—子查询与连接表[八]

    前言

    简单介绍一下子查询与连接表。

    正文

    什么是子查询呢?

    列出订购物品TNT2的所有客户。

    select cust_id
    from orders
    where order_num IN (SELECT order_num
    
    from orderitems
    where prod_id = 'TNT2'
    )
    

    格式化SQL 包含子查询的SELECT语句难以阅读和调试,特别是它们较为复杂时更是如此。如上所示把子查询分解为多行并且适当地进行缩进,能极大地简化子查询的使用。

    对于能嵌套的子查询的数目没有限制,不过在实际使用时由于性能的限制,不能嵌套太多的子查询。

    注:

    列必须匹配 在WHERE子句中使用子查询(如这里所示),应
    该保证SELECT语句具有与WHERE子句中相同数目的列。通常,
    子查询将返回单个列并且与单个列匹配,但如果需要也可以使用多个列。
    

    除了子查询可以放在where 中,还可以放到select中去。

    假如需要显示customers表中每个客户的订单总数。

    select cust_name, cust_state, (SELECT COUNT(*) FROM orders WHERE orders.cust_id = customers.cust_id) as orders
    from customers
    ORDER BY cust_name
    

    mysql 的运行过程是先执行了customers 中查出来了cust_name,cust_state,cust_id,然后执行5次子查询,查出来了结果。

    逐渐增加子查询来建立查询 用子查询测试和调试查询很有
    技巧性,特别是在这些语句的复杂性不断增加的情况下更是如
    此。用子查询建立(和测试)查询的最可靠的方法是逐渐进行,
    这与MySQL处理它们的方法非常相同。首先,建立和测试最
    内层的查询。然后,用硬编码数据建立和测试外层查询,并且
    仅在确认它正常后才嵌入子查询。这时,再次测试它。对于要
    增加的每个查询,重复这些步骤。这样做仅给构造查询增加了
    一点点时间,但节省了以后(找出查询为什么不正常)的大量
    时间,并且极大地提高了查询一开始就正常工作的可能性
    

    下面介绍一下联结:

    SELECT vend_name,prod_name,prod_price
    FROM vendors,products
    WHERE  vendors.vend_id=products.vend_id
    ORDER BY vend_name, prod_name
    

    注:

    完全限定列名 在引用的列可能出现二义性时,必须使用完
    全限定列名(用一个点分隔的表名和列名)。如果引用一个
    没有用表名限制的具有二义性的列名,MySQL将返回错误。
    

    这里使用where 语句进行联接的作用:

    利用WHERE子句建立联结关系似乎有点奇怪,但实际上,有一个很充
    分的理由。请记住,在一条SELECT语句中联结几个表时,相应的关系是
    在运行中构造的。在数据库表的定义中不存在能指示MySQL如何对表进
    行联结的东西。你必须自己做这件事情。在联结两个表时,你实际上做
    的是将第一个表中的每一行与第二个表中的每一行配对。WHERE子句作为
    过滤条件,它只包含那些匹配给定条件(这里是联结条件)的行。没有
    WHERE子句,第一个表中的每个行将与第二个表中的每个行配对,而不管
    它们逻辑上是否可以配在一起。
    

    注:

    笛卡儿积(cartesian product) 由没有联结条件的表关系返回
    的结果为笛卡儿积。检索出的行的数目将是第一个表中的行数乘
    以第二个表中的行数。
    

    目前为止所用的联结称为等值联结(equijoin),它基于两个表之间的
    相等测试。这种联结也称为内部联结。其实,对于这种联结可以使用稍
    微不同的语法来明确指定联结的类型。下面的SELECT语句返回与前面例
    子完全相同的数据:

    SELECT vend_name,prod_name,prod_price
    FROM vendors INNER JOIN products on vendors.vend_id = products.vend_id
    ORDER BY vend_name, prod_name
    

    使用哪种语法 ANSI SQL规范首选INNER JOIN语法。此外,
    尽管使用WHERE子句定义联结的确比较简单,但是使用明确的
    联结语法能够确保不会忘记联结条件,有时候这样做也能影响
    性能。

    性能考虑 MySQL在运行时关联指定的每个表以处理联结。
    这种处理可能是非常耗费资源的,因此应该仔细,不要联结
    不必要的表。联结的表越多,性能下降越厉害。

    多做实验 正如所见,为执行任一给定的SQL操作,一般存在
    不止一种方法。很少有绝对正确或绝对错误的方法。性能可能
    会受操作类型、表中数据量、是否存在索引或键以及其他一些
    条件的影响。因此,有必要对不同的选择机制进行实验,以找
    出最适合具体情况的方法。
    

    我们同样可以使用多张表的联接,但是有一个问题,因为表名多个地方使用,故而表名很长,那么可以使用表的别名。

    如:

    下面介绍一下几种特殊的连接。

    自联接:

    假如你发现某物品(其ID为DTNTR)存在问题,因此想知道生产该物
    品的供应商生产的其他物品是否也存在这些问题。此查询要求首先找到
    生产ID为DTNTR的物品的供应商,然后找出这个供应商生产的其他物品。
    下面是解决此问题的一种方法:

    你可能使用子查询,这样做:

    select prod_id,prod_name
    from products
    where vend_id = (SELECT vend_id from products WHERE prod_id ='DTNTR')
    
    

    同样可以使用自联接。

    select t1.prod_id,t2.prod_name
    from products t1, products t2
    where t1.vend_id = t2.vend_id and t1.prod_id='DTNTR'
    

    用自联结而不用子查询 自联结通常作为外部语句用来替代
    从相同表中检索数据时使用的子查询语句。虽然最终的结果是
    相同的,但有时候处理联结远比处理子查询快得多。应该试一
    下两种方法,以确定哪一种的性能更好。
    

    自然联接:

    无论何时对表进行联结,应该至少有一个列出现在不止一个表中(被
    联结的列)。标准的联结(前一章中介绍的内部联结)返回所有数据,甚
    至相同的列多次出现。自然联结排除多次出现,使每个列只返回一次。

    怎样完成这项工作呢?答案是,系统不完成这项工作,由你自己完
    成它。自然联结是这样一种联结,其中你只能选择那些唯一的列。这一
    般是通过对表使用通配符(SELECT *),对所有其他表的列使用明确的子
    集来完成的。

    外部联结:

    许多联结将一个表中的行与另一个表中的行相关联。但有时候会需
    要包含没有关联行的那些行。例如,可能需要使用联结来完成以下工作:

    比如:对每个客户下了多少订单进行计数,包括那些至今尚未下订单的
    客户;

    SELECT customers.cust_id,order_num
    from customers LEFT OUTER JOIN orders on customers.cust_id = orders.cust_id
    

    这条SELECT语句使用了关键字OUTER JOIN来指定联结的类型(而不是在WHERE子句中指定)。但是,与内部联结关联两个表中的行不同的是,外部联结还包括没
    有关联行的行。在使用OUTER JOIN语法时,必须使用RIGHT或LEFT关键字
    指定包括其所有行的表(RIGHT指出的是OUTER JOIN右边的表,而LEFT
    指出的是OUTER JOIN左边的表)。

    使用带聚集函数的联结

    要检索所有客户及每个客户所下的订单数:

    SELECT customers.cust_id, COUNT(order_num) as num
    from customers LEFT OUTER JOIN orders on customers.cust_id = orders.cust_id
    GROUP BY cust_id
    

    在总结关于联结的这两章前,有必要汇总一下关于联结及其使用的
    某些要点。

    注意点:
    1.注意所使用的联结类型。一般我们使用内部联结,但使用外部联结也是有效的。
    2.保证使用正确的联结条件,否则将返回不正确的数据。
    3.应该总是提供联结条件,否则会得出笛卡儿积。
    4.在一个联结中可以包含多个表,甚至对于每个联结可以采用不同的联结类型。虽然这样做是合法的,一般也很有用,但应该在一

    起测试它们前,分别测试每个联结。这将使故障排除更为简单。

    下一节组合查询和全文搜索。

  • 相关阅读:
    POJ 2947:Widget Factory 求同余方程
    高斯消元几道入门题总结POJ1222&&POJ1681&&POJ1830&&POJ2065&&POJ3185
    POJ 1166:The Clocks
    神经网络 --学习之路,资料汇编
    机器学习 入门资料汇编
    无符号 coredump调试
    CentOS 6.3 升级软件 gcc等,并安装部署DNN环境 (未完成,不完整)
    OpenCL size_t error
    Nervanasys --> pycuda --> installation
    tmux.conf
  • 原文地址:https://www.cnblogs.com/aoximin/p/15336211.html
Copyright © 2011-2022 走看看