zoukankan      html  css  js  c++  java
  • 数据库基础知识

    一. 数据库简介和创建

    1. 系统数据库

    在安装好SQL SERVER后,系统会自动安装5个用于维护系统正常运行的系统数据库:
    (1)master:记录了SQL SERVER实例的所有系统级消息,包括实例范围的元数据(如登录帐号)、端点、链接服务器和系统配置设置。
    (2)msdb:供SQL SERVER 代理服务调度报警和作业以及记录操作员的使用,保存关于调度报警、作业、操作员等信息。(备份还原时)
    (3)model:SQL SERVER 实例上创建的所有数据库的模板。
    (4)tempdb:临时数据库,用于保存临时对象或中间结果集,为数据库的排列等操作提供一个临时工作空间。(每次启动都会重新创建)
    (5)Resource:一个只读数据库,包含了SQL SERVER 的所有系统对象。(隐藏的数据库)


    2. 数据库的组成

    2.1 数据文件
    (1)主要数据文件:扩展名为 .mdf ,每个数据库有且只能有一个。
    (2)次要数据文件:扩展名为 .ndf , 可以没有或有多个。

    2.2 日志文件
    扩展名为 .ldf ,用于存放恢复数据库的所有日志信息。

    2.3 数据的存储分配
    (1)数据文件和日志文件的默认存放位置为:Programe FilesMicrosoft SQL ServerMSSQL.1MSSQLData文件夹。
    (2)数据的存储分配单位是数据页。一页表是一块8KB的连续磁盘空间。
    (3)页是存储数据的最小空间分配单位,页的大小决定了数据库表中一行数据的最大大小。


    3. SQL语句 数据库操作

    (1)创建数据库

    CREATE  DATABASE database_name




    二. SQL基础

    SQL(Structured Query Language,结构化查询语言)是用户操作关系数据库的通用语言。

    1. SQL功能概述

    这里写图片描述


    2. 系统提供的数据类型

    2.1 数值数据类型

    数据类型说明存储空间
    bit bit数据类型是整型,其值只能是0、1或空值。这种数据类型用于存储只有两种可能值的数据,如Yes 或No、True 或False 、On 或Off. (很省空间的一种数据类型,如果能够满足需求应该尽量多用。) 1字节
    tinyint tinyint 数据类型能存储从0到255 之间的整数。它在你只打算存储有限数目的数值时很有用。 1字节
    smallint smallint 数据类型可以存储从- 2的15次幂(-32768)到2的15次幂(32767)之间的整数。这种数据类型对存储一些常限定在特定范围内的数值型数据非常有用。(如果tinyint类型太单调不能满足您的需求,您可以考虑用smallint类型,因为这个类型相对也是比较安全的,不接受恶意脚本内容的嵌入。) 2字节
    int int 数据类型可以存储从- 2的31次幂(-2147483648)到2的31次幂 (2147483 647)之间的整数。存储到数据库的几乎所有数值型的数据都可以用这种数据类型 4个字节
    numeric(p,s) 或 decimal(p,s) 数据类型能用来存储从-10的38次幂-1到10的38次幂-1的固定精度和范围的数值型数据。使用这种数据类型时,必须指定范围和精度。 范围是小数点左右所能存储的数字的总位数。精度是小数点右边存储的数字的位数 最多17个字节

    2.2 普通编码字符串类型

    数据类型说明存储空间
    char(n) char数据类型用来存储指定长度的定长非统一编码型的数据,n表示字符串的最大长度,取值范围为1~8000 (若实际字符串控件小于n,系统自动在后面补空格) n字节_______
    varchar(n) 可变长度的字符串类型,n表示字符串的最大长度,取值范围为1~8000。 字符数+2字节额外开销
    text text 数据类型用来存储大量的非统一编码型字符数据。这种数据类型最多可以有231-1或20亿个字符. 每个字符一个字节

    char 和 varchar的区别:
    若某列数据类型为varchar(20),存字符串”Jone”时,只占用4个字节,而char(20)会在为填满的空间中填写空格。所以, varchar类型比char类型更节省空间,但它的开销会大一些,处理速度也慢一些。因此,n值比较小(小于4),用char类型更好些。


    2.3 统一编码字符串类型(Unicode)

    数据类型说明存储空间
    nchar(n) nchar 数据类型用来存储定长统一编码字符型数据。统一编码用双字节结构来存储每个字符,而不是用单字节(普通文本中的情况)。它允许大量的扩展字符。此数据类型能存储4000种字符,使用的字节空间上增加了一倍. 2n字节_______
    nvarchar(n) nvarchar 数据类型用作变长的统一编码字符型数据。此数据类型能存储4000种字符,使用的字节空间增加了一倍. 字符数+2字节额外开销
    ntext 最多可存储2的30次方-1将近10亿个字符 每个字符两个字节





    三. SQL数据操作语言

    1.数据查询语句

    1.1 查询语句的基本结构

    SELECT <目标列名序列>  --需要哪些列
        From <表名>      --来自哪张表
        [WHERE <行选择条件>]
        [GROUP BY <分组依据列>]
        [HAVING <组>]
        [ORDER BY <排序依据列>]
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    SELECT子句用于指定输出的字段;
    FROM子句用于指定数据的来源;
    WHERE子句用于指定数据的选择条件;
    GROUP BY子句用于对检索到的记录进行分组;
    HAVING 子句用于指定组的选择条件;
    ORDER BY 子句用于对查询的结果进行排序;
    以上子句中,SELECT 子句和FROM子句是必需的,其它是可选的。



    1.2 单表查询

    1.2.1选择表中若干列

    (1)查询指定的列

    SELECT 列名 FROM 表名
    • 1

    例子 :SELECT Sname,Sno FROM Student

    (2)查询全部列

    SELECT * FROM 表名
    • 1

    例子 :SELECT * FROM Student

    (3)查询经过计算的列

    SELECT 列名 FROM 表名
    • 1

    例子 :SELECT Sname,year(getdata()) - year(Birthdate) FROM Student




    1.2.2 选择表中的若干元祖

    (1)消除取值相同的行:DISTINCT

    SELECT DISTINCT Sno FROM 表名
    • 1

    例子 :SELECT DISTINCT Sno FROM Student



    (2)查询满足条件的元祖

    查询条件谓 词
    比较 =、>、>=、<=、<、<>、!=、!>、!<
    确定范围 BETWEEN…AND、 NOT BETWEEN…AND
    确定集合 IN 、NOT IN
    字符匹配 LIKE 、NOT LIKE
    空值 IS NULL、IS NOT NULL
    多重条件(逻辑谓词) AND、OR

    a.比较大小
    例子 :SELECT Sname FROM Student WHERE year(getdata()) - year(Birthdate) < 20


    b.确定范围
    BETWEEN…AND 和 NOT BETWEEN…AND可用于查找属性值在或不在指定范围。

    列名 | 表达式 | [NOT] BETWEEN 下限值 AND 上限值  
    • 1

    BETWEEN…AND 代表的范围是上限值和下限值之间(包括边界值),即为 true。
    NOT BETWEEN…AND 代表的范围是不在上限值和下限值之间(不包括边界值),即为true。(若判断值为边界值时,为 false)

    例子 :SELECT Sno,Cno FROM SC WHERE Grade BETWEEN 80 AND 90
    此查询等价于:SELECT Sno,Cno FROM SC WHERE Grade >= 80 AND Grade <= 90

    例子 :SELECT Sno,Cno FROM SC WHERE Grade NOT BETWEEN 80 AND 90
    此查询等价于:SELECT Sno,Cno FROM SC WHERE Grade < 80 OR Grade > 90


    c. 确定集合
    IN运算符的含义:当列中的值和集合中的某个常量值相等时,结果为True
    NOT IN运算符的含义:当列中的值和集合中的全部常量值都不相等时,结果为True

    例子 :SELECT Sno FROM Student WHERE Dept IN ('信息管理系','计算机系')
    此查询等价于:SELECT Sno FROM Student WHERE Dept = '信息管理系' OR Dept = '计算机系')

    例子 :SELECT Sno FROM Student WHERE Dept NOT IN ('信息管理系','计算机系')
    此查询等价于:SELECT Sno FROM Student WHERE Dept != '信息管理系' AND Dept != '计算机系')


    d. 字符串匹配
    Like运算符用于查找指定列中与匹配串匹配的元祖。

    列名 [NOT] LIKE <匹配串>
    • 1
    通配符含义
    _(下划线) 匹配任意一个字符
    %(百分号) 匹配0个或多个字符
    [] 匹配[]中的任意一个字符。如[abcd]表示匹配abcd其中任何一个,若是连续的,可以用 - 表示,如[a-d]
    [^] 不匹配[]中的任意一个字符。如[^abcd]表示不匹配abcd其中任何一个,若是连续的,可以用 - 表示,如[^a-d]

    例子 :

    (查询姓“张”的学生详细信息)
    SELECT * FROM Student WHERE Sname LIKE '张%'
    
    (查询不姓“张”的学生详细信息)
    SELECT * FROM Student WHERE Sname NOT LIKE '张%'
    
    (查询姓“张”、“李”的学生详细信息)
    SELECT * FROM Student WHERE Sname LIKE '[张李]%'
    
    (查询名字的第二个字为“小” 或 “大”的学生详细信息)
    SELECT * FROM Student WHERE Sname LIKE '_[小大]%'
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    e. 涉及空值的查询
    空值(NULL)在数据库中有特殊含义,表示当前不确定或未知的值。判断是否为NULL时,不可用普通的比较运算符,需用IS NULL
    例子 :SELECT Sno FROM Student WHERE Grade IS NULL



    1.2.3 对查询结果进行排序

    将查询结果按照指定的顺序显示。ASC表示按列值升序排列(从上往下,值从大到小)。DESC表示按列值降序排列(从上往下,值从小到大)。默认为ASC

    ORDER BY <列名> [ASC|DESC]
    • 1

    例子 :SELECT Sno,Grade FROM SC ORDER BY Grade DESC



    1.2.4 使用聚合函数统计数据

    聚合函数也称为统计函数或集合函数,作用是对一组值进行计算并返回一个统计结果。

    聚合函数含义
    COUNT(*) 统计表中元祖的个数
    COUNT([DISTINCT]<列名>) 统计本列的非空列值个数
    SUM(<列名>) 计算列值的和值(必须是数值型列)
    AVG(<列名>) 计算列值的平均值(必须是数值型列)
    MAX(<列名>) 计算列值的最大值
    MIN(<列名>) 计算列值的最小值

    上述函数除 COUNT(*) 外,其它函数在计算过程中均忽略NULL值

    (统计学生总人数)
    SELECT COUNT(*) FROM Student
    
    (统计“001”学号学生的考试平均成绩)
    SELECT AVG(Grade) FROM SC WHERE Sno = '001'
    
    (查询“C001”号课程考试成绩的最高分和最低分)
    SELECT MAX(Grade) 最高分,MIN(Grade) 最低分 FROM SC WHERE Cno = 'C001'
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    聚合函数不能出现在WHERE子句中!



    1.2.5 对数据进行分组统计

    需要先对数据进行分组,然后再对每个组进行统计。分组子句GROUP BY。在一个查询语句中,可以用多个列进行分组。
    分组子句跟在WHERE子句的后面:

    GROUP BY <分组依据列>[,...n]
        [HAVING <组筛选条件>]
    • 1
    • 2

    (1)使用GROUP BY 子句

    (统计每门课程的选课人数,列出课程号和选课人数)
    SELECT Cno as 课程号, COUNT(Sno) as 选课人数 From SC Group BY Cno
    
    (统计每个学生的选课门数和平均成绩)
    SELECT Sno 学号, COUNT(*)  选课门数,AVG(Grade) 平均成绩 From SC Group BY Sno
    
    带WHERE子句的分组(统计每个系的女生人数)
    SELECT Dept, COUNT(*)  女生人数 From Student Where Sex = '女' Group BY Dept
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    (2)使用HAVING 子句
    HAVING子句用于对分组后的统计结果再进行筛选,它的功能与WHERE子句类似,它用于组而不是单个记录。在HAVING子句中可以使用聚合函数,但在WHERE子句中不能,通常与GROUP子句一起使用。

    (查询选课门数超过3门的学生的学号和选课门数)
    SELECT Sno 学号, COUNT(*)  选课门数,AVG(Grade) 平均成绩 From SC Group BY Sno HAVING COUNT(*) > 3
    • 1
    • 2

    (3)WHERE 、GROUP BY 、HAVING 的作用及执行顺序

    • WHERE子句用于筛选FROM子句中指定的数据所产生的行数据。
    • GROUP BY 子句用于对经 WHERE 子句筛选后的结果数据进行分组。
    • HAVING 子句用于对分组后的统计结果再进行筛选。

    可以分组操作之前应用的筛选条件,在WHERE子句中指定它们更有效,这样可以减少参与分组的数据行。在HAVING子句中指定的筛选条件应该是那些必须在执行分组操作之后应用的筛选条件。

    (查询计算机系和信息管理系每个系的学生人数)
    第一种:
    SELECT Dept,COUNT(*) FROM Student GROUP BY Dept Having Dept in('计算机系','信息管理系')
    第二种:
    SELECT Dept,COUNT(*) FROM Student WHERE Dept in ('计算机系','信息管理系')GROUP BY Dept 
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    以上例子比较:第一种是按照系分组好了之后,只采取所有系中的两个系,显然效率不高。而第二种是先进行WHERE筛选条件之后,再进行GROUP BY 计算,显示更好。





    1.3 多表连接查询

    若一个查询同时涉及到两张或以上的表,则称为连接查询。

    1.3.1 内连接

    使用内连接时,如果两个表的相关字段满足条件,则从两个表中提取数据组成新的记录。

    FROM 表1 [INNER] JOIN 表2 ON <连接条件>
    • 1

    注意:连接条件中的连接字段必须是可比的,必须是语义相同的列。

    (查询学生及选课的详细信息)
    SELECT * FROM Student INNER JOIN SC ON Student.Sno = SC.Sno
    
    (查询计算机系学生的选课情况,列出该学生的名字、所修课程号、成绩)------行选择条件
    SELECT Sname,Cno,Grade FROM Student INNER JOIN SC ON Student.Sno = SC.Sno WHERE Dept = '计算机系'
    
    (统计每个系的平均成绩) ------分组的多表查询
    SELECT Dept,AVG(Grade) AS AverageGrade FROM Student S INNER JOIN SC ON S.Sno = SC.Sno Group BY Dept
    
    (统计计算机系每个学生的选课门数、平均成绩、最高成绩、最低成绩)------分组和行选择条件的多表连接查询
    SELECT Sno,COUNT(*),AVG(Grade),MAX(Grade),MIN(Grade) FROM Student S JOIN SC ON S.Sno = SC.Sno WHERE Dept = '计算机系' Group BY Dept
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    1.3.2 自连接

    自连接是一种特殊的内连接,相互连接的表在物理上是一张表,但在逻辑上可以看做是两张表。

    FROM 表1 AS T1 JOIN 表1 AS T2
    • 1

    通过为表取别名的方法,可以让物理上的一张表在逻辑上成为两张表。(一定要为表取别名!)

    (查询与刘晨在同一个系学习的学生的姓名、所在系)
    SELECT S1.Sname,S1.Dept FROM Student S1 JOIN Student S2 
    ON S1.Dept = S2.Dept   ---同一个系的学生
    WHERE S2.Sname = '刘晨'  ---S2表作为查询条件
    AND S1.Sname != '刘晨'   ----S1表作为结果表,并从中去掉‘刘晨’本人信息
    • 1
    • 2
    • 3
    • 4
    • 5

    1.3.3 外连接

    内连接操作中,只有满足条件的元祖才能出现在查询结果集中。
    外连接是只限制一张表中的数据必须满足条件,而另一张表的数据可以不满足条件。

    FROM 表1 LEFT|RIGHT [OUTER] JOIN 表2 ON <连接条件>
    • 1

    LEFT [OUTER] JOIN 称为左外连接,含义是限制表2中的数据必须满足条件,但不管表1中的数据是否满足条件,均输出表1中的数据。
    LEFT [OUTER] JOIN 称为右外连接,含义是限制表1中的数据必须满足条件,但不管表2中的数据是否满足条件,均输出表2中的数据。


    内连接与外连接的区别:
    这里写图片描述

    内连接:表A与表B进行内连接,则结果为两个表中满足条件的记录集,即C部分。
    外连接:如果表A和表B进行左外连接,则结果为 记录集A + 记录集C;如果表A和表B进行右外连接,则结果为 记录集B + 记录集C。

    (查询没有人选的选修课程名)
    SELECT Cname FROM Course C LEFT JOIN  SC ON C.Cno = SC.Cno WHERE SC.Cno IS NULL
    • 1
    • 2

    例子解析:如果存在部分课程为被人选择,则必定在Course表中有但在SC表中没有出现,即在进行外连接时没人选的课程在与SC表构成的连接结果集中,对应的Sno、Cno、Grade列必定为空,所以只需**在连接后的结果中选出**SC表中Sno或Cno为空的元祖即可。

    (统计计算机系每个学生的选课门数,包括没选课的学生)
    SELECT S.Sno AS 学号,COUNT(SC.Cno) AS 选课门数 FROM Student S LEFT JOIN SC ON S.Sno = SC.Sno WHERE Dept = '计算机系' GROUP BY S.Sno
    • 1
    • 2

    例子解析: 上述例子要求统计每个学生的….,所以在GROUP BY分组时,是按照学生表中的学号来分。而对于聚合函数COUNT,上述要求统计每个学生的选课门数,若写成COUNT(S.Sno)或COUNT(*),则对没选课的学生都返回1,因为在外连接结果中,S.Sno不会是NULL,而COUNT(*)函数本身也不考虑NULL,它是直接对元祖个数进行计数。

    注意:在对外连接的结果进行分组、统计等操作时,一定要注意分组依据列和统计列的选择。





    1.4 使用TOP限制结果集行数

    在使用SELECT语句进行查询时,有时只需要前几行数据。

    TOP (expression) [PERCENT] [WITH TIES]
    • 1
    • expression:指定返回行数的数值表达式。如果指定了PERCENT,expression将隐式转换成float,否则是bigint
    • PERCENT:指定只返回结果集中前 expression% 行数据。
    • WITH TIES:指定从基本结果集中返回额外的数据行(只有在SELECT子句中包含了ORDER BY子句时,才能使用)。

    TOP谓词写在SELECT单词的后面(如果有DISTINCT,则在DISTINCT后面)。

    (查询考试成绩最高的3个成绩。列出学号、课程号、成绩)
    SELECT TOP 3 Sno,Cno,Grade FROM SC ORDER BY Grade DESC
    若要包括并列第3名的成绩:
    SELECT TOP 3 Sno,Cno,Grade WITH TIES FROM SC ORDER BY Grade DESC
    • 1
    • 2
    • 3
    • 4





    2.数据更改功能

    2.1 插入数据

    INSERT INTO 表名[(列名)] VALUES (值)
    • 1

    (1)简单插入语句

    INSERT INTO Student VALUES ('001','陈东','男','1996/6/23','信息管理系')
    • 1

    (2)多行插入语句

    INSERT INTO SC VALUES('001','C001',90),
                         ('001','C002',30),
                         ('001','C005',NULL)
    • 1
    • 2
    • 3

    (3)不按表顺序插入语句
    按与表列顺序不同的顺序插入数据

    INSERT INTO Student(Sno,Sname,Sex,Dept) VALUES ('001','陈东','男','1996/6/23','信息管理系')
    • 1




    2.2 更新数据

    UPDATE 表名 SET 列名 = 值
    • 1

    (1)无条件更新

    UPDATE SC SET Grade = Grade+10
    • 1

    (2)有条件更新

    (将“C001”号课程的学分改成5分)
    UPDATE Course SET Grade = 5 WHERE Cno = 'C001'
    
    (将计算机系全体学生的成绩加5分)
    UPDATE SC SET Grade = Grade+5 FROM SC JOIN Student S ON S.Sno = SC.Sno WHERE Dept = '计算机系' 
    • 1
    • 2
    • 3
    • 4
    • 5




    2.3 删除数据

    DELETE [TOP (expression) [PERCENT]]
        FROM 表名
    • 1
    • 2

    (1)无条件删除

    DELETE FROM Student
    • 1

    (2)有条件删除

    (删除所有考试成绩不合格的学生的选课记录)
    DELETE FROM SC WHERE Grade < 60
    
    (删除Student表中2.5%的行数据)
    DELETE TOP (2.5) PERCENT FROM Student
    • 1
    • 2
    • 3
    • 4
    • 5






    四. 高级查询

    1. CASE函数

    CASE函数是一种多分支函数,它可以根据条件列表的值返回多个可能的结果表达式中的一个。

    1.1 简单CASE函数

    CASE input_expression
        WHEN when_expression THEN result_expression
        [...n]
        [ELSE else_expression]
    END
    • 1
    • 2
    • 3
    • 4
    • 5
    • input_expression:所计算的表达式,可以是一个变量名、字段名、函数或子查询。
    • when_expression :要与input _expression进行比较的简单表达式。简单表达式中不可包含比较运算法,只需给出被比较的表达式或值。
    • else_expression : 比较结果均不为TRUE时返回的表达式。
    (查询选了JAVA课程的学生的学号、姓名、所在系、成绩,
    若所在系为“计算机系”,则显示“CS”;若所在系为“信息管理系”,则显示“IM”;若所在系为“通信工程系”,则显示“COM”)
    SELECT S.Sno 学号,Sname 姓名,
        CASE Dept
            WHEN '计算机系' THEN 'CS'
            WHEN '信息管理系' THEN 'IM'
            WHEN '通信工程系' THEN 'COM'
        END AS 所在系,Grade 成绩
        FROM Student S JOIN SC ON S.Sno = SC.Sno 
        JOIN Course C ON C.Cno = SC.Cno
        WHERE Cname = 'Java'
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    1.2 搜索CASE函数

    简单 CASE函数只能将input_expression与一个单值进行比较,如果需要跟一个范围内的值进行比较,就需要搜索CASE函数

    CASE 
        WHEN Boolean_expression THEN result_expression
        [...n]
        [ELSE else_expression]
    END
    • 1
    • 2
    • 3
    • 4
    • 5
    • Boolean_expression :比较表达式,可以包含比较运算符,直接将两者进行比较。
    上述例子也可以用搜索CASE函数:
    SELECT S.Sno 学号,Sname 姓名,
        CASE 
            WHEN Dept = '计算机系' THEN 'CS'
            WHEN Dept = '信息管理系' THEN 'IM'
            WHEN Dept = '通信工程系' THEN 'COM'
        END AS 所在系,Grade 成绩
        FROM Student S JOIN SC ON S.Sno = SC.Sno 
        JOIN Course C ON C.Cno = SC.Cno
        WHERE Cname = 'Java'
    
    (查询C001课程的考试情况,列出学号和成绩,然后根据成绩划分等级)
    SELECT S.Sno 学号,Sname 姓名,
        CASE 
            WHEN Grade >= 90 THEN '优'
            WHEN Grade BETWEEN 80 AND 99 THEN '良'
            WHEN Grade BETWEEN 70 AND 79 THEN '中'
            WHEN Grade BETWEEN 60 AND 69 THEN '及格'
        END AS 成绩
        FROM  SC ON WHERE Cno = 'C001'
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21




    2. 子查询

    如果一个SELECT语句嵌套在另一个SELECT、INSERT、UPDATE或DELETE语句中,则称为子查询或内层查询;而包含子查询的语句称为主查询。

    子查询通常用于满足下列需求之一:

    • 把一个查询分解成一系列的逻辑步骤
    • 提供一个列表作为WHERE子句和IN、EXISTS、ANY、ALL的目标对象
    • 提供由外层查询中每一条记录驱动的查询

    子查询通常有几种形式:

    • WHERE 列名 [NOT] IN (子查询)
    • WHERE 列名 比较运算符 (子查询)
    • WHERE EXISTS(子查询)

    2.1 使用基于集合测试的嵌套子查询

    使用嵌套子查询进行基于集合的测试时,子查询返回的是一个值列表,外层查询通过运算符 IN 或 NOT IN,对子查询返回的结果集进行比较。

    SELECT <查询列表> FROM ...
    WHERE <列名> [NOT] IN (
    SELECT <列名> FROM)
    • 1
    • 2
    • 3

    包含这种子查询形式的查询语句是分步骤实现的,即先执行子查询,然后在子查询的结果基础上执行外层查询(先内后外)。子查询返回的结果是一个集合,外层查询就是在这个集合上使用IN运算符进行比较。

    (查询与刘晨在同一系的学生)
    SELECT Sno,Sname,Dept FROM Student WHERE Dept IN
        (SELECT Dept From Student Where Sname = '刘晨')
    
    (查询选修了JAVA课程学生的姓名)
    SELECT Sname FROM Stduent WHERE Sno IN(
        SELECT Sno FROM SC WHERE Cno IN(
            SELECT Cno FROM Course WHERE Cname = 'JAVA'))
    
    第二个例子也可以用了连接查询来做:
    SELECT Sname From Student S JOIN SC ON S.Sno = SC.Sno JOIN Course C ON C.Cno = SC.Cno WHERE Cname = 'JAVA'
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    上述的例子可以看出子查询连接查询可以互通,但在某些情况下是不可以的:

    (统计选了JAVA 课程的学生的姓名和所在系)
    子查询:
    SELECT Sno 学号,COUNT(*) 选课门数,AVG(Grade) 平均成绩
        FROM SC WHERE Sno IN(
          SELECT Sno FROM SC JOIN Course C 
            ON C.Cno = SC.Cno
              WHERE Cname = 'JAVA')
         GROUP BY Sno
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    这个查询不能完全用连接查询 实现,因为这个查询的语义是要先找出选了JAVA课程的学生,然后再计算这些学生的选课门数和平均成绩。

    连接查询:

    SELECT Sno 学号,COUNT(*) 选课门数,AVG(Grade) 平均成绩
            FROM SC JOIN Course C ON C.Cno = SC.Cno WHERE Cname = 'JAVA'       GROUP BY Sno
    • 1
    • 2

    以上查询是错误的,查出来学生的选课门数都是1 !!! 实际上这个1指的是JAVA这一门课程,,其平均成绩也是JAVA成绩。




    【注意:】连接查询和子查询的区别:★★★★★

    • 之所以这样,是因为在执行有连接操作的查询时,系统首先将所有被连接的表连接成一张大表,这张大表中的数据全部满足连接条件的数据。之后再在这张连接后的大表上执行WHERE子句,然后是GROUP BY子句。

    执行完WHERE子句之后,连接的大表中的数据就只剩下JAVA这一门课程的情况了,显然不符情况。

    • 对于含有嵌套的子查询的查询,是先执行子查询,然后在子查询的结果基础上再执行外层查询。



    【注意:】在子查询中否定和在外查询中否定的区别 ★★★★★

    IN 和 != 的搭配 相较于 NOT IN 和 =的搭配是否相同?
    在子查询中否定和在外查询中否定的区别?

    (查询没选C001课程的学生的姓名和所在系)
    
    1.多表连接:
    SELECT Sname,Dept FROM Student S JOIN SC ON S.Sno= SC。Sno WHERE Cno != 'C001'
    
    2. 嵌套子查询:
    1)在子查询中否定
    SELECT Sname,Dept FROM Student
        WHERE Sno NOT IN(
          SELECT Sno FROM SC WHERE Cno = 'C001')
    
    2)在外层查询中否定
    SELECT Sname,Dept FROM Student
        WHERE Sno IN(
          SELECT Sno FROM SC WHERE Cno != 'C001')
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    这个例子,连接查询是错误的,嵌套子查询中方法一在子查询中的否定是错误的!嵌套子查询中方法二在外查询中的否定是正确的!

    【连接查询】:
    - 上面已经讲过,对于连接查询,所有的条件都是在连接之后的结果表上进行的,而且是逐行进行判断。一旦发现满足要求“Cno != ‘C001’”,则此行满足条件。所以最后的结果既包括没有选C001课程的学生,也包含选了C001同时选了别的课程的学生。

    【含有嵌套的子查询】:
    - 对于含有嵌套的子查询的查询,是先执行子查询,然后在子查询的结果基础上再执行外层查询。而且在子查询中也是逐行判断的,当发现有满足条件的数据时,将此行数据作为外行查询的一个比较条件。

    本例要查询的是某个学生所选的全部课程中均不包含C001课程,如果将否定放在子查询中,则查出的学生既包括没有选C001课程的学生,也包含选了C001同时选了别的课程的学生。显然,这个否定的范围不够。

    通常情况下,对于这种带有部分否定条件的查询都应该用子查询来实现,而且应该放在外层!




    2.2 使用比较测试的嵌套子查询

    SELECT <查询列表> FROM...
        WHERE <列名> 比较运算符 (
          SELECT <列名> FROM ...)
    • 1
    • 2
    • 3

    使用嵌套子查询进行比较测试时,要求子查询只能返回单个值。外层查询一般通过比较运算符(=、<>、 <= 、>=),将外层查询中某个列的值与子查询返回的值进行比较。

    (查询选了C004 课程且成绩高于此课程的平均成绩的学生的学号和成绩)
    SELECT Sno, Grade FROM SC
        WHERE Cno = 'C004' AND Grade >(
          SELECT AVG(Grade) FROM SC WHERE Cno = 'C004'
    • 1
    • 2
    • 3
    • 4



    2.2 使用SOME 和 ALL 嵌套子查询

    当子查询返回单值时,可以使用比较运算符进行比较,但返回多值时,就需要通过SOME和ALL修饰,同时必须使用比较操作符!

    WHERE <列名> 比较运算符 [SOME | ALL](子查询)
    • 1
    (查询其他学期开设的课程中比第一学期开设课程的学分少的课程名、开课学期、学分)
    SELECT Cname,Semester,Credit FROM Course
        WHERE Credit < SOME(
          SELECT Credit FROM Course
            WHERE Semester = 1)
    AND Semester != 1
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    该语句实际上等价于:查询比第一学期学分最高的课程的学分小的其它学期的课程名、开课学期和学分:

    SELECT Cname,Semester,Credit FROM Course
        WHERE Credit < (
          SELECT MAX(Credit) FROM Course
            WHERE Semester = 1)
    AND Semester != 1
    • 1
    • 2
    • 3
    • 4
    • 5

    (查询至少有一次成绩大于或等于90分的学生的学号及选修的全部课程的课程号和考试成绩)
    SELECT Sname,Cno,Grade FROM Student S
        JOIN SC ON S.Sno = SC.Sno
         WHERE S.Sno = SOME (
          SELECT Sno FROM SC 
              WHERE Grade >= 90)
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    该语句实际上是查询成绩大于或等于90的学生的学号及选修的全部课程的课程号和考试成绩
    ,可用子查询来做:

    SELECT Sname,Cno,Grade FROM Student S
        JOIN SC ON S.Sno = SC.Sno
         WHERE S.Sno IN (
          SELECT Sno FROM SC 
              WHERE Grade >= 90)
    • 1
    • 2
    • 3
    • 4
    • 5



  • 相关阅读:
    《Apache Doris在美团外卖数仓中的应用实践》
    《一文教会你如何写复杂业务的代码》
    《SOFA企业应用框架》
    《为什么阿里巴巴代码规约要求避免使用 Apache BeanUtils 进行属性的拷贝》
    《浅析VO、DTO、DO、PO的概念、区别和用处》
    Spring 注解
    《浅析VO、DTO、DO、PO的概念、区别和用处》
    dsgn_ebook
    《清华大学刘世霞“可解释机器学习的可视化分析”(附PPT)》
    《图结构的相似度度量与分类》
  • 原文地址:https://www.cnblogs.com/gbbwzz/p/8477972.html
Copyright © 2011-2022 走看看