zoukankan      html  css  js  c++  java
  • mysql数据库多表查询及函数运算符(二)

    一、单表查询的语法

    SELECT 字段1,字段2... FROM 表名
                      WHERE 条件
                      GROUP BY field
                      HAVING 筛选
                      ORDER BY field
                      LIMIT 限制条数
    

    二、关键字的执行优先级(重点)

    重点中的重点:关键字的执行优先级
    from
    where
    group by
    having
    select
    distinct
    order by
    limit
    

    1.找到表:from

    2.拿着where指定的约束条件,去文件/表中取出一条条记录

    3.将取出的一条条记录进行分组group by,如果没有group by,则整体作为一组

    4.将分组的结果进行having过滤

    5.执行select

    6.去重

    7.将结果按条件排序:order by

    8.限制结果的显示条数

    查询

    给表起别名,用在SQL语句同时查询多张表,又不想写太多表名的情况下

    select s.name, s.gender from students2 as s;
    

    去重

    select distinct gender from students2; # 只显示有多少种性别,而不是多少个性别
    

    三、条件查询

    比较运算> < = >= <= !=

     select * from students2 where age = 18; # 一个等号=就行
    

    and

    select name from students2 where age > 18 and gender="女";
    

    条件:不在 18岁以上的女性 这个范围内的信息

    select * from students2 where not (age > 18 and gender="女");
    

    易错

    select * from students2 where not age > 18 and gender="女";
    

    模糊查询like

      % 替换一个或者多个

      _ 替换一个

    查询姓名中以“小”开始的名字

    select name from students2 where name like "小%";
    

    查询姓名中有“小”所有的名字

    select name from students2 where name like "%小%";
    

    查询有两个字的名字

    select * from students2 where name like "__";
    

    查询至少有两个字的名字

    select * from students2 where name like "__%";
    

    rlike 正则

    查询以小开始的姓名

    select name from students2 where name rlike "^小.*";
    

    范围查询

    in(1, 3, 8)表示在一个非连续的范围内

    查询年龄为12, 18, 21的信息

    select * from students2 where age in (12, 18, 21);
    

    查询年龄不为12, 18, 21的信息

    select * from students2 where age not in (12, 18, 21);
    

    between ... and ... 表示在一个连续的范围内

    查询年龄在12到18之间的信息

    select * from students2 where age between 12 and 18;
    

    查询年龄不在12到18之间的信息

    select * from students2 where age not between 12 and 18;
    

    不能加括号:

    select * from students2 where age not (between 12 and 18);
    

    空判断

    判空 is null

    判非空 is not null

    排序

    order by 字段

    asc从小到大排列 升序

    desc从大到小排列 降序

    升序

    select * from students2 where (age between 12 and 18) and gender=2 order by age;
    

    省略asc,即原本是:

    select * from students2 where (age between 12 and 18) and gender=2 order by age asc;
    

    降序

    select * from students2 where (age between 12 and 18) and gender=2 order by age desc;
    

    order by 多个字段

    按年龄降序排,然后再按id降序排

    select * from students2 where age between 12 and 18 order by age desc, id desc;
    

    四、聚合分组

    聚合函数

    count 总数

    select count(*) from students2 where gender=2;
    
    select count(*) as 女性人数 from students2 where gender=2;
    

    max 最大值

    select max(age) from students2;
    

    min 最小值

    sum 求和

    select sum(age) from students2;
    

    avg 平均值

    select avg(age) from students2 where gender=2;
    

    select 后面可以跟表达式

     select sum(age)/count(age) from students2 where gender=2;
    

    round(123.23, 1) 四舍五入 保留一位小数

    select round(sum(age)/count(age), 1) from students2 where gender=2;
    

    分组 group by和聚合函数一起使用

    错误:

    select * from students2  group by gender;
    

    筛选的条件是每个分组唯一的标识

    select gender from students2  group by gender;
    

    计算每个分组里面的人数

    select gender, count(*) from students2 group by gender;
    

    count(*)是对分组结果的计算

    显示每个分组里面人的名字

    select gender, group_concat(name) from students2 group by gender;
    

    计算女性的人数

    select gender, count(gender) from students2 where gender=2 group by gender;
    
    select gender, group_concat(name,"_",age," ",id) from students2 where gender=2 group by gender; # 用下划线和空格分开,否则会连在一起
    

    强调

    如果我们用unique的字段作为分组的依据,则每一条记录自成一组,这种分组没有意义
    多条记录之间的某个字段值相同,该字段通常用来作为分组的依据
    

    having 筛选分组

    查询平均年龄超过18岁的性别,以及姓名

    select gender, group_concat(name) from students2 group by gender having avg(age) > 18;
    

    where 和 having的区别:1、where在group by前面,having在后面。2、where是对表进行条件判断,而having是对查询结果进行条件判断。

    分页 limit

    限制查询出来的个数

    select * from students2 where gender=2 limit 2;
    

    limit start, count

     select * from students2 limit 2, 5;
    

    limit (第N页-1)+每页的个数, 每页的个数

    错误:

    不能填入表达式

    select * from students2 limit (3-1)*2, 2;
    

    limit要放在最后面

    错误

    select * from students limit 4, 2 order by age asc;
    

    正确

    select * from students2 order by age asc limit 4, 2;
    

    连接查询

    内连接,取交集

    select .... from 表名 inner join 表名;

    select * from students2 inner join classes;
    

    但是上面那样只是把students2里每一条数据和classes里的全部数据做连接,没有加条件限制

    用on进行条件限制

    select * from students2 inner join classes on students2.cls_id = classes.id;
    

    只显示某些字段

     select students2.*, classes.name from students2 inner join classes on students2.cls_id = classes.id;
    

    给表起别名

    select s.name, c.name from students2 as s inner join classes as c on s.cls_id = c.id;
    

    五、多表连接

    外连接 并集

    左连接,查询结果为两个表匹配到的数据,左表特有的数据,对于右表中不存在的数据用null填充

    select * from students2 as s left join classes as c on s.cls_id = c.id;
    

    right join一般用的少,只要把表互换,left join也可以达到同样效果

    查询没有对应班级信息的学生

    select * from students2 as s left join classes as c on s.cls_id = c.id having c.id is null;
    

    自关联

    例如把全国各省市县地区导入到同一张表中,查询山东省的所有市

    select province.city from ares as province inner join ares as city on city.pid = province.aid having province.atitle = "山东省";
    

    子查询

    一个select里面嵌套另一个select

    查询身高最高的女生的所有信息

     select * from students2 where high = (select max(high) from students2 where gender=2);
    

    用这个办法解决刚刚查询省份的问题

    select * from areas where pid = (select aid from areas where atitle = "河北省");
    

    带EXISTS关键字的子查询

    EXISTS关字键字表示存在。在使用EXISTS关键字时,内层查询语句不返回查询的记录。
    而是返回一个真假值。True或False
    当返回True时,外层查询语句将进行查询;当返回值为False时,外层查询语句不进行查询

    img

    #department表中存在dept_id=203,Ture
    mysql> select * from employee
        ->     where exists
        ->         (select id from department where id=200);
    +----+------------+--------+------+--------+
    | id | name       | sex    | age  | dep_id |
    +----+------------+--------+------+--------+
    |  1 | egon       | male   |   18 |    200 |
    |  2 | alex       | female |   48 |    201 |
    |  3 | wupeiqi    | male   |   38 |    201 |
    |  4 | yuanhao    | female |   28 |    202 |
    |  5 | liwenzhou  | male   |   18 |    200 |
    |  6 | jingliyang | female |   18 |    204 |
    +----+------------+--------+------+--------+
    
    #department表中存在dept_id=205,False
    mysql> select * from employee
        ->     where exists
        ->         (select id from department where id=204);
    Empty set (0.00 sec)
    

    六、数据库设计

    设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。

    目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多规范要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。

    范式的包含关系。一个数据库设计如果符合第二范式,一定也符合第一范式。如果符合第三范式,一定也符合第二范式…

    第一范式(1NF):属性不可分

    (****1NF是对属性的原子性约束,要求属性具有原子性,不可再分解)

    name tel age

    ​ 手机 座机

    Josh 13612345678 021-9876543 22

    Wang 13988776655 010-1234567 21

    很明显,tel这个属性还可以进行分解,分解成手机和座机这两个属性,不满足第一范式的数据库,不是关系数据库!所以,我们在任何关系数据库管理系统中,做不出这样的“表”来。

    第二范式(2NF):符合1NF,并且非主属性完全依赖于码。

    (2NF通俗说是要有主键(主键可以有多个字段),其他部分依赖完全于主键,不能是一部分)

    如果这都不能理解,只能看看如下科学的解释了:

    一个候选码中的主属性也可能是好几个。如果一个主属性,它不能单独做为一个候选码,那么它也不能确定任何一个非主属性。给一个反例:我们考虑一个小学的教务 管理系统,学生上课指定一个老师,一本教材,一个教室,一个时间,大家都上课去吧,没有问题。那么数据库怎么设计?(学生上课表)

    学生 课程 老师 老师职称 教材 教室 上课时间

    小明 一年级语文(上) 大宝 副教授 《小学语文1》 101 14:30

    一个学生上一门课,一定在特定某个教室。所以有(学生,课程)->教室

    一个学生上一门课,一定是特定某个老师教。所以有(学生,课程)->老师

    一个学生上一门课,他老师的职称可以确定。所以有(学生,课程)->老师职称

    一个学生上一门课,一定是特定某个教材。所以有(学生,课程)->教材

    一个学生上一门课,一定在特定时间。所以有(学生,课程)->上课时间

    因此(学生,课程)是一个码。

    ​ 然而,一个课程,一定指定了某个教材,一年级语文肯定用的是《小学语文1》,那么就有课程->教材。(学生,课程)是个码,课程却决定了教材,这就叫做不完全依赖,或者说部分依赖。出现这样的情况,就不满足第二范式!有什么不好吗?你可以想想:

    ​ 1、校长要新增加一门课程叫“微积分”,教材是《大学数学》,怎么办?学生还没选课,而学生又是主属性,主属性不能空,课程怎么记录呢,教材记到哪呢? ……郁闷了吧?(插入异常)

    ​ 2、下学期没学生学一年级语文(上)了,学一年级语文(下)去了,那么表中将不存在一年级语文(上),也就没了《小学语文1》。这时候,校长问:一年级语文(上)用的什么教材啊?……郁闷了吧?(删除异常)

    ​ 3、校长说:一年级语文(上)换教材,换成《大学语文》。有10000个学生选了这么课,改动好大啊!改累死了……郁闷了吧?(修改异常)

    那应该怎么解决呢?投影分解,将一个表分解成两个或若干个表

    学生 课程 老师 老师职称 教室 上课时间

    小明 一年级语文(上) 大宝 副教授 101 14:30

    学生上课表

    课程 教材

    一年级语文(上) 《小学语文1》

    第三范式(3NF):符合2NF,****并且,消除传递依赖。

    (3NF是对字段冗余性的约束,即任何字段不能由其他字段派生出来,它要求字段没有冗余)

    正如前面所说:没有数据冗余的数据库并不一定是最好的数据库,所以有没有冗余的设计,要综合来考虑。

    上面的“学生上课表”符合2NF,可以这样验证:两个主属性单独使用,不用确定其它四个非主属性的任何一个。但是它有传递依赖!在“老师”和“老师职称”这里,一个老师一定能确定一个老师职称。

    如果不消除这种传递依赖,有可能会出现:

    1、老师升级了,变教授了,要改数据库,表中有N条,改了N次……(修改异常)

    2、没人选这个老师的课了,老师的职称也没了记录……(删除异常)

    3、新来一个老师,还没分配教什么课,他的职称记到哪?……(插入异常)

    那应该怎么解决呢?和上面一样,投影分解:

    学生 课程 老师 教室 上课时间

    小明 一年级语文(上) 大宝 101 14:30

    老师 老师职称

    大宝 副教授

    BCNF:符合3NF,****并且,主属性不依赖于主属性。

    若关系模式属于第二范式,且每个属性都不传递依赖于键码,则R属于BC范式。

    通常

    BC范式的条件有多种等价的表述:每个非平凡依赖的左边必须包含键码;每个决定因素必须包含键码。

    BC范式既检查非主属性,又检查主属性。当只检查非主属性时,就成了第三范式。满足BC范式的关系都必然满足第三范式。

    还可以这么说:若一个关系达到了第三范式,并且它只有一个候选码,或者它的每个候选码都是单属性,则该关系自然达到BC范式。

    一般,一个数据库设计符合3NF或BCNF就可以了。

    第四范式:****要求把同一表内的多对多关系删除。

    第五范式:从最终结构重新建立原始结构。

  • 相关阅读:
    说说ReactiveCocoa 2
    xcode5 添加Build Phases脚本
    关于CoreData的一个工具Mogenerator的使用
    Keystone controller.py & routers.py代码解析
    Openstack Restful API 开发框架 Paste + PasteDeploy + Routes + WebOb
    Openstack Restful API 开发框架 Paste + PasteDeploy + Routes + WebOb
    Web 开发规范 — WSGI
    Web 开发规范 — WSGI
    Openstack API 类型 & REST 风格
    Openstack API 类型 & REST 风格
  • 原文地址:https://www.cnblogs.com/yly123/p/11321307.html
Copyright © 2011-2022 走看看