zoukankan      html  css  js  c++  java
  • MySQL

    目录

    一、MySQL的基本使用

     1.1数据库简介

     1.2数据完整性

    1.3命令行脚本

    二、 MySQL-查询

    2.1 MySQL查询

    2.2 条件

    2.3 排序

    2.4聚合函数

    2.5分组

    2.6分页

    2.7连接查询

    2.8自关联

    2.9子查询

    三、MySQL与Python交互

    3.1Python操作MySQL步骤

    3.2增删改查

    3.3参数化

    四、MySQL高级

    4.1视图

    4.2事务

    4.3索引

    一、MySQL的基本使用

    1.1数据库简介

    1.1.1 RDBMS

      Relational Database Management System

    通过表来表示关系型

    • 当前主要使用两种类型的数据库:关系型数据库、非关系型数据库,本部分主要讨论关系型数据库,对于非关系型数据库会在后面学习

    • 所谓的关系型数据库RDBMS,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据

    • 查看数据库排名:https://db-engines.com/en/ranking

    • 关系型数据库的主要产品:

      • oracle:在以前的大型项目中使用,银行,电信等项目
      • mysql:web时代使用最广泛的关系型数据库
      • ms sql server:在微软的项目中使用
      • sqlite:轻量级数据库,主要应用在移动平台

    1.1.2 SQL

      Structured Query Language

    SQL是结构化查询语言,是一种用来操作RDBMS的数据库语言,当前关系型数据库都支持使用SQL语言进行操作,也就是说可以通过 SQL 操作 oracle,sql server,mysql,sqlite 等等所有的关系型的数据库

    • SQL语句主要分为:

      • DQL:数据查询语言,用于对数据进行查询,如select

      • DML:数据操作语言,对数据进行增加、修改、删除,如insert、udpate、delete

      • TPL:事务处理语言,对事务进行处理,包括begin transaction、commit、rollback

      • DCL:数据控制语言,进行授权与权限回收,如grant、revoke

      • DDL:数据定义语言,进行数据库、表的管理等,如create、drop

      • CCL:指针控制语言,通过控制指针完成表的操作,如declare cursor

    • 对于web程序员来讲,重点是数据的crud(增删改查),必须熟练编写DQL、DML,能够编写DDL完成数据库、表的操作,其它语言如TPL、DCL、CCL了解即可

    • SQL 是一门特殊的语言,专门用来操作关系数据库

    • 不区分大小写

    1.1.3 MySQL

    MySQL 简介

    • 点击查看MySQL官方网站

    • MySQL是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,后来被Sun公司收购,Sun公司后来又被Oracle公司收购,目前属于Oracle旗下产品

    特点

    • 使用C和C++编写,并使用了多种编译器进行测试,保证源代码的可移植性

    • 支持多种操作系统,如Linux、Windows、AIX、FreeBSD、HP-UX、MacOS、NovellNetware、OpenBSD、OS/2 Wrap、Solaris等

    • 为多种编程语言提供了API,如C、C++、Python、Java、Perl、PHP、Eiffel、Ruby等

    • 支持多线程,充分利用CPU资源

    • 优化的SQL查询算法,有效地提高查询速度

    • 提供多语言支持,常见的编码如GB2312、BIG5、UTF8

    • 提供TCP/IP、ODBC和JDBC等多种数据库连接途径

    • 提供用于管理、检查、优化数据库操作的管理工具

    • 大型的数据库。可以处理拥有上千万条记录的大型数据库

    • 支持多种存储引擎

    • MySQL 软件采用了双授权政策,它分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQL作为网站数据库

    • MySQL使用标准的SQL数据语言形式

    • Mysql是可以定制的,采用了GPL协议,你可以修改源码来开发自己的Mysql系统

    • 在线DDL更改功能

    • 复制全局事务标识

    • 复制无崩溃从机

    • 复制多线程从机

    1.2数据完整性

    • 一个数据库就是一个完整的业务单元,可以包含多张表,数据被存储在表中

    • 在表中为了更加准确的存储数据,保证数据的正确有效,可以在创建表的时候,为表添加一些强制性的验证,包括数据字段的类型、约束

    数据类型

    • 可以通过查看帮助文档查阅所有支持的数据类型

    • 使用数据类型的原则是:够用就行,尽量使用取值范围小的,而不用大的,这样可以更多的节省存储空间

    • 常用数据类型如下:

      • 整数:int,bit

      • 小数:decimal

      • 字符串:varchar,char

      • 日期时间: date, time, datetime

      • 枚举类型(enum)

    • 特别说明的类型如下:

      • decimal表示浮点数,如decimal(5,2)表示共存5位数,小数占2位

      • char表示固定长度的字符串,如char(3),如果填充'ab'时会补一个空格为'ab '

      • varchar表示可变长度的字符串,如varchar(3),填充'ab'时就会存储'ab'

      • 字符串text表示存储大文本,当字符大于4000时推荐使用

      • 对于图片、音频、视频等文件,不存储在数据库中,而是上传到某个服务器上,然后在表中存储这个文件的保存路径

    • 更全的数据类型可以参考http://blog.csdn.net/anxpp/article/details/51284106

    约束

    • 主键primary key:物理上存储的顺序

    • 非空not null:此字段不允许填写空值

    • 惟一unique:此字段的值不允许重复

    • 默认default:当不填写此值时会使用默认值,如果填写时以填写为准

    • 外键foreign key:对关系字段进行约束,当为关系字段填写值时,会到关联的表中查询此值是否存在,如果存在则填写成功,如果不存在则填写失败并抛出异常

    • 说明:虽然外键约束可以保证数据的有效性,但是在进行数据的crud(增加、修改、删除、查询)时,都会降低数据库的性能,所以不推荐使用,那么数据的有效性怎么保证呢?答:可以在逻辑层进行控制

        

      数值类型(常用)

    类型字节大小有符号范围(Signed)无符号范围(Unsigned)
    TINYINT 1 -128 ~ 127 0 ~ 255
    SMALLINT 2 -32768 ~ 32767 0 ~ 65535
    MEDIUMINT 3 -8388608 ~ 8388607 0 ~ 16777215
    INT/INTEGER 4 -2147483648 ~2147483647 0 ~ 4294967295
    BIGINT 8 -9223372036854775808 ~ 9223372036854775807 0 ~ 18446744073709551615

      字符串

    类型字节大小示例
    CHAR 0-255 类型:char(3) 输入 'ab', 实际存储为'ab ', 输入'abcd' 实际存储为 'abc'
    VARCHAR 0-255 类型:varchar(3) 输 'ab',实际存储为'ab', 输入'abcd',实际存储为'abc'
    TEXT 0-65535 大文本

      日期时间类型

    类型字节大小示例
    DATE 4 '2020-01-01'
    TIME 3 '12:29:59'
    DATETIME 8 '2020-01-01 12:29:59'
    YEAR 1 '2017'
    TIMESTAMP 4 '1970-01-01 00:00:01' UTC ~ '2038-01-01 00:00:01' UTC

    1.3命令行脚本

    命令行连接

    • 打开终端,运行命令:

        mysql -uroot -p 回车后输入密码,当前设置的密码为mysql

    • 退出登录:

        quit 和 exit 或 ctrl+d

    • 登录成功后,输入如下命令查看效果:

        查看版本:select version(); 显示当前时间:select now(); 

     1.3.1 数据库操作

    • 查看所有数据库

    show databases;
    • 使用数据库

    use 数据库名;
    • 查看当前使用的数据库

    select database();
    • 创建数据库

    create database 数据库名 charset=utf8;
    • 删除数据库

    drop database 数据库名;

    1.3.2 数据表操作

    • 查看当前数据库中所有表

    show tables;
    • 查看表结构

    desc 表名;
    • 创建表

    • auto_increment表示自动增长

    CREATE TABLE table_name( column1 datatype contrai,
    
    column2 datatype,
    
    column3 datatype,
    
    .....
    
    columnN datatype,
    
    PRIMARY KEY(one or more columns) );
    View Code

    例:创建班级表

    create table classes( id int unsigned auto_increment primary key not null, name varchar(10) );
    View Code

    例:创建学生表

    create table students( id int unsigned primary key auto_increment not null,
    
    name varchar(20) default '',
    
    age tinyint unsigned default 0,
    
    height decimal(5,2),
    
    gender enum('','','保密'),
    
    cls_id int unsigned default 0 )
    View Code
    • 修改表-添加字段

    alter table 表名 add 列名 类型; 例: alter table students add birthday datetime;
    • 修改表-修改字段:重命名版

    alter table 表名 change 原名 新名 类型及约束; 例: alter table students change birthday birth datetime not null;
    • 修改表-修改字段:不重命名版

    alter table 表名 modify 列名 类型及约束; 例: alter table students modify birth date not null;
    • 修改表-删除字段

    alter table 表名 drop 列名; 例: alter table students drop birthday;
    • 删除表

    drop table 表名; 例: drop table students;
    • 查看表的创建语句

    show create table 表名; 例: show create table classes;

    1.3.3 数据增删改查(curd)

    增删改查(curd)

    curd的解释: 代表创建(Create)、更新(Update)、读取(Retrieve)和删除(Delete)

    查询基本使用

    • 查询所有列

    select * from 表名;   例:select * from classes;
    • 查询指定列

    • 可以使用as为列或表指定别名

    select 列1,列2,... from 表名;    例:select id,name from classes;

    增加

    格式:INSERT [INTO] tb_name [(col_name,...)] {VALUES | VALUE} ({expr | DEFAULT},...),(...),...
    • 说明:主键列是自动增长,但是在全列插入时需要占位,通常使用0或者 default 或者 null 来占位,插入成功后以实际数据为准

    • 全列插入:值的顺序与表中字段的顺序对应

    insert into 表名 values(...)   例:insert into students values(0,’郭靖‘,1,'蒙古','2019-1-2');
    • 部分列插入:值的顺序与给出的列顺序对应

    insert into 表名(列1,...) values(值1,...)   例:insert into students(name,hometown,birthday) values('黄蓉','桃花岛','2019-3-2');
    • 上面的语句一次可以向表中插入一行数据,还可以一次性插入多行数据,这样可以减少与数据库的通信

    • 全列多行插入:值的顺序与给出的列顺序对应

    insert into 表名 values(...),(...)...;
    例:
    insert into classes values(0,'python1'),(0,'python2');
    insert into 表名(列1,...) values(值1,...),(值1,...)...;
    例:
    insert into students(name) values('杨康'),('杨过'),('小龙女');
    View Code

    修改

    格式: UPDATE tbname SET col1={expr1|DEFAULT} [,col2={expr2|default}]...[where 条件判断]
    update 表名 set 列1=值1,列2=值2... where 条件  例:update students set gender=0,hometown='北京' where id=5;

    删除

    DELETE FROM tbname [where 条件判断]
    delete from 表名 where 条件  例:delete from students where id=5;
    • 逻辑删除,本质就是修改操作

    update students set isdelete=1 where id=1;

    1.3.4 数据备份与恢复

    备份

    • 运行mysqldump命令

    mysqldump –uroot –p 数据库名 > python.sql; # 按提示输入mysql的密码

    恢复

    • 连接mysql,创建新的数据库

    • 退出连接,执行如下命令

    mysql -uroot –p 新数据库名 < python.sql # 根据提示输入mysql密码

    二、 MySQL-查询

    2.1 MySQL查询

    查询

    创建数据库、数据表

    -- 创建数据库
    create database python_test_1 charset=utf8;
    -- 使用数据库
    use python_test_1;
    create table students(
        id int unsigned primary key auto_increment not null,
        name varchar(20) default '',
        age tinyint unsigned default 0,
        height decimal(5,2),
        gender enum('','','保密') default '保密',
        cls_id int unsigned default 0,
        is_delete bit default 0
    );
    -- students表
    create table classes (
        id int unsigned auto_increment primary key not null,
        name varchar(30) not null
    );
    -- classes表

    准备数据

    insert into students values
    (0,'小明',18,180.00,2,1,0),
    (0,'小月月',18,180.00,2,2,1),
    (0,'彭于晏',29,185.00,1,1,0),
    (0,'刘德华',59,175.00,1,2,1),
    (0,'黄蓉',38,160.00,2,1,0),
    (0,'凤姐',28,150.00,4,2,1),
    (0,'王祖贤',18,172.00,2,1,1),
    (0,'周杰伦',36,NULL,1,1,0),
    (0,'程坤',27,181.00,1,2,0),
    (0,'刘亦菲',25,166.00,2,2,0),
    (0,'金星',33,162.00,3,3,1),
    (0,'静香',12,180.00,2,4,0),
    (0,'郭靖',12,170.00,1,4,0),
    (0,'周杰',34,176.00,2,5,0);
    -- 向students表中插入数据
    insert into classes values (0, "python_01"), (0, "python_02");
    -- 向classes表中插入数据
    • 查询所有字段

    select * from 表名; 例: select * from students;
    • 查询指定字段

    select 列1,列2,... from 表名; 例: select name from students;
    • 使用 as 给字段起别名

    select id as 序号, name as 名字, gender as 性别 from students;

    消除重复行

    • 在select后面列前使用distinct可以消除重复的行

    select distinct 列1,... from 表名; 例: select distinct gender from students;

    2.2 条件

    使用where子句对表中的数据筛选,结果为true的行会出现在结果集中

    • 语法如下:
    select * from 表名 where 条件;     例:select * from students where id=1;
    • where后面支持多种运算符,进行条件的处理

      • 比较运算符

      • 逻辑运算符

      • 模糊查询

      • 范围查询

      • 空判断

    比较运算符

    • 等于: =

    • 大于: >

    • 大于等于: >=

    • 小于: <

    • 小于等于: <=

    • 不等于: != 或 <>

    例1:查询编号大于3的学生
    
    
    select * from students where id > 3;
    
    例2:查询编号不大于4的学生
    
    
    select * from students where id <= 4;
    
    例3:查询姓名不是“黄蓉”的学生
    
    
    select * from students where name != '黄蓉';
    
    例4:查询没被删除的学生
    
    
    select * from students where is_delete=0;
    例子

    逻辑运算符

    • and

    • or

    • not

    例5:查询编号大于3的女同学
    
    
    select * from students where id > 3 and gender=0;
    
    例6:查询编号小于4或没被删除的学生
    
    
    select * from students where id < 4 or is_delete=0;
    例子

    模糊查询

    • like

    • %表示任意多个任意字符

    • _表示一个任意字符

    例7:查询姓黄的学生
    
    
    select * from students where name like '黄%';
    
    例8:查询姓黄并且“名”是一个字的学生
    
    
    select * from students where name like '黄_';
    
    例9:查询姓黄或叫靖的学生
    
    
    select * from students where name like '黄%' or name like '%靖';
    例子

    范围查询

    • in表示在一个非连续的范围内

    例10:查询编号是1或3或8的学生
    
    
    select * from students where id in(1,3,8);
    
    between ... and ...表示在一个连续的范围内
    
    例11:查询编号为3至8的学生
    
    
    select * from students where id between 3 and 8;
    
    例12:查询编号是3至8的男生
    
    
    select * from students where (id between 3 and 8) and gender=1;
    例子

    空判断

    • 注意:null与''是不同的

    • 判空is null

    例13:查询没有填写身高的学生
    
    
    select * from students where height is null;
    
    判非空is not null
    
    例14:查询填写了身高的学生
    
    
    select * from students where height is not null;
    
    例15:查询填写了身高的男生
    
    
    select * from students where height is not null and gender=1;
    例子

    优先级

    • 优先级由高到低的顺序为:小括号,not,比较运算符,逻辑运算符

    • and比or先运算,如果同时出现并希望先算or,需要结合()使用

    2.3 排序

    为了方便查看数据,可以对数据进行排序

    语法:
    select * from 表名 order by 列1 asc|desc [,列2 asc|desc,...]
    说明
    • 将行数据按照列1进行排序,如果某些行列1的值相同时,则按照列2排序,以此类推

    • 默认按照列值从小到大排列(asc)

    • asc从小到大排列,即升序

    • desc从大到小排序,即降序

    例1:查询未删除男生信息,按学号降序
    
    select * from students where gender=1 and is_delete=0 order by id desc;
    例2:查询未删除学生信息,按名称升序
    
    select * from students where is_delete=0 order by name;
    例3:显示所有的学生信息,先按照年龄从大-->小排序,当年龄相同时 按照身高从高-->矮排序
    
    select * from students  order by age desc,height desc;
    例子

    2.4聚合函数

    为了快速得到统计数据,经常会用到如下5个聚合函数

    总数

    • count(*)表示计算总行数,括号中写星与列名,结果是相同的
    例1:查询学生总数
    
    select count(*) from students;
    例子

    最大值

    • max(列)表示求此列的最大值
    例2:查询女生的编号最大值
    
    select max(id) from students where gender=2;
    例子

    最小值

    • min(列)表示求此列的最小值
    例3:查询未删除的学生最小编号
    
    select min(id) from students where is_delete=0;
    例子

    求和

    • sum(列)表示求此列的和
    例4:查询男生的总年龄
    
    select sum(age) from students where gender=1;
    
    -- 平均年龄
    select sum(age)/count(*) from students where gender=1;
    例子

    平均值

    • avg(列)表示求此列的平均值
    例5:查询未删除女生的编号平均值
    
    select avg(id) from students where is_delete=0 and gender=2;
    例子

    2.5分组

    group by

    1. group by的含义:将查询结果按照1个或多个字段进行分组,字段值相同的为一组

    2. group by可用于单个字段分组,也可用于多个字段分组

    select * from students;
    +----+-----------+------+--------+--------+--------+-----------+
    | id | name      | age  | height | gender | cls_id | is_delete |
    +----+-----------+------+--------+--------+--------+-----------+
    |  1 | 小明      |   18 | 180.00 ||      1 |           |
    |  2 | 小月月    |   18 | 180.00 ||      2 |          |
    |  3 | 彭于晏    |   29 | 185.00 ||      1 |           |
    |  4 | 刘德华    |   59 | 175.00 ||      2 |          |
    |  5 | 黄蓉      |   38 | 160.00 ||      1 |           |
    |  6 | 凤姐      |   28 | 150.00 | 保密   |      2 |          |
    |  7 | 王祖贤    |   18 | 172.00 ||      1 |          |
    |  8 | 周杰伦    |   36 |   NULL ||      1 |           |
    |  9 | 程坤      |   27 | 181.00 ||      2 |           |
    | 10 | 刘亦菲    |   25 | 166.00 ||      2 |           |
    | 11 | 金星      |   33 | 162.00 | 中性   |      3 |          |
    | 12 | 静香      |   12 | 180.00 ||      4 |           |
    | 13 | 周杰      |   34 | 176.00 ||      5 |           |
    | 14 | 郭靖      |   12 | 170.00 ||      4 |           |
    +----+-----------+------+--------+--------+--------+-----------+
    
    select gender from students group by gender;
    +--------+
    | gender |
    +--------+
    ||
    ||
    | 中性   |
    | 保密   |
    +--------+
    根据gender字段来分组,gender字段的全部值有4个'','','中性','保密',所以分为了4组 当group by单独使用时,只显示出每组的第一条记录, 所以group by单独使用时的实际意义不大
    例子

    group by + group_concat()

    1. group_concat(字段名)可以作为一个输出字段来使用,

    2. 表示分组之后,根据分组结果,使用group_concat()来放置每一组的某字段的值的集合

    select gender from students group by gender;
    +--------+
    | gender |
    +--------+
    ||
    ||
    | 中性   |
    | 保密   |
    +--------+
    
    select gender,group_concat(name) from students group by gender;
    +--------+-----------------------------------------------------------+
    | gender | group_concat(name)                                        |
    +--------+-----------------------------------------------------------+
    || 彭于晏,刘德华,周杰伦,程坤,郭靖                                 |
    || 小明,小月月,黄蓉,王祖贤,刘亦菲,静香,周杰                        |
    | 中性   | 金星                                                       |
    | 保密   | 凤姐                                                       |
    +--------+-----------------------------------------------------------+
    
    
    select gender,group_concat(id) from students group by gender;
    +--------+------------------+
    | gender | group_concat(id) |
    +--------+------------------+
    || 3,4,8,9,14       |
    || 1,2,5,7,10,12,13 |
    | 中性   | 11               |
    | 保密   | 6                |
    +--------+------------------+
    例子

    group by + 集合函数

    1. 通过group_concat()的启发,我们既然可以统计出每个分组的某字段的值的集合,那么我们也可以通过集合函数来对这个值的集合做一些操作

    select gender,group_concat(age) from students group by gender;
    +--------+----------------------+
    | gender | group_concat(age)    |
    +--------+----------------------+
    || 29,59,36,27,12       |
    || 18,18,38,18,25,12,34 |
    | 中性   | 33                   |
    | 保密   | 28                   |
    +--------+----------------------+
    
    
    分别统计性别为男/女的人年龄平均值
    select gender,avg(age) from students group by gender;
    +--------+----------+
    | gender | avg(age) |
    +--------+----------+
    ||  32.6000 |
    ||  23.2857 |
    | 中性   |  33.0000 |
    | 保密   |  28.0000 |
    +--------+----------+
    
    分别统计性别为男/女的人的个数
    select gender,count(*) from students group by gender;
    +--------+----------+
    | gender | count(*) |
    +--------+----------+
    ||        5 |
    ||        7 |
    | 中性   |        1 |
    | 保密   |        1 |
    +--------+----------+
    例子

    group by + having

    1. having 条件表达式:用来分组查询后指定一些条件来输出查询结果

    2. having作用和where一样,但having只能用于group by

    select gender,count(*) from students group by gender having count(*)>2;
    +--------+----------+
    | gender | count(*) |
    +--------+----------+
    ||        5 |
    ||        7 |
    +--------+----------+
    例子

    group by + with rollup

    1. with rollup的作用是:在最后新增一行,来记录当前列里所有记录的总和

    select gender,count(*) from students group by gender with rollup;
    +--------+----------+
    | gender | count(*) |
    +--------+----------+
    ||        5 |
    ||        7 |
    | 中性   |        1 |
    | 保密   |        1 |
    | NULL   |       14 |
    +--------+----------+
    
    
    select gender,group_concat(age) from students group by gender with rollup;
    +--------+-------------------------------------------+
    | gender | group_concat(age)                         |
    +--------+-------------------------------------------+
    || 29,59,36,27,12                            |
    || 18,18,38,18,25,12,34                      |
    | 中性   | 33                                        |
    | 保密   | 28                                        |
    | NULL   | 29,59,36,27,12,18,18,38,18,25,12,34,33,28 |
    +--------+-------------------------------------------+
    例子

    2.6分页

    语法

    select * from 表名 limit start,count

    说明

    • 从start开始,获取count条数据

    例1:查询前3行男生信息
    
    select * from students where gender=1 limit 0,3;
    例子

    示例:分页

    • 已知:每页显示m条数据,当前显示第n页

    • 求总页数:此段逻辑后面会在python中实现

      • 查询总条数p1

      • 使用p1除以m得到p2

      • 如果整除则p2为总数页

      • 如果不整除则p2+1为总页数

    • 求第n页的数据

    select * from students where is_delete=0 limit (n-1)*m,m
    例子

    2.7连接查询

    当查询结果的列来源于多张表时,需要将多张表连接成一个大的数据集,再选择合适的列返回

    mysql支持三种类型的连接查询,分别为:

    • 内连接查询:查询的结果为两个表匹配到的数据

     

    • 右连接查询:查询的结果为两个表匹配到的数据,右表特有的数据,对于左表中不存在的数据使用null填充

    • 左连接查询:查询的结果为两个表匹配到的数据,左表特有的数据,对于右表中不存在的数据使用null填充

    语法

    select * from 表1 inner或left或right join 表2 on 表1.列 = 表2.列
    
    
    例1:使用内连接查询班级表与学生表
    
    select * from students inner join classes on students.cls_id = classes.id;
    例2:使用左连接查询班级表与学生表
    
    此处使用了as为表起别名,目的是编写简单
    select * from students as s left join classes as c on s.cls_id = c.id;
    例3:使用右连接查询班级表与学生表
    
    select * from students as s right join classes as c on s.cls_id = c.id;
    例4:查询学生姓名及班级名称
    
    select s.name,c.name from students as s inner join classes as c on s.cls_id = c.id;
    例子

    2.8自关联
    • 设计省信息的表结构provinces

      • id
      • ptitle
    •  设计市信息的表结构citys

      • id
      • ctitle
      • proid
    • citys表的proid表示城市所属的省,对应着provinces表的id值

    问题:

    能不能将两个表合成一张表呢?

    思考:

    观察两张表发现,citys表比provinces表多一个列proid,其它列的类型都是一样的

    意义:

    存储的都是地区信息,而且每种信息的数据量有限,没必要增加一个新表,或者将来还要存储区、乡镇信息,都增加新表的开销太大

    答案:

    定义表areas,结构如下

    • id

    • atitle

    • pid

    说明:

    • 因为省没有所属的省份,所以可以填写为null

    • 城市所属的省份pid,填写省所对应的编号id

    • 这就是自关联,表中的某一列,关联了这个表中的另外一列,但是它们的业务逻辑含义是不一样的,城市信息的pid引用的是省信息的id

    • 在这个表中,结构不变,可以添加区县、乡镇街道、村社区等信息

    创建areas表的语句如下:

    create table areas(
        aid int primary key,
        atitle varchar(20),
        pid int
    );
    View Code
    • 从sql文件中导入数据
    source areas.sql;
    View Code
    • 查询一共有多少个省
    select count(*) from areas where pid is null;
    View Code
    例1:查询省的名称为“山西省”的所有城市
    select city.* from areas as city
    inner join areas as province on city.pid=province.aid
    where province.atitle='山西省';
    例2:查询市的名称为“广州市”的所有区县
    select dis.* from areas as dis
    inner join areas as city on city.aid=dis.pid
    where city.atitle='广州市';
    例子

    2.9子查询

    子查询

      在一个 select 语句中,嵌入了另外一个 select 语句, 那么被嵌入的 select 语句称之为子查询语句

    主查询

      主要查询的对象,第一条 select 语句

    主查询和子查询的关系

    • 子查询是嵌入到主查询中

    • 子查询是辅助主查询的,要么充当条件,要么充当数据源

    • 子查询是可以独立存在的语句,是一条完整的 select 语句

    子查询分类

    • 标量子查询: 子查询返回的结果是一个数据(一行一列)

    • 列子查询: 返回的结果是一列(一列多行)

    • 行子查询: 返回的结果是一行(一行多列)

    标量子查询

    1. 查询班级学生平均年龄

    2. 查询大于平均年龄的学生

    查询班级学生的平均身高

    select * from students where age > (select avg(age) from students);
    View Code

    列级子查询

    • 查询还有学生在班的所有班级名字
      1. 找出学生表中所有的班级 id
      2. 找出班级表中对应的名字
    select name from classes where id in (select cls_id from students);
    View Code

    行级子查询

    • 需求: 查找班级年龄最大,身高最高的学生

    • 行元素: 将多个字段合成一个行元素,在行级子查询中会使用到行元素

    select * from students where (height,age) = (select max(height),max(age) from students);
    View Code

    子查询中特定关键字使用

    • in 范围

      • 格式: 主查询 where 条件 in (列子查询)

    2.10 总结

    查询的完整格式 

    SELECT select_expr [,select_expr,...] [      
          FROM tb_name
          [WHERE 条件判断]
          [GROUP BY {col_name | postion} [ASC | DESC], ...] 
          [HAVING WHERE 条件判断]
          [ORDER BY {col_name|expr|postion} [ASC | DESC], ...]
          [ LIMIT {[offset,]rowcount | row_count OFFSET offset}]
    ]
    View Code
    • 完整的select语句

    select distinct *
    from 表名
    where ....
    group by ... having ...
    order by ...
    limit start,count
    View Code
    • 执行顺序为:
      • from 表名
      • where ....
      • group by ...
      • select distinct *
      • having ...
      • order by ...
      • limit start,count
    • 实际使用中,只是语句中某些部分的组合,而不是全部

     三、MySQL与Python交互

    3.1Python操作MySQL步骤

    引入模块

    • 在py文件中引入pymysql模块

    from pymysql import *

    Connection 对象

    • 用于建立与数据库的连接

    • 创建对象:调用connect()方法

    conn=connect(参数列表)
    • 参数host:连接的mysql主机,如果本机是'localhost'

    • 参数port:连接的mysql主机的端口,默认是3306

    • 参数database:数据库的名称

    • 参数user:连接的用户名

    • 参数password:连接的密码

    • 参数charset:通信采用的编码方式,推荐使用utf8

    对象的方法

    • close()关闭连接

    • commit()提交

    • cursor()返回Cursor对象,用于执行sql语句并获得结果

    Cursor对象

    • 用于执行sql语句,使用频度最高的语句为select、insert、update、delete

    • 获取Cursor对象:调用Connection对象的cursor()方法

    cs1=conn.cursor()

    对象的方法

    • close()关闭

    • execute(operation [, parameters ])执行语句,返回受影响的行数,主要用于执行insert、update、delete语句,也可以执行create、alter、drop等语句

    • fetchone()执行查询语句时,获取查询结果集的第一个行数据,返回一个元组

    • fetchall()执行查询时,获取结果集的所有行,一行构成一个元组,再将这些元组装入一个元组返回

    对象的属性

    • rowcount只读属性,表示最近一次execute()执行后受影响的行数

    • connection获得当前连接对象

    3.2增删改查 

    增删改

    from pymysql import *
    
    def main():
        # 创建Connection连接
        conn = connect(host='localhost',port=3306,database='jing_dong',user='root',password='mysql',charset='utf8')
        # 获得Cursor对象
        cs1 = conn.cursor()
        # 执行insert语句,并返回受影响的行数:添加一条数据
        # 增加
        count = cs1.execute('insert into goods_cates(name) values("硬盘")')
        #打印受影响的行数
        print(count)
    
        count = cs1.execute('insert into goods_cates(name) values("光盘")')
        print(count)
    
        # # 更新
        # count = cs1.execute('update goods_cates set name="机械硬盘" where name="硬盘"')
        # # 删除
        # count = cs1.execute('delete from goods_cates where id=6')
    
        # 提交之前的操作,如果之前已经之执行过多次的execute,那么就都进行提交
        conn.commit()
    
        # 关闭Cursor对象
        cs1.close()
        # 关闭Connection对象
        conn.close()
    
    if __name__ == '__main__':
        main()
    View Code

    查询一行数据

    from pymysql import *
    
    def main():
        # 创建Connection连接
        conn = connect(host='localhost',port=3306,user='root',password='mysql',database='jing_dong',charset='utf8')
        # 获得Cursor对象
        cs1 = conn.cursor()
        # 执行select语句,并返回受影响的行数:查询一条数据
        count = cs1.execute('select id,name from goods where id>=4')
        # 打印受影响的行数
        print("查询到%d条数据:" % count)
    
        for i in range(count):
            # 获取查询的结果
            result = cs1.fetchone()
            # 打印查询的结果
            print(result)
            # 获取查询的结果
    
        # 关闭Cursor对象
        cs1.close()
        conn.close()
    
    if __name__ == '__main__':
        main()
    View Code

    查询多行数据

    from pymysql import *
    
    def main():
        # 创建Connection连接
        conn = connect(host='localhost',port=3306,user='root',password='mysql',database='jing_dong',charset='utf8')
        # 获得Cursor对象
        cs1 = conn.cursor()
        # 执行select语句,并返回受影响的行数:查询一条数据
        count = cs1.execute('select id,name from goods where id>=4')
        # 打印受影响的行数
        print("查询到%d条数据:" % count)
    
        # for i in range(count):
        #     # 获取查询的结果
        #     result = cs1.fetchone()
        #     # 打印查询的结果
        #     print(result)
        #     # 获取查询的结果
    
        result = cs1.fetchall()
        print(result)
    
        # 关闭Cursor对象
        cs1.close()
        conn.close()
    
    if __name__ == '__main__':
        main()
    View Code

    3.3参数化

    • sql语句的参数化,可以有效防止sql注入

    • 注意:此处不同于python的字符串格式化,全部使用%s占位

    from pymysql import *
    
    def main():
    
        find_name = input("请输入物品名称:")
    
        # 创建Connection连接
        conn = connect(host='localhost',port=3306,user='root',password='mysql',database='jing_dong',charset='utf8')
        # 获得Cursor对象
        cs1 = conn.cursor()
    
    
        # # 非安全的方式
        # # 输入 " or 1=1 or "   (双引号也要输入)
        # sql = 'select * from goods where name="%s"' % find_name
        # print("""sql===>%s<====""" % sql)
        # # 执行select语句,并返回受影响的行数:查询所有数据
        # count = cs1.execute(sql)
    
        # 安全的方式
        # 构造参数列表
        params = [find_name]
        # 执行select语句,并返回受影响的行数:查询所有数据
        count = cs1.execute('select * from goods where name=%s', params)
        # 注意:
        # 如果要是有多个参数,需要进行参数化
        # 那么params = [数值1, 数值2....],此时sql语句中有多个%s即可 
    
        # 打印受影响的行数
        print(count)
        # 获取查询的结果
        # result = cs1.fetchone()
        result = cs1.fetchall()
        # 打印查询的结果
        print(result)
        # 关闭Cursor对象
        cs1.close()
        # 关闭Connection对象
        conn.close()
    
    if __name__ == '__main__':
        main()
    View Code

    四、MySQL高级

    4.1视图

    1. 问题

    对于复杂的查询,往往是有多个数据表进行关联查询而得到,如果数据库因为需求等原因发生了改变,为了保证查询出来的数据与之前相同,则需要在多个地方进行修改,维护起来非常麻烦

    解决办法:定义视图

    2. 视图是什么

    通俗的讲,视图就是一条SELECT语句执行后返回的结果集。所以我们在创建视图的时候,主要的工作就落在创建这条SQL查询语句上。

    视图是对若干张基本表的引用,一张虚表,查询语句执行的结果,不存储具体的数据(基本表数据发生了改变,视图也会跟着改变);

    方便操作,特别是查询操作,减少复杂的SQL语句,增强可读性;

    3. 定义视图

    建议以v_开头

    create view 视图名称 as select语句;

    4. 查看视图

    查看表会将所有的视图也列出来

    show tables;

    5. 使用视图

    视图的用途就是查询

    select * from v_stu_score;

    6. 删除视图

    drop view 视图名称; 例: drop view v_stu_sco;

    7. 视图的作用

    1. 提高了重用性,就像一个函数

    2. 对数据库重构,却不影响程序的运行

    3. 提高了安全性能,可以对不同的用户

    4. 让数据更加清晰

    4.2事务

    事务四大特性(简称ACID)

    • 原子性(Atomicity)

    • 一致性(Consistency)

    • 隔离性(Isolation)

    • 持久性(Durability)

    以下内容出自《高性能MySQL》第三版,了解事务的ACID及四种隔离级有助于我们更好的理解事务运作。

    下面举一个银行应用是解释事务必要性的一个经典例子。假如一个银行的数据库有两张表:支票表(checking)和储蓄表(savings)。现在要从用户Jane的支票账户转移200美元到她的储蓄账户,那么至少需要三个步骤:

    1. 检查支票账户的余额高于或者等于200美元。
    2. 从支票账户余额中减去200美元。
    3. 在储蓄帐户余额中增加200美元。

    上述三个步骤的操作必须打包在一个事务中,任何一个步骤失败,则必须回滚所有的步骤。

    可以用START TRANSACTION语句开始一个事务,然后要么使用COMMIT提交将修改的数据持久保存,要么使用ROLLBACK撤销所有的修改。事务SQL的样本如下:

    1. start transaction;
    2. select balance from checking where customer_id = 10233276;
    3. update checking set balance = balance - 200.00 where customer_id = 10233276;
    4. update savings set balance = balance + 200.00 where customer_id = 10233276;
    5. commit;

    一个很好的事务处理系统,必须具备这些标准特性:

    • 原子性(atomicity)

        一个事务必须被视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部提交成功,要么全部失败回滚,对于一个事务来说,不可能只执行其中的一部分操作,这就是事务的原子性

    • 一致性(consistency)

        数据库总是从一个一致性的状态转换到另一个一致性的状态。(在前面的例子中,一致性确保了,即使在执行第三、四条语句之间时系统崩溃,支票账户中也不会损失200美元,因为事务最终没有提交,所以事务中所做的修改也不会保存到数据库中。)

    • 隔离性(isolation)

        通常来说,一个事务所做的修改在最终提交以前,对其他事务是不可见的。(在前面的例子中,当执行完第三条语句、第四条语句还未开始时,此时有另外的一个账户汇总程序开始运行,则其看到支票帐户的余额并没有被减去200美元。)

    • 持久性(durability)

        一旦事务提交,则其所做的修改会永久保存到数据库。(此时即使系统崩溃,修改的数据也不会丢失。)

    事务命令

    表的引擎类型必须是innodb类型才可以使用事务,这是mysql表的默认引擎

    查看表的创建语句,可以看到engine=innodb

    -- 选择数据库
    use jing_dong;
    -- 查看goods表
    show create table goods;
    View Code

    开启事务,命令如下:

    • 开启事务后执行修改命令,变更会维护到本地缓存中,而不维护到物理表中
    begin;
    或者
    start transaction;
    View Code

    提交事务,命令如下

    • 将缓存中的数据变更维护到物理表中
    commit;
    View Code

    回滚事务,命令如下:

    • 放弃缓存中变更的数据

    rollback;
    View Code

    注意

    1. 修改数据的命令会自动的触发事务,包括insert、update、delete

    2. 而在SQL语句中有手动开启事务的原因是:可以进行多次数据的修改,如果成功一起成功,否则一起会滚到之前的数据

    4.2.1提交

    step1:连接
    终端1:查询商品分类信息
    select * from goods_cates;
    step2:增加数据
    终端2:开启事务,插入数据
    begin;
    insert into goods_cates(name) values('小霸王游戏机');
    终端2:查询数据,此时有新增的数据
    select * from goods_cates;
    step3:查询
    终端1:查询数据,发现并没有新增的数据
    select * from goods_cates;
    step4:提交
    终端2:完成提交
    commit;
    step5:查询
    终端1:查询,发现有新增的数据
    select * from goods_cates;
    View Code

    4.2.2回滚

    step1:连接
    终端1
    select * from goods_cates;
    step2:增加数据
    终端2:开启事务,插入数据
    begin;
    insert into goods_cates(name) values('小霸王游戏机');
    终端2:查询数据,此时有新增的数据
    select * from goods_cates;
    step3:查询
    终端1:查询数据,发现并没有新增的数据
    select * from goods_cates;
    step4:回滚
    终端2:完成回滚
    rollback;
    step5:查询
    终端1:查询数据,发现没有新增的数据
    select * from goods_cates;
    View Code

    4.3索引

    索引是什么

    索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针。

    更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度

    索引的使用

    • 查看索引
    show index from 表名;
    • 创建索引
      • 如果指定字段是字符串,需要指定长度,建议长度与定义字段时的长度一致
      • 字段类型如果不是字符串,可以不填写长度部分
    create index 索引名称 on 表名(字段名称(长度))
    • 删除索引:
    drop index 索引名称 on 表名;

    索引demo

    1.创建测试表testindex
    create table test_index(title varchar(10));
    2. 使用python程序(ipython也可以)通过pymsql模块 向表中加入十万条数据
    from pymysql import connect
    
    def main():
        # 创建Connection连接
        conn = connect(host='localhost',port=3306,database='jing_dong',user='root',password='mysql',charset='utf8')
        # 获得Cursor对象
        cursor = conn.cursor()
        # 插入10万次数据
        for i in range(100000):
            cursor.execute("insert into test_index values('ha-%d')" % i)
        # 提交数据
        conn.commit()
    
    if __name__ == "__main__":
        main()
    3. 查询
    开启运行时间监测:
    set profiling=1;
    查找第1万条数据ha-99999
    select * from test_index where title='ha-99999';
    查看执行的时间:
    show profiles;
    为表title_index的title列创建索引:
    create index title_index on test_index(title(10));
    执行查询语句:
    select * from test_index where title='ha-99999';
    再次查看执行的时间
    show profiles;
    例子

    注意:

    要注意的是,建立太多的索引将会影响更新和插入的速度,因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格,就没有必要为一个很少使用的where字句单独建立索引了,对于比较小的表,排序的开销不会很大,也没有必要建立另外的索引。

    建立索引会占用磁盘空间

  • 相关阅读:
    Lucene底层原理和优化经验分享(1)-Lucene简介和索引原理
    mysql 索引
    C++ 后台进程 daemon
    Linux进程状态
    实现一个简单的shared_ptr
    [LeetCode] Factorial Trailing Zeroes
    完美转发
    排序
    每天五个java相关面试题(7)--线程篇
    程序员为什么会淡忘?
  • 原文地址:https://www.cnblogs.com/ForT/p/10692333.html
Copyright © 2011-2022 走看看