zoukankan      html  css  js  c++  java
  • MySQL数据库

    数据库概述
    数据存储阶段
    数据库应用
    基础概念
    数据库分类和常见数据库
    认识关系型数据库和MySQL
    SQL语句
    建立数据库和数据表
    数据库操作
    数据表的管理
    表结构设计初步
    数据类型支持
    数据操作基础
    插入(insert)
    查询(select)
    where子句
    算数运算符
    比较运算符
    逻辑运算符
    位运算符
    更新表记录(update)
    删除表记录(delete)
    表字段的操作(alter)
    时间类型数据
    时间格式
    日期时间函数
    时间操作
    高级查询语句
    模糊查询和正则查询
    as 用法
    排序
    分页(限制)
    联合查询
    子查询
    聚合操作
    聚合函数
    聚合分组
    聚合筛选
    去重语句
    聚合运算
    索引操作
    索引概述
    索引分类
    索引创建
    扩展:索引结构
    外键约束和表关联关系
    外键约束
    表关联设计
    E-R模型
    表关联查询
    多表查询
    内连接
    外链接
    视图
    视图概念
    视图操作
    视图作用
    函数和存储过程
    函数创建
    存储过程创建
    存储过程和存储函数操作
    函数和存储过程区别
    事务控制
    事务概述
    事务操作
    事务四大特性
    数据库优化
    数据库设计范式
    MySQL存储引擎
    字段数据类型选择
    键的设置
    explain语句
    SQL优化
    表的拆分
    数据库备份和用户管理
    数据备份
    表的复制
    用户权限管理
    pymysql模块
    pymysql安装
    pymysql使用流程
    常用函数
    数据库概述
    数据存储阶段
    【1】 人工管理阶段

    缺点 : 数据无法共享,不能单独保持,数据存储量有限

    【2】 文件管理阶段 (.txt .doc .xls)

    优点 : 数据可以长期保存,可以存储大量的数据,使用简单

    缺点 : 数据一致性差,数据查找修改不方便,数据冗余度可能比较大

    【3】数据库管理阶段

    优点 : 数据组织结构化降低了冗余度,提高了增删改查的效率,容易扩展,方便程序调用,做自动化处理

    缺点 :需要使用sql 或者 其他特定的语句,相对比较复杂

    数据库应用
    融机构、游戏网站、购物网站、论坛网站 ... ...

    基础概念
    数据 : 能够输入到计算机中并被识别处理的信息集合

    数据结构 :研究一个数据集合中数据之间关系的

    数据库 : 按照数据结构,存储管理数据的仓库。数据库是在数据库管理系统管理和控制下,在一定介质上的数据集合。

    数据库管理系统 :管理数据库的软件,用于建立和维护数据库

    数据库系统 : 由数据库和数据库管理系统,开发工具等组成的集合

    数据库分类和常见数据库
    关系型数据库和非关系型数据库
    关系型: 采用关系模型(二维表)来组织数据结构的数据库

    非关系型: 不采用关系模型组织数据结构的数据库

    开源数据库和非开源数据库
    开源:MySQL、SQLite、MongoDB

    非开源:Oracle、DB2、SQL_Server

    常见的关系型数据库
    MySQL、Oracle、SQL_Server、DB2 SQLite

    认识关系型数据库和MySQL
    数据库结构
    数据元素 --> 记录 -->数据表 --> 数据库

    数据库概念解析
    数据表(table) : 存放数据的表格

    字段(column): 每个列,用来表示该列数据的含义

    记录(row): 每个行,表示一组完整的数据

    MySQL特点
    是开源数据库,使用C和C++编写
    能够工作在众多不同的平台上
    提供了用于C、C++、Python、Java、Perl、PHP、Ruby众多语言的API
    存储结构优良,运行速度快
    功能全面丰富
    MySQL安装
    Ubuntu安装MySQL服务

    安装服务端: sudo apt-get install mysql-server
    安装客户端: sudo apt-get install mysql-client

    配置文件:/etc/mysql
    命令集: /usr/bin
    数据库存储目录 :/var/lib/mysql
    Windows安装MySQL

    下载MySQL安装包(windows) https://dev.mysql.com/downloads/mysql/
    mysql-installer5.7..msi

    安装教程去安装

    启动和连接MySQL服务
    服务端启动

    查看MySQL状态: sudo /etc/init.d/mysql status
    启动服务:sudo /etc/init.d/mysql start | stop | restart 或者 service mysql start|stop|restart
    客户端连接

    命令格式

    mysql -h主机地址 -u用户名 -p密码
    mysql -hlocalhost -uroot -p123456
    本地连接可省略 -h 选项: mysql -uroot -p123456
    关闭连接

    ctrl-D
    exit

    SQL语句
    什么是SQL

    结构化查询语言(Structured Query Language),一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。

    SQL语句使用特点

    SQL语言基本上独立于数据库本身
    各种不同的数据库对SQL语言的支持与标准存在着细微的不同
    每条命令必须以 ; 结尾
    SQL命令(除了数据库名和表名)可以不区分字母大小写
    建立数据库和数据表
    数据库操作
    1.查看已有库

    show databases;

    2.创建库

    create database 库名 [character set utf8];

    e.g. 创建stu数据库,编码为utf8
    create database stu character set utf8;
    create database stu charset=utf8;
    3.查看创建库的语句

    show create database 库名;

    e.g. 查看stu创建方法
    show create database stu;
    4.查看当前所在库

    select database();

    5.切换库

    use 库名;

    e.g. 使用stu数据库
    use stu;
    6.删除库

    drop database 库名;

    e.g. 删除test数据库
    drop database test;
    7.库名的命名规则

    数字、字母、下划线,但不能使用纯数字
    库名区分字母大小写
    不能使用特殊字符和mysql关键字
    数据表的管理
    表结构设计初步
    【1】 分析存储内容
    【2】 确定字段构成
    【3】 设计字段类型

    数据类型支持
    数字类型:

    整数类型(精确值) - INTEGER,INT,SMALLINT,TINYINT,MEDIUMINT,BIGINT
    定点类型(精确值) - DECIMAL
    浮点类型(近似值) - FLOAT,DOUBLE
    比特值类型 - BIT

    对于精度比较高的东西,比如money,用decimal类型提高精度减少误差。列的声明语法是DECIMAL(M,D)。

    M是数字的最大位数(精度)。其范围为1~65,M 的默认值是10。
    D是小数点右侧数字的数目(标度)。其范围是0~30,但不得超过M。
    比如 DECIMAL(6,2)最多存6位数字,小数点后占2位,取值范围-9999.99到9999.99。

    比特值类型指0,1值表达2种情况,如真,假

    字符串类型:

    CHAR和VARCHAR类型
    BLOB和TEXT类型
    ENUM类型和SET类型

    char 和 varchar
    char:定长,效率高,一般用于固定长度的表单提交数据存储,默认1字符
    varchar:不定长,效率偏低 ,但是节省空间。

    text 和blob
    text用来存储非二进制文本
    blob用来存储二进制字节串

    enum 和 set
    enum用来存储给出的一个值
    set用来存储给出的值中一个或多个值

    表的基本操作
    创建表

    create table 表名(
    字段名 数据类型,
    字段名 数据类型,
    ...
    字段名 数据类型
    );

    如果你想设置数字为无符号则加上 unsigned
    如果你不想字段为 NULL 可以设置字段的属性为 NOT NULL, 在操作数据库时如果输入该字段的数据为NULL ,就会报错。
    DEFAULT 表示设置一个字段的默认值
    AUTO_INCREMENT定义列为自增的属性,一般用于主键,数值会自动加1。
    PRIMARY KEY 关键字用于定义列为主键。主键的值不能重复,且不能为空。
    e.g. 创建班级表
    create table class_1 (id int primary key auto_increment,name varchar(32) not null,age tinyint unsigned not null,sex enum('w','m'),score float default 0.0);

    e.g. 创建兴趣班表
    create table interest (id int primary key auto_increment,name varchar(32) not null,hobby set('sing','dance','draw'),level char not null,price decimal(6,2),remark text);
    查看数据表

    show tables;

    查看已有表的字符集

    show create table 表名;

    查看表结构

    desc 表名;

    删除表

    drop table 表名;

    数据操作基础
    插入(insert)
    insert into 表名 values(值1),(值2),...;
    insert into 表名(字段1,...) values(值1),...;
    e.g.
    insert into class_1 values (2,'Baron',10,'m',91),(3,'Jame',9,'m',90);
    查询(select)
    select * from 表名 [where 条件];
    select 字段1,字段2 from 表名 [where 条件];
    e.g.
    select * from class_1;

    select name,age from class_1;
    where子句
    where子句在sql语句中扮演了重要角色,主要通过一定的运算条件进行数据的筛选

    MySQL 主要有以下几种运算符:

    算术运算符
    比较运算符
    逻辑运算符
    位运算符

    算数运算符

    e.g.
    select * from class_1 where age % 2 = 0;
    比较运算符

    e.g.
    select * from class_1 where age > 8;
    select * from class_1 where between 8 and 10;
    select * from class_1 where age in (8,9);
    逻辑运算符

    e.g.
    select * from class_1 where sex='m' and age>9;
    位运算符

    更新表记录(update)
    update 表名 set 字段1=值1,字段2=值2,... where 条件;

    注意:update语句后如果不加where条件,所有记录全部更新
    e.g.
    update class_1 set age=11 where name='Abby';
    删除表记录(delete)
    delete from 表名 where 条件;

    注意:delete语句后如果不加where条件,所有记录全部清空
    e.g.
    delete from class_1 where name='Abby';
    表字段的操作(alter)
    语法 :alter table 表名 执行动作;

    • 添加字段(add)
      alter table 表名 add 字段名 数据类型;
      alter table 表名 add 字段名 数据类型 first;
      alter table 表名 add 字段名 数据类型 after 字段名;
    • 删除字段(drop)
      alter table 表名 drop 字段名;
    • 修改数据类型(modify)
      alter table 表名 modify 字段名 新数据类型;
    • 修改字段名(change)
      alter table 表名 change 旧字段名 新字段名 新数据类型;
    • 表重命名(rename)
      alter table 表名 rename 新表名;
      e.g.
      alter table interest add tel char(11) after name;
      时间类型数据
      时间和日期类型:

    日期DATE,日期时间DATETIME,时间戳TIMESTAMP
    时间TIME
    年份YEAR

    时间格式
    date :"YYYY-MM-DD"
    time :"HH:MM:SS"
    datetime :"YYYY-MM-DD HH:MM:SS"
    timestamp :"YYYY-MM-DD HH:MM:SS"
    注意
    1、datetime :以系统时间存储
    2、timestamp :以标准时间存储但是查看时转换为系统时区,所以表现形式和datetime相同

    e.g.
    create table marathon (id int primary key auto_increment,athlete varchar(32),birthday date,registration_time datetime,performance time);
    日期时间函数
    now() 返回服务器当前日期时间,格式对应datetime类型
    curdate() 返回当前日期,格式对应date类型
    curtime() 返回当前时间,格式对应time类型
    时间操作
    查找操作
    select * from marathon where birthday>='2000-01-01';
    select * from marathon where birthday>="2000-07-01" and performance<="2:30:00";
    日期时间运算

    语法格式

    select * from 表名 where 字段名 运算符 (时间-interval 时间间隔单位);

    时间间隔单位: 2 hour | 1 minute | 2 second | 2 year | 3 month | 1 day

    select * from marathon where registration_time > (now()-interval 7 day);
    高级查询语句
    模糊查询和正则查询
    LIKE用于在where子句中进行模糊查询,SQL LIKE 子句中使用百分号 %来表示任意0个或多个字符,下划线_表示任意一个字符。

    使用 LIKE 子句从数据表中读取数据的通用语法:

    SELECT field1, field2,...fieldN
    FROM table_name
    WHERE field1 LIKE condition1
    e.g.
    mysql> select * from class_1 where name like 'A%';
    mysql中对正则表达式的支持有限,只支持部分正则元字符

    SELECT field1, field2,...fieldN
    FROM table_name
    WHERE field1 REGEXP condition1
    e.g.
    select * from class_1 where name regexp '^B.+';
    as 用法
    在sql语句中as用于给字段或者表重命名

    select name as 姓名,age as 年龄 from class_1;
    select * from class_1 as c where c.age > 17;
    排序
    ORDER BY 子句来设定你想按哪个字段哪种方式来进行排序,再返回搜索结果。

    使用 ORDER BY 子句将查询数据排序后再返回数据:

    SELECT field1, field2,...fieldN from table_name1 where field1
    ORDER BY field1 [ASC [DESC]]
    默认情况ASC表示升序,DESC表示降序

    select * from class_1 where sex='m' order by age;
    分页(限制)
    LIMIT 子句用于限制由 SELECT 语句返回的数据数量 或者 UPDATE,DELETE语句的操作数量

    带有 LIMIT 子句的 SELECT 语句的基本语法如下:

    SELECT column1, column2, columnN
    FROM table_name
    WHERE field
    LIMIT [num]
    联合查询
    UNION 操作符用于连接两个以上的 SELECT 语句的结果组合到一个结果集合中。多个 SELECT 语句会删除重复的数据。

    UNION 操作符语法格式:

    SELECT expression1, expression2, ... expression_n
    FROM tables
    [WHERE conditions]
    UNION [ALL | DISTINCT]
    SELECT expression1, expression2, ... expression_n
    FROM tables
    [WHERE conditions];
    expression1, expression2, ... expression_n: 要检索的列。
    tables: 要检索的数据表。
    WHERE conditions: 可选, 检索条件。
    DISTINCT: 可选,删除结果集中重复的数据。默认情况下 UNION 操作符已经删除了重复数据,所以 DISTINCT 修饰符对结果没啥影响。
    ALL: 可选,返回所有结果集,包含重复数据。

    select * from class_1 where sex='m' UNION ALL select * from class_1 where age > 9;
    子查询
    定义 : 当一个select语句中包含另一个select 查询语句,则称之为有子查询的语句
    子查询出现的位置:

    from 之后 ,此时子查询的内容作为一个新的表内容,再进行外层select查询
    select name from (select * from class_1 where sex='m') as s where s.score > 90;
    需要将子查询结果集重命名一下,方便where子句中的引用操作
    where字句中,此时select查询到的内容作为外层查询的条件值
    select * from class_1 where age = (select age from class_1 where name='Tom');
    子句返回的结果需要一个明确值,即需要时某个记录的某个元素,不能是多行或者多列
    聚合操作
    聚合操作指的是在数据查找基础上对数据的进一步整理筛选行为,在认识聚合之前先看一个更完整的sql语句

    select语句执行顺序
    (7) SELECT
    (8) [DISTINCT] <select_list>
    (1) FROM <left_table>
    (3) <join_type> JOIN <right_table>
    (2) ON <join_condition>
    (4) WHERE <where_condition>
    (5) GROUP BY <group_by_list>
    (6) HAVING <having_condition>
    (9) ORDER BY <order_by_condition>
    (10) LIMIT <limit_number>
    聚合函数
    方法 功能
    avg(字段名) 该字段的平均值
    max(字段名) 该字段的最大值
    min(字段名) 该字段的最小值
    sum(字段名) 该字段所有记录的和
    count(字段名) 统计该字段记录的个数
    eg1 : 找出表中的最大攻击力的值?

    select max(attack) from sanguo;
    eg2 : 表中共有多少个英雄?

    select count(name) as number from sanguo;
    eg3 : 蜀国英雄中攻击值大于200的英雄的数量

    select count(*) from sanguo where attack > 200;
    注意: 此时select 后只能写聚合函数,无法查找其他字段。

    聚合分组
    group by
    给查询的结果进行分组
    e.g. : 计算每个国家的平均攻击力

    select country,avg(attack) from sanguo
    group by country;
    e.g. : 对多个字段创建索引,此时多个字段都相同时为一组

    select age,sex,count(*) from class1 group by age,sex;
    e.g. : 所有国家的男英雄中 英雄数量最多的前2名的 国家名称及英雄数量

    select country,count(id) as number from sanguo
    where gender='M' group by country
    order by number DESC
    limit 2;
    使用分组时select 后的字段为group by分组的字段和聚合函数,不能包含其他内容。group by也可以同时依照多个字段分组,如group by A,B 此时必须A,B两个字段值均相同才算一组。

    聚合筛选
    having语句
    对分组聚合后的结果进行进一步筛选

    eg1 : 找出平均攻击力大于105的国家的前2名,显示国家名称和平均攻击力
    select country,avg(attack) from sanguo
    group by country
    having avg(attack)>105
    order by avg(attack) DESC
    limit 2;
    注意

    having语句通常与group by联合使用。
    having语句存在弥补了where关键字不能与聚合函数联合使用的不足,where只能操作表中实际存在的字段,having操作的是聚合函数生成的显示列
    去重语句
    distinct语句
    不显示字段重复值

    eg1 : 表中都有哪些国家
    select distinct name,country from sanguo;
    eg2 : 计算一共有多少个国家
    select count(distinct country) from sanguo;
    注意

    distinct和from之间所有字段都相同才会去重
    聚合运算
    查询表记录时做数学运算
    运算符 : + - * / %

    eg1: 查询时显示攻击力翻倍
    select name,attack2 from sanguo;
    eg2: 更新蜀国所有英雄攻击力 * 2
    update sanguo set attack=attack
    2 where country='蜀国';
    索引操作
    索引概述
    定义
    索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。

    优点
    加快数据检索速度,提高查找效率

    缺点
    占用数据库物理存储空间
    当对表中数据更新时,索引需要动态维护,降低数据写入效率

    索引分类
    普通(MUL)
    普通索引 :字段值无约束,KEY标志为 MUL

    唯一索引(UNI)
    唯一索引(unique) :字段值不允许重复,但可为 NULL,KEY标志为 UNI

    主键索引(PRI)
    一个表中只能有一个主键字段, 主键字段不允许重复,且不能为NULL,KEY标志为PRI。通常设置记录编号字段id,能唯一锁定一条记录

    索引创建
    主键索引的创建方法已经在数据表中介绍过了,下面是普通索引和唯一索引的创建方法:

    创建表时直接创建索引
    create table 表名(
    字段名 数据类型,
    字段名 数据类型,
    index(字段名),
    index(字段名),
    unique(字段名)
    );
    在已有表中创建索引:
    create [unique] index 索引名 on 表名(字段名);
    查看索引
    1、desc 表名; --> KEY标志为:MUL 、UNI。
    2、show index from 表名;
    扩展: 借助性能查看选项去查看索引性能
    show variables like 'profiling';

    set profiling = 1; 打开功能 (项目上线一般不打开)

    show profiles 查看语句执行信息
    删除索引
    drop index 索引名 on 表名;
    已有表添加主键索引或自增长属性
    alter table 表名 add primary key(id);
    alter table 表名 modify id int auto_increment;
    创建复合主键
    primary key(uid,pid)
    此时两个字段只要不都相同即可。
    删除主键索引或自增长属性
    alter table 表名 modify id int; 要先删除自增长,因为它只作用于主键字段
    alter table 表名 drop primary key;
    扩展:索引结构
    mysql最为常用的就是使用B-Tree结构构建索引表。那么为什么树形结构能够加快查找速度呢?

    二叉查找树

    B 树是对查找结构的进一步优化,加快了区间查找效率:

    B树

    B+树

    外键约束和表关联关系
    外键约束
    约束 : 约束是一种限制,它通过对表的行或列的数据做出限制,来确保表的数据的完整性、唯一性

    foreign key 功能 : 建立表与表之间的某种约束的关系,由于这种关系的存在,能够让表与表之间的数据,更加的完整,关连性更强,为了具体说明创建如下部门表和人员表。

    创建部门

    CREATE TABLE dept (id int PRIMARY KEY auto_increment,dname VARCHAR(50) not null);
    创建人员

    CREATE TABLE person (
    id int PRIMARY KEY AUTO_INCREMENT,
    name varchar(32) NOT NULL,
    age tinyint DEFAULT 0,
    sex enum('m','w','o') DEFAULT 'o',
    salary decimal(8,2) DEFAULT 250.00,
    hire_date date NOT NULL,
    dept_id int DEFAULT NULL
    ) ;
    上面两个表中每个人员都应该有指定的部门,但是实际上在没有约束的情况下人员是可以没有部门的或者也可以添加一个不存在的部门,这显然是不合理的。当然并不是任何情况都需要建立外键关系,如果没有这种约束时也可以不建立,但是当表与表之间存在这种约束时最好建立。

    主表和从表:若同一个数据库中,B表的外键与A表的主键相对应,则A表为主表,B表为从表。
    foreign key 外键的定义语法:

    [CONSTRAINT symbol] FOREIGN KEY [id] (index_col_name, ...)

    REFERENCES tbl_name (index_col_name, ...)

    [ON DELETE {RESTRICT | CASCADE | SET NULL | NO ACTION}]

    [ON UPDATE {RESTRICT | CASCADE | SET NULL | NO ACTION}]
    该语法可以在 CREATE TABLE 和 ALTER TABLE 时使用,如果不指定CONSTRAINT symbol,mysql会自动生成一个名字,可以通过show create table [tb]命令查看

    建立表时直接建立外键关联,注意本表的外键列类型与指定的主表列相同,且主表指定列需为主键

    CREATE TABLE person (
    id int PRIMARY KEY AUTO_INCREMENT,
    name varchar(32) NOT NULL,
    age tinyint DEFAULT 0,
    sex enum('m','w','o') DEFAULT 'o',
    salary decimal(10,2) DEFAULT 250.00,
    hire_date date NOT NULL,
    dept_id int DEFAULT NULL,
    constraint dept_fk foreign key(dept_id) references dept(id));
    建立表后增加外键

    alter table person add constraint dept_fk foreign key(dept_id) references dept(id);
    通过外键名称解除外键约束

    alter table person drop foreign key dept_fk;

    删除外键后发现desc查看索引标志还在,其实外键也是一种索引,需要将外键名称的索引删除之后才可以。
    restrict(默认) : on delete restrict on update restrict
    当主表删除记录时,如果从表中有相关联记录则不允许主表删除
    当主表更改主键字段值时,如果从表有相关记录则不允许更改
    cascade :数据级联更新 on delete cascade on update cascade
    当主表删除记录或更改被参照字段的值时,从表会级联更新
    set null : on delete set null on update set null
    当主表删除记录时,从表外键字段值变为null
    当主表更改主键字段值时,从表外键字段值变为null
    no action
    同 restrict,都是立即检查外键限制
    表关联设计
    当我们应对复杂的数据关系的时候,数据表的设计就显得尤为重要,认识数据之间的依赖关系是更加合理创建数据表关联性的前提。常见的数据关系如下:

    一对一关系
    一张表的一条记录一定只能与另外一张表的一条记录进行对应,反之亦然。

    举例 : 学生信息和学籍档案,一个学生对应一个档案,一个档案也只属于一个学生

    create table student(id int primary key auto_increment,name varchar(50) not null);

    create table record(id int primary key auto_increment,
    comment text not null,
    st_id int unique,
    foreign key(st_id) references student(id)
    on delete cascade
    on update cascade
    );
    一对多关系
    一张表中有一条记录可以对应另外一张表中的多条记录;但是反过来,另外一张表的一条记录
    只能对应第一张表的一条记录,这种关系就是一对多或多对一

    举例: 一个人可以拥有多辆汽车,每辆车登记的车主只有一人。

    create table person(
    id varchar(32) primary key,
    name varchar(30),
    sex char(1),
    age int
    );

    create table car(
    id varchar(32) primary key,
    name varchar(30),
    price decimal(10,2),
    pid varchar(32),
    constraint car_fk foreign key(pid) references person(id)
    );
    多对多关系
    一对表中(A)的一条记录能够对应另外一张表(B)中的多条记录;同时B表中的一条记录
    也能对应A表中的多条记录

    举例:一个运动员可以报多个项目,每个项目也会有多个运动员参加,这时为了表达多对多关系需要单独创建关系表。

    CREATE TABLE athlete (
    id int NOT NULL AUTO_INCREMENT,
    name varchar(30) DEFAULT NULL,
    age tinyint NOT NULL,
    country varchar(30) NOT NULL,
    description varchar(30) DEFAULT NULL,
    PRIMARY KEY (id),
    );

    CREATE TABLE item (
    id int NOT NULL AUTO_INCREMENT,
    rname varchar(30) NOT NULL,
    PRIMARY KEY (id),
    );

    CREATE TABLE athlete_item (
    aid int NOT NULL,
    tid int NOT NULL,
    PRIMARY KEY (aid,tid),
    CONSTRAINT athlete_fk FOREIGN KEY (aid) REFERENCES athlete (id),
    CONSTRAINT item_fk FOREIGN KEY (tid) REFERENCES item (id)
    );
    E-R模型
    定义

    E-R模型(Entry-Relationship)即 实体-关系 数据模型,用于数据库设计
    用简单的图(E-R图)反映了现实世界中存在的事物或数据以及他们之间的关系
    实体、属性、关系

    实体
    1、描述客观事物的概念
    2、表示方法 :矩形框
    3、示例 :一个人、一本书、一杯咖啡、一个学生
    属性
    1、实体具有的某种特性
    2、表示方法 :椭圆形
    3、示例
    学生属性 :学号、姓名、年龄、性别、专业 ...
    感受属性 :悲伤、喜悦、刺激、愤怒 ...
    关系
    1、实体之间的联系
    2、一对一关联(1:1)
    3、一对多关联(1:n)
    4、多对多关联(m:n)
    ER图的绘制

    矩形框代表实体,菱形框代表关系,椭圆形代表属性

    表关联查询
    如果多个表存在一定关联关系,可以多表在一起进行查询操作,其实表的关联查询与外键约束之间并没有必然联系,但是基于外键约束设计的具有关联性的表往往会更多使用关联查询查找数据。

    多表查询
    多个表数据可以联合查询,语法格式如下:

    select 字段1,字段2... from 表1,表2... [where 条件]
    e.g.
    select * from dept,person where dept.id = person.dept_id;
    内连接
    内连接查询只会查找到符合条件的记录,其实结果和表关联查询是一样的,官方更推荐使用内连接查询。

    SELECT 字段列表
    FROM 表1 INNER JOIN 表2
    ON 表1.字段 = 表2.字段;
    select * from person inner join dept on person.dept_id =dept.id;
    笛卡尔积
    笛卡尔积就是将A表的每一条记录与B表的每一条记录强行拼在一起。所以,如果A表有n条记录,B表有m条记录,笛卡尔积产生的结果就会产生n*m条记录。

    select * from person inner join dept;
    外链接
    左连接 : 左表为主表,显示右表中与左表匹配的项

    SELECT 字段列表
    FROM 表1 LEFT JOIN 表2
    ON 表1.字段 = 表2.字段;
    select * from person left join dept on person.dept_id =dept.id;
    右连接 :右表为主表,显示左表中与左表匹配的项

    SELECT 字段列表
    FROM 表1 RIGHT JOIN 表2
    ON 表1.字段 = 表2.字段;
    select * from person right join dept on person.dept_id =dept.id;
    视图
    视图概念
    视图是存储的查询语句,当调用的时候,产生结果集,视图充当的是虚拟表的角色。其实视图可以理解为一个表或多个表中导出来的表,作用和真实表一样,包含一系列带有行和列的数据 视图中,用户可以使用SELECT语句查询数据,也可以使用INSERT,UPDATE,DELETE修改记录,视图可以使用户操作方便,并保障数据库系统安全。

    视图操作
    创建视图
    语法结构:

    CREATE [OR REPLACE] VIEW [view_name] AS [SELECT_STATEMENT];

    释义:

    CREATE VIEW: 创建视图
    OR REPLACE : 可选,如果添加原来有同名视图的情况下会覆盖掉原有视图
    view_name : 视图名称
    SELECT_STATEMENT :SELECT语句

    e.g.
    create view c1 as select name,age from class_1;
    删除视图

    drop view [IF EXISTS] 视图名;

    IF EXISTS 表示如果存在,这样即使没有指定视图也不会报错。

    drop view c1;
    修改视图

    参考创建视图,将create关键字改为alter

    alter view c1 as select name,age,score from class_1;
    视图表的增删改查操作

    视图的增删改查操作与一般表的操作相同,使用insert update delete select即可,但是原数据表的约束条件仍然对视图产生作用。

    视图作用
    作用
    是对数据的一种重构,不影响原数据表的使用。
    简化高频复杂操作的过程,就像一种对复杂操作的封装。
    提高安全性,可以给不同用户提供不同的视图
    让数据更加清晰
    缺点
    视图的性能相对较差,从数据库视图查询数据可能会很慢
    表依赖关系处理麻烦,根据数据库的基础表创建一个视图。每当更改视图或者原表时,另一个也会修改。
    函数和存储过程
    存储过程和函数是事先经过编译并存储在数据库中的一段sql语句集合,调用存储过程和函数可以简化应用开发工作,提高数据处理的效率。

    函数创建
    delimiter 自定义符号  -- 如果函数体只有一条语句, begin和end可以省略, 同时delimiter也可以省略

      create function 函数名(形参列表) returns 返回类型  -- 注意是retruns

      begin

        函数体    -- 函数语句集,set @a 定义变量

        return val

      end 自定义符号

      delimiter ;

    释义:
    delimiter 自定义符号 是为了在函数内些语句方便,制定除了;之外的符号作为函数书写结束标志,一般用$$或者//
    形参列表 : 形参名 类型 类型为mysql支持类型
    返回类型: 函数返回的数据类型,mysql支持类型即可
    函数体: 若干sql语句组成,如果只有一条语句也可以不写delimiter和begin,end
    return: 返回指定类型返回值
    e.g. 无参数的函数调用
    delimiter $$
    create function st() returns int
    begin
    return (select score from class_1 order by score desc limit 1);
    end $$
    delimiter ;

    select st();
    e.g. 含有参数的函数调用
    delimiter $$
    create function queryNameById(uid int(10))
    returns varchar(20)
    begin
    return (select name from class_1 where id=uid);
    end $$
    delimiter ;

    select queryNameById(1);
    存储过程创建
    创建存储过程语法与创建函数基本相同,但是没有返回值。

    delimiter 自定义符号 

      create procedure 存储过程名(形参列表)

      begin

        存储过程    -- 存储过程语句集,set @a 定义变量

      end 自定义符号

      delimiter ;

    释义:
    delimiter 自定义符号 是为了在函数内些语句方便,制定除了;之外的符号作为函数书写结束标志
    形参列表 :[ IN | OUT | INOUT ] 形参名 类型
    in 输入,out 输出,inout 可以输入也可以输出
    存储过程: 若干sql语句组成,如果只有一条语句也可以不写delimiter和begin,end

    e.g. 存储过程创建和调用
    delimiter $$
    create procedure st()
    begin
    select name,age from class_1;
    select name,score from class_1 order by score desc;
    end $$
    delimiter ;

    call st();
    存储过程三个参数的区别
    IN 类型参数可以接收变量也可以接收常量,传入的参数在存储过程内部使用即可,但是在存储过程内部的修改无法传递到外部。
    OUT 类型参数只能接收一个变量,接收的变量不能够在存储过程内部使用(内部为NULL),但是可以在存储过程内对这个变量进行修改。因为定义的变量是全局的,所以外部可以获取这个修改后的值。
    INOUT类型参数同样只能接收一个变量,但是这个变量可以在存储过程内部使用。在存储过程内部的修改也会传递到外部。
    设置变量方法: set @[变量名] = 值; 表示这是一个用户变量,使用时用@[变量名]。 在函数内部设置declare [变量名] [变量类型]为局部变量,局部变量可以使用set赋值或者着使用into关键字。
    e.g. : 分别将参数类型改为IN OUT INOUT 看一下结果区别
    delimiter $$
    create procedure p_out ( OUT num int )
    begin
    select num;
    set num=100;
    select num;
    end $$

    delimiter ;

    set @num=10;
    call p_out(@num)
    存储过程和存储函数操作
    调用存储过程
    语法:

    call 存储过程名字([存储过程的参数[,……]])
    调用存储函数
    语法:

    select 存储函数名字([存储过程的参数[,……]])
    使用show status语句查看存储过程和函数的信息
    语法:

    show {procedure|function} status [like’存储过程或存储函数的名称’]
    显示内容:数据库、名字、类型、创建者、创建和修改日期

    使用show create语句查看存储过程和函数的定义
    语法:

    show create {procedure|function} 存储过程或存储函数的名称
    删除存储过程或存储函数
    语法:

    DROP {PROCEDURE | FUNCTION} [IF EXISTS] sp_name
    函数和存储过程区别
    函数有且只有一个返回值,而存储过程不能有返回值。
    函数只能有输入参数,而存储过程可以有in,out,inout多个类型参数。
    存储过程中的语句功能更丰富,实现更复杂的业务逻辑,而函数中通常不会使用insert,update,delete等语句,只是完成查询的工作,受输入参数并返回一个结果,功能针对性比较强。
    存储过程一般是作为一个独立的部分来执行(call调用)。而函数可以作为查询语句的一个部分来调用.
    事务控制
    事务概述
    MySQL 事务主要用于处理操作量大,复杂度高的数据。比如说,在人员管理系统中,你删除一个人员,既需要删除人员的基本资料,也要删除和该人员相关的信息,如信箱,文章等等,如果操作就必须同时操作成功,如果有一个不成功则所有数据都不动。这时候数据库操作语句就构成一个事务。事务主要处理数据的增删改操作。

    定义
    一件事从开始发生到结束的过程

    作用
    确保数据的一致性、完整性、准确性、有效性

    事务操作
    开启事务
    mysql>begin; # 方法1
    mysql>start transaction; # 方法2
    开始执行事务中的1条或者n条SQL命令
    终止事务,若begin之后没有commit,而是使用其他语句,比如select,那么会自动commit,修改直接生效。
    mysql>commit; # 事务中SQL命令都执行成功,提交到数据库,结束!
    mysql>rollback; # 有SQL命令执行失败,回滚到初始状态,结束!
    事务四大特性
    原子性(atomicity)
    一个事务必须视为一个不可分割的最小工作单元,整个事务中的所有操作要么全部提交成功,要么全部失败回滚,对于一个事务来说,不可能只执行其中的一部分操作

    一致性(consistency)
    事务完成时,数据必须处于一致状态,数据的完整性约束没有被破坏,事务在执行过程中发生错误,则回到事务开始前的状态,就像这个事务从来没有执行过一样。

    隔离性(isolation)
    一个事务所做的修改在最终提交以前,对其他事务是不可见的。多个事务相互独立。

    持久性(durability)
    一旦事务提交,则其所做的修改就会永久保存到数据库中。此时即使系统崩溃,修改的数据也不会丢失。

    注意:

    事务只针对于表记录操作(增删改)有效,对于库和表的操作无效。
    数据库优化
    数据库设计范式
    设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式。

    目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。

    各种范式呈递次规范,越高的范式数据库冗余越小。但是范式越高也意味着表的划分更细,一个数据库中需要的表也就越多,此时多个表联接在一起的花费是巨大的,尤其是当需要连接的两张或者多张表数据非常庞大的时候,表连接操作几乎是一个噩梦,这严重地降低了系统运行性能。所以通常数据库设计遵循第一第二第三范式,以避免数据操作异常,又不至于表关系过于复杂。

    范式简介:

    第一范式: 数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等组合的数据项。简单来说要求数据库中的表示二维表,每个数据元素不可再分。
    第二范式: 第二范式(2NF)要求数据库表中的每个实例或记录必须可以被唯一地区分,所有属性依赖于主属性。即选取一个能区分每个实体的属性或属性组,作为实体的唯一标识,每个属性都能被主属性筛选。
    第三范式: 在第二范式的基础上属性不传递依赖,即每个属性于其它非主属性。要求一个关系中不包含已在其它关系已包含的非主关键字信息。
    MySQL存储引擎
    定义

    mysql数据库管理系统中用来处理表的处理器
    基本操作

    1、查看所有存储引擎
    mysql> show engines;
    2、查看已有表的存储引擎
    mysql> show create table 表名;
    3、创建表指定
    create table 表名(...)engine=MyISAM,charset=utf8,auto_increment=10000;
    4、已有表指定
    alter table 表名 engine=InnoDB;
    常用存储引擎特点

    InnoDB
    1、支持行级锁,仅对指定的记录进行加锁,这样其它进程还是可以对同一个表中的其它记录进行操作。
    2、支持外键、事务、事务回滚
    3、表字段和索引同存储在一个文件中
    1、表名.frm :表结构
    2、表名.ibd : 表记录及索引文件
    MyISAM
    1、支持表级锁,在锁定期间,其它进程无法对该表进行写操作。如果你是写锁,则其它进程则读也不允许
    2、表字段和索引分开存储
    1、表名.frm :表结构
    2、表名.MYI : 索引文件(my index)
    3、表名.MYD : 表记录(my data)
    如何选择存储引擎

    1、执行查操作多的表用 MyISAM(使用InnoDB浪费资源)
    2、执行写操作多的表用 InnoDB

    CREATE TABLE tb_stu(
    id int(11) NOT NULL AUTO_INCREMENT,
    name varchar(30) DEFAULT NULL,
    sex varchar(2) DEFAULT NULL,
    PRIMARY KEY (id)
    )ENGINE=MyISAM DEFAULT CHARSET=utf8;

    字段数据类型选择
    优先程度 数字 > 时间日期 > 字符串
    同一级别 占用空间小的 > 占用空间多的
    字符串在查询比较排序时数据处理慢
    占用空间少,数据库占磁盘页少,IO处理就更快
    少于50字节 char > varchar
    对数据存储精确不要求 float > decimel
    如果很少被查询可以用 TIMESTAMP(时间戳实际是整形存储)
    键的设置
    Innodb如果不设置主键也会自己设置隐含的主键,所以最好自己设置
    尽量设置占用空间小的字段为主键
    外键的设置用于保持数据完整性,但是会降低数据导入和操作效率,特别是高并发情况下,而且会增加维护成本
    虽然高并发下不建议使用外键约束,但是在表关联时建议在关联键上建立索引,以提高查找速度
    explain语句
    使用 EXPLAIN 关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。这可以帮你分析你的查询语句或是表结构的性能瓶颈。通过explain命令可以得到:

    表的读取顺序
    数据读取操作的操作类型
    哪些索引可以使用
    哪些索引被实际使用
    表之间的引用
    每张表有多少行被优化器查询
    explain select * from class_1 where id <5;
    EXPLAIN主要字段解析:

    table:显示这一行的数据是关于哪张表的

    type:这是最重要的字段之一,显示查询使用了何种类型。从最好到最差的连接类型为system、const、eq_reg、ref、range、index和ALL,一般来说,得保证查询至少达到range级别,最好能达到ref。

    type中包含的值:

    • system、const: 可以将查询的变量转为常量. 如id=1; id为 主键或唯一键.
    • eq_ref: 访问索引,返回某单一行的数据.(通常在联接时出现,查询使用的索引为主键或唯一键)
    • ref: 访问索引,返回某个值的数据.(可以返回多行) 通常使用=时发生
    • range: 这个连接类型使用索引返回一个范围中的行,比如使用>或<查找东西,并且该字段上建有索引时发生的情况
    • index: 以索引的顺序进行全表扫描,优点是不用排序,缺点是还要全表扫描
    • ALL: 全表扫描,应该尽量避免
      possible_keys:显示可能应用在这张表中的索引。如果为空,表示没有可能应用的索引。

    key:实际使用的索引。如果为NULL,则没有使用索引。

    key_len:使用的索引的长度。在不损失精确性的情况下,长度越短越好

    rows:MySQL认为必须检索的用来返回请求数据的行数

    SQL优化
    尽量选择数据类型占空间少,在where ,group by,order by中出现的频率高的字段建立索引
    explain 放在查询语句前面可以获取查询计划,建立合适索引
    尽量避免使用 select * ...;用具体字段代替 * ,不要返回用不到的任何字段
    少使用like %查询,否则会全表扫描
    子查询优化为join查询
    控制使用自定义函数
    单条查询最后添加 LIMIT 1,停止全表扫描
    where子句中不使用 != ,否则放弃索引全表扫描
    尽量避免 NULL 值判断,否则放弃索引全表扫描
    优化前:select number from t1 where number is null;
    优化后:select number from t1 where number=0;
    在number列上设置默认值0,确保number列无NULL值
    尽量避免 or 连接条件,否则放弃索引全表扫描,可以用union代替
    优化前:select id from t1 where id=10 or id=20;
    优化后: select id from t1 where id=10 union all
    select id from t1 where id=20;
    尽量避免使用 in 和 not in,否则全表扫描
    优化前:select id from t1 where id in(1,2,3,4);
    优化后:select id from t1 where id between 1 and 4;
    表的拆分
    垂直拆分 : 表中列太多,分为多个表,每个表是其中的几个列。将常查询的放到一起,blob或者text类型字段放到另一个表

    水平拆分 : 减少每个表的数据量,通过hash key进行划分然后拆成多个表

    数据库备份和用户管理
    数据备份
    备份命令格式
    mysqldump -u用户名 -p 源库名 > ~/stu.sql

    --all-databases 备份所有库
    db_name 备份单个库
    -B 库1 库2 库3 备份多个库
    库名 表1 表2 表3 备份指定库的多张表

    恢复命令格式
    mysql -uroot -p 目标库名 < stu.sql

    表的复制
    1、表能根据实际需求复制数据
    2、复制表时不会把KEY属性复制过来

    语法

    create table 表名 select 查询命令;
    用户权限管理
    开启MySQL远程连接

    更改配置文件,重启服务!
    1.sudo -i
    2.cd /etc/mysql/mysql.conf.d
    3.cp mysqld.cnf mysqld.cnf.bak
    4.vi mysqld.cnf #找到44行左右,加 # 注释

    bind-address = 127.0.0.1

    [mysqld]
    character_set_server = utf8
    5.保存退出
    6.service mysql restart
    7.修改用户表host值
    use mysql;
    update user set host='%' where user='root';
    8.刷新权限
    flush privileges;
    添加授权用户

    1. 用root用户登录mysql
      mysql -uroot -p123456
    2. 添加用户 % 表示自动选择可用IP
      CREATE USER 'username'@'host' IDENTIFIED BY 'password';
    3. 授权
      grant 权限列表 on 库.表 to "用户名"@"%" identified by "密码" with grant option;
    4. 刷新权限
      flush privileges;
      权限列表

    all privileges 、select 、insert ... ...
    库.表 : . 代表所有库的所有表
    示例

    1、添加授权用户work,密码123,对所有库的所有表有所有权限
    mysql>grant all privileges on . to 'work'@'%' identified by '123' with grant option;
    mysql>flush privileges;
    2、添加用户duty,密码123,对db2库中所有表有所有权限
    mysql>grant all privileges on books.* to 'duty'@'%' identified by '123' with grant option;
    mysql>flush privileges;
    pymysql模块
    pymysql安装
    sudo pip3 install pymysql

    pymysql使用流程
    建立数据库连接(db = pymysql.connect(...))
    创建游标对象(cur = db.cursor())
    游标方法: cur.execute("insert ....")
    提交到数据库或者获取数据 : db.commit()/db.fetchall()
    关闭游标对象 :cur.close()
    断开数据库连接 :db.close()
    常用函数
    参考代码 day16/mysql.py
    参考代码 day16/read_db.py
    参考代码 day16/write_db.py

    db = pymysql.connect(参数列表)

    host :主机地址,本地 localhost
    port :端口号,默认3306
    user :用户名
    password :密码
    database :库
    charset :编码方式,推荐使用 utf8

    数据库连接对象(db)的方法

    cur = db.cursor() 返回游标对象,用于执行具体SQL命令
    db.commit() 提交到数据库执行
    db.rollback() 回滚,用于当commit()出错是回复到原来的数据形态
    db.close() 关闭连接

    游标对象(cur)的方法

    cur.execute(sql命令,[列表]) 执行SQL命令
    cur.executemany(sql命令,[data]) 根据数据列表项多次执行SQL命令,一般用于写操作。
    cur.fetchone() 获取查询结果集的第一条数据,查找到返回一个元组否则返回None
    cur.fetchmany(n) 获取前n条查找到的记录,返回结果为元组嵌套元组, ((记录1),(记录2))。
    cur.fetchall() 获取所有查找到的记录,返回结果形式同上。
    cur.close() 关闭游标对象

  • 相关阅读:
    【520】利用 TextBlob & Vader 进行情感分析
    【519】Visio 里面实现输入公式
    Xcode 复制多行/移动某行/删除多行 快捷键
    rosbag 时间和topic过滤
    卡方分布(Chi-squared)外点(outlier)剔除
    EVO使用方法详解
    CloudCompare分离点云地面点和非地面点
    slam方向期刊和会议汇总
    UrbanLoco数据集
    ElasticSearch学习笔记——ik分词添加词库
  • 原文地址:https://www.cnblogs.com/bky20061005/p/13054777.html
Copyright © 2011-2022 走看看