sql必知必会 - 走看看

zoukankan html css js c++ java

sql必知必会
一、sql介绍

我们可以把SQL语言按照功能划分成以下的4个部分:

DDL，英文叫做Data Definition Language，也就是数据定义语言，它用来定义我们的数据库对象，包括数据库、数据表和列。通过使用DDL，我们可以创建，删除和修改数据库和表结构。

DML，英文叫做Data Manipulation Language，数据操作语言，我们用它操作和数据库相关的记录，比如增加、删除、修改数据表中的记录。

DCL，英文叫做Data Control Language，数据控制语言，我们用它来定义访问权限和安全级别。

DQL，英文叫做Data Query Language，数据查询语言，我们用它查询想要的记录，它是SQL语言的重中

之重。在实际的业务中，我们绝大多数情况下都是在和查询打交道，因此学会编写正确且高效的查询语句，是学习的重点。

SQL是我们与DBMS交流的语言，我们在创建DBMS之前，还需要对它进行设计，对于RDBMS来说采用的是 ER图(Entity Relationship Diagram)，即实体-关系图的方式进行设计。

它是我们用来描述现实世界的概念模型，在这个模型中有3个要素:实体、属性、关系。

关于SQL大小写的问题，我总结了下面两点:
1. 表名、表别名、字段名、字段别名等都小写; 2. SQL保留字、函数名、绑定变量等都大写。

SELECT name, hp_max FROM heros WHERE role_main = '战士'
你能看到SELECT、FROM、WHERE这些常用的SQL保留字都采用了大写，而name、hp_max、role_main这些字段名，表名都采用了小写。此外在数据表的字段名推荐采用下划线命名，比如role_main这种。

二、DBMS

（1）DB、DBS和DBMS的区别是什么

DBMS的英文全称是DataBase Management System，数据库管理系统，实际上它可以对多个数据库进行管理，所以你可以理解为DBMS = 多个数据库(DB) + 管理程序。

DB的英文是DataBase，也就是数据库。数据库是存储数据的集合，你可以把它理解为多个数据表。

DBS的英文是DataBase System，数据库系统。它是更大的概念，包括了数据库、数据库管理系统以及数据库管理人员DBA。

这里需要注意的是，虽然我们有时候把Oracle、MySQL等称之为数据库，但确切讲，它们应该是数据库管理系统，即DBMS。
（2）不同类型的数据库各自特点

关系型数据库(RDBMS)就是建立在关系模型基础上的数据库，SQL就是关系型数据库的查询语言。

键值型数据库通过Key-Value键值的方式来存储数据，其中Key和Value可以是简单的对象，也可以是复杂的对象。Key作为唯一的标识符，优点是查找速度快，在这方面明显优于关系型数据库，同时缺点也很明显，它无法像关系型数据库一样自由使用条件过滤(比如WHERE)，如果你不知道去哪里找数据，就要遍历所有的键，这就会消耗大量的计算。键值型数据库典型的使用场景是作为内容缓存。Redis是最流行的键值型数据库。

文档型数据库用来管理文档，在数据库中文档作为处理信息的基本单位，一个文档就相当于一条记录， MongoDB是最流行的文档型数据库。

搜索引擎也是数据库检索中的重要应用，常见的全文搜索引擎有Elasticsearch、Splunk和Solr。虽然关系型数据库采用了索引提升检索效率，但是针对全文索引效率却较低。搜索引擎的优势在于采用了全文搜索的技术，核心原理是“倒排索引”。

列式数据库是相对于行式存储的数据库，Oracle、MySQL、SQL Server等数据库都是采用的行式存储 (Row-based)，而列式数据库是将数据按照列存储到数据库中，这样做的好处是可以大量降低系统的I/O，适合于分布式文件系统，不足在于功能相对有限。

图形数据库，利用了图这种数据结构存储了实体(对象)之间的关系。最典型的例子就是社交网络中人与人的关系，数据模型主要是以节点和边(关系)来实现，特点在于能高效地解决复杂的关系问题。

（3）sql阵营中的DBMS

1979年，Oracle 2诞生，它是第一个商用的RDBMS(关系型数据库管理系统)，随后被卖给了军方客户。随着Oracle软件的名气越来越大，公司也改叫Oracle公司。20世纪90年代，Oracle的创始人埃里森成为继比尔·盖茨之后第二富有的人，可以说IBM缔造了两个帝国，一个是软件业的霸主微软，另一个是企业软件市场的霸主Oracle。如今Oracle的年收入达到了400亿美金，足以证明商用数据库软件的价值。从这点我们也能看出，如果选择了一个大的赛道，就要尽早商业化，占据大型企业客户完全可以创建巨大的商业价值，也足以证明一个软件企业不需要靠卖硬件也可以挣到很多钱。

MySQL是1995年诞生的开源数据库管理系统，因为免费开源的特性，得到了开发者的喜爱，用户量迅速增长，成为开源数据库的No.1。但在发展过程中，MySQL先后两次被易手，先是在2008年被SUN收购，然后在2010年SUN被Oracle收购，于是Oracle同时拥有了MySQL的管理权，至此Oracle在数据库领域中成为绝对的领导者。从这里我们也能看到，虽然MySQL是免费的产品，但是使用人数多，就足以证明巨大的用户价值。一个有巨大用户价值的产品，即使没有直接的商业价值，但作为基础设施也会被商业巨头看上。

不过在Oracle收购MySQL的同时，MySQL的创造者担心MySQL有闭源的风险，因此创建了MySQL的分支项目MariaDB，MariaDB在绝大部分情况下都是与MySQL兼容的，并且增加了许多新的特性，比如支持更多的存储引擎类型。许多企业也由原来的MySQL纷纷转向了MariaDB。

SQL Server是微软开发的商业数据库，诞生于1989年。实际上微软还推出了Access数据库，它是一种桌面数据库，同时具备后台存储和前台界面开发的功能，更加轻量级，适合小型的应用场景。因为后台的存储空间有限，一般只有2G，Access的优势在于可以在前台便捷地进行界面开发。而SQL Server是大型数据库，用于后台的存储和查询，不具备界面开发的功能。从这里我们也能看出，即使SQL语言是通用的，但是为了满足不同用户的使用场景，会存在多个DBMS。比如Oracle更适合大型跨国企业的使用，因为他们对费用不敏感，但是对性能要求以及安全性有更高的要求，而MySQL更受到许多互联网公司，尤其是早期创业公司的青睐。
三、不同DBMS中的sql是怎么执行的。

1. Oracle中的SQL是如何执行的，什么是硬解析和软解析;

从上面这张图中可以看出，SQL语句在Oracle中经历了以下的几个步骤。

语法检查:检查SQL拼写是否正确，如果不正确，Oracle会报语法错误。

语义检查:检查SQL中的访问对象是否存在。比如我们在写SELECT语句的时候，列名写错了，系统就会提示错误。语法检查和语义检查的作用是保证SQL语句没有错误。

权限检查:看用户是否具备访问该数据的权限。

共享池检查:共享池(Shared Pool)是一块内存池，最主要的作用是缓存SQL语句和该语句的执行计

划。Oracle通过检查共享池是否存在SQL语句的执行计划，来判断进行软解析，还是硬解析。那软解析和硬解析又该怎么理解呢? 在共享池中，Oracle首先对SQL语句进行Hash运算，然后根据Hash值在库缓存(Library Cache)中查找，如果存在SQL语句的执行计划，就直接拿来执行，直接进入“执行器”的环节，这就是软解析。如果没有找到SQL语句和执行计划，Oracle就需要创建解析树进行解析，生成执行计划，进入“优化器”这个步骤，这就是硬解析。

优化器:优化器中就是要进行硬解析，也就是决定怎么做，比如创建解析树，生成执行计划。

执行器:当有了解析树和执行计划之后，就知道了SQL该怎么被执行，这样就可以在执行器中执行语句了。

共享池是Oracle中的术语，包括了库缓存，数据字典缓冲区等。库缓存：存sql语句和执行计划。数据字典缓冲区（决定是否需要硬解析，应该避免使用硬解析，因为在sql执行过程中，创建解析树，生成执行计划是很消耗资源。）：Oracle中的对象定义，比如表、视图、索引等对象。对sql进行解析对时候，如果需要相关数据就会从数据字典缓冲区中提取。

如何避免硬解析，尽量使用软解析呢?

在Oracle中，绑定变量是它的一大特色。绑定变量就是在SQL语句中使用变量，通过不同的变量取值来改变SQL的执行结果。这样做的好处是能提升软解析的可能性，不足之处在于可能会导致生成的执行计划不够优化，因此是否需要绑定变量还需要视情况而定。
举个例子，我们可以使用下面的查询语句:

SQL> select * from player where player_id = 10001;

你也可以使用绑定变量，如:

SQL> select * from player where player_id = :player_id;

这两个查询语句的效率在Oracle中是完全不同的。如果你在查询player_id = 10001之后，还会查询10002、 10003之类的数据，那么每一次查询都会创建一个新的查询解析。而第二种方式使用了绑定变量，那么在第一次查询之后，在共享池中就会存在这类查询的执行计划，也就是软解析。

因此我们可以通过使用绑定变量来减少硬解析，减少Oracle的解析工作量。但是这种方式也有缺点，使用动态SQL的方式，因为参数不同，会导致SQL的执行效率不同，同时SQL优化也会比较困难。

2、mysql中sql是如何执行的？

mysql是典型的cs架构，服务器端程序使用mysqld。整体的mysql流程如下图所示。

1. 连接层:客户端和服务器端建立连接，客户端发送SQL至服务器端; 2. SQL层:对SQL语句进行查询处理;
3. 存储引擎层:与数据库文件打交道，负责数据的存储和读取。
其中SQL层与数据库文件的存储方式无关，我们来看下SQL层的结构:

　　1. 查询缓存:Server如果在查询缓存中发现了这条SQL语句，就会直接将结果返回给客户端;如果没有，就进入到解析器阶段。需要说明的是，因为查询缓存往往效率不高，所以在MySQL8.0之后就抛弃了这个功能。

解析器:在解析器中对SQL语句进行语法分析、语义分析。

优化器:在优化器中会确定SQL语句的执行路径，比如是根据全表检索，还是根据索引来检索等。

执行器:在执行之前需要判断该用户是否具备权限，如果具备权限就执行SQL查询并返回结果。在MySQL8.0以下的版本，如果设置了查询缓存，这时会将查询结果进行缓存。

你能看到SQL语句在MySQL中的流程是:SQL语句→缓存查询→解析器→优化器→执行器。在一部分中， MySQL和Oracle执行SQL的原理是一样的。

与Oracle不同的是，MySQL的存储引擎采用了插件的形式，每个存储引擎都面向一种特定的数据库应用环境。同时开源的MySQL还允许开发人员设置自己的存储引擎，下面是一些常见的存储引擎:

InnoDB存储引擎:它是MySQL 5.5.8版本之后默认的存储引擎，最大的特点是支持事务、行级锁定、外键约束等。

MyISAM存储引擎:在MySQL 5.5.8版本之前是默认的存储引擎，不支持事务，也不支持外键，最大的特点是速度快，占用资源少。

Memory存储引擎:使用系统内存作为存储介质，以便得到更快的响应速度。不过如果mysqld进程崩溃，则会导致所有的数据丢失，因此我们只有当数据是临时的情况下才使用Memory存储引擎。

NDB存储引擎:也叫做NDB Cluster存储引擎，主要用于MySQL Cluster分布式集群环境，类似于Oracle 的RAC集群。

Archive存储引擎:它有很好的压缩机制，用于文件归档，在请求写入时会进行压缩，所以也经常用来做仓库。

需要注意的是，数据库的设计在于表的设计，而在MySQL中每个表的设计都可以采用不同的存储引擎，我们可以根据实际的数据处理需要来选择存储引擎，这也是MySQL的强大之处。
查看全文

相关阅读:
codeforce1029B B. Creating the Contest(简单dp，简单版单调栈)
spfa算法
 spfa算法
 HDU King (非连通图的差分约束，经典好题)
HDU King (非连通图的差分约束，经典好题)
差分约束系统相关证明（存在负环则无解证明）
Java API 读取HDFS的单文件
 採用邻接矩阵创建图
 旧金山攻略
 一个jeecg整合activiti的学习样例,源代码下载

原文地址：https://www.cnblogs.com/cmpunk/p/11306617.html