zoukankan      html  css  js  c++  java
  • MySQL数据库常见面试题

    SQL基础

    1.MySQL的数据类型

    2.MySQL的SQL语句分类

    DDL(Data Definition Language)语句:数据定义语言,这些语句定义了不同的数据段、表、列、索引等数据库对象的定义。常用的语句关键字主要包括create、drop、alter等。

    DML(Data Manipulation Language)语句:数据操纵语句,用于添加、删除、更新和查询数据库记录,并检查数据完整性,常用的语句关键字主要包括insert、delete、update和select等。

    DCL(Data Control Language)语句:数据控制语句,用于控制不同数据段直接的许可和访问级别的语句。这些语句定义了数据库、表、字段、用户的访问权限和安全级别。主要的语句关键字包括grant、revoke等。

    数据库范式

    第一范式(1NF)是指在关系模型中,数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。
    第二范式(2NF)是在1NF的基础上,要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性
    第三范式(3NF)在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
    巴斯-科德范式(BCNF)在3NF基础上,任何非主属性不能对主键子集依赖(在3NF基础上消除对主码子集的依赖)


    白话区:
    第一范式:每个表应该有唯一标识每一行的主键。
    第二范式:在复合主键的情况下,非主键部分不应该依赖于部分主键。
    第三范式:非主键之间不应该有依赖关系。
    BC范式:排除了任何属性(不光是非主属性,2NF和3NF所限制的都是非主属性)对候选键的传递依赖与部分依赖。

    MyISAM与Innodb区别

    (1)MyISAM不支持事务,Innodb支持事务

    (2)Myisam不支持外键,innodb支持外键

    (3)myisam支持表级锁,innodb支持行级锁

    (4)innodb 进行select count(*) from tablename时,需要对表进行一次遍历;myisam进行select count(*) from tablename时

    (5)myisam删除表时,先将表drop,然后新建一个表;innodb则是将表中数据一条一条的删除

    (6)对于包含auto-increment字段的索引,innodb只包含auto-increment字段;而myisam则可以和其他字段一起建立联合索引

    (7)myisam搜索引擎查找要比innodb搜索引擎快

    (8)innodb中索引没有fulltext类型,而myisam中有fulltext类型

    视图

    视图(View)是一种虚拟存在的表,对于使用视图的用户来说基本上是透明的。视图并
    不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时
    动态生成的
     简单:使用视图的用户完全不需要关心后面对应的表的结构、关联条件和筛选条件,
    对用户来说已经是过滤好的复合条件的结果集。
     安全:使用视图的用户只能访问他们被允许查询的结果集,对表的权限管理并不能
    限制到某个行某个列,但是通过视图就可以简单的实现。
     数据独立:一旦视图的结构确定了,可以屏蔽表结构变化对用户的影响,源表增加
    列对视图没有影响;源表修改列名,则可以通过修改视图来解决,不会造成对访问
    者的影响

    事务的特性及隔离级别:

    1.事务特性--ACID
    Atomicity(原子性):要么全做,要么不做,不能只做一半(银行转账)
    Consistency(约束性):事务的前后,约束都能满足
    Isolation(依赖性):事务之间是独立的,互不影响的
    Durability(持久性):事务执行之后,事物的结果可以持久保存

    2.事务隔离级别:
    read uncommitted:可以读到未提交的事务结果
    read committed:只能读已提交事务的结果
    repeatable reads:可以读到开启事务时的值
    serializable:两个事务同时发生,必定是有先后的

    索引

    1.什么是索引

    索引(Index)是帮助MySQL高效获取数据的数据结构。

    2.索引的种类

    从逻辑角度

    1、主键索引:主键是一种唯一性索引,但它必须指定为“PRIMARY KEY”
    2、唯一索引:不允许具有索引值相同的行,从而禁止重复的索引或键值。系统在创建该索引时检查是否有重复的键值,并在每次使用 INSERT 或 UPDATE 语句添加数据时进行检查。
    3、组合索引

    从物理存储角度
    1、聚簇索引(clustered index):聚簇索引的叶子节点就是数据节点
    2、非聚簇索引(non-clustered index):非聚簇索引的叶子节点仍然是索引节点,只不过有指向对应数据块的指针。

    从数据结构角度
    1、B+树索引
    2、hash索引
    3、FULLTEXT索引(InnoDB引擎5.7以后支持):

    3.索引的设计原则

    4.索引存在但是不使用索引

    (1)如果MySQL估计使用索引比全表扫描更慢,则不使用索引。例如如果列key_part1均匀分布在1~100之间,下列查询使用索引就不是很好

    SELECT * FROM table_name where key_part1 > 1 and key_part1 < 90;
    

    (2)如果使用 MEMORY/HEAP 表并且 where 条件中不使用“=”进行索引列,那么不会用到索引。heap 表只有在“=”的条件下才会使用索引。

    (3)用 or 分割开的条件,如果 or 前的条件中的列有索引,而后面的列中没有索引,那么涉及到的索引都不会被用到,例如

    (4)对于符合索引如果不是第一列,在查询中也不会被MySQL用到

    (5)如果like是以%开始,那么索引不会被MySQL使用

    (6)如果列类型是字符串,那么一定记得在 where 条件中把字符常量值用引号引起来,否则的话即便这个列上有索引,MySQL 也不会用到的,因为,MySQL 默认把输入的常量值进行转换以后才进行检索。

    5.B+Tree索引

    B+树:B+树是为磁盘或其他直接存取辅助设备设计的一种平衡查找树。在B+树中,所有记录结点都是按键值的大小顺序存放在同一层的叶子节点上,由各叶子节点指针进行连接。 

    数据库中B+树索引分为聚集索引和辅助索引,两者内部都是B+树,即高度平衡的,叶子节点存放着所有的数据。聚集索引与辅助索引不同的是,叶子节点存放的是否是一整行的信息。

    聚集索引

    聚集索引:聚集索引就是按照每张表的主键构造的一棵B+树,同时叶子节点中存放的即为整张表的行记录数据,也将聚集索引的叶子节点称为数据页。

    辅助索引

    慢查询

    1.为什么查询速度会慢

    查询性能低下最基本的原因是访问的数据太多。某些查询可能不可避免的需要筛选大量数据,但这并不常见。大部分性能低下的查询都可以减少访问的数据量的方式进行优化。对于低效的查询,我们发现通过下面两个步骤来分析总是很有效:

    (1)确认应用程序是否在检索大量超过需要的数据。这通常意味着访问了太多的行,但有时候也可能是访间了太多的列。
    (2)确认MYSQL服务器层是否在分析大量超过需要的数据行。

    2.慢查询基础

    (1)是否向数据库请求了不需要的数据

    查询不需要的记录
    一个常见的错误是常常会误以为MYSQL会只返回需要的数据,实际上MYSQL却
    是先返回全部结果集再进行计算。我们经常会看到一些了解其他数据库系统的人会
    设计出这类应用程序。这些开发者习惯使用这样的技术,先使用SELECT语句查询大
    量的结果,然后获取前面的N行后关闭结果集(例如在新闻网站中取出100条记录,
    但是只是在页面上显示前面10条)。他们认为MYSQL会执行查询,并只返回他们
    需要的10条数据,然后停止查询。实际情况是MYSQL会查询出全部的结果集,客
    户端的应用程序会接收全部的结果集数据,然后抛弃其中大部分数据。最简单有效
    的解决方法就是在这样的查询后面加上LIMIT。
    多表关联时返回全部列
    如果你想查询所有在电影Academy Dinosaur中出现的演员,千万不要按下面的写法
    编写查询:

    ysql> select FRO sakila. Actor
    MER torn sakila. fin actor usimg(actor. id
    -2 INBROR, 5azla to. Mt
    -) WERE sakila. Film. Title - 'acadery Dinosaur';
    这将返回这三个表的全部数据列。正确的方式应该是像下面这样只取需要的列:
    my5ql> SELECT sakila. Actor. " fro sakila. Actor. . ;

    总是取出全部列
    每次看到SELECT *的时候都需要用怀疑的眼光审视,是不是真的需要返回全部的
    列?很可能不是必需的。取出全部列,会让优化器无法完成索引覆盖扫描这类优化,
    还会为服务器带来额外的I/O、内存和CPU的消耗。因此,一些DBA是严格禁止
    SELECT *的写法的,这样做有时候还能避免某些列被修改带来的问题。
    当然,查询返回超过需要的数据也不总是坏事。在我们研究过的许多案例中,人们
    会告诉我们说这种有点浪费数据库资源的方式可以简化开发,因为能提高相同代码
    片段的复用性,如果清楚这样做的性能影响,那么这种做法也是值得考虑的。如果
    应用程序使用了某种缓存机制,或者有其他考虑,获取超过需要的数据也可能有其
    好处,但不要忘记这样做的代价是什么。获取并缓存所有的列的查询,相比多个独
    立的只获取部分列的查询可能就更有好处。
    重复查询相同的数据
    如果你不太小心,很容易出现这样的错误——不断地重复执行相同的查询,然后每
    次都返回完全相同的数据。例如,在用户评论的地方需要查询用户头像的URL,那
    么用户多次评论的时候,可能就会反复查询这个数据。比较好的方案是,当初次查
    的的时候将这个数据缓存起来,需要的时候从缓存中取出,这样性能显然会更好

    (2)MySQL是否在扫描额外的记录

    响应时间

    扫描行数

    返回的行数

    3.查看慢查询日志

    慢查询日志记录了包含所有执行时间超过参数 long_query_time(单位:秒)所设置值的 SQL
    语句的日志。获得表锁定的时间不算作执行时间。
    (1) 文件位置和格式
    当用--log-slow-queries[=file_name]选项启动 mysqld(MySQL 服务器)时,慢查询日志开始被
    记录。和前面几种日志一样,如果没有给定 file_name 的值,日志将写入参数 DATADIR(数
    据目录)指定的路径下,默认文件名是 host_name-slow.log。
    (2) 日志的读取
    和错误日志、查询日志一样,慢查询日志记录的格式也是纯文本,可以被直接读取。下例中
    演示了慢查询日志的设置和读取过程。
    (2.1)首先查询一下 long_query_time 的值。

    mysql> show variables like 'long%';
    +-----------------+-------+
    | Variable_name | Value |
    +-----------------+-------+
    | long_query_time | 10 | 
    +-----------------+-------+
    1 row in set (0.00 sec)

    (2.2)为了方便测试,将修改慢查询时间为 2 秒。

    mysql> set long_query_time=2;
    Query OK, 0 rows affected (0.02 sec)
    

    (2.3)依次执行下面两个查询语句。
    第一个查询因为查询时间低于 2 秒而不会出现在慢查询日志中:

    mysql> select count(1) from emp;
    +----------+
    | count(1) |
    +----------+
    | 131075 | 
    +----------+
    1 row in set (0.00 sec)
    

    第二个查询因为查询时间大于 2 秒而应该出现在慢查询日志中:

    mysql> select count(1) from emp t1,dept t2 where t1.id=t2.id;
    322
    +----------+
    | count(1) |
    +----------+
    | 33555200 | 
    +----------+
    1 row in set (11.31 sec)

    (2.4)查看慢查询日志。

    [root@localhost mysql]# more localhost-slow.log
    /usr/sbin/mysqld, Version: 5.0.41-community-log (MySQL Community Edition (GPL)). started 
    with:
    Tcp port: 3306 Unix socket: /var/lib/mysql/mysql.sock
    Time Id Command Argument
    # Time: 070810 23:43:55
    # User@Host: root[root] @ localhost []
    # Query_time: 297 Lock_time: 0 Rows_sent: 0 Rows_examined: 26214
    use test;
    # Query_time: 11 Lock_time: 0 Rows_sent: 1 Rows_examined: 512
    select count(1) from emp t1,dept t2 where t1.id=t2.id; 

    从上面日志中,可以发现查询时间超过 2 秒的 SQL,而小于 2 秒的则没有出现在此日志中。
    如果慢查询日志中记录内容很多,可以使用 mysqldumpslow 工具(MySQL 客户端安装自带)
    来对慢查询日志进行分类汇总。下例中对日志文件 bj37-slow.log 进行了分类汇总,只显示汇
    总后摘要结果:

    [zzx@bj37 data]$ mysqldumpslow bj37-slow.log
    [root@localhost mysql]# mysqldumpslow localhost-slow.log
    Reading mysql slow query log from localhost-slow.log
    Count: 1 Time=297.00s (297s) Lock=0.00s (0s) Rows=0.0 (0), root[root]@localhost
    select count(N) from emp t1,emp t2 where t1.id<>t2.id
    Count: 2 Time=11.00s (22s) Lock=0.00s (0s) Rows=1.0 (2), root[root]@localhost
    select count(N) from emp t1,dept t2 where t1.id=t2.id
    Count: 1 Time=9.00s (9s) Lock=0.00s (0s) Rows=0.0 (0), root[root]@localhost
    select count(N) from emp t1,emp t2 where t1.id=t2.id
    Count: 2 Time=3.00s (6s) Lock=0.00s (0s) Rows=1.0 (2), root[root]@localhost
    select count(N) from emp t1,dept t2 where t1.id=t2.id and t1.id=N

    对于 SQL 文本完全一致,只是变量不同的语句,mysqldumpslow 将会自动视为同一个语句进
    行统计,变量值用 N 来代替。这个统计结果将大大增加用户阅读慢查询日志的效率,并迅
    速定位系统的 SQL 瓶颈。
    注意:慢查询日志对于我们发现应用中有性能问题的 SQL 很有帮助,建议正常情况下,打开此
    日志并经常查看分析。
    (3) 其他选项
    在 MySQL 5.1 中,通过--log-slow-admin-statements 服务器选项,可以请求将慢管理语句,例
    如 OPTIMIZE TABLE、ANALYZE TABLE 和 ALTER TABLE 写入慢查询日志

    MySQL优化

    1.优化SQL语句

    (1)通过show status命令了解各种SQL的执行效率

    例如show status like 'Com_%'

    Com_select:执行select操作的次数,一次查询只累加1.
    Com_insert:执行insert操作的次数,对于批量插入的INSERT操作,只累加一次。
    Com_updated:执行UPDATE操作的次数。
    Com_deleted:执行delle操作的次数。

    Innodb_rows_read:select查询返回的行数.
    Innodb_rows_inserted:执行INSERT操作插入的行数。
    Innodb_rows_updated:执行UPDATE操作更新的行数
    Innodb_rows_deleted:执行DELETE操作删除的行数。

    Connections::图连接MYSQL服务器的次数。
    Uptime:服务器工作时间。
    Slow_queries:慢查询的次数。

    (2)定位性效率较低的SQL语句

    通过慢查询日志定位那些执行效率较低的sql语句,用--log-slow-queries[=file_name]选
    项启动时,mysqld写一个包含所有执行时间超过long_query_time秒的SQL语句的日志
    文件。
    慢查询日志在查询结束以后才纪录,所以在应用反映执行效率出现问题的时候慢查
    询日志并不能定位问题,可以使用show processlist命令查看当前mysql在进行的线程,
    包括线程的状态、是否锁表等,可以实时地查看SOL的执行情况,同时对一些锁表操
    作进行优化。

    (3)通过Explain分析低效SQL的执行计划

    Explain解析的每一列含义:

    select_type:表示select的类型,常见的取值有simple(简单表,即不使用表连接
    或者子查询)、PRIMARV(主查询,即外层的查询)、UNION(UNION中的第二个或
    中的第二个或者后面的查询语句)、SUBQUERY (子查询中的第一个SHLECT)等。
    table:输出结果集的表。
    type:表示表的连接类型,性能由好到差的连接类型为
      system(表中仅有一行,即常量表)、
      const(单表中最多有一个匹配行,例如primary key或者unique index).
      eq_ref(对于前面的每一行,在此表中只查询一条记录,简单来说,就是多表连接中使用primary key或者unique index)、
      ref(与eq_ref类似,区别在于不是使用primary key或者unique index,而是使用普通的索引)、
      ref_or_null(与ref类似,区别在于条件中包含对NULL的查询)、
      index_merge(索引合并优化)、
      unique_subquery (in的后面是一个查询主键字段的子查询)、
      index_subquery(与unique_Subquery类似,区别在于in的后面是查询非唯一索引字段的子查询)、
      range(单表中的范围查询)、
      index(对于前面的每一行,都通过查询索引来得到数据)、
      all(对于前面的每一行都通过全表扫描来得到数据)。
    possible_keys:表示查询时,可能使用的索引
    key:表示实际使用的索引。
    key_len:索引字段的长度。
    rows:扫描行的数量。
    extra:执行情况的说明和描述。

    (4)确定问题并采取相应的优化措施

    2.MySQL如何使用索引

  • 相关阅读:
    Zabbix Server 和 Zabbix Agentd 开机自动运行
    nginx+keepalive实现高可用负载均衡
    zabbix添加对web页面url的状态监控
    Zabbix当内存剩余不足10%的时候触发报警
    zabbix cpu监控介绍
    bash小结
    数据库知识入门
    MySQL简单管理
    python环境
    paramiko实现putty功能
  • 原文地址:https://www.cnblogs.com/Hangtutu/p/8395152.html
Copyright © 2011-2022 走看看