一、什么是存储引擎
mysql中建立的库===>文件夹
库中建立的表===>文件
生活中我们用来存储数据的文件有不同的类型,每种文件类型对应各自不同的处理机制:比如处理文本用txt类型,处理表格用excel,处理图片用png等。
数据库中的表也应该有不同的类型,表的类型不同,会对应mysql不同的存取机制,表类型又称为存储引擎。
存储引擎说白了就是如何存储数据、如何为存储的数据建立索引和如何更新、查询数据等技术的实现方法。因为在关系数据库中数据的存储是以表的形式存储的,所以存储引擎也可以称为表类型(即存储和操作此表的类型)。
数据库提供多种存储引擎,用户可以根据不同的需求为数据表选择不同的存储引擎。(用户也可以自己编写定制自己的存储引擎)
SQL 解析器、SQL 优化器、缓冲池、存储引擎等组件在每个数据库中都存在,但不是每 个数据库都有这么多存储引擎。 MySQL 的插件式存储引擎可以让存储引擎层的开发人员设 计他们希望的存储层,例如,有的应用需要满足事务的要求,有的应用则不需要对事务有这 么强的要求 ;有的希望数据能持久存储,有的只希望放在内存中,临时并快速地提供对数据的查询。
二、mysql支持的存储引擎
查看mysql所有支持的存储引擎
mysql> show engines; +--------------------+---------+----------------------------------------------------------------+--------------+------+------------+ | Engine | Support | Comment | Transactions | XA | Savepoints | +--------------------+---------+----------------------------------------------------------------+--------------+------+------------+ | InnoDB | DEFAULT | Supports transactions, row-level locking, and foreign keys | YES | YES | YES | | MRG_MYISAM | YES | Collection of identical MyISAM tables | NO | NO | NO | | MEMORY | YES | Hash based, stored in memory, useful for temporary tables | NO | NO | NO | | BLACKHOLE | YES | /dev/null storage engine (anything you write to it disappears) | NO | NO | NO | | MyISAM | YES | MyISAM storage engine | NO | NO | NO | | CSV | YES | CSV storage engine | NO | NO | NO | | ARCHIVE | YES | Archive storage engine | NO | NO | NO | | PERFORMANCE_SCHEMA | YES | Performance Schema | NO | NO | NO | | FEDERATED | NO | Federated MySQL storage engine | NULL | NULL | NULL | +--------------------+---------+----------------------------------------------------------------+--------------+------+------------+ 9 rows in set (0.00 sec)
很多数据库只能支持一种存储引擎,mysql可以支持多种存储引擎这是它的重要特点。它的默认引擎是InnoDB,它支持的功能也都是python开发需要用到的。
1、InnoDB存储引擎
支持事务,其设计目标主要面向联机事务处理(OLTP)的应用。其特点是行锁设计、支持外键,并支持类似 Oracle 的非锁定读,即默认读取操作不会产生锁。 从 MySQL 5.5.8 版本开始是默认的存储引擎。
InnoDB 存储引擎将数据放在一个逻辑的表空间中,这个表空间就像黑盒一样由 InnoDB 存储引擎自身来管理。从 MySQL 4.1(包括 4.1)版本开始,可以将每个 InnoDB 存储引擎的 表单独存放到一个独立的 ibd 文件中。此外,InnoDB 存储引擎支持将裸设备(row disk)用 于建立其表空间。
InnoDB 通过使用多版本并发控制(MVCC)来获得高并发性,并且实现了 SQL 标准 的 4 种隔离级别,默认为 REPEATABLE 级别,同时使用一种称为 netx-key locking 的策略来 避免幻读(phantom)现象的产生。除此之外,InnoDB 存储引擎还提供了插入缓冲(insert buffer)、二次写(double write)、自适应哈希索引(adaptive hash index)、预读(read ahead) 等高性能和高可用的功能。
对于表中数据的存储,InnoDB 存储引擎采用了聚集(clustered)的方式,每张表都是按 主键的顺序进行存储的,如果没有显式地在表定义时指定主键,InnoDB 存储引擎会为每一 行生成一个 6 字节的 ROWID,并以此作为主键。
InnoDB 存储引擎是 MySQL 数据库最为常用的一种引擎,Facebook、Google、Yahoo 等 公司的成功应用已经证明了 InnoDB 存储引擎具备高可用性、高性能以及高可扩展性。对其 底层实现的掌握和理解也需要时间和技术的积累。如果想深入了解 InnoDB 存储引擎的工作 原理、实现和应用,可以参考《MySQL 技术内幕:InnoDB 存储引擎》一书。
2、MyISAM存储引擎
不支持事务、表锁设计、支持全文索引,主要面向一些OLAP 数据库应用,在 MySQL 5.5.8 版本之前是默认的存储引擎(除Windows 版本外)。数据库系统 与文件系统一个很大的不同在于对事务的支持,MyISAM 存储引擎是不支持事务的。究其根本,这也并不难理解。用户在所有的应用中是否都需要事务呢?在数据仓库中,如果没有 ETL 这些操作,只是简单地通过报表查询还需要事务的支持吗?此外,MyISAM 存储引擎的 另一个与众不同的地方是,它的缓冲池只缓存(cache)索引文件,而不缓存数据文件,这与 大多数的数据库都不相同。
3、NDB存储引擎
MySQL AB 公司从 Sony Ericsson 公司收购了 NDB 存储引擎。 NDB 存储引擎是一个集群存储引擎,类似于 Oracle 的 RAC 集群,不过与 Oracle RAC 的 share everything 结构不同的是,其结构是 share nothing 的集群架构,因此能提供更高级别的 高可用性。NDB 存储引擎的特点是数据全部放在内存中(从 5.1 版本开始,可以将非索引数 据放在磁盘上),因此主键查找(primary key lookups)的速度极快,并且能够在线添加 NDB 数据存储节点(data node)以便线性地提高数据库性能。由此可见,NDB 存储引擎是高可用、 高性能、高可扩展性的数据库集群系统,其面向的也是 OLTP 的数据库应用类型。
4、Memory存储引擎
正如其名,Memory 存储引擎中的数据都存放在内存中,数据库重启或发生崩溃,表中的数据都将消失。它非常适合于存储 OLTP 数据库应用中临时数据的临时表,也可以作为 OLAP 数据库应用中数据仓库的维度表。Memory 存储引擎默认使用哈希 索引,而不是通常熟悉的 B+ 树索引。
5、Infobright存储索引
第三方的存储引擎。其特点是存储是按照列而非行的,因此非常 适合 OLAP 的数据库应用。其官方网站是 http://www.infobright.org/,上面有不少成功的数据 仓库案例可供分析。
6、NTSE存储引擎
网易公司开发的面向其内部使用的存储引擎。目前的版本不支持事务, 但提供压缩、行级缓存等特性,不久的将来会实现面向内存的事务支持。
7、BLACKHOLE
黑洞存储引擎,可以应用于主备复制中的分发主库。
MySQL 数据库还有很多其他存储引擎,上述只是列举了最为常用的一些引擎。如果 你喜欢,完全可以编写专属于自己的引擎,这就是开源赋予我们的能力,也是开源的魅力所在。
三、指定表类型(存储引擎)
方法1:建表时指定
mysql> create database db2; Query OK, 1 row affected (0.00 sec) mysql> use db2 Database changed mysql> create table t1(id int)engine=innodb; Query OK, 0 rows affected (0.01 sec) mysql> create table t2(id int)engine=memory; Query OK, 0 rows affected (0.01 sec) mysql> create table t3(id int)engine=blackhole; Query OK, 0 rows affected (0.01 sec) mysql> create table t4(id int)engine=myisam; Query OK, 0 rows affected (0.01 sec)
查看对应文件夹下文件:
sh-3.2# ls -lrt total 304 -rw-r----- 1 _mysql _mysql 61 5 9 18:50 db.opt -rw-r----- 1 _mysql _mysql 8556 5 9 18:51 t1.frm # 表结构 -rw-r----- 1 _mysql _mysql 98304 5 9 18:52 t1.ibd # 表数据文件innodb -rw-r----- 1 _mysql _mysql 8556 5 9 18:52 t2.frm # 只有表结构没有表数据(存放在内存中)memory -rw-r----- 1 _mysql _mysql 8556 5 9 18:52 t3.frm # 没有数据文件,丢进去就没有了 blackhole -rw-r----- 1 _mysql _mysql 8556 5 9 18:53 t4.frm # 表结构 myisam -rw-r----- 1 _mysql _mysql 0 5 9 18:53 t4.MYD # 表数据 -rw-r----- 1 _mysql _mysql 1024 5 9 18:53 t4.MYI # 表索引 sh-3.2# pwd /usr/local/mysql/data/db2
由此可见不同类型的表在硬盘中有不同的体现,对应的存取机制也不一样。
mysql> insert into t1 values(1); Query OK, 1 row affected (0.01 sec) mysql> insert into t2 values(1); Query OK, 1 row affected (0.00 sec) mysql> insert into t3 values(1); Query OK, 1 row affected (0.01 sec) mysql> insert into t4 values(1); Query OK, 1 row affected (0.00 sec) mysql> select * from t1; +------+ | id | +------+ | 1 | +------+ 1 row in set (0.00 sec) mysql> select * from t2; +------+ | id | +------+ | 1 | +------+ 1 row in set (0.00 sec) mysql> select * from t3; Empty set (0.00 sec) mysql> select * from t4; +------+ | id | +------+ | 1 | +------+ 1 row in set (0.00 sec)
t3没有数据,进一步说明了blackhole类型,数据一放进去就丢失掉了,表内永远不存记录。
然后重启mysql或重启机器,再查看t2表,发现数据为空,说明表内数据情况,证明数据存放在内存中。
方法2:在配置文件中指定默认的存储引擎
/etc/my.cnf [mysqld] default-storage-engine=INNODB innodb_file_per_table=1