MySQL-8.0.x 新特性之索引页合并

zoukankan html css js c++ java

MySQL-8.0.x 新特性之索引页合并
【背景】

　　索引的重要是在些不表、在这里我想说的另一个问题；索引和数据一样在innodb中都是以page的形式来组织的，那么问题就来了。

　　比如果说索引 ix_person_name 的内容只要8个页面就能完整的保存下来，如果这个时候一条insert语句来了，由于索引的8个

　　页面都是满的、我们只能在新的页面中保存这条insert(所插入数据)的索引。

　　1): 如果insert插入数据的索引值比当前的都要大或是都要小，那么新的索引页面只要加入到列表的尾部或首部就行了，这两种情况

　　相对来说还是比较“廉价”的。

　　2): 如果insert插入数据的索引在已有索引之间，也就是说它比最小的大、但是比最大的小。这个就要对索引页面做“裂解”了，这个

　　这个就相对来说比较“重”了。

　　

【问题在哪里】

　　之所以引起“裂解”是因为在索引页面适当的位置上没有空间可以用来保存键值关系了，为了防止把页面写满使得最后要做“裂解”,数据库

　　引入了一个“填充因子”的概念，比如说填充因子设置为80%就是说当页面中的空间80%都已经写入数据之后就可以为索引分配新的页面

　　了，不要等到页面空间用完。这个就是期望通过多个相对“廉价”的操作来避免“重”的操作。

　　

【副作用也不小】

　　由于“填充因子”是80%所以之前8个页面就可以保存下来的内容现在用了10个页面，由于操作是以页面为单位的所以最“糟糕”的情况下

　　数据库的多了20%的开销(当然事实上并没有这么多、这只是从页面数据数量这个维度来说的)。

　　以上所说的还不是全部、通常真实的填充率不太可能有80%；比如说在经历过一段时间的oltp之后，有一些数据被删除了，所以这些

　　数据所对应的索引内容也会被回收、这些内容之前占的空间可能就是先放着等着后面的重用。

　　假设数据量没有变多少，可以实际上的填充率由之前的80%下降到了10%，极端数据库的工作量又增加了。

　　总的来说索引在页面中排列的越是“紧密”对于读来说它可以明显的减小开销，但是这个会增大写的开销。之前DBA只能“暗中观察”，

　　不能“有所作为”，但是MySQL-8.0.x版本下变天了；DBA可以在一定程序上左右“历史的进程”！

【手段】

　　在mysql-8.0.x中DBA可以指定索引页面合并的阀值，比如说把阀值设置为50%也就是说当相邻的两个索引页面，当他们的填充率

　　都小于或等于50%的情况下就可能把这两个页面合并成一个页面。也就是说索引页面合并有利于“读”操作

【例子】

　　假设我们有一个person表并把name列的索引的合并阀值设置为45%，birthday列索引的阀值设置为48%　　
use tempdb; create table person(id int not null auto_increment primary key, name varchar(16), birthday datetime default now()); create index ix_person_name on tempdb.person(name) comment 'MERGE_THRESHOLD=45'; create index ix_person_birthday on tempdb.person(birthday) comment 'MERGE_THRESHOLD=48';
　　1): MERGE_THRESHOLD 是以comment的形式体现在SQL中的、MySQL并没有为它单开一个子句

　　2): MERGE_THRESHOLD 只能是大写的小写的话会被“无视”

【可以从information_schema中查询索引页的合并阀值】
select * from INNODB_INDEXES where name in ('ix_person_name','ix_person_birthday') ; +----------+--------------------+----------+------+----------+---------+-------+-----------------+ | INDEX_ID | NAME | TABLE_ID | TYPE | N_FIELDS | PAGE_NO | SPACE | MERGE_THRESHOLD | +----------+--------------------+----------+------+----------+---------+-------+-----------------+ | 147 | ix_person_name | 1059 | 0 | 2 | 5 | 2 | 45 | | 148 | ix_person_birthday | 1059 | 0 | 2 | 6 | 2 | 48 | +----------+--------------------+----------+------+----------+---------+-------+-----------------+ 2 rows in set (0.01 sec)
----
查看全文

相关阅读:
进阶算子
 Scala中sortBy和Spark中sortBy区别
 简单算子演示
 map和FlatMap之间区别?
RDD
Spark高可用
 Django Rest Framework
Scrapy
asyncio
BeautifulSoup

原文地址：https://www.cnblogs.com/JiangLe/p/10108945.html