zoukankan      html  css  js  c++  java
  • 一颗高度为3的B+树能存多少行数据?

    InnoDB存储引擎的最小储存单元是 页(Page) ,一个页的大小是默认是 16K 。磁盘存储数据最小单元是 扇区 ,一个扇区的大小是 512字节 , 而文件系统(例如XFS/EXT4)它的最小单元是 ,一个块的大小是 4k

    因此InnoDB的所有数据文件(后缀为 .ibd 的文件),它的大小始终都是16384B(16k)的整数倍。

    image-20210908191431225

    数据表中的数据都是存储在页中的,所以一个页中能存储多少行数据呢?假设一行数据的大小是1k,那么一个页可以存放16行这样的数据。

    但是除了有 存放数据的页 以外,还有 存放键值+指针(索引)的页 ,即B+树中的非叶子节点,该页存放键值和指向数据页的指针,这样的页由N个(键值+指针)组成。当然它也是排好序的。 这样的数据组织形式,我们称为「索引组织表」。索引组织表通过非叶子节点的「二分查找法」以及指针确定数据在哪个页中,进而在去数据页中查找到需要的数据。

    这里我们先假设B+树高为2,即存在一个根节点和若干个叶子节点,没有子页节点,那么这棵B+树的存放总记录数为:根节点指针数*单个叶子节点记录行数

    那么现在我们需要计算出非叶子节点能存放多少指针,也就是存放多少索引?

    我们假设主键ID为 bigint 类型,长度为8字节,而 指针大小在InnoDB源码中设置为6字节 ,这样一共14字节。

    我们一个页中能存放多少这样的单元,其实就代表有多少指针,即 16384/14=1170。一个页能存放1170个索引

    那么可以算出一棵高度为2的B+树,能存放1170*16=18720条这样的数据记录。

    根据同样的原理我们可以算出一个高度为3的B+树可以存放:1170(根存的记录指针数据)✖1170(下一级每个节点存的记录指针数据)✖16(每个叶子阶段存的数据条数)=21902400 条这样的记录,即2100w量级。

    所以在InnoDB中B+树高度一般为1-3层,它就能满足千万级的数据存储。

    在查找数据时一次页的查找代表一次 IO ,所以通过主键索引查询通常只需要1-3次 IO 操作即可查找到数据,即使一个是千万量级的表,也是很快的。

    最后还有一个问题,如何得到InnoDB主键索引B+树的高度

    在InnoDB的表空间文件中,约定 page number 为 3 的代表主键索引的根页,而在根页偏移量为 64 的地方存放了该B+树的 page level

    如果 page level 为1,树高为2, page level 为2,则树高为3。即B+树的高度=page level + 1

    首先,找到MySql数据库物理文件存放位置:

    image-20210908192220335

    使用hexdump工具,查看表空间文件指定偏移量上的数据:

    image-20210908192307766

    page level 值是 1,那么 B+树高度为 page level + 1 = 2

    花五年时间成为某个领域的专家
  • 相关阅读:
    用JavaScript玩转计算机图形学(二)基本光源
    两条像面试用的编程问题,和我的囧事
    混合语言的游戏开发系统架构
    为你详解Linux安装GCC方法
    Windows Phone 7常用资源大集合
    html5之Web Workers示例
    MFC/Win32中使用GDI+
    linux yum命令详解
    Linux development tools
    HTML5之Canvas标签简要学习
  • 原文地址:https://www.cnblogs.com/sang-bit/p/15260053.html
Copyright © 2011-2022 走看看