zoukankan      html  css  js  c++  java
  • AeroSpike 4.x 基本原理和读写流程

    AeroSpike 4.x 基本原理和读写流程

    AeroSpike 是一个基于Hash的NoSQL,本质上是一个KV存储系统

    最简单的理解就是内存中存放了一个红黑树,红黑树里面存放的是索引,索引里面存放的是hash之后的值以及数据存放的位置

    classDiagram class Index{ ...... // offset: 4 cf_digest keyd;//20 bytes ...... // offset: 47 uint64_t rblock_id: 37; // can address 2^37 * 16b = 2Tb drive uint64_t n_rblocks: 19; // is enough for 8Mb/16b = 512K rblocks uint64_t file_id: 7; // can spec 2^7 = 128 drives ...... }

    索引中不会存放Key的值,而是存放一个hash值(通过key+set计算cf_digest_compute2),索引另外还存放了设备号(实际是文件)以及具体的rblock_id以及value的长度(n_rblocks)

    大概的查询流程

    st=>start: Start
    find_index=>operation: 查内存索引
    hit_index=>condition: 索引命中
    find_swb=>operation: 查写入缓冲区(SWB)
    find_ssd=>operation: 查磁盘
    hit=>condition: 命中
    e=>end
    
    st->find_index->hit_index
    hit_index(yes)->find_swb->hit
    hit_index(no)->e
    hit(yes)->e
    hit(no)->find_ssd
    find_ssd->e
    

    理解 rblock,swb

    设备(实际上是个文件描述符)

    什么是rblock

    我们把一个文件区域进行划分块,每一块大小为16byte

    | rblock0 | rblock1 | rblock2 | ... | rblockn |

    因此通过rblock_id 很容易就能确定value是在哪里存储

    nblock是这条记录占用block的数量

    什么是swb

    swb 是写入缓冲区

    因为写磁盘这个操作比较耗时,为了降低系统调用次数可以引入缓冲区,每次先写这个缓冲区,写满之后再刷盘

    AeroSpike所有操作都是基于写入的,只会操作当前缓冲区,不会更改之前写入的记录,比如删除一条记录也是写入一条某个key被删除

    缓冲区大小是 8M

    无效的key处理

    后台线程扫描文件,整理块

  • 相关阅读:
    《算法导论》第二章笔记
    Python实现websocket之Django Channel实时推送与聊天
    zabbix设置钉钉报警
    ESXi安装报错,No network adapters were detected...
    supervisor指南
    Flask入门到放弃(五)—— 蓝图
    Flask入门到放弃(四)—— 数据库
    Flask入门很轻松(三)—— 模板
    Flask入门很轻松 (二)
    Flask入门很轻松 (一)
  • 原文地址:https://www.cnblogs.com/stdpain/p/12635528.html
Copyright © 2011-2022 走看看