LevelDb 源码阅读感

zoukankan html css js c++ java

LevelDb 源码阅读感
读了部分LevelDb的code，有以下几点感触：

1. 对资源控制的很小心：Level Db中将内存，文件个数均视作资源，任何一次写入都需要判断当前是否有足够的资源，比如内存是否超过了限定值，文件个数是否已经太多以致持续高速写入将会导致读操作的IO频繁影响性能等；任何一个指标达到了阈值则开始流控，比如每次写入delay 1ms等。

2. 文件compaction的启动标准给出了一个量化指标：
// We arrange to automatically compact this file after // a certain number of seeks. Let's assume: // (1) One seek costs 10ms // (2) Writing or reading 1MB costs 10ms (100MB/s) // (3) A compaction of 1MB does 25MB of IO: // 1MB read from this level // 10-12MB read from next level (boundaries may be misaligned) // 10-12MB written to next level // This implies that 25 seeks cost the same as the compaction // of 1MB of data. I.e., one seek costs approximately the // same as the compaction of 40KB of data. We are a little // conservative and allow approximately one seek for every 16KB // of data before triggering a compaction.
作者认为一次seek大概的cost大概可以相当于compaction 16kb的数据，所以如果一个文件大小是X的话，则seek X/16次的时候其cost已经跟将该文件compaction一样了，这时候就可以启动对该文件的compaction了。

3. 每次访问的时候对memfile ref count ++，这个节省了内存拷贝的开销，但是如果read qps很高的话，可能导致内存中的memtable始终无法被释放，从而可能导致内存占用过多，最后block写，这点不是很有道理。

4. Iterator里面多路merge使用的是简单的数组查找，没有使用优先级队列等，也许作者觉得这个DB就不是为大规模数据访问准备的？

5. 其merge的方法也挺有意思的，将文件分为多个level，除开level0外，其余level中的文件之间没有overlap（http://leveldb.googlecode.com/svn/trunk/doc/impl.html），我觉得这样增加了复杂性，至于性能能好多少就不得而知了。

6. blockindex的key可能未必真正存在，比如两个block的end key分别是i am raymond 和i see youha，则block index中的key可以存储成i b，因为i b > i am raymond 并且i b < i see youha, 这样降低了blockindex的存储空间。

7. 只要有可能总是使用变长编码和压缩，这个应该是google的强项了

8. block cache里面同时存储了文件信息，当文件被移除的时候，该文件的block也被移除，这个作用个人觉得对性能影响不大，不过如果内存很有限，文件个数以匀速增长和删除，可能是有意义的。

整体感觉，Level DB适合小规模存储，可以当成BerkeleyDB来使用，对于移动开发平台应该挺有优势的，对于构建大规模数据平台可能不合适。

另外感觉LEVELDB的某些实现过于精细，可能google却是碰到了那些我们很少碰到的问题吧。
查看全文

相关阅读:
Visual Studio工具 vcpkg简介
 可跨平台C++开源图形图像框架:openFrameworks
Visual Studio2017 设置了vcpkg之后，编译其他程序出问题
 PCL 3维点云的模板匹配
 Eigen库和STL容器冲突问题
 C 和 CPP 混合代码cmath编译出错
 VS2017在Release下编译错误C1001
伪随机数
 和求余运算巧妙结合的jns指令
 [显示属性]-自定义桌面里没有IE选项

原文地址：https://www.cnblogs.com/raymondshiquan/p/level_db_notes.html