参考:
http://taobaofed.org/blog/2017/07/05/leveldb-analysis/
和leveldb源码(block.cc的Seek函数)。
leveldb的key、value是放在一起的,可以scan,但搜索不是全量搜索,而和搜索相关的是,bloom filter和restarts。
bloom filter
bloom filter用来快速确定某个key是否存在,有意思的是,leveldb用了多个bloom filter,这样可以多次判定。
restarts
和想象的一样,leveldb用了二分搜索。leveldb的key本来是压缩的,但是也有不压缩的key,一般是间隔几个就不压缩,并用restarts记录offset。leveldb的key是有序的,
restarts项存储时候类似数组一样放在一起,所以用二分搜索restarts,就可以找到key的存在。