zoukankan      html  css  js  c++  java
  • 比Redis更快:Berkeley DB面面观

    比Redis更快:Berkeley DB面面观

     

    比Redis更快:Berkeley DB面面观

    Redis很火,最近大家用的多。从两年前开始,Memcached转向Redis逐渐成为潮流;
    而Berkeley DB可能很多朋友还很陌生,首先,我们简单的介绍一下。

    Berkeley DB介绍

    • 历史悠久。Berkeley DB1991年发行第一版, 2006年被Oracle收购;
    • Berkeley DB是一个嵌入式数据库系统,将其归类到内存数据库范畴没有问题;
    • 使用Key-Value结构存储,本身不支持SQL,5.5版以后整合了SQLite,可使用sql进行查询;官方资料给出的评估是如果原生的bdb能让性能提升10倍,使用SqlLite之后,大概就只有2-3倍;sql的解析及底层的衔接耗时较多;

    • 开源产品,使用的开源协议为: AFFERO GPL (AGPL)。这个协议对商用产品主要的约束是对与使用Berkeley DB的软件,发布软件包时需要付费;举个例子:如果微软的office要使用则必须付费;而腾讯的QQ后台服务器使用则无需付费;

    Berkeley DB设计思想

    简单、小巧、可靠、高性能。
    DB库和应用运行在同一进程空间,接口为API形式,应用通过API存取DB;

    应用范例

    MySQL 5.1版之前的数据事务存储引擎使用的是Berkeley DB;(5.1版之后不再使用更多的可能是出于商业的原因,因为Berkeley DB被Oracle收购了)
    Google Accounts选用的Berkeley DB作为存储引擎;

    Berkeley DB VS Redis

    除了速度,Berkeley DB的最大的优势是支持多索引(次级索引);支持多索引,使得从关系型DB中移植到内存DB更容易,可有效避免数据膨胀及自行处理索引之间的映射关系;

    eg:一张学生信息表,以学号为主键(唯一性索引)建立了索引可以查询到指定的学生记录;如果再希望以姓名来查询,可以以姓名为键建立次级索引来查询;
    在查询条件比较复杂的情况下,可组合建立多个次级索引来找到同一份数据;
    想进一步了解次级索引如何使用,可参考这篇文章:《Berkeley DB多索引查询

    性能测试对比:Berkeley DB VS Redis

    使用环境:

    CPU:Intel Core 2 Duo P9xxx 2.0G
    MEM:16G
    OS:Red Hat Enterprise Linux Server release 6.3  (Santiago) x86_64

    同样是内存数据库,我们对比Berkeley DB和Redis的运行时间(单位:ms)
    A表记录:506622条记录:每条记录:96个字节
    B表记录:2478条记录;每条记录:10个字节;
    C表记录:107221条记录;每条记录:82个字节;

    重建内存数据库 BDB用4s,Redis 20s;
    更新内存数据库,BDB和Redis的实验结果都比较理想
    查询记录时,BDB比Redis基本快一个数量级;
    缓存、重建整个表操作,BDB性能明显优于Redis;这是因为BDB提供批量读取所有数据的接口,而Redis没有提供类似的接口;

    性能对比测试:Berkeley DB VS Oracle

    为了将数据从Oracle中移植出来,我们需要对比关系型数据库和Berkeley DB的查询效率:
    首先,我们使用唯一性索引作为Berkeley DB的主键,并因此查询来和oracle对比;
    数据规模:

    实验数据;1112516条记录:
    大小2.8G;

    以查询出最终结果为准:
    SQL查询:
    SELECT * FROM table_a
    WHERE (DATE=to_date(:v, 'YYYYMMDD') AND A =:a AND B =:b AND c>=:c AND D>=:d) AND ( E=:e) AND (F=:F) AND (G=:g) AND H!='C' AND N='N'";
    其中>= 、 !=操作无法编入索引,在索引查处数据后需应用再进行筛选过滤;
    最终的查询结果为一条记录;

         在存取速度上,Berkerley DB比关系型数据库,比redis都快不少,在批量查询及数据导入操作上甚至快上一个数量级。这主要是因为:
    1. 全内存操作;数据都在内存中;
    2. DB与应用在同一个进程地址空间中;这样,就没有额外的网络开销。
    当然,我们会意识到使用Berkerley DB就必须在每个应用物理节点上都开辟一大块内存,来存放Berkerley DB的数据。这方面,分布式的Redis则显得更为实惠。
     

    如果这篇文章让你对Berkeley DB产生了兴趣,如果你也想着效率那点事,想着将关系数据库转到nosql,试着上手吧。传送门:《Berkeley DB入门篇》。

    Posted by: 大CC | 31OCT,2013

  • 相关阅读:
    C#里边的控件缩写大全(比较规范)
    jQuery的一些备忘
    有趣的史实~
    值类型 VS 引用类型~
    一道笔试题和UML思想 ~
    数据绑定以及Container.DataItem几种方式与用法分析
    用户控件与自定义控件的异同
    .NET资源站点汇总~
    C#中抽象类和接口的区别
    弹出窗口的一些东西(一),备忘~
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/3398715.html
Copyright © 2011-2022 走看看