zoukankan      html  css  js  c++  java
  • Hubbledotnet V0.8.3.6 版本性能测试报告

    测试数据

    论文标题和摘要信息,数据行数 400 万行,数据大小2.6GB

    测试环境

    Intel Core2 Duo T7100 1.8GHz

    2.0 GB of RAM

    硬盘转速为 5400 转

    普通笔记本电脑

    Hubbledotnet 0.8.3.6 版本 + 盘古分词 1.2 版本

    表结构

    image

    索引参数

    image

    这个参数设置索引时的并发线程数

    Step 为 5000。这个参数指明每次批量索引的行数。

    索引速度

    image

    400万数据,索引用时 8237秒,即每小时索引 174 万行。

    我忘记将盘古分词改成最新版本了,如果用最新的2.0.1.0 版本,索引速度应该还可以提高30%左右。

    索引文件大小

    image

    两个字段的索引文件大小总和为 624M

    内存占用

    image

    HubbleTask 服务在400万数据时占用内存为 180M 左右,这其中有50M左右为盘古分词占用,20M左右为.net 自身占用,索引实际占用内存为110M左右。

    查询速度

    查询单个字

    首次查询

    image

    用时320ms

    第二次查询

    image

    用时2.23ms

    首次翻页

    image

    用时295ms

    查询多个字

    采用 Match 方式首次查询

     image

    用时342ms

    采用 Contains 方式首次查询

    image

    用时132ms

    Contains 和 Match 的区别是Contains 对输入的单词分量按与方式匹配,Match是按或方式匹配。Contains 比 Match 更精确和快速。

  • 相关阅读:
    OLEDB 数据变更通知
    Python处理正则表达式超时的办法
    OLEDB 静态绑定和数据转化接口
    Keepalived+LVS(DR)+MySQL
    Keepalived+Nginx实现Nginx的高可用
    ISCSI存储
    memcached随笔练习
    Varnish快速安装及测试
    Oracle及其相关软件历史版本下载地址
    使用VMwaver 克隆CentOS 6.9网卡配置报错
  • 原文地址:https://www.cnblogs.com/eaglet/p/1756192.html
Copyright © 2011-2022 走看看