zoukankan      html  css  js  c++  java
  • lucene合并测试的总结

    1 查询的总时间等于每个segment查询时间的总和
    2 合并的步骤
        (1)做flush操作的先生成一个新的segment
        (2)检查在新segment之前已经存在的segment的数量是否大于maxmerge(默认是10个),大于了进行合并
        (3)合并完成又会生成一个新的segment,然后把前面10个segment删除。
     
    每次追加46W条数据(46W一次提交) kfc数据,单field,单字分词,保存termvector,position,offset和payload信息,每次追加以后进行一次查询测试。
     
    每次提交46W数据花费42-43S左右的时间 查询时间提高0.05秒,加入第12个segment的时候触发合并,合并前690MB,合并后425MB,12segment查询一次0.5S,查到3293508数据,12个segment生成到合并花费560S
    总时间 42*11+560
     
    egg同类测试(单字分词,压缩方式)
    每批数据在22S左右,12次提交以后文件总大小1.3G,花费时间为244S,查询到 3293508花费 1.335018s
    总时间 22*12
  • 相关阅读:
    uva 147 Dollars
    hdu 2069 Coin Change(完全背包)
    hdu 1708 Fibonacci String
    hdu 1568 Fibonacci
    hdu 1316 How Many Fibs?
    poj 1958 Strange Towers of Hanoi
    poj 3601Tower of Hanoi
    poj 3572 Hanoi Tower
    poj 1920 Towers of Hanoi
    筛选法——素数打表
  • 原文地址:https://www.cnblogs.com/hdflzh/p/4034825.html
Copyright © 2011-2022 走看看