zoukankan      html  css  js  c++  java
  • lucene合并测试的总结

    1 查询的总时间等于每个segment查询时间的总和
    2 合并的步骤
        (1)做flush操作的先生成一个新的segment
        (2)检查在新segment之前已经存在的segment的数量是否大于maxmerge(默认是10个),大于了进行合并
        (3)合并完成又会生成一个新的segment,然后把前面10个segment删除。
     
    每次追加46W条数据(46W一次提交) kfc数据,单field,单字分词,保存termvector,position,offset和payload信息,每次追加以后进行一次查询测试。
     
    每次提交46W数据花费42-43S左右的时间 查询时间提高0.05秒,加入第12个segment的时候触发合并,合并前690MB,合并后425MB,12segment查询一次0.5S,查到3293508数据,12个segment生成到合并花费560S
    总时间 42*11+560
     
    egg同类测试(单字分词,压缩方式)
    每批数据在22S左右,12次提交以后文件总大小1.3G,花费时间为244S,查询到 3293508花费 1.335018s
    总时间 22*12
  • 相关阅读:
    js创建map
    [POJ 1911] 棋盘
    [POJ 2176] Folding
    [POJ 1014] Dividing
    [洛谷P3486]POI2009 KON-Ticket Inspector
    [洛谷P1131] ZJOI2007 时态同步
    [洛谷P1133] 教主的花园
    [洛谷P1095]NOIP2007 普及组T3 守望者的逃离
    [POJ1187] 陨石的秘密
    [POJ1772] Substract
  • 原文地址:https://www.cnblogs.com/hdflzh/p/4034825.html
Copyright © 2011-2022 走看看