zoukankan      html  css  js  c++  java
  • 关于lucene断点续索引和增量索引的问题

    关于lucene断点续索引和增量索引的问题
    1、像百度、google等桌面搜索建立索引的时候可以停止后重新索引,他能保证以前索引过的文件重新索引的时候不用再索引吗?如果停止后要索引的文件进行了删除和添加等操作,那么他是怎么处理的以保证索引文件的覆盖率。用lucene索引文件的时候如何实现这种功能,给个思路。

    2、如何在我给一个目录里添加一个文件的时候自动把这个文件用lucene索引起来,就是所谓的增量索引,难道用个timer扫描目录变化或者用filewatch来监视这个目录,然后对其索引吗?可是这样的话必须做个windows服务了,要不这个软件关闭的话就不能相应目录里文件的变化了。

    3、如果一个文件修改或者删除了,如何同步到索引里,用IndexReader找这个Document的时候考什么去找,必须要在Document里放一个类似于主键的域来找到它,并删除或者重新建立索引吗?

    就这3问题,大家给说说思路,谢谢。

  • 相关阅读:
    [转载]浅谈如何管理测试团队
    使用 virtualenv
    使用 HTMLTestRunner.py
    Jenkins 十二: 集成 selenium 测试
    [转载]聊一聊人员培养
    Jenkins 十一: 构建Maven项目
    Jenkins 八: 构建Git项目
    Jenkins 九: 小技巧
    jsp详解
    cookie详解
  • 原文地址:https://www.cnblogs.com/onlytiancai/p/689697.html
Copyright © 2011-2022 走看看