lucene问题汇总:
当IndexSearcher打开一份磁盘索引后,IndexSearcher实例持有的是打开索引时的一份镜像索引,而执行优化动作后,将会把优化后的索引存储到原磁盘路径下,导致索引容量翻倍。
那么怎么解决这个问题呢?IndexSearcher实例执行re-open动作,然后再执行优化操作,此时的优化操作很快,相当于是删除之前IndexSearcher持有的镜像索引。
特别是在实时索引过程中,对大索引的优化一般比较耗时,因此合理的解决方案是:单独开一条线程执行优化操作,当优化完成后对IndexSearcher实例进行re-open操作,然后再执行一次优化操作。
在这一系列过程中,不会因为优化操作而对检索服务造成影响,也不会占用额外的磁盘空间(第二次优化的时候会将重复的索引文件进行删除,节约磁盘空间)。
但是必须注意的是:在第一优化操作时,必须保证空闲磁盘空间大于目前的索引容量。