zoukankan      html  css  js  c++  java
  • Lucene索引维护(添加、修改、删除)

    1. Field域属性分类

    添加文档的时候,我们文档当中包含多个域,那么域的类型是我们自定义的,上个案例使用的TextField域,那么这个域他会自动分词,然后存储
                我们要根据数据类型和数据的用途合理的选择合适的域
                Field类:
                    StringField(fieldName,fieldValue,Stroe.YES/NO) 存储的数据类型为字符串,包含索引,是否存储根据Stroe定义,不会经过分析器
                    StroeField(fieldName,fieldValue) 支持多种数据类型,不分析,不建立索引,默认保存到索引库当中
                    LongPoint(name,value) 会进行分析,会创建索引,但是不会保存到索引库当中
                    TextField(fieldName,fieldValue,Stroe.YES/NO) 会分析,会创建索引,是否保存取决Store

    2. 添加索引

    @Test
        public void createDocument() throws IOException {
            //创建IndexWriter对象   参数一:索引库位置   参数二:指定配置
            IndexWriter indexWriter=new IndexWriter(FSDirectory.open(new File("E:\Y2学习\Lucene\索引库\Index").toPath()),
                    new IndexWriterConfig(new IKAnalyzer()));
            //创建一个文档对象
            Document document=new Document();
            document.add(new TextField("fieldName","hehe.txt", Field.Store.YES));
            document.add(new StoredField("fieldPath","c://hehe.txt"));
            document.add(new LongPoint("fieldSize",123));
            document.add(new StoredField("fieldSize",123));
            document.add(new TextField("fieldContent","ojdbc14和ikanalyzer的maven找不到的解决办法,手动发布oJdbc14到maven仓库,手动发布ikanalyzer到maven,同时本教程适用于所有jar包发布 下载 IKAnalyzer结合Lucene使用和单独使用例子 简单性能测试 11-26 阅读数 1890 IKAnalyzer是一个开源基于JAVA语言的 .", Field.Store.YES));
            //创建索引,将文档添加到索引库当中
            indexWriter.addDocument(document);
            //关闭
            indexWriter.close();
        }

    3. 修改索引:原理-先删除再添加

    /**
         * 索引修改,修改fieldName域中关键词匹配到全文检索的文档
         * @throws IOException
         */
        @Test
        public void updateDocument() throws IOException {
            //创建IndexWriter对象   参数一:索引库位置   参数二:指定配置
            IndexWriter indexWriter=new IndexWriter(FSDirectory.open(new File("E:\Y2学习\Lucene\索引库\Index").toPath()),
                    new IndexWriterConfig(new IKAnalyzer()));
    
            //创建文档
            Document document=new Document();
            document.add(new TextField("fieldName","new.txt", Field.Store.YES));
            document.add(new StoredField("fieldPath","c://new.txt"));
            document.add(new LongPoint("fieldSize",456));
            document.add(new StoredField("fieldSize",456));
            document.add(new TextField("fieldContent","修改fieldName为全文检索的文档,进行文档替换,先删除掉fieldName为全文检索的两个文档,再添加一个fileName为new的新文档", Field.Store.YES));
    
            //修改  参数一为条件  参数二为修改的文档值
            indexWriter.updateDocument(new Term("fieldName","全文检索"),document);
    
            //关闭
            indexWriter.close();
        }

    4.删除索引

    4.1 删除全部:慎用

    @Test
        public void deleteAllDocument() throws IOException {
            //创建IndexWriter对象   参数一:索引库位置   参数二:指定配置
            IndexWriter indexWriter=new IndexWriter(FSDirectory.open(new File("E:\Y2学习\Lucene\索引库\Index").toPath()),
                    new IndexWriterConfig(new IKAnalyzer()));
    
            //删除索引
            indexWriter.deleteAll();
            //关闭
            indexWriter.close();
        }

    4.2 根据域和关键词删除

    /**
         * 根据域和关键词进行删除
         * @throws IOException
         */
        @Test
        public void deleteByFieldAndTermDocument() throws IOException {
            //创建IndexWriter对象   参数一:索引库位置   参数二:指定配置
            IndexWriter indexWriter=new IndexWriter(FSDirectory.open(new File("E:\Y2学习\Lucene\索引库\Index").toPath()),
                    new IndexWriterConfig(new IKAnalyzer()));
    
            //定义一个删除条件,定义一个查询对象
            Query query=new TermQuery(new Term("fieldName","全文检索"));
            //删除
            indexWriter.deleteDocuments(query);
    
            //关闭
            indexWriter.close();
        }

    没有执行条件删除时一共15个文档

    readIndex(全文检索)  搜索到俩个文档

     

     执行条件删除后

  • 相关阅读:
    IDEA常用快捷指令整理
    Python dict 字典
    内联函数
    【MFC】编辑框 CEdit Ctrl控件自动换行设置
    mysql 多sql文件恢复方案
    Linux: 用64位的系统,能编译32位的程序吗?
    C++ 遍历数组
    工业现场传感器传感器为什么采用电流形式输出?
    【转】电磁阀、电磁铁的工作原理说明
    PCB板强弱电隔离距离不够导致损坏和问题检查记录
  • 原文地址:https://www.cnblogs.com/chx9832/p/12363320.html
Copyright © 2011-2022 走看看