zoukankan      html  css  js  c++  java
  • Lucene之模糊、精确、匹配、范围、多条件查询

    Lucene的查询方式很 丰富,对于数值类型的数据,采取TermRangeQuery的方式,对于String类型的,就可以采取TermQuery等,查询方式了,可以通过采取合适的查询方式,检索到数据。Queryparser这个查询方式包含了其他几种查询方式。

    查询方式

    查询方式意义
    TermQuery 精确查询
    TermRangeQuery 查询一个范围
    PrefixQuery 前缀匹配查询
    WildcardQuery 通配符查询
    BooleanQuery 多条件查询
    PhraseQuery 短语查询
    FuzzyQuery 模糊查询
    Queryparser 万能查询(上面的都可以用这个来查询到)

    案例

    package com.yellowcong.demo;
    
    import java.io.File;
    import java.io.IOException;
    import java.util.ArrayList;
    import java.util.Date;
    import java.util.List;
    
    import org.apache.lucene.analysis.standard.StandardAnalyzer;
    import org.apache.lucene.document.Document;
    import org.apache.lucene.document.Field;
    import org.apache.lucene.document.IntField;
    import org.apache.lucene.document.LongField;
    import org.apache.lucene.document.StringField;
    import org.apache.lucene.document.TextField;
    import org.apache.lucene.index.IndexReader;
    import org.apache.lucene.index.IndexWriter;
    import org.apache.lucene.index.IndexWriterConfig;
    import org.apache.lucene.index.Term;
    import org.apache.lucene.search.FuzzyQuery;
    import org.apache.lucene.search.IndexSearcher;
    import org.apache.lucene.search.NumericRangeQuery;
    import org.apache.lucene.search.PhraseQuery;
    import org.apache.lucene.search.PrefixQuery;
    import org.apache.lucene.search.Query;
    import org.apache.lucene.search.ScoreDoc;
    import org.apache.lucene.search.TermQuery;
    import org.apache.lucene.search.TopDocs;
    import org.apache.lucene.search.WildcardQuery;
    import org.apache.lucene.store.FSDirectory;
    import org.apache.lucene.util.Version;
    
    /**
     * 创建用户:狂飙的yellowcong<br/>
     * 创建时间:下午5:27:50<br/>
     * 创建日期:2017年12月2日<br/>
     * 机能概要:
     */
    public class Demo4 {
        private static List<Passage> psgList = null;
    
        // 写对象
        private static IndexWriter writer = null;
    
        public static void main(String[] args) throws Exception {
    
            // 删除 所有索引
            deleteAll();
    
            // 建立索引
            index();
    
            //精确String 类型查询
            getByTermQuery();
    
            //范围查询
            getByRange();
    
            //前缀匹配查询
            getByPrefix();
    
            //通配符查询
            getByWildcard();
    
            //短语查询
            getByPhrase();
    
            //模糊查询
            getByFuzzy();
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:下午12:00:43<br/>
         * 机能概要:精确查询
         * @throws Exception
         */
        public static void getByTermQuery() {
            System.out.println("-------------查询用户名为yellowcong的数据-------------");
            //精确查询,根据名称来直接
            Query query = new TermQuery(new Term("username", "yellowcong"));
    
            //执行查询
            excQuery(query);
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:下午12:25:21<br/>
         * 机能概要:范围查询
         */
        public static void getByRange(){
            //精确查询
            System.out.println("-------------查询id在1-3的数据-------------");
            //查询前三条数据,后面两个true,表示的是是否包含头和尾
            Query query = NumericRangeQuery.newIntRange("id", 1, 3, true, true);
            //执行查询
            excQuery(query);
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:下午12:25:56<br/>
         * 机能概要:前缀查询数据
         */
        public static void getByPrefix(){
            System.out.println("-------------查询前缀 邮箱 以z开头的数据-------------");
            //查询前缀 邮箱 以z开头的数据
            Query query = new PrefixQuery(new Term("email", "z"));
    
            //执行查询
            excQuery(query);
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:下午12:29:55<br/>
         * 机能概要:通配符查询数据
         */
        public static void getByWildcard(){
            //通配符就更简单了,只要知道“*”表示0到多个字符,而使用“?”表示一个字符就行了
            System.out.println("-------------------查询email 以 @qq结尾的数据--------------");
            //查询email 以 @qq结尾的数据
            Query query = new WildcardQuery(new Term("email","*@qq.com"));
            //执行查询
            excQuery(query);
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:下午12:43:43<br/>
         * 机能概要:短语查询,查询中间有几个单词的那种
         */
        public static void getByPhrase(){
            System.out.println("------------查询内容中,有I LOVE YOU 的数据---------------");
            //短语查询,但是对于中文没有太多的用,其中查询的时候还有
            PhraseQuery query = new PhraseQuery();
            //设定有几跳,表示中间存在一个单词
            query.setSlop(1);
            //查询
            query.add(new Term("content","i"));
    
            //I  XX you  就可以被查询出来
            query.add(new Term("content","you"));
    
            excQuery(query);
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:下午12:49:14<br/>
         * 机能概要:默认提供的模糊查询对中文来说,没有任何用
         * @throws Exception
         */
        public  static void getByFuzzy() throws Exception{
            System.out.println("-------------------------模糊查询---------------");
            FuzzyQuery query = new FuzzyQuery(new Term("username","zhangsan"));
            excQuery(query);
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:下午12:01:55<br/>
         * 机能概要:查询Query 将需要查询的条件传递进来
         * @param query
         */
        public static void excQuery(Query query){
            //查询
            IndexReader reader  = null;
            try {
                reader = getIndexReader();
    
                //获取查询数据
                IndexSearcher searcher = new IndexSearcher(reader);
    
                //检索数据
                TopDocs topDocs = searcher.search(query, 100);
                for(ScoreDoc scoreDoc : topDocs.scoreDocs){
                    //湖区偶
                    Document doc = reader.document(scoreDoc.doc);
                    System.out.println(doc.get("id")+":"+doc.get("username")+":"+doc.get("email"));
                }
            } catch (Exception e) {
                e.printStackTrace();
            }finally{
                coloseReader(reader);
            }
        }
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月3日<br/>
         * 创建时间:上午11:52:52<br/>
         * 机能概要:关闭IndexReader
         * @param reader
         */
        private static void coloseReader(IndexReader reader) {
            try {
                if (reader != null) {
                    reader.close();
                }
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    
        static {
            psgList = new ArrayList<Passage>();
    
            // 产生一堆数据
            psgList.add(new Passage(1, "yellowcong" ,
                    "717350389@qq.com", "逗比", 23 , "I LOVE YOU ", new Date()));
    
            psgList.add(new Passage(2, "张三" ,
                    "zhashang@qq.com", "逗比", 23, "三炮", new Date()));
            psgList.add(new Passage(3, "李四" ,
                    "lisi@neusoft.com", "逗比", 23, "三炮", new Date()));
            psgList.add(new Passage(4, "王五" ,
                    "wangwu@aliyun.com", "逗比", 23, "三炮", new Date()));
            psgList.add(new Passage(5, "赵六" ,
                    "zhaoliu@baidu.com", "逗比", 23, "三炮", new Date()));
            System.out.println("-------------------------添加的数据----------------------");
            for(Passage psg:psgList){
                System.out.println(psg.getId()+":"+psg.getUsername()+":"+psg.getEmail()+":"+psg.getContent());
            }
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午5:43:57<br/>
         * 机能概要:获取IndexWriter 同一时间 ,只能打开一个 IndexWriter,独占写锁 。内建线程安全机制。
         * 
         * @return
         * @throws Exception
         */
        @SuppressWarnings("static-access")
        public static IndexWriter getIndexWriter() throws Exception {
            // 创建IdnexWriter
            String path = getIndexPath();
            FSDirectory fs = FSDirectory.open(new File(path));
            // 判断资源是否占用
            if (writer == null || !writer.isLocked(fs)) {
                synchronized (Demo3.class) {
                    if (writer == null || !writer.isLocked(fs)) {
                        // 创建writer对象
                        writer = new IndexWriter(fs,
                                new IndexWriterConfig(Version.LUCENE_45, new StandardAnalyzer(Version.LUCENE_45)));
                    }
                }
            }
            return writer;
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午5:46:36<br/>
         * 机能概要:获取到IndexReader 任意多个IndexReaders可同时打开,可以跨JVM。
         * 
         * @return
         * @throws Exception
         */
        public static IndexReader getIndexReader() throws Exception {
            // 创建IdnexWriter
            String path = getIndexPath();
            FSDirectory fs = FSDirectory.open(new File(path));
            // 获取到读
            return IndexReader.open(fs);
        }
    
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午7:57:04<br/>
         * 机能概要:删除所有的索引
         */
        public static void deleteAll() {
            IndexWriter writer = null;
            try {
                // 获取IndexWriter
                writer = getIndexWriter();
    
                // 删除所有的数据
                writer.deleteAll();
    
                int cnt = writer.numDocs();
                System.out.println("索引条数	" + cnt);
    
                // 提交事物
                writer.commit();
            } catch (Exception e) {
                e.printStackTrace();
            } finally {
                coloseWriter(writer);
            }
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午5:37:22<br/>
         * 机能概要:获取索引目录
         * 
         * @return 目录
         */
        private static String getIndexPath() {
            // 获取索引的目录
            String path = Demo3.class.getClassLoader().getResource("index").getPath();
    
            // 不存在就创建目录
            File file = new File(path);
            if (!file.exists()) {
                file.mkdirs();
            }
            return path;
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午8:24:16<br/>
         * 机能概要:关闭IndexWriter
         */
        private static void coloseWriter(IndexWriter writer) {
            try {
                if (writer != null) {
                    writer.close();
                }
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午8:26:15<br/>
         * 机能概要:关闭IndexReader
         * 
         * @param reader
         */
        public static void closerReader(IndexReader reader) {
            try {
                if (reader != null) {
                    reader.close();
                }
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午8:10:01<br/>
         * 机能概要: 查询数据
         * 
         * @param key
         *            查询范围
         * @param val
         *            值
         */
        public static void search(String key, Object val) {
            IndexReader reader = null;
            try {
                reader = getIndexReader();
    
                IndexSearcher searcher = new IndexSearcher(reader);
    
                // 精确查询
                Query query = null;
    
                // 定义查询条件
                if (val instanceof Integer) {
                    // 后面的两个true 表示的是 是否包含 上下的数据
                    query = NumericRangeQuery.newIntRange(key, Integer.parseInt(val.toString()),
                            Integer.parseInt(val.toString()), true, true);
                } else {
                    query = new TermQuery(new Term(key, val.toString()));
                }
                // QueryParser paraser = new QueryParser(Version.LUCENE_45, key, new
                // StandardAnalyzer(Version.LUCENE_45));
                // Query query = paraser.parse(val);
    
                // 获取查询到的Docuemnt
                TopDocs topDocs = searcher.search(query, 500);
                // 总共命中的条数
                System.out.println(topDocs.totalHits);
                for (ScoreDoc score : topDocs.scoreDocs) {
                    //
                    Document doc = searcher.doc(score.doc);
    
                    // 查询到的结果
                    String username = doc.get("username");
                    System.out.println(username);
                }
            } catch (Exception e) {
                e.printStackTrace();
            } finally {
                closerReader(reader);
            }
        }
    
        /**
         * 创建用户:狂飙的yellowcong<br/>
         * 创建日期:2017年12月2日<br/>
         * 创建时间:下午6:03:33<br/>
         * 机能概要:建立索引
         */
        public static void index() {
            IndexWriter writer = null;
            try {
                // 1、获取IndexWriter
                writer = getIndexWriter();
    
                // 2、建立索引
                for (Passage psg : psgList) {
                    Document doc = new Document();
    
                    // IntField 不能直接检索到,需要结合
                    doc.add(new IntField("id", psg.getId(), Field.Store.YES));
    
                    // 用户String类型的字段的存储,StringField是只索引不分词
                    doc.add(new TextField("username", psg.getUsername(), Field.Store.YES));
    
                    // 主要对int类型的字段进行存储,需要注意的是如果需要对InfField进行排序使用SortField.Type.INT来比较,如果进范围查询或过滤,需要采用NumericRangeQuery.newIntRange()
                    doc.add(new IntField("age", psg.getAge(), Field.Store.YES));
    
                    // 对String类型的字段进行存储,TextField和StringField的不同是TextField既索引又分词
                    doc.add(new TextField("content", psg.getContent(), Field.Store.NO));
    
                    doc.add(new StringField("keyword", psg.getKeyword(), Field.Store.YES));
    
                    doc.add(new StringField("email", psg.getEmail(), Field.Store.YES));
    
                    // 日期数据添加索引
                    doc.add(new LongField("addDate", psg.getAddDate().getTime(), Field.Store.YES));
    
                    // 3、添加文档
                    writer.addDocument(doc);
                }
    
                // 索引条数
                int cnt = writer.numDocs();
                System.out.println("索引条数	" + cnt);
    
                // 提交事物
                writer.commit();
            } catch (Exception e) {
                e.printStackTrace();
            } finally {
                coloseWriter(writer);
            }
        }
    
        static class Passage {
            private int id;
            private String username;
            private String email;
            private String keyword;
            private int age;
            // 这个模拟的是文章
            private String content;
            private Date addDate;
    
            public Passage(int id, String username, String email, String keyword, int age, String content, Date addDate) {
                super();
                this.id = id;
                this.username = username;
                this.email = email;
                this.keyword = keyword;
                this.age = age;
                this.content = content;
                this.addDate = addDate;
            }
    
            public int getId() {
                return id;
            }
    
            public void setId(int id) {
                this.id = id;
            }
    
            public String getUsername() {
                return username;
            }
    
            public void setUsername(String username) {
                this.username = username;
            }
    
            public String getEmail() {
                return email;
            }
    
            public void setEmail(String email) {
                this.email = email;
            }
    
            public String getKeyword() {
                return keyword;
            }
    
            public void setKeyword(String keyword) {
                this.keyword = keyword;
            }
    
            public int getAge() {
                return age;
            }
    
            public void setAge(int age) {
                this.age = age;
            }
    
            public String getContent() {
                return content;
            }
    
            public void setContent(String content) {
                this.content = content;
            }
    
            public Date getAddDate() {
                return addDate;
            }
    
            public void setAddDate(Date addDate) {
                this.addDate = addDate;
            }
        }
    }
    

      

  • 相关阅读:
    常遇问题及解决
    cs231笔记1
    scikit-learn模型参数保存和多分类策略(one vs one和one vs rest)
    练习1_scikit_learn自带数据集_sklearn和svm
    记一次连不上wifi网的处理
    剑指offer | 从1到n整数中1出现的次数 | 22
    剑指offer | 数组中出现次数超过一半的数字 | 21
    剑指offer | 不用加减乘除做加法 | 20
    剑指offer | 二进制中1的个数 | 19
    剑指offer | 链表中环的入口结点 | 18
  • 原文地址:https://www.cnblogs.com/fan-yuan/p/9228822.html
Copyright © 2011-2022 走看看