zoukankan      html  css  js  c++  java
  • Lucene 入门需要了解的东西

    全文搜索引擎的原理网上大段的内容,要想深入的学习,最好的办法就是先用一下,lucene 发展比较快,下面是写第一个demo  要注意的一些事情:

    1、Lucene的核心jar包,下面几个包分别位于不同的文件夹,需要手工找到并引用就可以进行开发了

    lucene-core-5.3.1.jar

    lucene-analyzers-common-5.3.1.jar

    lucene-queryparser-5.3.1.jar

    2、主要开发包说明

    org.apache.lucene.analysis:语言分析器,主要用于分词

    org.apache.lucene.document:索引文档的管理

    org.apache.lucene.index:索引管理,如增、删、改

    org.apache.lucene.queryparser:查询分析

    org.apache.lucene.search:检索管理

    org.apache.lucene.store:数据存储管理

    org.apache.lucene.util:工具包

    3、写入索引操作的核心类

    Directory:代表索引文档的存储位置,这是一个抽象类有FSDirectoryRAMDirectory两个主要子类。前者将索引写入文件系统,后者将索引文档写入内存。

    Analyzer:建立索引时使用的分析器,主要子类有StandardAnalyzer(一个汉字一个词),还可以由第三方提供如开源社区提供一些中文分词器。

    IndexWriterConfig:操作索引库的配置信息

    IndexWriter:建立索引的核心类,用来操作索引(增、删、改)

    Document:代表一个索引文档

    Field:代表索引文档中存储的数据,新版本的Lucene进行了细化给出了多个子类:IntFieldLongFieldFloatFieldDoubleFieldTextFieldStringField等。

  • 相关阅读:
    Flask框架学习教程 汇总篇
    git版本管理工具
    Django-rest framework框架 汇总篇
    数据库学习之路 汇总篇
    Web后端开发学习教程 汇总篇
    Django框架学习教程 汇总篇
    Web前端开发学习教程 汇总篇
    Python开发之爬虫 汇总篇
    Python从入门到放弃 汇总篇
    flask之SQLAlchemy
  • 原文地址:https://www.cnblogs.com/dhf327/p/5058498.html
Copyright © 2011-2022 走看看