zoukankan      html  css  js  c++  java
  • Apache Lucene

    1.Lucene  -全文搜索引擎

    Apache Lucene 是一个基于Java的全文搜索引擎,利用它能够轻易的为Java软件添�全文搜索引擎的功能。

    Lucene最重要的工作是替文件的每个字索引,索引让搜索娥效率比传统的逐字搜索高出非常多。

    Lucene 提供一组解析、过滤、分析文件,已经编排和有用索引的API。它的强大之处除了高效和简单外,最重要的是使开发人员能够随时依据自己的须要自己定义其功能。

    2.Lucene是所中搜索引擎框架的基础。下面是基于Lucene的,分别实现了不同功能的拓展。

    Nutch -全文搜索和网络爬虫

    Solr -基于Lucene的全文搜索引擎框架

    Compass -基于Lucene的搜索有引擎框架

    LIUS-基于Lucene的多文件格式索引框架

    WebLucene-基于Lucene和XML的网页索引引擎

    3.原理

    Lucene不是一个完整的全文索引应用,而是一个用Java写的全文索引引擎工具包,它能够嵌入到各种应用中实现针相应用的全文索引/检索功能。
    Lucene进行索引,首先会将进行索引的文件存储到Lucene索引库,并对文档进行索引,然后搜索时使用搜索的API接口查到被索引的文档。
    这一过程与数据库存入数据记录、创建索引、SQL查下的过程类似。

    4工作过程

    1.创建文档对象Document
    2.IndexWriter保存文档索引(能够使用不同的中文分词器)
    3.使用IndexSercher进行搜索
    4.使用IndexReader删除索引







  • 相关阅读:
    Jenkins tomcat 一键发布 (三)
    Jenkins docker 一键发布 (二)
    Jenkins docker 一键发布 (一)
    jenkins构建maven项目:找不到本地依赖包的解决办法
    Linux socket编程示例
    Linux虚拟机环境搭建
    Linux vim 配置
    vs2013 Qt5.7.0环境安装搭建
    Linux下如何生成core dump 文件
    QT5新建工程错误->无法打开源文件QtWidgets/QApplication
  • 原文地址:https://www.cnblogs.com/hrhguanli/p/3957762.html
Copyright © 2011-2022 走看看