zoukankan      html  css  js  c++  java
  • Apache Lucene

    1.Lucene  -全文搜索引擎

    Apache Lucene 是一个基于Java的全文搜索引擎,利用它能够轻易的为Java软件添�全文搜索引擎的功能。

    Lucene最重要的工作是替文件的每个字索引,索引让搜索娥效率比传统的逐字搜索高出非常多。

    Lucene 提供一组解析、过滤、分析文件,已经编排和有用索引的API。它的强大之处除了高效和简单外,最重要的是使开发人员能够随时依据自己的须要自己定义其功能。

    2.Lucene是所中搜索引擎框架的基础。下面是基于Lucene的,分别实现了不同功能的拓展。

    Nutch -全文搜索和网络爬虫

    Solr -基于Lucene的全文搜索引擎框架

    Compass -基于Lucene的搜索有引擎框架

    LIUS-基于Lucene的多文件格式索引框架

    WebLucene-基于Lucene和XML的网页索引引擎

    3.原理

    Lucene不是一个完整的全文索引应用,而是一个用Java写的全文索引引擎工具包,它能够嵌入到各种应用中实现针相应用的全文索引/检索功能。
    Lucene进行索引,首先会将进行索引的文件存储到Lucene索引库,并对文档进行索引,然后搜索时使用搜索的API接口查到被索引的文档。
    这一过程与数据库存入数据记录、创建索引、SQL查下的过程类似。

    4工作过程

    1.创建文档对象Document
    2.IndexWriter保存文档索引(能够使用不同的中文分词器)
    3.使用IndexSercher进行搜索
    4.使用IndexReader删除索引







  • 相关阅读:
    POJ 1328 Radar Installation
    POJ 1700 Crossing River
    POJ 1700 Crossing River
    poj 3253 Fence Repair (贪心,优先队列)
    poj 3253 Fence Repair (贪心,优先队列)
    poj 3069 Saruman's Army(贪心)
    poj 3069 Saruman's Army(贪心)
    Redis 笔记与总结2 String 类型和 Hash 类型
    数据分析方法有哪些_数据分析方法
    数据分析方法有哪些_数据分析方法
  • 原文地址:https://www.cnblogs.com/hrhguanli/p/3957762.html
Copyright © 2011-2022 走看看