zoukankan      html  css  js  c++  java
  • lucene、solr、nutch三者的关系

    lucene是一个做搜索用的类库 nutch和solr都是基于lucene的,二者都是可直接运行的应用程序;
    直接在业务上使用lucene的倒是不太多见。  
    solr主要提供了建立索引(用户可以直接post数据给solr,然后由solr进行索引)和提供查询索引的功能(它内嵌了jetty,可以直接提供HTTP服务)
    nutch一般用作爬虫使用,负责抓取数据。

    solr的重大变化:从5.0开始,solr不再以war包发布(war包可以部署到任何servlet容器中),而是以独立的java服务器程序的形式发布(基于内嵌的jetty),它有启动/停止脚本,还有安装脚本用于在类unix上安装一个solr产品,后续版本不支持部署到其他的servlet容器上(如tomcat)

    现在可以直接用ElasticSearch+Nutch做搜索引擎了。

  • 相关阅读:
    课后作业一
    软工假期预习作业
    Spark2.0自定义累加器
    JAVA hashmap知识整理
    Spark 累加器
    RDD与DataFrame的转换
    Scala笔记整理
    Spark RDD
    Hbase的flush机制
    Spring源码-ImportSelector实现分析
  • 原文地址:https://www.cnblogs.com/jpfss/p/10871145.html
Copyright © 2011-2022 走看看