zoukankan      html  css  js  c++  java
  • Solr4.10与tomcat整合并安装中文分词器

    1.solr

    Solr Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 

      Solr可以从Solr官方网站(http://lucene.apache.org/solr/ )下载,解压后目录如下:

    binsolr的运行脚本

    contribsolr的一些贡献软件/插件,用于增强solr的功能。

    dist:该目录包含build过程中产生的warjar文件,以及相关的依赖文件。

    docssolrAPI文档

    examplesolr工程的例子目录:

    l example/solr:

    该目录是一个包含了默认配置信息的SolrCore目录。

    l example/multicore

    该目录包含了在Solrmulticore中设置的多个Core目录。

    l example/webapps:

        该目录中包括一个solr.war,该war可作为solr的运行实例工程。

    licensessolr相关的一些许可信息

    solr 需要运行在一个Servlet容器中,Solr4.10.3要求jdk使用1.7以上;

    2.Solr整合tomcat:

    1. distsolr-4.10.3.war拷贝到Tomcatwebapp目录下改名为solr.war
    2. 新建 F:data 目录 ,拷贝:solr-4.10.0examplesolr 文件夹到 F:date

    3. 修改 D:datasolrcollection1confsolrconfig.xml,将<dataDir>${solr.data.dir:}</dataDir>  改<dataDir>${solr.data.dir:F:/data/solr/collection1/data}</dataDir>

    4. 修改 apache-tomcat-8.0.12webappssolrWEB-INFweb.xml,将
      <!--  
          <env-entry>  
             <env-entry-name>solr/home</env-entry-name>  
             <env-entry-value>/put/your/solr/home/here</env-entry-value>  
             <env-entry-type>java.lang.String</env-entry-type>  
          </env-entry>  
         --> 

      改为:

    5. <env-entry>  
             <env-entry-name>solr/home</env-entry-name>  
             <env-entry-value>F:/data/solr</env-entry-value>  
             <env-entry-type>java.lang.String</env-entry-type>  
          </env-entry>  

      5.拷贝examplelibext 目录下所有jar包到Tomcat的webappsolrWEB-INFlib目录下

    6. 拷贝log4j.properties文件在  Tomcat下webappssolrWEB-INF目录中创建文件 classes文件夹,复制Solr目录下example esourceslog4j.properties至Tomcat下webappssolrWEB-INFclasses目录 
    7. 启动tomcat 访问 :http://localhost:8080/solr
    8. 3.安装中文分词器
       第一步:配置
      IKAnalyzerjar
          拷贝IKAnalyzer的文件到TomcatSolr目录中

          将IKAnalyzer2012FF_u1.jar拷贝到 Tomcatwebapps/solr/WEB-INF/lib 下。

      第二步:IKAnalyzer的配置文件

       在Tomcatwebapps/solr/WEB-INF/下创建classes目录

       将IKAnalyzer.cfg.xmlext_stopword.dic  mydict.dic  copyTomcat

       webapps/solr/WEB-INF/classes

       注意:ext_stopword.dic mydict.dic必须保存成无BOMutf-8类型。

       第三步:修改schema.xml文件

       修改schema.xml文件

      修改Solrschema.xml文件,添加FieldType

       

      <fieldType name="text_ik" class="solr.TextField">
      
        <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
      
      </fieldType>

       第四步:设置业务系统Field

      设置业务系统Field

      <field name="item_title" type="text_ik" indexed="true" stored="true"/>
      
      <field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>
      
      <field name="item_price"  type="long" indexed="true" stored="true"/>
      
      <field name="item_image" type="string" indexed="false" stored="true" />
      
      <field name="item_category_name" type="string" indexed="true" stored="true" />
      
      <field name="item_desc" type="text_ik" indexed="true" stored="false" />
      
       
      
      <field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
      
      <copyField source="item_title" dest="item_keywords"/>
      
      <copyField source="item_sell_point" dest="item_keywords"/>
      
      <copyField source="item_category_name" dest="item_keywords"/>
      
      <copyField source="item_desc" dest="item_keywords"/>

       

       

    1. 拷贝examplelibext 目录下所有jar包到TomcatwebappsolrWEB-INFlib目录下

  • 相关阅读:
    第一阶段个人总结02
    第二阶段冲刺第十天
    第二阶段冲刺第九天
    第二阶段冲刺第八天
    第二阶段冲刺第七天
    第二阶段冲刺第六天
    第二阶段冲刺第五天
    第二阶段冲刺第四天
    第十六周总结
    第二阶段冲刺第三天
  • 原文地址:https://www.cnblogs.com/y3596597/p/6880577.html
Copyright © 2011-2022 走看看