zoukankan      html  css  js  c++  java
  • Solr——从postgresql数据库导入数据

    1,配置准备

    本文的前提是你已经配置好了solr,并新创建了一个core,我们下面都会按照前一篇文章中的core_demo为基础开始

    2,修改soreconfig.xml

    在soreconfig.xml的<requestHandler name="/select" class="solr.SearchHandler">上面添加如下代码:

        <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
           <lst name="defaults">
              <str name="config">data-config.xml</str>
           </lst>
      </requestHandler>

    注意:需要确认文件中不存在其他的dataimport,如果存在直接替换即可

    在同级目录下创建data-config.xml文件,然后配置数据库相关属性

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    <?xml version="1.0" encoding="UTF-8"?> 
    <dataConfig>
        <dataSource name="source1" type="JdbcDataSource"
                  driver="com.mysql.jdbc.Driver"
                  url="jdbc:mysql://127.0.0.1:5432/address"
                  user="root"
                  password="123456" />
        <document>
            <entity name="company" dataSource="source1" pk="id" query="SELECT company.name,company.id,company.address FROM company">
                <field column='name' name='name' />
                <field column='id' name='id' />
                                      <field column='address' name='address' />
            </entity>
        </document>
    </dataConfig>

      关于详细的配置请参照:http://blog.csdn.net/boolbo/article/details/50352331

        官方wiki:https://cwiki.apache.org/confluence/display/solr/

    3,配置managed-schema.xml

    复制代码
    <?xml version="1.0" encoding="UTF-8" ?>
    
    <schema name="example" version="1.6">
      
       <field name="billid" type="int" indexed="true" stored="false"/>
       <field name="name" type="string" indexed="true" stored="true"/>
       <field name="address" type="string" indexed="true" stored="true"/>
       <field name="cityname" type="string" indexed="true" stored="true"/>
       <field name="createtime" type="date" indexed="true" stored="true"/>
       
       <field name="_version_" type="long" indexed="false" stored="false"/>
       <field name="text" type="string" indexed="true" stored="false" multiValued="true"/>
       <field name="_root_" type="string" indexed="true" stored="false" docValues="false" />
    
    
        <uniqueKey>billid</uniqueKey>
    
        <fieldType name="string" class="solr.StrField" sortMissingLast="true" />
        <fieldType name="int" class="solr.TrieIntField" docValues="true" precisionStep="0" positionIncrementGap="0"/>
        <fieldType name="long" class="solr.TrieLongField" docValues="true" precisionStep="0" positionIncrementGap="0"/>
        <fieldType name="date" class="solr.TrieDateField" docValues="true" precisionStep="0" positionIncrementGap="0"/>
    
    
    </schema>
    复制代码

    网上很多教程说到schema.xml,这个文件是solr之前的版本中用到的,6.6版本是不需要的,直接修改上面的文件就可以。

    4,拷贝jar

    拷贝solr-6.6.3dist路径下的solr-dataimporthandler-6.6.3.jar,solr-dataimporthandler-extras-6.6.3.jar 到E: omcat-8.5.28webappssolrWEB-INFlib目录下

    同时拷贝postgresql-42.2.5.jar链接jar到该目录下 

    不需要修改任何配置文件即可,继续下面的步骤

    5,修改jar配置路径(如果没有的话)

    继续打开solrconfig.xml 找到lib标签,修改jar的路径,下面贴上我本地修改后的路径

    复制代码

    <lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*.jar" />
    <lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-cell-d.*.jar" />

    <lib dir="${solr.install.dir:../../../..}/contrib/clustering/lib/" regex=".*.jar" />
    <lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-clustering-d.*.jar" />

    <lib dir="${solr.install.dir:../../../..}/contrib/langid/lib/" regex=".*.jar" />
    <lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-langid-d.*.jar" />

    <lib dir="${solr.install.dir:../../../..}/contrib/ltr/lib/" regex=".*.jar" />
    <lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-ltr-d.*.jar" />

    <lib dir="${solr.install.dir:../../../..}/contrib/velocity/lib" regex=".*.jar" />
    <lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-velocity-d.*.jar" />

    复制代码

    不需要添加任何jar即可

    6,重启tomcat,刷新solr页面即可看到下面界面

     full-import 全量导入,delta-import-增量导入

    点击Execute就可以导入了,点击左侧Query可查询导入的数据

  • 相关阅读:
    02注册Github账户
    软件工程概论第一节
    01课堂测试
    第二阶段冲刺01
    在子类中,若要调用父类中被覆盖的方法,可以使用super关键字
    动手动脑
    springBoot学习 错误记录
    什么是Hadoop?什么是HDFS?
    springCloud当中Eureca sever当中Camden到底是什么?
    Eureca Server的Helloworld例子
  • 原文地址:https://www.cnblogs.com/LCharles/p/9845565.html
Copyright © 2011-2022 走看看