zoukankan      html  css  js  c++  java
  • solr3.6数据导入DataImport实现

    上文中介绍了定时器实现实时索引数据的解决方案,本文对其进行补充,介绍数据导入的配置

    1 配置RequestHandler

     <!-- DataImportHandler -->

     <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">  
         <lst name="defaults">  
           <str name="config">db/db-data-config.xml</str>  
         </lst>  
      </requestHandler>

    2 配置数据源和数据实体

    包括全部导入和增量导入

    <dataConfig>      

    <dataSource driver="net.sourceforge.jtds.jdbc.Driver" url="jdbc:jtds:sqlserver://IP;instance=SQLSRV2005;DatabaseName=CloudPlat" user="sa" password="sa"  batchSize="100"/>
    <document>
            <entity name="article" pk="DocAutoId" query="select * from CP_InfoListPub order by DocAutoId"         
            deltaImportQuery
    ="select * from CP_InfoListPubClone where DocAutoId='${dataimporter.delta.DocAutoId}'"
            deltaQuery
    ="select DocAutoId from CP_InfoListPubClone where Doc_GatherDate &gt; '${dataimporter.last_index_time}'"
            deletedPkQuery
    ="select DocAutoId from CP_InfoListPubClone where DocAutoId=0"
            transformer
    ="ClobTransformer,HTMLStripTransformer,DateFormatTransformer" >
                <field column="DocAutoId" name="id" />        
                <field column="Doc_Title" name="title" /> 
                <field column="Doc_RegionName" name="region" />
                <field column="Doc_TradeName" name="trade" />
                <field column="Doc_Content" name="content" clob="true" stripHTML="true"/>            
                <field column="Doc_PubDate" name="update"  dateTimeFormat="yyyy-MM-dd"/>
                <field column="Doc_Url" name="link" />
            </entity>
        </document>

    </dataConfig> 

    3 引入相关的文件,apache-solr-dataimporthandler-1.4.0.jar,apache-solr-dataimporthandler-extras-1.4.0.jar,mysql-connector-java-5.1.10.jar等

    启动tomcat,访问http://localhost:8080/solr/dataimport?command=full-import 将数据全部导入solr服务器进行索引

    访问http://localhost:8080/solr/dataimport?command=status可以查看运行状态

    当修改data-config.xml 文件配置时运行http://localhost:8080/solr/dataimport?command=reload-config可以进行重新加载配置文件

    如果想终止运行http://localhost:8080/solr/dataimport?command=abort

  • 相关阅读:
    java根据图片路径下载到服务器方案 (转)
    什么是JSP (转)
    获取给定月中哪些天有聊天记录
    患者咨询服务区数据获取
    获取 不在当前设置录入状态,但是曾经设定过的测量指标 的最后测量日期
    MySQL 常用函数之——substr()
    MySql查询时间段的方法(转)
    MySQL 百万级分页优化(Mysql千万级快速分页)(转)
    mysql的sql分页函数limit使用 (转)
    MySql实现分页查询的SQL,mysql实现分页查询的sql语句 (转)
  • 原文地址:https://www.cnblogs.com/chenying99/p/2622905.html
Copyright © 2011-2022 走看看