zoukankan      html  css  js  c++  java
  • Solr建立索引时,过滤HTML标签

    原文地址  http://www.joyphper.net/article/201306/188.html

    1、在数据库的读取文件data-config.xml 中的entity 标记里边添加 transformer=”HTMLStripTransformer” 代码。

    <entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description  from table">
                <field column="description" name="description" stripHTML="true"/>
    </entity> 

    2、在field 字段需要过滤html代码的字段添加 stripHTML=”true”

    <entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description from table">
                 <field column="description" name="description" stripHTML="true"/>
    </entity>

    3、修改schema.xml文件中的fieldType标记中的内容,添加如下代码<charFilter class=”solr.HTMLStripCharFilterFactory” />

    <analyzer type="query">
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"  mode="simple" reload="true" />
        <filter class="solr.LowerCaseFilterFactory" />
        <charFilter class="solr.HTMLStripCharFilterFactory" />
    </analyzer>

  • 相关阅读:
    64_q2
    64_q1
    64_p10
    64_p9
    64_p8
    64_p7
    64_p6
    64_p5
    64_p4
    64_p3
  • 原文地址:https://www.cnblogs.com/fengh/p/4795126.html
Copyright © 2011-2022 走看看