Solr建立索引时，过滤HTML标签 - 走看看

zoukankan html css js c++ java

Solr建立索引时，过滤HTML标签

原文地址 http://www.joyphper.net/article/201306/188.html

1、在数据库的读取文件data-config.xml 中的entity 标记里边添加 transformer=”HTMLStripTransformer” 代码。

<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description from table">
            <field column="description" name="description" stripHTML="true"/>
</entity>

2、在field 字段需要过滤html代码的字段添加 stripHTML=”true”

<entity name="edusystem" pk="url" transformer="HTMLStripTransformer" query="SELECT description from table">
             <field column="description" name="description" stripHTML="true"/>
</entity>

3、修改schema.xml文件中的fieldType标记中的内容，添加如下代码<charFilter class=”solr.HTMLStripCharFilterFactory” />

<analyzer type="query">
    <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" reload="true" />
    <filter class="solr.LowerCaseFilterFactory" />
    <charFilter class="solr.HTMLStripCharFilterFactory" />
</analyzer>

查看全文

相关阅读:
新线程 handler
解决获取View的width和Height为0的4种方法
 回调深入理解同步回调以android中View.OnClickListener为列
 回调函数
 android:layout_weight
studio rendering problems
android:exported属性
 Codeforces 1264C/1265E Beautiful Mirrors with queries (概率期望、DP)
Codeforces 1254C/1255F Point Ordering (交互题)
Codeforces 576D Flights for Regular Customers (图论、矩阵乘法、Bitset)

原文地址：https://www.cnblogs.com/fengh/p/4795126.html

Copyright © 2011-2022 走看看