zoukankan      html  css  js  c++  java
  • 转载:Solr的自动完成实现方式(第三部分:Suggester方式续)

    转自:http://www.cnblogs.com/ibook360/archive/2011/11/30/2269126.html

     在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天,我们来看一下如果为suggester添加字段,以这种方式来提供自动完成的功能。 
     

    组件配置 
    在上一期的配置组件中添加如下的参数:

    <str name="sourceLocation">dict.txt</str>  

    这样我们的配置就变成了: 

    复制代码
    <searchComponent name="suggest" class="solr.SpellCheckComponent">   
    <lst name="spellchecker">
    <str name="name">suggest</str>
    <str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
    <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>
    <str name="field">name_autocomplete</str>
    <str name="sourceLocation">dict.txt</str>
    </lst>
    </searchComponent>
    复制代码

    使用这个参数,我们让suggest组件使用名叫dict.txt的文件作为solr的配置字典。 


    handler配置 
    handler的配置也需要添加额外的一个参数:

    <str name="spellcheck.onlyMorePopular">true</str>  

    完整的配置为: 

    复制代码
    <requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchComponent">   
    <lst name="defaults">
    <str name="spellcheck">true</str>
    <str name="spellcheck.dictionary">suggest</str>
    <str name="spellcheck.count">10</str>
    <str name="spellcheck.onlyMorePopular">true</str>
    </lst>
    <arr name="components">
    <str>suggest</str>
    </arr>
    </requestHandler>
    复制代码

    这个参数告诉solr,当查询的结果数多于设定的count数时,返回点击数更多的那些。 


    Dictionary 
    我们告诉solr来使用这个字段,那么这个字段长的什么样呢?下面来看一个例子: 

    # sample dict 
    Hard disk hitachi
    Hard disk wd 2.0
    Hard disk jjdd 3.0

    这个字典的结果是什么样的呢?每个词组放在单独的一行中,每行以改词组的权重为结束(权重与词组之间以TAB字符分隔),这个权重就是跟spellcheck.onlyMorePopular=true 香港的参数,默认值为1.0。该字段必须以UTF-8的编码格式存储。每行前有#字符的将被忽略(注释行)。 

    数据 
    以这种方式,我们不需要数据,字段就是数据。 

    运行 
    在重新构建suggester之后,我们来看一下它的运行情况,输入命令: 

    /suggest?q=Har

    得到的结果为: 

    复制代码
    <?xml version="1.0" encoding="UTF-8"?>   
    <response>
    <lst name="responseHeader">
    <int name="status">0</int>
    <int name="QTime">0</int>
    </lst>
    <lst name="spellcheck">
    <lst name="suggestions">
    <lst name="Dys">
    <int name="numFound">3</int>
    <int name="startOffset">0</int>
    <int name="endOffset">3</int>
    <arr name="suggestion">
    <str>Hard disk jjdd</str>
    <str>Hard disk wd</str>
    <str>Hard disk hitachi</str>
    </arr>
    </lst>
    </lst>
    </lst>
    </response>
    复制代码

    结束语 
    跟预期一样,suggest的结果是按权重排序的。这里的大小写敏感(注意首字母). 

    你有什么建议呢?如果我们有一个很好的字典,这个字典的权重是基于用户的查询行为产生的,那么用户肯定会喜欢它!如果没有好的字典,还是不要用这种方式的好。 

    下一步 
    下一期,我们看一下不同方式的suggest产生的索引结构和大小。 

    原文URL:http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene 

  • 相关阅读:
    从零到有模拟实现一个Set类
    node+express+mysql 实现登陆注册
    从路由原理出发,深入阅读理解react-router 4.0的源码
    linux rsyncserver文件同步
    为什么说Python是一门动态语言--Python的魅力
    python基础教程_学习笔记11:魔法方法、属性和迭代器
    list,set,map,数组间的相互转换
    TCP/IP协议族
    宿舍更换的新淋浴喷头"水温vs旋钮角度"关系的研究(曲线)
    单元測试中 Right-BICEP 和 CORRECT
  • 原文地址:https://www.cnblogs.com/fesh/p/4535957.html
Copyright © 2011-2022 走看看