zoukankan      html  css  js  c++  java
  • Solr 6.0 学习(五)solr基本查询和高级查询

    参考:http://www.cnblogs.com/rainbowzc/p/4354224.html

    查询参数

    常用:

    • q - 查询字符串,必须的。
    • fl - 指定返回那些字段内容,用逗号或空格分隔多个。
    • start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。
    • rows - 指定返回结果最多有多少条记录,配合start来实现分页。
    • sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]。示例:(inStock desc, price asc)表示先 "inStock" 降序, 再 "price" 升序,默认是相关性降序。
    • wt - (writer type)指定输出格式,可以有 xml, json, php, phps。
    • fq - (filter query)过虑查询,作用:在q查询符合结果中同时是fq查询符合的,例如:q=mm&fq=date_time:[20081001 TO 20091031],找关键字mm,并且date_time是20081001到20091031之间的
    • 注意:solr查询时间为UTC 格式(2013-04-25T22:22:12.000Z)
    • 如:
      • timestamp:[* TO NOW]

      • createdate:[1976-03-06T23:59:59.999Z TO *]

      • createdate:[1995-12-31T23:59:59.999Z TO 2007-03-06T00:00:00Z]

      • pubdate:[NOW-1YEAR/DAY TO NOW/DAY+1DAY]

      • createdate:[1976-03-06T23:59:59.999Z TO 1976-03-06T23:59:59.999Z+1YEAR]

      • createdate:[1976-03-06T23:59:59.999Z/YEAR TO 1976-03-06T23:59:59.999Z]

    不常用:

    • defType
    • q.op - 覆盖schema.xml的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定
    • df - 默认的查询字段,一般默认指定
    • qt - (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。

    其它:

    • indent - 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。
    • version- 查询语法的版本,建议不使用它,由服务器指定默认值。

    检索运算符

    • : 指定字段查指定值,如返回所有值:
    • ? 表示单个任意字符的通配
    • * 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)
    • ~ 表示模糊检索,如检索拼写类似于"roam"的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。 邻近检索,如检索相隔10个单词的"apache"和"jakarta","jakarta apache"~10
    • ^ 控制相关度检索,如检索jakarta apache,同时希望去让"jakarta"的相关度更加好,那么在其后加上""符号和增量值,即jakarta4 apache
    • 布尔操作符AND、||
    • 布尔操作符OR、&&
    • 布尔操作符NOT、!、-(排除操作符不能单独与项使用构成查询)
    • + 存在操作符,要求符号"+"后的项必须在文档相应的域中存在
    • () 用于构成子查询
    • [] 包含范围检索,如检索某时间段记录,包含头尾,date:[200707 TO 200710]
    • {}不包含范围检索,如检索某时间段记录,不包含头尾,date:{200707 TO 200710}
    • " 转义操作符,特殊字符包括+ - && || ! ( ) { } [ ] ^ " ~ * ? : "

    示例

    • 1. 查询所有
    http://localhost:8080/solr/primary/select?q=*:*
    
    • 2. 限定返回字段
    http://localhost:8080/solr/primary/select?q=*:*&fl=productId
    

    表示:查询所有记录,只返回productId字段

    • 3. 分页
    http://localhost:8080/solr/primary/select?q=*:*&fl=productId&rows=6&start=0
    

    表示:查询前六条记录,只返回productId字段

    • 4. 增加限定条件
    http://localhost:8080/solr/primary/select?q=*:*&fl=productId&rows=6&start=0&fq=category:2002&fq=namespace:d&fl=productId+category&fq=en_US_city_i:1101
    

    表示:查询category=2002、en_US_city_i=110以及namespace=d的前六条记录,只返回productId和category字段

    • 5. 添加排序
    http://localhost:8080/solr/primary/select?q=*:*&fl=productId&rows=6&start=0&fq=category:2002&fq=namespace:d&sort=category_2002_sort_i+asc
    

    表示:查询category=2002以及namespace=d并按category_2002_sort_i升序排序的前六条记录,只返回productId字段

    • 6. facet查询

    现实分组统计结果

    http://localhost:8080/solr/primary/select?q=*:*&fl=productId&fq=category:2002&facet=true&facet.field=en_US_county_i&facet.field=en_US_hotelType_s&facet.field=price_p&facet.field=heatRange_i
    
    http://localhost:8080/solr/primary/select?q=*:*&fl=productId&fq=category:2002&facet=true&facet.field=en_US_county_i&facet.field=en_US_hotelType_s&facet.field=price_p&facet.field=heatRange_i&facet.query=price_p:[300.00000+TO+*]

    facet   

    基本参数:


    具体实例和用法参考:

    参考:facet用法

    group  




    查询的url:

    http://localhost:8080/solr/my_solr/select?q=province:湖&wt=xml&indent=true&rows=100&group=true&group.field=province&group.field=province&group.limit=20&group.ngroups=true

    group=true:设置开启分组查询

    group.field=province:设置分组字段

    group.limit=20:设置分组后展示分组下数据量

    group.ngroups=true:设置为true表示会返回分组的分组

    下面是查询结果:

    1. <response>  
    2. <lst name="responseHeader">  
    3. <int name="status">0</int>  
    4. <int name="QTime">81</int>  
    5. <lst name="params">  
    6. <str name="q">province:湖</str>  
    7. <str name="indent">true</str>  
    8. <str name="group.limit">20</str>  
    9. <str name="rows">100</str>  
    10. <str name="group.ngroups">true</str>  
    11. <str name="wt">xml</str>  
    12. <arr name="group.field">  
    13. <str>province</str>  
    14. <str>province</str>  
    15. </arr>  
    16. <str name="group">true</str>  
    17. </lst>  
    18. </lst>  
    19. <lst name="grouped">  
    20. <lst name="province">  
    21. <int name="matches">13</int>  
    22. <int name="ngroups">3</int>  
    23. <arr name="groups">  
    24. <lst>  
    25. <str name="groupValue">1</str>  
    26. <result name="doclist" numFound="1" start="0">  
    27. <doc>  
    28. <str name="id">10</str>  
    29. <str name="province">湖1</str>  
    30. <str name="suggestText">湖1</str>  
    31. <long name="_version_">1535191400888401920</long>  
    32. </doc>  
    33. </result>  
    34. </lst>  
    35. <lst>  
    36. <str name="groupValue">2</str>  
    37. <result name="doclist" numFound="11" start="0">  
    38. <doc>  
    39. <str name="id">11</str>  
    40. <str name="province">湖2</str>  
    41. <str name="suggestText">湖2</str>  
    42. <long name="_version_">1535191406371405824</long>  
    43. </doc>  
    44. <doc>  
    45. <str name="id">13</str>  
    46. <str name="province">湖2</str>  
    47. <str name="suggestText">湖2</str>  
    48. <long name="_version_">1535191409744674816</long>  
    49. </doc>  
    50. <doc>  
    51. <str name="id">14</str>  
    52. <str name="province">湖2</str>  
    53. <str name="suggestText">湖2</str>  
    54. <long name="_version_">1535191412264402944</long>  
    55. </doc>  
    56. <doc>  
    57. <str name="id">15</str>  
    58. <str name="province">湖2</str>  
    59. <str name="suggestText">湖2</str>  
    60. <long name="_version_">1535191414894231552</long>  
    61. </doc>  
    62. <doc>  
    63. <str name="id">16</str>  
    64. <str name="province">湖2</str>  
    65. <str name="suggestText">湖2</str>  
    66. <long name="_version_">1535191417461145600</long>  
    67. </doc>  
    68. <doc>  
    69. <str name="id">17</str>  
    70. <str name="province">湖2</str>  
    71. <str name="suggestText">湖2</str>  
    72. <long name="_version_">1535191419842461696</long>  
    73. </doc>  
    74. <doc>  
    75. <str name="id">18</str>  
    76. <str name="province">湖2</str>  
    77. <str name="suggestText">湖2</str>  
    78. <long name="_version_">1535191422327586816</long>  
    79. </doc>  
    80. <doc>  
    81. <str name="id">19</str>  
    82. <str name="province">湖2</str>  
    83. <str name="suggestText">湖2</str>  
    84. <long name="_version_">1535191424609288192</long>  
    85. </doc>  
    86. <doc>  
    87. <str name="id">20</str>  
    88. <str name="province">湖2</str>  
    89. <str name="suggestText">湖2</str>  
    90. <long name="_version_">1535191431052787712</long>  
    91. </doc>  
    92. <doc>  
    93. <str name="id">23</str>  
    94. <str name="province">湖2</str>  
    95. <str name="suggestText">湖2</str>  
    96. <long name="_version_">1535191435711610880</long>  
    97. </doc>  
    98. <doc>  
    99. <str name="id">30</str>  
    100. <str name="province">湖2</str>  
    101. <str name="suggestText">湖2</str>  
    102. <long name="_version_">1535191428366336000</long>  
    103. </doc>  
    104. </result>  
    105. </lst>  
    106. <lst>  
    107. <str name="groupValue">111</str>  
    108. <result name="doclist" numFound="1" start="0">  
    109. <doc>  
    110. <str name="id">111</str>  
    111. <str name="province">湖111</str>  
    112. <str name="suggestText">湖111</str>  
    113. <long name="_version_">1535191723089592320</long>  
    114. </doc>  
    115. </result>  
    116. </lst>  
    117. </arr>  
    118. </lst>  
    119. <lst name="province">...</lst>  
    120. </lst>  
    121. </response>  
    <response>
    <lst name="responseHeader">
    <int name="status">0</int>
    <int name="QTime">81</int>
    <lst name="params">
    <str name="q">province:湖</str>
    <str name="indent">true</str>
    <str name="group.limit">20</str>
    <str name="rows">100</str>
    <str name="group.ngroups">true</str>
    <str name="wt">xml</str>
    <arr name="group.field">
    <str>province</str>
    <str>province</str>
    </arr>
    <str name="group">true</str>
    </lst>
    </lst>
    <lst name="grouped">
    <lst name="province">
    <int name="matches">13</int>
    <int name="ngroups">3</int>
    <arr name="groups">
    <lst>
    <str name="groupValue">1</str>
    <result name="doclist" numFound="1" start="0">
    <doc>
    <str name="id">10</str>
    <str name="province">湖1</str>
    <str name="suggestText">湖1</str>
    <long name="_version_">1535191400888401920</long>
    </doc>
    </result>
    </lst>
    <lst>
    <str name="groupValue">2</str>
    <result name="doclist" numFound="11" start="0">
    <doc>
    <str name="id">11</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191406371405824</long>
    </doc>
    <doc>
    <str name="id">13</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191409744674816</long>
    </doc>
    <doc>
    <str name="id">14</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191412264402944</long>
    </doc>
    <doc>
    <str name="id">15</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191414894231552</long>
    </doc>
    <doc>
    <str name="id">16</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191417461145600</long>
    </doc>
    <doc>
    <str name="id">17</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191419842461696</long>
    </doc>
    <doc>
    <str name="id">18</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191422327586816</long>
    </doc>
    <doc>
    <str name="id">19</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191424609288192</long>
    </doc>
    <doc>
    <str name="id">20</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191431052787712</long>
    </doc>
    <doc>
    <str name="id">23</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191435711610880</long>
    </doc>
    <doc>
    <str name="id">30</str>
    <str name="province">湖2</str>
    <str name="suggestText">湖2</str>
    <long name="_version_">1535191428366336000</long>
    </doc>
    </result>
    </lst>
    <lst>
    <str name="groupValue">111</str>
    <result name="doclist" numFound="1" start="0">
    <doc>
    <str name="id">111</str>
    <str name="province">湖111</str>
    <str name="suggestText">湖111</str>
    <long name="_version_">1535191723089592320</long>
    </doc>
    </result>
    </lst>
    </arr>
    </lst>
    <lst name="province">...</lst>
    </lst>
    </response>

    其实想想和sql的group类似。

    suggest 联想查询

    配置solrconfig.xml文件。

    1. <span style="font-family:Microsoft YaHei;font-size:12px;"><!-- suggest 配置 start -->  
    2.   <searchComponent name="suggest" class="solr.SuggestComponent">  
    3.     <lst name="suggester">  
    4.       <str name="name">mySuggester</str>  
    5.       <str name="lookupImpl">FuzzyLookupFactory</str>      <!-- org.apache.solr.spelling.suggest.fst -->  
    6.       <str name="dictionaryImpl">DocumentDictionaryFactory</str>     <!-- org.apache.solr.spelling.suggest.HighFrequencyDictionaryFactory -->   
    7.       <!-- 索引字段 -->  
    8.       <str name="field">suggestText</str>  
    9.       <!-- 索引的type -->  
    10.       <str name="suggestAnalyzerFieldType">suggestField</str>  
    11.       <str name="buildOnStartup">false</str>  
    12.     </lst>  
    13.   </searchComponent>  
    14.   
    15.   <requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">  
    16.     <lst name="defaults">  
    17.       <str name="suggest">true</str>  
    18.       <str name="suggest.count">10</str>  
    19.     </lst>  
    20.     <arr name="components">  
    21.       <str>suggest</str>  
    22.     </arr>  
    23.   </requestHandler>  
    24.  <!-- suggest 配置 end --></span>  
    <span style="font-family:Microsoft YaHei;font-size:12px;"><!-- suggest 配置 start -->
      <searchComponent name="suggest" class="solr.SuggestComponent">
        <lst name="suggester">
          <str name="name">mySuggester</str>
          <str name="lookupImpl">FuzzyLookupFactory</str>      <!-- org.apache.solr.spelling.suggest.fst -->
          <str name="dictionaryImpl">DocumentDictionaryFactory</str>     <!-- org.apache.solr.spelling.suggest.HighFrequencyDictionaryFactory --> 
    	  <!-- 索引字段 -->
          <str name="field">suggestText</str>
    	  <!-- 索引的type -->
          <str name="suggestAnalyzerFieldType">suggestField</str>
    	  <str name="buildOnStartup">false</str>
        </lst>
      </searchComponent>
    
      <requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">
        <lst name="defaults">
          <str name="suggest">true</str>
          <str name="suggest.count">10</str>
        </lst>
        <arr name="components">
          <str>suggest</str>
        </arr>
      </requestHandler>
     <!-- suggest 配置 end --></span>

    配置schema.xml

    配置field的name和type 需要和solrconfig中对应

    1. <span style="font-family:Microsoft YaHei;font-size:12px;"><field name="suggestText" type="suggestField" indexed="true" stored="true"/></span>  
    <span style="font-family:Microsoft YaHei;font-size:12px;"><field name="suggestText" type="suggestField" indexed="true" stored="true"/></span>

    这里suggestText是从其他索引复制过来,这里是province。

    1. <span style="font-family:Microsoft YaHei;font-size:12px;"<copyField source="province" dest="suggestText"/></span>  
    <span style="font-family:Microsoft YaHei;font-size:12px;"> <copyField source="province" dest="suggestText"/></span>

    定义fieldType如下

    1. <span style="font-family:Microsoft YaHei;font-size:12px;"><fieldType class="solr.TextField" name="suggestField"  
    2.         positionIncrementGap="100">  
    3.         <analyzer>  
    4.         <tokenizer class="solr.StandardTokenizerFactory"/>  
    5.         <filter class="solr.StandardFilterFactory"/>  
    6.         <filter class="solr.LowerCaseFilterFactory"/>  
    7.         </analyzer>  
    8.     </fieldType></span>  
    <span style="font-family:Microsoft YaHei;font-size:12px;"><fieldType class="solr.TextField" name="suggestField"
    		positionIncrementGap="100">
    		<analyzer>
    		<tokenizer class="solr.StandardTokenizerFactory"/>
    		<filter class="solr.StandardFilterFactory"/>
    		<filter class="solr.LowerCaseFilterFactory"/>
    		</analyzer>
    	</fieldType></span>

    http://localhost:8080/solr/my_solr/suggest?suggest=true&suggest.build=true&suggest.dictionary=mySuggester&suggest.count=3&wt=xml&suggest.q="湖"

    suggest=true: 表示开启suggest功能

    suggest.build=true:

    如果设置为true,这个请求会导致重建suggest索引。
    这个字段一般用于初始化的操作中,在线上环境,一般不会每个请求都重建索引,如果线上你希望保持字典最新,最好使用buildOnCommit或者buildOnOptimize来操作。如:searchComponent中添加<str name="buildOnCommit">true</str>

    suggest.dictionary=mySuggester:其中mySuggester是在searchComponent中配置的<str name="name">mySuggester</str>

    suggest.q="湖":表示进行查询建议的文本

    suggest.count=3:表示返回的数据量

    一般常用的就是这些属性,具体详情可以查看:http://www.cnblogs.com/yjf512/p/5166382.html

    上述url最终返回结果如下:

    1. <response>  
    2. <lst name="responseHeader">  
    3. <int name="status">0</int>  
    4. <int name="QTime">1</int>  
    5. </lst>  
    6. <lst name="suggest">  
    7. <lst name="mySuggester">  
    8. <lst name=""湖"">  
    9. <int name="numFound">3</int>  
    10. <arr name="suggestions">  
    11. <lst>  
    12. <str name="term">湖1</str>  
    13. <long name="weight">0</long>  
    14. <str name="payload"/>  
    15. </lst>  
    16. <lst>  
    17. <str name="term">湖111</str>  
    18. <long name="weight">0</long>  
    19. <str name="payload"/>  
    20. </lst>  
    21. <lst>  
    22. <str name="term">湖2</str>  
    23. <long name="weight">0</long>  
    24. <str name="payload"/>  
    25. </lst>  
    26. </arr>  
    27. </lst>  
    28. </lst>  
    29. </lst>  
    30. </response>  
    <response>
    <lst name="responseHeader">
    <int name="status">0</int>
    <int name="QTime">1</int>
    </lst>
    <lst name="suggest">
    <lst name="mySuggester">
    <lst name=""湖"">
    <int name="numFound">3</int>
    <arr name="suggestions">
    <lst>
    <str name="term">湖1</str>
    <long name="weight">0</long>
    <str name="payload"/>
    </lst>
    <lst>
    <str name="term">湖111</str>
    <long name="weight">0</long>
    <str name="payload"/>
    </lst>
    <lst>
    <str name="term">湖2</str>
    <long name="weight">0</long>
    <str name="payload"/>
    </lst>
    </arr>
    </lst>
    </lst>
    </lst>
    </response>

     

  • 相关阅读:
    从苏宁电器到卡巴斯基(后传)第06篇:我的离职信
    Dalvik模式下基于Android运行时类加载的函数dexFindClass脱壳
    基于dalvik模式下的Xposed Hook开发的某加固脱壳工具
    Android平台dalvik模式下java Hook框架ddi的分析(2)--dex文件的注入和调用
    黑板客 -- 爬虫闯关 -- 关卡05
    黑板客 -- 爬虫闯关 -- 关卡04
    黑板客 -- 爬虫闯关 -- 关卡03
    黑板客 -- 爬虫闯关 -- 关卡02
    黑板客 -- 爬虫闯关 -- 关卡01
    Python小游戏 -- 猜单词
  • 原文地址:https://www.cnblogs.com/cuihongyu3503319/p/9104680.html
Copyright © 2011-2022 走看看