zoukankan      html  css  js  c++  java
  • Solr 学习(5) —- Solr查询语法和参数

    1、查询地址

     

    建立好solr的索引后,可以通过管理界面进行查询。http://127.0.0.1:8983/solr/admin/form.jsp

     

    要尝试多个查询方法的话,可以进入full interface模式,并勾选debug选项,像下面这样

     

     


    随便进行一个查询,如输入 hi ,通过返回的页面的debug项中,就可以看到solr进行查询的很多相关信息

     

     

    Xml代码  收藏代码
    1. <lst name="debug">  
    2. <str name="rawquerystring">hi</str>  
    3. <str name="querystring">hi</str>  
    4. <str name="parsedquery">text:hi</str>  
    5. <str name="parsedquery_toString">text:hi</str>  
    6. <lst name="explain">  
    7. <str name="1474002">  
    8. 8.481748 = (MATCH) fieldWeight(text:hi in 207626), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=207626)  
    9. </str>  
    10. <str name="556830">  
    11. 8.481748 = (MATCH) fieldWeight(text:hi in 794169), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=794169)  
    12. </str>  
    13. <str name="735197">  
    14. 8.481748 = (MATCH) fieldWeight(text:hi in 901810), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=901810)  
    15. </str>  
    16. <str name="2142779">  
    17. 8.481748 = (MATCH) fieldWeight(text:hi in 1584789), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=1584789)  
    18. </str>  
    19. <str name="182950">  
    20. 8.481748 = (MATCH) fieldWeight(text:hi in 1862408), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=1862408)  
    21. </str>  
    22. <str name="155112">  
    23. 8.481748 = (MATCH) fieldWeight(text:hi in 1967709), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=1967709)  
    24. </str>  
    25. <str name="2223440">  
    26. 8.481748 = (MATCH) fieldWeight(text:hi in 2181479), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=2181479)  
    27. </str>  
    28. <str name="2236992">  
    29. 8.481748 = (MATCH) fieldWeight(text:hi in 2199957), product of: 1.0 = tf(termFreq(text:hi)=1) 8.481748 = idf(docFreq=1336maxDocs=23736311.0 = fieldNorm(field=textdoc=2199957)  
    30. </str>  
    31. <str name="2231513">  
    32. 7.4968767 = (MATCH) fieldWeight(text:hi in 2179538), product of: 1.4142135 = tf(termFreq(text:hi)=2) 8.481748 = idf(docFreq=1336maxDocs=23736310.625 = fieldNorm(field=textdoc=2179538)  
    33. </str>  
    34. <str name="17885">  
    35. 5.9975014 = (MATCH) fieldWeight(text:hi in 2009670), product of: 1.4142135 = tf(termFreq(text:hi)=2) 8.481748 = idf(docFreq=1336maxDocs=23736310.5 = fieldNorm(field=textdoc=2009670)  
    36. </str>  
    37. </lst>  
    38. <str name="QParser">LuceneQParser</str>  
    39. <lst name="timing">  
    40. <double name="time">8.0</double>  
    41. <lst name="prepare">  
    42. <double name="time">1.0</double>  
    43. <lst name="org.apache.solr.handler.component.QueryComponent">  
    44. <double name="time">1.0</double>  
    45. </lst>  
    46. <lst name="org.apache.solr.handler.component.FacetComponent">  
    47. <double name="time">0.0</double>  
    48. </lst>  
    49. <lst name="org.apache.solr.handler.component.MoreLikeThisComponent">  
    50. <double name="time">0.0</double>  
    51. </lst>  
    52. <lst name="org.apache.solr.handler.component.HighlightComponent">  
    53. <double name="time">0.0</double>  
    54. </lst>  
    55. <lst name="org.apache.solr.handler.component.StatsComponent">  
    56. <double name="time">0.0</double>  
    57. </lst>  
    58. <lst name="org.apache.solr.handler.component.DebugComponent">  
    59. <double name="time">0.0</double>  
    60. </lst>  
    61. </lst>  
    62. <lst name="process">  
    63. <double name="time">7.0</double>  
    64. <lst name="org.apache.solr.handler.component.QueryComponent">  
    65. <double name="time">5.0</double>  
    66. </lst>  
    67. <lst name="org.apache.solr.handler.component.FacetComponent">  
    68. <double name="time">0.0</double>  
    69. </lst>  
    70. <lst name="org.apache.solr.handler.component.MoreLikeThisComponent">  
    71. <double name="time">0.0</double>  
    72. </lst>  
    73. <lst name="org.apache.solr.handler.component.HighlightComponent">  
    74. <double name="time">0.0</double>  
    75. </lst>  
    76. <lst name="org.apache.solr.handler.component.StatsComponent">  
    77. <double name="time">0.0</double>  
    78. </lst>  
    79. <lst name="org.apache.solr.handler.component.DebugComponent">  
    80. <double name="time">2.0</double>  
    81. </lst>  
    82. </lst>  
    83. </lst>  
    84. </lst>  
     

    同时 在查询的头部信息中,也可以看到查询语法和参数是否被正确解析

     

     

    Java代码  收藏代码
    1. <lst name="responseHeader">  
    2. <int name="status">0</int>  
    3. <int name="QTime">8</int>  
    4. <lst name="params">  
    5. <str name="explainOther"/>  
    6. <str name="fl">*,score</str>  
    7. <str name="debugQuery">on</str>  
    8. <str name="indent">on</str>  
    9. <str name="start">0</str>  
    10. <str name="q">hi</str>  
    11. <str name="hl.fl"/>  
    12. <str name="qt"/>  
    13. <str name="wt"/>  
    14. <str name="fq"/>  
    15. <str name="rows">10</str>  
    16. <str name="version">2.2</str>  
    17. </lst>  
    18. </lst>  
     

     

    具体命中的文档数可以在respose标签里找到,如下说明找到1328个包含查询词的文档

     

     

    Xml代码  收藏代码
    1. <result name="response" numFound="1328" start="0" maxScore="8.481748">  
     

     

    以上这些地方对分析解决查询中出现的问题都很有帮助

     

    2、查询语法

     

     

    solr的一些查询语法 

    1.1. 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字段名称. 

     

    1.2. 查询规则: 

    如欲查询特定字段(非预设字段),请在查询词前加上该字段名称加 “:” (不包含”号) 符号, 

    例如: address:北京市海淀区上地软件园 tel:88xxxxx1 

    1>. q代表query input 

     

    2>. version代表solr版本(建议不要变动此变量) 

     

    3>. start代表显示结果从哪一笔结果资料开始,预设为0代表第一笔, rows是说要显示几笔数据,预设为10笔 

    (因为有时查询结果可能有几百笔,但不需要显示所有结果,所以预设是从第一笔开始到第十笔) 

    所以若要显示第10到30笔就改为: 

    http: //localhost:8080/solr/select/?indent=on&version=2.2&q=address:北京 市海淀区上地软件园+tel:88xxxxx1&version=2.2&start=10&rows= 20&indent=on 

    (indent代表输出的xml要不要缩行.预设为开启 on) 

     

    1.3. 另外,要限定输出结果的内容可用 “fl=” 加上你要的字段名称,如以下这个范例: 

    http: //localhost:8080/solr/select/?indent=on&version=2.2&q=text:北京+ OR+text:亿度&start=0&rows=10&fl=name,address,tel 

    在fl=之后加上了name,adress,tel 

    所以结果会如下: 

     

     

     

    3、查询参数

    常用

    • q - 查询字符串,必须的。
    • fl - 指定返回那些字段内容,用逗号或空格分隔多个。
    • start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。
    • rows - 指定返回结果最多有多少条记录,配合start来实现分页。
    • sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(inStock desc, price asc)表示先 “inStock” 降序, 再 “price” 升序,默认是相关性降序。
    • wt - (writer type)指定输出格式,可以有 xml, json, php, phps, 后面 solr 1.3增加的,要用通知我们,因为默认没有打开。
    • fq - (filter query)过虑查询,作用:在q查询符合结果中同时是fq查询符合的,例如:q=mm&fq=date_time:[20081001 TO 20091031],找关键字mm,并且date_time是20081001到20091031之间的。官方文档:http://wiki.apache.org/solr/CommonQueryParameters

    不常用

    • q.op - 覆盖schema.xml的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定
    • df - 默认的查询字段,一般默认指定
    • qt - (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。

    其它

    • indent - 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。
    • version - 查询语法的版本,建议不使用它,由服务器指定默认值。

    [Solr的检索运算符]
     “:” 指定字段查指定值,如返回所有值*:*²
     “?”²表示单个任意字符的通配
     “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)²
     “~”²表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。
    ²邻近检索,如检索相隔10个单词的”apache”和”jakarta”,”jakarta apache”~10
     “^”²控制相关度检索,如检索jakarta apache,同时希望去让”jakarta”的相关度更加好,那么在其后加上”^”符号和增量值,即jakarta^4 apache
     布尔操作符AND、||²
     布尔操作符OR、²&&
     布尔操作符NOT、!、-²(排除操作符不能单独与项使用构成查询)
     “+” 存在操作符,要求符号”+”后的项必须在文档相应的域中存在²
     ( ) 用于构成子查询²
    ² [] 包含范围检索,如检索某时间段记录,包含头尾,date:[200707 TO 200710]
     {}²不包含范围检索,如检索某时间段记录,不包含头尾
    date:{200707 TO 200710}
     " 转义操作符,特殊字符包括+ -² && || ! ( ) { } [ ] ^ ” ~ * ? : "


  • 相关阅读:
    使用binlog恢复数据
    Xtrabackup增量差量备份
    解压腾讯DB冷备的xb文件
    mysqldump
    xtrabackup备份选项
    MySQL的各种日志
    MySQL的事务相关概念
    LVS(dr)+keepalived
    MeasureSpec学习
    网络通信机制:Socket、TCP/IP、HTTP
  • 原文地址:https://www.cnblogs.com/daichangya/p/12958663.html
Copyright © 2011-2022 走看看