zoukankan      html  css  js  c++  java
  • Elasticsearch.net一些开发笔记

    .net下开发es半年多了,留下些笔记

    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/combining-filters.html
    //bool 和 dis_max 过滤器能并联多个过滤器一起
    // should 各个子查询的关系式or
    // 如果should有兄弟过滤器那么 should和他的兄弟过滤器就是 and关系

    //must 各个子查询的关系是and ,must 子元素里里面的 所有兄弟过滤器是一个and的关系,必须都要满足才能被检索出来
    //must的多个子查询是 and的意思 如果 只有一个子查询 为什么还加个 must???

    //当没有 must 语句的时候,至少有一个 should 语句必须匹配。 当有must的时候 should就成了加分项

    //查询语句用constant_score的意思是 constant_score 里面的查询都使用结构化查询 也就是不使用评分

    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/_best_fields.html#dis-max-query
    //dis_max 和 bool的区别是 dis_max 返回最佳字段 比如 搜索 Brown fox 被搜索内容里里面出现 Brown fox的的时候得分要高于单独 出现Brown和fox的内容
    //dis_max 的子查询 queries 是什么意思???


    //exists 和 missing 相当于 is not null 和 is null

    //match 查询主要的应用场景就是进行全文搜索
    //fields 数组能指定多个查询字段

    //filter 过滤器能在查询指定用户的内容起到作用

    //同样的数据如果被索引在不通的索引当中那么即便查询的时候是有条件一样 结果不一定是相同的,因为内容下各自的索引分片当中的权重不一样
    //所以很多人一直有疑惑 为什么我搜索的内容和我想要的结果不也一样 比如以下数据

    // index1 {content:中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首}
    // index2 { content:"你好中国"} { content:"我来自中国"}
    //当你搜索 中国驻洛杉矶 的时候你预计是 index的数据排在前面 但是实际上是 index2的数据会排在前面 elasticsearch 中专业解释叫“被破坏的相关度”


    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/multi-match-query.html
    //multi_match相对match来说 multi_match查询为能在多个字段上反复执行相同查询提供了一种便捷方式 就是说使用multi_match包含的子查询能一条语句查询多个字段
    //不需要些多个match 或者多个 term之类 直接使用fields 包含所有字段就ok
    //match_phrase 相对match来说 match_phrase 查询时按照关键字的顺序来的 比如搜索 上海 李静 那结果中 上海 一定要在 李静的 前面 才能被搜索到


    ///cross_fields
    ///当查询 上海 李静 的时候 operator设置成 and type 设置成cross_fields 如果多个字段共同满足 有上海和李静 就符合查询(比如地址中有上海,名字中有李静)
    // operator的值是 and和or minimum_should_match可以取代and和or 用百分百来匹配

    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/_Improving_Performance.html
    //rescore 结合 window_size 能对结果中的指定条数的数据进行 rescore_query(邻近查询) 查询 并且重新得分 提高结果精度

    //minimum_should_match


    /// 没有做分词的字段 也能使用 prefix 做局部查询 比如身份证是精确查询的 但是能使用 prefix 搜索430124开头的,但是不打分
    /// wildcard 还能做正则匹配

    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/scoring-theory.html
    ///创建索引的时候 如果为字段指定了 "index_options": "docs" 则表示 该字段搜索的时候忽略词频


    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/query-time-boosting.html
    //当在多个索引中搜索内容的时候可以通过 indices_boost 为各个索引整体提升权重


    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/query-scoring.html 里面包含用 match 、multi_match 、term 、bool 和 dis_max 的导航


    //https://www.elastic.co/guide/cn/elasticsearch/guide/current/_best_fields.html#dis-max-query
    //dis_max 最佳查询
    //如果一个稳定有 name adder 两个字段 当搜 key的时候 name adder互相竞争 是一样使用dis_max 查询 他将返回name后者adder两者匹配key的分数高的那个作为整体分数

    //elasticsearch 查询批量删除

    https://www.elastic.co/guide/en/elasticsearch/reference/5.2/docs-delete-by-query.html

    https://blog.csdn.net/Sympeny/article/details/77876173

  • 相关阅读:
    mvc control 请求两次问题
    Jquery跨域获得Json
    使用ajax跨域withCredentials的作用
    以下是关于ASP.NET中保存各种信息的对象的比较,理解这些对象的原理,对制作完善的程序来说是相当有必要的(摘至互联网,并非原创--xukunping)
    【算法】字符串近似搜索(转)
    字符串相似度算法(编辑距离算法 Levenshtein Distance)(转)
    图像相似度算法的C#实现及测评
    求时间差的sql语句。 比如如下数据
    微信公众平台开发之微信access_token如何有效长期保存
    PowerDesigner打开设计文件后提示failed to read the fileXXX的解决办法
  • 原文地址:https://www.cnblogs.com/sxmny/p/8473638.html
Copyright © 2011-2022 走看看