zoukankan      html  css  js  c++  java
  • Elasticsearch:大数据量下如何做分页查询?

    背景说明

    业务场景中需要做基于ES的分页查询,而ES存储了上亿条数据,且数据每天还在不断增长,如何做分页查询呢(注意查询效率)?

    本质就是一个深度分页查询的问题,很多人可能会尝试ES自带的滚动查询机制。但在大数据量情况下,此种方式是行不通的(不信的可以自行尝试哦)。

    方案前提

    1. 产品侧:在大数据量分页情况下,产品层面不允许用户自行输入页码跳页;

    2. 技术侧:ES数据有全局唯一且有序的ID,可以通过相关算法生成。

     

    方案设计

    1.核心设计思想

    经分析,用户的点击跳页行为数据偏移量是有限的。且第1页和最后1页的跳转行为可以有效识别,那么可以将用户的点击查询行为分为几个场景:

    用户点击第1页:可以按照正常的逻辑进行查询,根据数据要求的排序方向进行顺序查询或倒序查询;

    用户点击最后1页:首先判断是否是最后1页;重新计算页数据展示大小;如果结果是按顺序展示,则先按倒序方向进行数据查询,再将结果进行翻转展示。如果结果按倒序展示反之操作即可;

    用户点击其他页:此种情况较为复杂。因为要重新计算数据的偏移量,所以需要有用户上次点击的页码信息(例如上次点击页码及对应的第1条数据ID和最后1条数据ID等)进行参照计算。详见下面的图例展示。

    2.方案设计

    2.1 定义接口参数

    2.2 数据查询逻辑

    第1页查询:

    最后1页查询:

    其他页查询:

    代码实现

    java及PHP代码都已上传到个人gitee上。(重点说明:代码仅供学习参考使用,未经作者同意,请勿用于商业用途)。

  • 相关阅读:
    Java Concurrency
    Java Concurrency
    Java Concurrency
    Java Concurrency
    Java Concurrency
    Java Concurrency
    Java Concurrency
    Java Concurrency
    存储的瓶颈(2)
    存储的瓶颈(3)
  • 原文地址:https://www.cnblogs.com/itsharehome/p/15627196.html
Copyright © 2011-2022 走看看