zoukankan      html  css  js  c++  java
  • 【未解决】mysql分页性能问题深究

     大佬们请教一个Mysql问题:现在有一个数据分页的功能
    【1】前提如下:
    (1.1)数据量大概有2亿条左右
    (1.2)2个查询条件,每页100条记录,不显示数据总量和总页数
    (1.3)正常情况下都ok,因为每次就是 limit 100,又不显示数据总量和总页数
    并且还使用了 id>上一次分页数据最大的ID 这种方法避免深度翻页的问题,效果比较理想,速度毫秒级
    【2】SQL

    select * from Log
    where     filetype ='文件类型' 
    and observetime >= '开始时间' 
    and observetime <= '结束时间' 
              and id > 上页数据最大的id
    order by observetime desc
    LIMIT 100

    id 为主键、递增,filetype 、observetime  都是正常的二级索引


    【3】核心问题现象
    》正常情况 between observetime 的命中行数非常大
    》当所有条件正常,并查询结果集大于100的时候,limit 100正常,速度500ms,非常快。
    Q:(3.1)当某一个条件值(比如filetype写个不存在的类型时)使得筛选结果集为空,则非常慢几十秒
    Q:(3.2)当筛选结果集不满足100时,则非常慢几十秒(比如按照时间+文件类型查询的结果只有1条记录,小于limit 100,也会很慢,几十秒都没结果 )

    原理
    如果符合条件的数据足够多,则limit100的过程就是,从符合条件的第一条数据开始往后查,当查够100条数据,则立刻返回。
    如果符合条件的数据不够,则会从符合条件的第一条数据开始往后扫描,一条条的查,直到把整个表扫描完仍然不够100条,才会返回结果(不够100条)。

     

    解决方案:
    方案一:
    查出满足条件的数据一共有多少条,按照条数处理,最后一个Limit的数量剩余满足条件的数量。
    但是,如果查询条件没有索引,统计总共有多少条的将会是个慢查询。

    方案二:
    类似滑动窗口的方式,每次对id查询idStart+1000=idEnd范围内的符合条件的数据。凑够1000条的时候返回,但是业务实现就会更加复杂。

    参考:

    https://blog.csdn.net/u014440417/article/details/80352550



  • 相关阅读:
    优化SQL查询:如何写出高性能SQL语句
    动态库与静态库
    多线程程序中fork导致的一些问题
    合理的使用size_t可以提高程序的可移植性和代码的可读性,让你的程序更高效。
    linux下C++ STL hash_map的使用以及使用char *型变量作为Key值的一大“坑”
    阅读腾讯编程规范的笔记
    2、vector的实现
    linux下C++对线程的封装
    1、空间配置器
    SQL Server三种表连接原理
  • 原文地址:https://www.cnblogs.com/gered/p/12516082.html
Copyright © 2011-2022 走看看