zoukankan      html  css  js  c++  java
  • MySQL百万级数据量分页查询方法及其优化

    点击上方“ 码农编程进阶笔记 ”,选择“置顶或者星标”
    文末有干货,每天定时与您相约!
    

    方法一:直接使用数据库提供的SQL语句

    语句样式:MySQL中可用如下方法:

    select * from table_name limit m, n;
    

    适用场景:适用于数据量较少的情况(元组百/千级)

    原因/缺点: 全表扫描,速度会很慢 且 有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2,1,3). limit限制的是从结果集的 m 位置处取出 n 条输出,其余抛弃.

    方法二:建立主键或唯一索引,利用索引(假设每页10条)

    语句样式: MySQL中,可用如下方法:

    select * from table_name where id_pk > (pageNum*10) limit m;
    

    适应场景: 适用于数据量多的情况(元组数上万)

    原因: 索引扫描,速度会很快. 有朋友提出: 因为数据查询出来并不是按照pk_id排序的,所以会有漏掉数据的情况,只能方法3

    方法三:基于索引再排序

    语句样式,MySQL中可用如下方法:

    select * from table_name where id_pk > (pageNum * 10) order by id_pk asc limit m;
    

    适应场景: 适用于数据量多的情况(元组数上万). 最好 order by 后的列对象是主键或唯一所以,使得 order by 操作能利用索引被消除但结果集是稳定的(稳定的含义,参见方法1)

    原因: 索引扫描,速度会很快. 但MySQL的排序操作,只有 asc 没有 desc ( desc 是假的,未来会做真正的 desc ,期待…).

    方法四:基于索引使用prepare

    第一个问号表示pageNum,第二个问号表示每页元组数

    语句样式,MySQL中可用如下方法:

    prepare stmt_name from select * from table_name where id_pk > (? * ?) order by id_pk asc limit m;
    

    适应场景: 大数据量

    原因: 索引扫描,速度会很快. prepare语句又比一般的查询语句快一点。

    方法五:利用MySQL支持order操作可以利用索引快速定位部分元祖,避免全表扫描

    比如:读第1000到1019行元组(pk是主键/唯一键).

    select * from your_table where pa >= 1000 order by pk asc limit 0,20;
    

    方法六:利用"子查询/连接+索引"快速定位元祖的位置,然后再读取元祖。

    比如(id是主键/唯一键,蓝色字体时变量)

    利用子查询示例:

    select * from your_table where id <= 
    (select id from your_table order by id desc limit ($page - 1) * $pagesize order by id desc limit $pagesize)
    

    利用连接示例:

    select * from your_table as t1
    join (select id from your_table order by id desc limit ($page - 1) * $pagesize as t2 where t1.id <= t2.id order by t1.id desc limit $pagesize);
    

    mysql大数据量使用limit分页,随着页码的增大,查询效率越低下。

    往日精选文章

    2020最新版MySQL数据库面试题(一)

    2020最新版MySQL数据库面试题(二)

    2020最新版MySQL数据库面试题(三)

    别怕!MySQL引起的CPU消耗过大,我有办法

    一次SQL查询优化原理分析(900W+数据,从17s到300ms)

    为什么 select count(*) from t,在 InnoDB 引擎中比 MyISAM 慢?

  • 相关阅读:
    HTML文本格式化与HTML 超链接
    html知识杂记
    常用的默认函数
    js条件语句初步练习
    DevOps之docker自动化部署web应用
    DevOps之docker自动化部署java应用
    hive应用基础知识备忘
    hive应用-离线数据仓库分层模型
    hive基础-数据模型
    hive基础-组件介绍
  • 原文地址:https://www.cnblogs.com/lxwphp/p/15452834.html
Copyright © 2011-2022 走看看