zoukankan      html  css  js  c++  java
  • 关于mysql的limit用于分页查询的优化

      昨日和一老同事Z君交流,Z君问我,当分页遇到海量数据时候我们常规的select * from `tablename` limit m,n 会很慢的问题,我思索片刻 不知有何优化方法。我们从交流中已经知道了 。在mysql查询中使用limit的话,mysql是会扫描m+n条记录之后在过滤前面的m条 最后返回我们想要的n条数据。所以当前面的那个sql的参数 m等于 10w 100w 1000w的时候效率直线下降。

      下面是技术渣渣的我在度娘中找到的比较全面详细的分析和优化办法。如下:

    使用查询语句的时候,经常要返回前几条或者中间某几行数据,这个时候怎么办呢?不用担心,已 经为我们提供了这样一个功能。
     LIMIT 子句可以被用于强制 SELECT 语句返回指定的记录数。LIMIT 接受一个或两个数字参数。参数必须是一个整数常量。
    如果给定两个参数,第一个参数指定第一个返回记录行的偏移量,第二个参数指定返回记录行的最大数目。
    SELECT * FROM table   LIMIT [offset,] rows | rows OFFSET offset

    这是两个参数,第一个是偏移量,第二个是数目
    select * from employee limit 3, 7; // 返回4-11行
    select * from employee limit 3,1; // 返回第4行

    一个参数
    select * from employee limit 3; // 返回前3行



    以前我在mysql中分页都是用的 limit 100000,20这样的方式,我相信你也是吧,但是要提高效率,让分页的代码效率更高一些,更快一些,那我们又该怎么做呢?

    第一部分:看一下分页的基本原理

    mysql explain SELECT * FROM message ORDER BY id DESC LIMIT 10000, 20
    ***************** 1. row **************
    id: 1
    select_type: SIMPLE
    table: message
    type: index
    possible_keys: NULL
    key: PRIMARY
    key_len: 4
    ref: NULL
    rows: 10020
    Extra:
    1 row in set (0.00 sec)

    对上面的mysql语句说明:limit 10000,20的意思扫描满足条件的10020行,扔掉前面的10000行,返回最后的20行,问题就在这里,如果是limit 100000,100,需要扫描100100行,在一个高并发的应用里,每次查询需要扫描超过10W行,性能肯定大打折扣。文中还提到limit n性能是没问题的,因为只扫描n行。

    第二部分:根据雅虎的几位工程师带来了一篇Efficient Pagination Using MySQL的报告内容扩展:在文中提到一种clue的做法,给翻页提供一些线索,比如还是SELECT * FROM message ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是1020,最小的是1000,如果我们只提供上一页、下一页这样的跳转(不提供到第N页的跳转),那么在处理上一页的时候SQL语句可以是:

    SELECT * FROM message WHERE id>1020 ORDER BY id ASC LIMIT 20;//下一页
    

      处理下一页的时候SQL语句可以是:

    SELECT * FROM message WHERE id<1000 ORDER BY id DESC LIMIT 20;//上一页
    

      不管翻多少页,每次查询只扫描20行。

    缺点是只能提供上一页、下一页的链接形式,但是我们的产品经理非常喜欢“上一页 1 2 3 4 5 6 7 8 9 下一页”这样的链接方式,怎么办呢?

      如果LIMIT m,n不可避免的话,要优化效率,只有尽可能的让m小一下,我们扩展前面的clue做法,还是SELECT * FROM message ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是2519,最小的是2500;
    当是第10页的SQL如下:

    SELECT * FROM tb_goods_info WHERE auto_id >=2500 ORDER BY auto_id ASC LIMIT 0,20
    

      比如要跳到第9页,SQL语句可以这样写:

    SELECT * FROM tb_goods_info WHERE auto_id <2500 ORDER BY auto_id desc LIMIT 0,20
    

      比如要跳到第8页,SQL语句可以这样写:

    SELECT * FROM tb_goods_info WHERE auto_id <2500 ORDER BY auto_id desc LIMIT 20,20

    比如要跳到第7页,SQL语句可以这样写:

    SELECT * FROM tb_goods_info WHERE auto_id <2500 ORDER BY auto_id desc LIMIT 40,20

    跳转到第11页:

    SELECT * FROM tb_goods_info WHERE auto_id >2519 ORDER BY auto_id asc LIMIT 0,20
    

      跳转到第12页:

    SELECT * FROM tb_goods_info WHERE auto_id >2519 ORDER BY auto_id asc LIMIT 20,20
    

      跳转到第13页:

    SELECT * FROM tb_goods_info WHERE auto_id >2519 ORDER BY auto_id asc LIMIT 40,20
    

      

    原理还是一样,记录住当前页id的最大值和最小值,计算跳转页面和当前页相对偏移,由于页面相近,这个偏移量不会很大,这样的话m值相对较小,大大减少扫描的行数。其实传统的limit m,n,相对的偏移一直是第一页,这样的话越翻到后面,效率越差,而上面给出的方法就没有这样的问题。

      注意SQL语句里面的ASC和DESC,如果是ASC取出来的结果,显示的时候记得倒置一下。

    以上转载自(如有侵权或者冒犯还请联系我) http://blog.chinaunix.net/uid-26602509-id-3363512.html

  • 相关阅读:
    《C#高级编程》学习笔记------C#中的委托和事件(续)
    .NET Reflector 7.6.1.824 Edition .NET程序反编译神器(附插件安装教程2012-10-13更新) 完全破解+使用教程
    《C#高级编程》学习笔记------C#中的事件和委托
    TensorFlow+实战Google深度学习框架学习笔记(5)----神经网络训练步骤
    Tensorflow学习笔记----模型的保存和读取(4)
    Tensorflow学习笔记----基础(3)
    Tools
    English Learning
    Tools
    Testing
  • 原文地址:https://www.cnblogs.com/lishuaige/p/5072352.html
Copyright © 2011-2022 走看看