zoukankan      html  css  js  c++  java
  • Mysql大数据量查询优化

    一般MYSQL最基本的分页方式:

    select * from content order by id desc limit 0, 10

    在中小数据量的情况下,这样的SQL足够用了,唯一需要注意的问题就是确保使用了索引。随着数据量的增加,页数会越来越多,查看后几页的SQL就可能类似:

    select * from content order by id desc limit 10000, 10

    一言以蔽之,就是越往后分页,LIMIT语句的偏移量就会越大,速度也会明显变慢。

    此时,我们可以通过2种方式:
    一,子查询的分页方式来提高分页效率,飘易用的SQL语句如下: 

    SELECT * FROM `content` WHERE id <= 
    (SELECT id FROM `content` ORDER BY id desc LIMIT ".($page-1)*$pagesize.", 1) ORDER BY id desc LIMIT $pagesize

     

    为什么会这样呢?因为子查询是在索引上完成的,而普通的查询时在数据文件上完成的,通常来说,索引文件要比数据文件小得多,所以操作起来也会更有效率。(via)通过explain SQL语句发现:子查询使用了索引!

    id select_type table type possible_keys key key_len ref rows Extra
    1 PRIMARY content range PRIMARY PRIMARY 4 NULL 6264 Using where
    2 SUBQUERY content index NULL PRIMARY 4 NULL 27085 Using index

        经过飘易的实测,使用子查询的分页方式的效率比纯LIMIT提高了14-20倍!

    二,JOIN分页方式

    SELECT * FROM `content` AS t1 
    JOIN (SELECT id FROM `content` ORDER BY id desc LIMIT ".($page-1)*$pagesize.", 1) AS t2 
    WHERE t1.id <= t2.id ORDER BY t1.id desc LIMIT $pagesize; 


        经过我的测试,join分页和子查询分页的效率基本在一个等级上,消耗的时间也基本一致。explain SQL语句:

    id select_type table type possible_keys key key_len ref rows Extra
    1 PRIMARY <derived2> system NULL NULL NULL NULL 1  
    1 PRIMARY t1 range PRIMARY PRIMARY 4 NULL 6264 Using where
    2 DERIVED content index NULL PRIMARY 4 NULL 27085 Using index
  • 相关阅读:
    Python 性能剖分工具
    串口编程
    拼音输入法实现
    Android 第三方分享中遇到的问题以及解决方案
    linux C 获取与修改IP地址
    git拉取远程分支并创建本地分支
    再次探讨企业级开发中的Try......Catch性能问题
    [手游新项目历程]-38-Supervisord守护进程
    公务员考试
    概念的内涵和外延
  • 原文地址:https://www.cnblogs.com/littlehb/p/3450639.html
Copyright © 2011-2022 走看看