zoukankan      html  css  js  c++  java
  • Mysql取随机数据效率测试(400W条中读取100条)

    测试数据表的创建在文章:http://www.cnblogs.com/wt645631686/p/6868192.html

    先看一下我的SQL方案

    SELECT * FROM `emp` WHERE `empno` >=(SELECT FLOOR(RAND() * ((SELECT MAX(empno) FROM `emp`) - (SELECT MIN(empno) FROM `emp`)) + (SELECT MIN(empno) FROM `emp`)))  LIMIT 100

     

    在终端中测试结果是0.01sec.

    在Mysql工具中测试结果是0.008-0.01sec。

    看一下我在网上找到方案:

    第一种方案:

    SELECT * 
    FROM `emp` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(empno) FROM `emp`)-(SELECT MIN(empno) FROM `emp`))+
    (SELECT MIN(empno) FROM `emp`)) AS empno) AS t2 
    WHERE t1.empno >= t2.empno 
    ORDER BY t1.empno LIMIT 100;

    在终端中测试结果是0.00sec.

    在Mysql工具中测试结果是0.001-0.003sec。

    第二种方案:

    SELECT * FROM `emp` 
    WHERE empno >= (SELECT floor(RAND() * (SELECT MAX(empno) FROM `emp`)))  
    ORDER BY empno LIMIT 100;

    在终端中测试结果是0.01-0.02sec.

    在Mysql工具中测试结果是0.014-0.016sec。

    第三种方案:

    SELECT * FROM `emp` 
    WHERE empno >= (SELECT floor( RAND() * ((SELECT MAX(empno) FROM `emp`)-(SELECT MIN(empno) FROM `emp`)) + 
    (SELECT MIN(empno) FROM `emp`)))  
    ORDER BY empno LIMIT 100;

    在终端中多次测试,由0.2sec最高,到最终结果是0.10-0.14sec,这是因为Mysql的查询缓存起到了作用。

    在Mysql工具中测试结果是0.125-0.289sec。

    最终第一种方案胜出,得出结论:采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。

    具体原因大家自己用EXPLAIN或者DESC,PROFILING工具分析一下。

  • 相关阅读:
    Hive分组提取TopN操作
    互联网产品评论语料的观点挖掘
    Hive实现用户访问路径还原
    java基础知识——类的继承
    SVM旅程
    基于概率的相似度定义方法
    基于概率的项目相似度之并行方法
    List接口的俩个实现的区别
    奇异值分解(SVD)
    在64位机器上使用32位的dll
  • 原文地址:https://www.cnblogs.com/wt645631686/p/6868285.html
Copyright © 2011-2022 走看看