zoukankan      html  css  js  c++  java
  • MYSQL批量插入数据库实现语句性能分析

      假定我们的表结构如下

    代码如下  
    CREATE TABLE example (
    example_id INT NOT NULL,
    name VARCHAR( 50 ) NOT NULL,
    value VARCHAR( 50 ) NOT NULL,
    other_value VARCHAR( 50 ) NOT NULL
    )

      通常情况下单条插入的sql语句我们会这么写:

    代码如下  
    INSERT INTO example
    (example_id, name, value, other_value)
    VALUES
    (100, 'Name 1', 'Value 1', 'Other 1');

      mysql允许我们在一条sql语句中批量插入数据,如下sql语句:

    代码如下  
    INSERT INTO example
    (example_id, name, value, other_value)
    VALUES
    (100, 'Name 1', 'Value 1', 'Other 1'),
    (101, 'Name 2', 'Value 2', 'Other 2'),
    (102, 'Name 3', 'Value 3', 'Other 3'),
    (103, 'Name 4', 'Value 4', 'Other 4');

      如果我们插入列的顺序和表中列的顺序一致的话,还可以省去列名的定义,如下sql

    代码如下  
    INSERT INTO example
    VALUES
    (100, 'Name 1', 'Value 1', 'Other 1'),
    (101, 'Name 2', 'Value 2', 'Other 2'),
    (102, 'Name 3', 'Value 3', 'Other 3'),
    (103, 'Name 4', 'Value 4', 'Other 4');

      上面看上去没什么问题,下面我来使用sql语句优化的小技巧,下面会分别进行测试,目标是插入一个空的数据表200W条数据

      第一种方法:使用insert into 插入,代码如下:

    代码如下  
    $params = array('value'=>'50');
    set_time_limit(0);
    echo date("H:i:s");
    for($i=0;$i<2000000;$i++){
    $connect_mysql->insert($params);
    };
    echo date("H:i:s");

      最后显示为:23:25:05 01:32:05 也就是花了2个小时多!

      第二种方法:使用事务提交,批量插入数据库(每隔10W条提交下)最后显示消耗的时间为:22:56:13 23:04:00 ,一共8分13秒 ,代码如下:

    代码如下  
    echo date("H:i:s");
    
    $connect_mysql->query('BEGIN');
    $params = array('value'=>'50');
    for($i=0;$i<2000000;$i++){ 
    $connect_mysql->insert($params);
    if($i%100000==0){
    $connect_mysql->query('COMMIT');
    $connect_mysql->query('BEGIN');
    }
    }
    $connect_mysql->query('COMMIT');
    echo date("H:i:s");

      第三种方法:使用优化SQL语句:将SQL语句进行拼接,使用 insert into table () values (),(),(),()然后再一次性插入,如果字符串太长,

      则需要配置下MYSQL,在mysql 命令行中运行 :set global max_allowed_packet = 2*1024*1024*10;消耗时间为:11:24:06 11:25:06;

      插入200W条测试数据仅仅用了1分钟!代码如下:

    代码如下  
    $sql= "insert into twenty_million (value) values";
    for($i=0;$i<2000000;$i++){
    $sql.="('50'),";
    };
    $sql = substr($sql,0,strlen($sql)-1);
    $connect_mysql->query($sql);

      最后总结下,在插入大批量数据时,第一种方法无疑是最差劲的,而第二种方法在实际应用中就比较广泛,第三种方法在插入测试数据或者其他低要求时比较合适,速度确实快。

  • 相关阅读:
    Atitit 趋势管理之道 attilax著
    Atitit 循环处理的新特性 for...else...
    Atitit 2017年的技术趋势与未来的大技术趋势
    atitit 用什么样的维度看问题.docx 如何了解 看待xxx
    atitit prj mnrs 项目中的几种经理角色.docx
    Atitit IT办公场所以及度假村以及网点以及租房点建设之道 attilax总结
    Atitit 工具选型的因素与方法 attilax总结
    Atitit.团队文化建设影响组织的的一些原理 法则 定理 效应 p826.v4
    Atiitt 管理方面的误区总结 attilax总结
    Atitit 未来趋势把控的书籍 attilax总结 v3
  • 原文地址:https://www.cnblogs.com/sunwk/p/10196030.html
Copyright © 2011-2022 走看看