zoukankan      html  css  js  c++  java
  • SqlServer数据插入性能小记

      对于SQL性能,已经很久没关注了。由于近期项目既没有几千万的海量数据也没有过多的性能要求,所以在性能上也就没下太多功夫。然而,前不久和朋友闲谈间话题一转就说到程序上了,他说他用Delphi做了个数据导入的功能,插入数据的时候感觉很慢。以个人对SQL的了解,就建议他使用批量插入的方式,并很认真的告诉他这样应该会快很多。而在实际工作中,类似批量导入数据的功能是非常常见的,也许一个不小心我们就搞挂了服务器。那就究竟要怎么做才能给服务器留条活路,让用户不用点完上传看部电影再看上传结果呢?为此做了个小实验,并简单说下自己的看法。

      环境:

        CPU : i7;  

        内存 : 6G;

        数据库:SqlServer2008;

        数据量:10W

      

      实验内容:

        创建LoopInsert 和BatchInsert两个函数,LoopInsert中使用拼接的方式生成insert into xxx values(...) insert into xxx values(...) ...形式的sql执行并返回sql的执行时间,BatchInsert中同样使用拼接sql的方式生成insert into xxx values(...),(...),(...)形似的sql并返回sql的执行时间。利用控制台程序多次执行两个函数,并输出执行结果。

      表结构: 

    CREATE TABLE TQRCode
        (
          ID INT PRIMARY KEY  IDENTITY(1, 1) ,
          Name NVARCHAR(300) ,
          Remark NVARCHAR(300)
        )
    

      

      C#实现代码: 

     1     public class DataInertTest
     2     {
     3         /// <summary>
     4         /// 循环插入
     5         /// </summary>
     6         /// <returns>执行时间(秒)</returns>
     7         public double LoopInsert(int count)
     8         { 
     9             StringBuilder sql = new StringBuilder();
    10             for (int i = 0; i < count; i++)
    11             {
    12                 sql.Append(" Insert into TQRCode(Name,Remark) values('这是第").Append(i).Append("条数据','这是第").Append(i).Append("条数据_remark') ");
    13             }
    14             //时间统计
    15             var stopwatch = new Stopwatch();
    16             stopwatch.Start();
    17             new Helper().Excute(sql.ToString());
    18             return stopwatch.Elapsed.TotalMilliseconds;
    19         }
    20 
    21         /// <summary>
    22         /// 批量插入
    23         /// </summary>
    24         /// <returns>执行时间(秒)</returns>
    25         public double BatchInsert(int count)
    26         { 
    27             StringBuilder sql = new StringBuilder();
    28             sql.Append(" Insert into TQRCode(Name,Remark) values ");
    29             for (int i = 0; i < count; i++)
    30             {
    31 
    32                 sql.Append(" ('这是第").Append(i).Append("条数据','这是第").Append(i).Append("条数据_remark') ");
    33                 if (i % 500 == 0)
    34                 { 
    35                     sql.Append(" Insert into TQRCode(Name,Remark) values ");
    36                 }
    37                 else if (i < count - 1)
    38                 {
    39                     sql.Append(",");
    40                 }
    41             }
    42 
    43             //时间统计
    44             var stopwatch = new Stopwatch();
    45             stopwatch.Start(); 
    46             new Helper().Excute(sql.ToString());
    47             return stopwatch.Elapsed.TotalMilliseconds;
    48         }
    49     }
    C#实现代码

      注:sqlserver中单次批量插入数据最多1000条否则会提示我们:The number of row value expressions in the INSERT statement exceeds the maximum allowed number of 1000 row values.  

     测试代码:

     1     class Program
     2     {
     3         static void Main(string[] args)
     4         {
     5             for (int i = 0; i < 3; i++)
     6             {
     7                 var obj = new DataInertTest();
     8                 var t1 = obj.LoopInsert(100000);
     9                 var t2 = obj.BatchInsert(100000);
    10 
    11                 Console.WriteLine("LoopInsert  : {0}", t1);
    12                 Console.WriteLine("BatchInsert : {0}", t2);
    13                 Console.WriteLine("--------------------------------------------------");
    14               
    15             } 
    16             Console.ReadLine();
    17         } 
    18     }
    测试代码

      

      测试结果:

       执行了3次结果很明显,效率差距在10倍以上。批量插入的方式之所以比循环插入快,主要因为sqlserver中每个insert into 都是一个独立的事务,循环插入500条数据就是500个事务,而一次插入500条数据,就只有一个事务。事务减少了消耗自然也就小了。且频繁的事务提交相当影响数据库的性能,也就起到了影响整个系统性能的作用(嘿嘿,一不小心也许服务器就挂了)

      需要注意的是,测试中因为数据量不大所以两种方式都是采用的一次入库的方式,这样做可以减少数据库连接次数。但是这样做有个很大的弊端:内存消耗会很大。10w数据的sql拼接还好,如果是100w行那就未必了。所以,如果单条数据较大,建议每几百或几千行的时候提交一次,这个数字具体多大需要量体裁衣,平衡内存消耗。

       

  • 相关阅读:
    【宋红康程序思想学习日记5】数组排序之冒泡法
    求割点 poj 1523
    网络流 poj 3308 最小割
    网络流最小割 POJ 3469
    网络流 POJ2112
    网络流 HDU 3605
    网络流HDU 2883
    网络流 最大流HDU 3549
    微信公众平台开发者中心服务器配置Token验证失败问题
    排列熵算法简介及c#实现
  • 原文地址:https://www.cnblogs.com/aser1989/p/4597188.html
Copyright © 2011-2022 走看看