zoukankan      html  css  js  c++  java
  • 大规模数据导入和导出(mysql)

    测试数据2.5G,共有数据9427567条。用的mysql的large服务器的配置。
    load 一次需要大概10分钟左右。
    建的表用的是MYISAM,调整了几个session的参数值

    SET SESSION BULK_INSERT_BUFFER_SIZE = 256217728 ;
    SET SESSION MYISAM_SORT_BUFFER_SIZE = 256217728 ; 
    运行结果如下

    Query OK, 9427567 rows affected, 1558 warnings (3 min 55.21 sec)
    Records: 9427567 Deleted: 0 Skipped: 0 Warnings: 0
    google到的还可以

    set global KEY_BUFFER_SIZE = 256217728 ;
    alter table tablename disable keys ; 
    如何load 数据里面带反斜杠(backslash)”” 的数据 
    由于如果你没有指定FIELDS子句,则默认值为假设您写下如下语句时的值:
    FIELDS TERMINATED BY ‘ ’ ENCLOSED BY ” ESCAPED BY ‘\’
    所以,如果你的数据里面有反斜杠(backslash)””的时候,数据会出现被截断的问题。出现这种问题,只要写上如下的fields子句即可
    FIELDS TERMINATED BY ‘ ’ ENCLOSED BY ” ESCAPED BY ”

    如何load 不同编码的数据 
    原来用的4.X的mysql,我是select into   outfile ,只后用iconv,或者其他软件来做。可以参考这里 ,但是由于这次数据大,用ultraedit等软件打开都要半天。好在新版的mysql可以增加一个新的参数
    CHARACTER SET gbk
    我的文本数据是GBK的编码,数据表是utf8的,用这种方法测试成功。
    如何load 的时候只insert特定的列 
    比如表里面有比元数据多的列。可以在load 的时候指定要插入的字段名字。

    示例的代码如下:

    LOAD DATA INFILE ' ~/data.txt '    
    INTO TABLE fb0505    
    CHARACTER SET   gbk    
    FIELDS TERMINATED BY ' ' ENCLOSED BY '' ESCAPED BY '' 
    LINES TERMINATED BY ' ' STARTING BY ''   
    ( seller_id , fb_type , fb_date , item_url ) ; 
    其中表fb0505里面还有一列是id。

  • 相关阅读:
    连接池
    Socket编程实践(2) --Socket编程导引
    自己定义JSTL函数
    用new和delete运算符进行动态分配和撤销存储空间
    Unix网络编程学习笔记之第12章 IPv4与IPv6的互操作性
    矩阵十题【五】 VOJ1049 HDU 2371 Decode the Strings
    Unity3d / 3ds max 模型分享站点
    浙大PAT考试1077~1080(2014上机复试题目)
    Java反射学习总结五(Annotation(注解)-基础篇)
    关于http和https淘宝支付宝跨域解决方法研究
  • 原文地址:https://www.cnblogs.com/8899man/p/7249407.html
Copyright © 2011-2022 走看看