使用executemany对数据进行批量插入的话,要注意一下事项:
1 #coding:utf8 2 3 conn = MySQLdb.connect(host = “localhost”, user = “root”, passwd = “123456”, db = “myDB”) 4 cursor = conn.cursor() 5 sql = “insert into myTable (created_day,name,count) values(%s,%s,%s) ON DUPLICATE KEY UPDATE count=count+values(count)” 6 args=[("2012-08-27","name1",100),("2012-08-27","name1",200),("2012-08-27","name2",300)] 7 try: 8 cursor.executemany(sql, args) 9 except Exception as e: 10 print0(“执行MySQL: %s 时出错:%s” % (sql, e)) 11 finally: 12 cursor.close() 13 conn.commit() 14 conn.close()
这里args是一个包含多个元组的数组,每个元组对应mysql当中的一条数据,注意这里的created_day对应的%s没有引号。这里推测executemany自己首先对sql语句进行正则匹配%s然后在此基础上,对字符串进行嵌入处理,如果这里%s加上引号的话,插入mysql当中会出现”0000-00-00″类型的错误日期。
如果一次性要插入很多条数据的话,在这里强烈 推荐使用executemany,从自己体会来讲,一条一条的insert需要2-3个小时时间的数据插入,使用executemany只需要2-3秒!!!
在这里executemany和ON DUPLICATE KEY UPDATE联合使用的时候如果按照sql常规模式,即:sql=”insert into myTable (created_day,name,count) values(%s,%s,%s) ON DUPLICATE KEY UPDATE count=count+%s”会报bug:not all arguments converted during string formatting