zoukankan      html  css  js  c++  java
  • 利用python将excel数据导入mySQL

    主要用到的库有xlrdpymysql, 注意pymysql不支持python3

    篇幅有限,只针对主要操作进行说明

    连接数据库

    首先pymysql需要连接数据库,我这里连接的是本地数据库(数据库叫lds714610)。

    conn = connect( host='localhost', port=3306, database='lds714610',
      user='root', charset='utf8')
    
    # 主要通过cursor来对数据库进行查询,插入等一系列操作
    cursor = conn.cursor()
    
    #在操作完所有操作后,提交修改,退出数据库
    conn.commit()
    conn.close()
    

    从excel中读取数据

    导入数据之前,需要先读取excel中的数据。

    通过xlrd库读取到excel表的数据,返回的数据类型很单一,几乎都是字符类型。所以excel表格中的空也是用""表示的,而不是null或None。

    # excel文件
    # 第一步打开excel文件,类似普通的文件open操作。注意open_workbook的参数必须是unicode编码
    book = open_workbook(fileName[i].decode('utf-8'))
    
    # 表格
    # 一个excel文件中可能有多个表,可以通过sheets()方法返回关于所有表格的list列表
    sheet = book.sheets()[0]	#通过下标可以获取某一个表格
    
    # 行 (元组)
    # 下面获取一个表格内特定行的特定列的值
    sheet.cell_value(i,j)	#表格获取i行j列的值,一般会使用strip()去掉空格
    
    # sheet有很多关于表格的属性
    tolRows = sheet.nrows	#表格的总行数
    

    向pymysql中写入数据

    之后说过对于pymysql通过cursor对数据库进行读写。

    对于库pymysql,程序从中读取到的数据类型可能是string、float、datetime等。同时也是使用None表示数据库中的空值,pymysql中 insert into的value如果是空字串"",不会对应mySQL中的NONE,而是同样表示一个空字串。

    # 查询
    cursor.execute("select TID from Train where TName = %s", TName)
    
    # 获取查询结果,fetchall的结果是一个元组,它的每个元素也是元组,并且元素对应select的一个查询结果
    # 如rows 可能是 ( (123,), (124,), (125,) ) 这种形式
    rows = cursor.fetchall()
      for r in rows:
        print(r[0])		#输出TID
    # fetchall(self):接收全部的返回结果行.
    # fetchone(self):返回一条结果行.
    # fetchmany(self, size=None):接收size条返回结果行
        
    # 插入多行,rows可能包含多组[TID], 但通过executemany可以用一条语句插入全部
    # 注意使用executemany向Mysql插入数据时,一律使用%s格式,即使插入的数据是数值, here %s is NOT formatter, but is a placeholder
    cursor.executemany(“ insert into Train(TID) values(%s) ”, rows)
    

    处理时间数据

    使用的库是datetimexlrd

    首先处理excel中的时间类型数据。在使用xlrd读取Excel表格中的日期格式时,读出的内容和原来Excel表格中的内容不一致。读取出来的是一个浮点数。导致不能正确使用。

    而xldate_as_tuple方法可以很好地解决这个问题。获取excel中的时间数据使用xlrd的xldate_as_tuple方法。

    from xlrd import xldate_as_tuple
    
    # 参数一:要处理的单元格值
    # 参数二:时间基准(0代表以1900-01-01为基准,1代表以1904-01-01为基准)
    # return (year, month, day, hour, minute, nearest_second)
    STime = xldate_as_tuple( sheet.cell_value(i,3), 0 )
    

    datetime的数据格式

    import datetime
    
    #字符串转datetime
    nowDateTime = datetime.datetime.strptime('2020-4-30', "%Y-%m-%d")
    
    # 直接指定年月日时分秒
    nowDateTime = datetime.datetime(2020, 4, 30, 0, 0, 0)
    
    #datetime转字符串
    nowDateTime.strftime("%Y-%m-%d %H:%M:%S")
    
    # 获取当前时间
    today = datetime.datetime.now()
    

    %Y-%m-%d %H:%M:%S 是datetime类型数据的一般格式,可以使用nowDateTime.date()方法去掉时分秒,但是得到的是datetime.date类型的数据,格式为 %Y-%m-%d

    因此如果要将datetime中的时分秒清0,方法是先将其转为“%Y-%m-%d”格式的字符串,再将字符串转为datetime类型数据。

    时间类型的计算

    datetime类型可以很方便的进行时间上的运行,如计算1天后、10天前、5分钟后或1小时前的年月日时分秒。

    # 计算5分钟后的时间
    after5Min = nowDateTime + timedelta( minutes = 5 )
    # 以此类推timedelta的形参还有days, hours等等
    

    注意nowDateTime.date() + timedelta( minutes = 5 ) 的结果里,时分秒一直是0,因为它是date类型。

    关于xlrd的例子 : https://xlrd.readthedocs.io/en/stable/api.html#xlrd-sheet
    https://www.cnblogs.com/insane-Mr-Li/p/9092619.html
    关于pymysql的例子 : https://www.cnblogs.com/huiyichanmian/p/11228192.html

    我的github有一个详细例子,欢迎去fork或start (里面有相关的excel文件和python文件)https://github.com/dslu7733/mysql_exercise/blob/master/lab/%E6%95%B0%E6%8D%AE%E5%BA%93%E4%BB%BF%E7%9C%9F%E6%95%B0%E6%8D%AE%E5%AF%BC%E5%85%A5/importData.py

  • 相关阅读:
    eclipse常用快捷键
    angularJS学习(三)——搭建学习环境
    node.js的安装
    AngularJS学习(二)——Angular应用的解析
    MTK如何烧录IMEI码(俗称串号)
    飞思卡尔IMX515评估板系统烧录和启动
    __asm__ __volatile__("": : :"memory")
    MTK6577+Android4.0之增加重启功能
    WinCE系统声音定制
    介绍一种很棒的wince 如何替换系统声音的方法
  • 原文地址:https://www.cnblogs.com/friedCoder/p/12812416.html
Copyright © 2011-2022 走看看