zoukankan      html  css  js  c++  java
  • Python Pandas pandas.DataFrame.to_sql函数方法的使用

    Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中DataFrame.to_sql方法的使用。

    DataFrame.to_sql (name,con,schema = None,if_exists ='fail',index = True,index_label = None,chunksize = None,dtype = None ) [source]

    将存储在DataFrame中的记录写入SQL数据库。

    支持SQLAlchemy [R16]支持的数据库。可以新创建,附加或覆盖表。

    参数:

    name:string

    SQL表的名称。

    con:sqlalchemy.engine.Engine或sqlite3.Connection

    使用SQLAlchemy可以使用该库支持的任何数据库。

    为sqlite3.Connection对象提供了旧版支持。

    schema:string,optional

    指定架构(如果数据库支持)。如果为None,请使用默认架构。

    if_exists:{'fail','replace','append'},默认'fail'

    如果表已存在的情况如下,

    • fail:引发ValueError。
    • replace:在插入新值之前删除表。
    • append:将新值插入现有表。

    index:布尔值,默认为True

    将DataFrame索引写为列。使用index_label作为表中的列名。

    index_label:字符串或序列,默认为None

    索引列的列标签。如果给出None(默认)且 index为True,

    则使用索引名称。

    如果DataFrame使用MultiIndex,则应该给出一个sequence。

    chunksize:int,可选

    行将一次批量写入的数量。默认情况下,所有行都将立即写入。

    dtype:dict,可选

    指定列的数据类型。键应该是列名,值应该是SQLAlchemy类型,

    或sqlite3传统模式的字符串。

    异常:

    ValueError异常

    当表已经存在且if_exists为'fail'时(默认值)。

    例如,

    1)创建内存中的SQLite数据库

    >>> from sqlalchemy import create_engine
    >>> engine = create_engine('sqlite://', echo=False)

    2)从头开始创建一个包含3行的表

    >>> df = pd.DataFrame({'name' : ['User 1', 'User 2', 'User 3']})
    >>> df
         name
    0  User 1
    1  User 2
    2  User 3
    >>> df.to_sql('users', con=engine)
    >>> engine.execute("SELECT * FROM users").fetchall()
    [(0, 'User 1'), (1, 'User 2'), (2, 'User 3')]
    >>> df1 = pd.DataFrame({'name' : ['User 4', 'User 5']})
    >>> df1.to_sql('users', con=engine, if_exists='append')
    >>> engine.execute("SELECT * FROM users").fetchall()
    [(0, 'User 1'), (1, 'User 2'), (2, 'User 3'),
     (0, 'User 4'), (1, 'User 5')]

    3)用df1覆盖表

    >>> df1.to_sql('users', con=engine, if_exists='replace',
    ...            index_label='id')
    >>> engine.execute("SELECT * FROM users").fetchall()
    [(0, 'User 4'), (1, 'User 5')]

    4)指定dtype(对于具有缺失值的整数很有用)。请注意,虽然pandas被强制将数据存储为浮点数,但数据库支持可空整数。使用Python获取数据时,我们会返回整数标量。

    >>> df = pd.DataFrame({"A": [1, None, 2]})
    >>> df
         A
    0  1.0
    1  NaN
    2  2.0
    >>> from sqlalchemy.types import Integer
    >>> df.to_sql('integers', con=engine, index=False,
    ...           dtype={"A": Integer()})
    >>> engine.execute("SELECT * FROM integers").fetchall()
    [(1,), (None,), (2,)]

     https://www.cjavapy.com/article/158/

     
  • 相关阅读:
    Linux基本常用知识整理
    uva488 Triangle Wave
    uva 10300 Ecological Premium
    Silverlight知识链接整理(11月12月)
    关于微软高校“创新之旅”活动—郑州大学站公告
    心动的Silverlight5
    Silverlight图片处理——Deep Zoom Composer
    微软高校“创新之旅”巡回活动郑州大学站圆满落幕
    Silverlight之Button控件简单自定义
    Silverlight之工具箱使用1
  • 原文地址:https://www.cnblogs.com/chanshion/p/12380259.html
Copyright © 2011-2022 走看看