zoukankan      html  css  js  c++  java
  • 第四节 pandas 数据加载

      pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read_table这两个使用最多。

    #导包
    import
    pandas as pd from pandas import DataFrame,Series import numpy as np

    一 文件操作

    1.1  读取文件

    • 文件数据

    • 读取代码
    df = pd.read_csv('./data-07/type-.txt',sep='-',header=None)
    # sep:分隔符
    # header:None首行不作为列索引
    • 效果展示

    1.2 写入文件

    #写入excel文件 :df.to_excel('name.xlsx')
    pd.excel('./eee.xls')

    二 数据库mysql 操作(pymysql)

    2.1 读取数据库

    (1)更新pymysql 

    在cmd中利用conda命令输入:conda update 库名,例如conda update pymysql,并回车,如下图所示

    推荐文章:

    库更新及jupyter-notebook默认目录更改方法:https://blog.csdn.net/zenghaitao0128/article/details/78241146

    (2) 导包

    import pandas as pd
    import pymysql
    import sys
    from sqlalchemy import create_engine

    (3) 创建conn管道

    #连接数据库,获取连接对象
    conn = create_engine('mysql+pymysql://root:123@localhost:3306/day02?charset=utf8')

    (4) 展示数据库中的数据

    sql='select *from student;' #书写mysql语句
    
    #读取库表中的数据值
    df=pd.read_sql(sql,conn)
    df

    conn创建参数详解

    import pandas as pd
    from sqlalchemy import create_engine
     
    ##将数据写入mysql的数据库,但需要先通过sqlalchemy.create_engine建立连接,且字符编码设置为utf8,否则有些latin字符不能处理
    conn = create_engine('mysql+mysqldb://root:password@localhost:3306/databasename?charset=utf8')
    pd.io.sql.to_sql(thedataframe,'tablename', conn, schema='databasename', if_exists='append')
    
     
    参数解释:
    
    第一个参数thedataframe是需要导入的pd dataframe,
    
    第二个参数tablename是将导入的数据库中的表名
    
    第三个参数conn是启动数据库的接口,pd 1.9以后的版本,除了sqllite,均需要通过sqlalchemy来设置
    
    第四个参数databasename是将导入的数据库名字
    
    第五个参数if_exists='append'的意思是,如果表tablename存在,则将数据添加到这个表的后面
    
    
    
    sqlalchemy.create_engine是数据库引擎
    
    ('mysql+mysqldb://root:password@localhost:3306/databasename?charset=utf8')的解释
    
    mysql是要用的数据库
    
    mysqldb是需要用的接口程序
    
    root是数据库账户
    
    password是数据库密码
    
    localhost是数据库所在服务器的地址,这里是本机
    
    3306是mysql占用的端口
    
    elonuse是数据库的名字
    
    charset=utf8是设置数据库的编码方式,这样可以防止latin字符不识别而报错

    原文:https://blog.csdn.net/biboshouyu/article/details/54139641

    2.2 DadaFrame数据写入数据库
    yconnect = create_engine('mysql+pymysql://root:123@localhost:3306/day02?charset=utf8')
    #将一个df中的数据值写入存储到
    df=DataFrame(data=np.random.randint(0,100,size=(2,3)))
    df
    df.to_sql('text',con=yconnect,if_exists='replace')

     
  • 相关阅读:
    边缘计算的下一场革命:1+1>2?
    深度学习黑箱:探秘人类编写的AI究竟在想什么
    Science:AI领域那么多引人注目的「进展」,竟是无用功
    什么是非结构化数据(unstructured data)?
    云计算的背水一战!核心技术决定未来!
    OpenAI最新论文:机器学习效率正在超越摩尔定律
    大数据和5G:这个交叉路口指向何方?
    实现一个边缘机器学习项目到底有多难?
    云计算模式:2021年的趋势是什么?
    当5G遇到新基建,边缘计算怎么发展?
  • 原文地址:https://www.cnblogs.com/angle6-liu/p/10411433.html
Copyright © 2011-2022 走看看