zoukankan      html  css  js  c++  java
  • 多文件合并:解决股票数据文件合并

    ​场景:当我们导出数据后发现数据是多个文件,这个时候我们需要把文件进行合并。

    实现思路:

    1、通过os文件获取文件的路径;

    2、把文件的路径放入一个列表;

    3、导入数据;

    4、把文件合并后导出。

    5、注意:合并时需要把重复的追加数据删除。

    步骤:

    import pandas as pd
    import os
    pd.set_option('expand_frame_repr', False)
    # 1、首先找到存储路径、
    file_location = r'C:UsersADMINDesktopcrawl_stock_dataDATA	est'
    # 2、批量获取文件名称
    file_list = []
    for root,dirs,files in os.walk(file_location):
        for filename in files:
            if filename.endswith('.csv'):
                file_path = os.path.join(root,filename)
                file_path = os.path.abspath(file_path)
                file_list.append(file_path)
    # 3、遍历名称导入数据
    all_data = pd.DataFrame()
    for fp in file_list:
        df = pd.read_csv(fp, skiprows=1, encoding='gbk')
        all_data = all_data.append(df,ignore_index=True)
    # 4、去除重复,导出数据
    all_data.sort_values(by=['交易日期','股票代码'],inplace=True)
    all_data.drop_duplicates().to_csv(r'C:UsersADMINDesktopcrawl_stock_dataDATA.csv')
  • 相关阅读:
    高精度乘除运算优化
    高精度除法
    高精度乘法
    期末考试
    P2341 [HAOI2006]受欢迎的牛[SCC缩点]
    P2002 消息扩散[SCC缩点]
    神奇搜索算法A*
    P3205 [HNOI2010]合唱队[区间dp]
    P4170 [CQOI2007]涂色
    P1220 关路灯[区间dp]
  • 原文地址:https://www.cnblogs.com/hanjiangs/p/14233122.html
Copyright © 2011-2022 走看看