zoukankan      html  css  js  c++  java
  • 电商 Python 访客Excel合并

    代码如下

    import pandas as pd
    import os
    import re
    
    path = "./files/"
    files = os.listdir(path)
    
    
    # 用于存放Excel,里面的每个元素类型为:pandas.core.frame.DataFrame
    list_excel = []
    
    for filename in files:
        fullname = path + filename# excel的相对路径
        df = pd.read_excel(fullname)# 默认读取Excel的第一个表单
        
        # 访问时间列 增加 日期
        m = re.search("(d{4}-d{1,2}-d{1,2})", filename)   
        strdate = m.group(1)
        df["访问时间"] =['%s %s' % (strdate, s) for s in df["访问时间"]]
        
        col_name = df.columns.tolist()
        if '搜索关键字' not in col_name:
            # 插入列
            index = col_name.index('入店来源') + 1
            col_name.insert(index, '搜索关键字')
            df = df.reindex(columns = col_name)
    
            # 修改值
            df.loc[df['入店来源'].str.find('手淘搜索') > -1 , '搜索关键字'] = df['入店来源'].str.replace('手淘搜索','')
            df.loc[df['入店来源'].str.find('手淘搜索') > -1 , '入店来源'] = '手淘搜索'
    
        list_excel.append(df)# 把Excel追加到list中
    
    
    writer = pd.ExcelWriter('test.xlsx')
    
    # pd.concat:数据拼接
    # to_excel:写入到Excel
    pd.concat(list_excel).to_excel(writer,'sheet1',index=False)
    
    writer.save()
    
    print('合并完成')
    
    
  • 相关阅读:
    java9的JShell小工具和编译器两种自动优化
    运算符
    数据类型
    常量&&变量
    强化学习复习笔记
    强化学习复习笔记
    DQN算法原理详解
    语言模型评价指标Perplexity
    C++ STL标准容器插入删除算法的复杂度
    集束搜索beam search和贪心搜索greedy search
  • 原文地址:https://www.cnblogs.com/guxingy/p/12987355.html
Copyright © 2011-2022 走看看