zoukankan      html  css  js  c++  java
  • python的pandas处理txt文件

    一、

    1.pandas读取txt数据

    
    

    import pandas as pd
    data = pd.read_csv('F:\python_env\music_rec\taste_profile_subset\mini_triplets.txt', sep=' ', names=['userID', 'musicID', 'Views'])

    # data.to_excel('240.xlsx') 将数据保存为excle格式

    sep=" "是原始文档间的空格每一个文档可能都不一样,可能有空格,逗号或者是 ,根据情况选择names用来设置列名,如果不设置的话,则默认使用第一列作为列名。

    2  isin() 筛选:

    data[data['views'].isin([1])]

     3  分组(统计汇总)

    “group by” 指的是涵盖下列一项或多项步骤的处理流程:

    • 分割:按条件把数据分割成多组;
    • 应用:为每组单独应用函数;
    • 组合:将处理结果组合成一个数据结构
    data.groupby('musicID').sum()#按照音乐分组,统计每首歌的总播放量
  • 相关阅读:
    HTML和CSS 基本要点必看
    CSS
    六个选择器
    HTML初级课程 (自学可懂)
    this
    1.作用域链
    js if 语句
    js数据类型
    ifelse语句
    三元运算符
  • 原文地址:https://www.cnblogs.com/StarZhai/p/14050342.html
Copyright © 2011-2022 走看看