python的pandas处理txt文件 - 走看看

zoukankan html css js c++ java

python的pandas处理txt文件
一、

1.pandas读取txt数据
import pandas as pd
data = pd.read_csv('F:\python_env\music_rec\taste_profile_subset\mini_triplets.txt', sep=' ', names=['userID', 'musicID', 'Views'])

# data.to_excel('240.xlsx') 将数据保存为excle格式
sep=" "是原始文档间的空格每一个文档可能都不一样，可能有空格，逗号或者是，根据情况选择names用来设置列名，如果不设置的话，则默认使用第一列作为列名。

2　　isin() 筛选：
data[data['views'].isin([1])]
3　　分组（统计汇总）

“group by” 指的是涵盖下列一项或多项步骤的处理流程：
- 分割：按条件把数据分割成多组；
- 应用：为每组单独应用函数；
- 组合：将处理结果组合成一个数据结构
data.groupby('musicID').sum()#按照音乐分组，统计每首歌的总播放量
查看全文

相关阅读:
编程开发之--单例模式（2）
编程开发之--单例模式（1）
oracle 存储过程
 数据结构与算法之--最大公约数、最小公倍数
 编程开发之--Oracle数据库--存储过程使用动态参数绑定（3）
软件开发之常用的工具
 Oracle PL/SQL学习之你需要知道的快捷键
 Linux下安装Tomcat服务器和部署Web应用
 如何在linux下安装tomcat服务器
 CentOS7 64位安装mysql教程

原文地址：https://www.cnblogs.com/StarZhai/p/14050342.html

Copyright © 2011-2022 走看看