zoukankan html css js c++ java

[学习笔记][自建表格数据用于练习Numpy和Pandas]

因为涉及敏感信息，原数据就不push到网上了，直接上代码：

第一步导入库：

1 import numpy as np
2 import pandas as pd

第二步自建数据录入，这一步脱敏了：

1 # 硬输入的话一定注意不要出现中文标点，否则会报错。
2 list = [["***",300,"微信"],["***",200,"微信"],["***",100,"微信"],["***",200,"微信"],["***",200,"微信"],["张娅玲",100,"微信"],
3         ["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],
4         ["***",501,"***"],["***",100,"微信"],["***",100,"微信"],["***",50,"微信"],["***",100,"微信"],
5        ["***",100,"***"]]

第三步转为numpy.array：

1 # 将list转化为numpy.array，方便处理。
2 list = numpy.array(list)

第四步修改列名为中文，继续脱敏：

1 # 修改列名，可以是中文。
2 df = pd.DataFrame(list)
3 df.columns = ["***","金额","备注"]

第五步修改行索引，因为默认行索引从0开始，我需要改成从1开始：

1 # 修改行索引
2 indexname = numpy.arange(1,19)
3 # 这里我试了range(),也试了linspace(),都返回报错。
4 df.index = indexname
5 df

第六步修改某一列属性：

1 # 修改某一列的属性，这里一定要注意将修改后属性列重新赋给列，否则无效。
2 df['金额'] = df['金额'].astype(int)

第七步查看各列属性并计算某列的数值之和：

1 df.dtypes
2 # 查看某列的总和
3 df['金额'].sum()

备注：原文件为 Numpy&PandasPractice.ipynb

查看全文

相关阅读:
07 selenium模块基本使用
 06 高性能异步爬虫
 05 request高级操作
 04 验证码识别
 03 数据解析
 02 requests模块
 01 爬虫简介
 Get和Post的正解
 pytoch之 encoder,decoder
pytorch之 RNN 参数解释

原文地址：https://www.cnblogs.com/jaysonguan/p/12383391.html