zoukankan      html  css  js  c++  java
  • [学习笔记][自建表格数据用于练习Numpy和Pandas]

    因为涉及敏感信息,原数据就不push到网上了,直接上代码:

    第一步导入库:

    1 import numpy as np
    2 import pandas as pd

    第二步自建数据录入,这一步脱敏了:

    1 # 硬输入的话一定注意不要出现中文标点,否则会报错。
    2 list = [["***",300,"微信"],["***",200,"微信"],["***",100,"微信"],["***",200,"微信"],["***",200,"微信"],["张娅玲",100,"微信"],
    3         ["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],
    4         ["***",501,"***"],["***",100,"微信"],["***",100,"微信"],["***",50,"微信"],["***",100,"微信"],
    5        ["***",100,"***"]]

    第三步转为numpy.array:

    1 # 将list转化为numpy.array,方便处理。
    2 list = numpy.array(list)

    第四步修改列名为中文,继续脱敏:

    1 # 修改列名,可以是中文。
    2 df = pd.DataFrame(list)
    3 df.columns = ["***","金额","备注"]

    第五步修改行索引,因为默认行索引从0开始,我需要改成从1开始:

    1 # 修改行索引
    2 indexname = numpy.arange(1,19)
    3 # 这里我试了range(),也试了linspace(),都返回报错。
    4 df.index = indexname
    5 df

    第六步修改某一列属性:

    1 # 修改某一列的属性,这里一定要注意将修改后属性列重新赋给列,否则无效。
    2 df['金额'] = df['金额'].astype(int)

    第七步查看各列属性并计算某列的数值之和:

    1 df.dtypes
    2 # 查看某列的总和
    3 df['金额'].sum()

    备注:原文件为 Numpy&PandasPractice.ipynb

  • 相关阅读:
    [atARC100F]Colorful Sequences
    [atARC103D]Robot Arms
    [atARC107F]Sum of Abs
    [atAGC047F]Rooks
    [loj3278]收获
    [cf809E]Surprise me
    [cf997E]Good Subsegments
    [cf603E]Pastoral Oddities
    Codeforces Round #453
    Educational Codeforces Round 32
  • 原文地址:https://www.cnblogs.com/jaysonguan/p/12383391.html
Copyright © 2011-2022 走看看