zoukankan      html  css  js  c++  java
  • [学习笔记][自建表格数据用于练习Numpy和Pandas]

    因为涉及敏感信息,原数据就不push到网上了,直接上代码:

    第一步导入库:

    1 import numpy as np
    2 import pandas as pd

    第二步自建数据录入,这一步脱敏了:

    1 # 硬输入的话一定注意不要出现中文标点,否则会报错。
    2 list = [["***",300,"微信"],["***",200,"微信"],["***",100,"微信"],["***",200,"微信"],["***",200,"微信"],["张娅玲",100,"微信"],
    3         ["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],["***",100,"微信"],
    4         ["***",501,"***"],["***",100,"微信"],["***",100,"微信"],["***",50,"微信"],["***",100,"微信"],
    5        ["***",100,"***"]]

    第三步转为numpy.array:

    1 # 将list转化为numpy.array,方便处理。
    2 list = numpy.array(list)

    第四步修改列名为中文,继续脱敏:

    1 # 修改列名,可以是中文。
    2 df = pd.DataFrame(list)
    3 df.columns = ["***","金额","备注"]

    第五步修改行索引,因为默认行索引从0开始,我需要改成从1开始:

    1 # 修改行索引
    2 indexname = numpy.arange(1,19)
    3 # 这里我试了range(),也试了linspace(),都返回报错。
    4 df.index = indexname
    5 df

    第六步修改某一列属性:

    1 # 修改某一列的属性,这里一定要注意将修改后属性列重新赋给列,否则无效。
    2 df['金额'] = df['金额'].astype(int)

    第七步查看各列属性并计算某列的数值之和:

    1 df.dtypes
    2 # 查看某列的总和
    3 df['金额'].sum()

    备注:原文件为 Numpy&PandasPractice.ipynb

  • 相关阅读:
    Java 基础
    Java 数据类型
    Spring 拦截器实现事物
    SSH 配置日记
    Hibernate 知识提高
    Jsp、Servlet
    leetcode 97. Interleaving String
    leetcode 750. Number Of Corner Rectangles
    leetcode 748. Shortest Completing Word
    leetcode 746. Min Cost Climbing Stairs
  • 原文地址:https://www.cnblogs.com/jaysonguan/p/12383391.html
Copyright © 2011-2022 走看看