zoukankan      html  css  js  c++  java
  • 23个Pandas方法

    23个Pandas核心方法

    1. 读取 CSV 格式
      pd.read_csv(“csv_file”)
      pd.DataFrame.from_csv(“csv_file”)
    2. 读取 Excel
      pd.read_excel("excel_file")
    3. 将 DataFrame 写入 CSV 文件
      df.to_csv("data.csv", sep=",", index=False)
    4. 显示基本的数据集特征信息
      df.info()
    5. 基本的数据集统计信息
      print(df.describe())
    6. 将 DataFrame 输出到一张表
      print(tabulate(print_table, headers=headers))
    7. 列出所有列的名字
      df.columns
    8. 删除缺失数据
      df.dropna(axis=0, how='any')
    9. 替换缺失数据
      df.replace(to_replace=None, value=None)
    10. 检查空值 NaN
      pd.isnull(object)
    11. 删除特征
      df.drop('feature_variable_name', axis=1)
    12. 将目标类型转换为浮点型
      pd.to_numeric(df["feature_name"], errors='coerce')
    13. 将 DataFrame 转换为 NumPy 数组
      df.as_matrix()
    14. 取 DataFrame 的前面「n」行
      df.head(n)
    15. 通过特征名取数据
      df.loc[feature_name]
    16. 对 DataFrame 使用函数
      df["height"].apply(*lambda* height: 2 * height)
      def multiply(x):
       return x * 2
      df["height"].apply(multiply)
    17. 重命名行(重命名第三行)
      df.rename(columns = {df.columns[2]:'size'}, inplace=True)
    18. 取某一行的唯一实体
      df["name"].unique()
    19. 访问子 DataFrame
      new_df = df[["name", "size"]]
    20. 总结数据信息
      # Sum of values in a data frame
      df.sum()
      # Lowest value of a data frame
      df.min()
      # Highest value
      df.max()
      # Index of the lowest value
      df.idxmin()
      # Index of the highest value
      df.idxmax()
      # Statistical summary of the data frame, with quartiles, median, etc.
      df.describe()
      # Average values
      df.mean()
      # Median values
      df.median()
      # Correlation between columns
      df.corr()
      # To get these values for only one column, just select it like this#
      df["size"].median()
    21. 给数据排序
      df.sort_values(ascending = False)
    22. 布尔型索引(过滤size的行,仅显示等于5的行)
      df[df["size"] == 5]
    23. 选定特定的值(选size列,第一行的值)
      df.loc([0], ['size'])

    print(df.describe())

  • 相关阅读:
    ElasticSearch安装配置
    Hadoop新手篇:hadoop入门基础教程
    实用贴:hadoop系统下载安装教程
    超详细hadoop集群服务器安装配置教程
    Hadoop伪分布式环境搭建之Linux操作系统安装
    超详细Dkhadoop虚拟机安装图文教程
    hadoop集群管理系统搭建规划说明
    NLP汉语自然语言处理入门基础知识介绍
    hadoop最新发行稳定版:DKHadoop版本选择详解
    大数据hadoop入门之hadoop家族详解
  • 原文地址:https://www.cnblogs.com/piaoyangz/p/9552319.html
Copyright © 2011-2022 走看看