zoukankan      html  css  js  c++  java
  • Python机器学习(八十九)Pandas 整理列名

    关于数据集的列名,通常建议最好使用小写字母,删除特殊字符,并用下划线替换空格。有时数据集的列名可能不是很规范,需要整理修改理列名。

    获取DataFrame的列名

    获取DataFrame的列名,可以使用DataFrame.columns属性。

    movies_df.columns

    输出

    Index(['Rank', 'Genre', 'Description', 'Director', 'Actors', 'Year',
           'Runtime (Minutes)', 'Rating', 'Votes', 'Revenue (Millions)',
           'Metascore'],
          dtype='object')

    使用rename方法重命名列名

    要重命名列名,可以使用DataFrame.rename()方法,该方法的参数是包含新旧列名的字典。

    movies_df.rename(columns={
            'Runtime (Minutes)': 'Runtime', 
            'Revenue (Millions)': 'Revenue_millions'
        }, inplace=True)
    
    movies_df.columns

    输出

    Index(['Rank', 'Genre', 'Description', 'Director', 'Actors', 'Year', 'Runtime',
           'Rating', 'Votes', 'Revenue_millions', 'Metascore'],
          dtype='object')

    但是如果我们想把所有的名字都小写呢?除了使用.rename(),我们还可以为列设置一个名称列表,如下所示:

    使用columns属性重命名列名

    除了rename方法,columns属性也可重命名列名。

    movies_df.columns = ['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime', 
                         'rating', 'votes', 'revenue_millions', 'metascore']
    
    movies_df.columns

    输出

    Index(['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime',
           'rating', 'votes', 'revenue_millions', 'metascore'],
          dtype='object')

    上面指定名称的代码过于繁琐,可以使用更简洁的循环:

    movies_df.columns = [col.lower() for col in movies_df]
    
    movies_df.columns

    输出

    Index(['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime',
           'rating', 'votes', 'revenue_millions', 'metascore'],
          dtype='object')
  • 相关阅读:
    雷林鹏分享:Mysql 连接的使用
    雷林鹏分享:MySQL GROUP BY 语句
    雷林鹏分享:MySQL 排序
    雷林鹏分享:MySQL UNION 操作符
    雷林鹏分享:MySQL LIKE 子句
    雷林鹏分享:MySQL DELETE 语句
    好用的工具库
    免费的自动构建CI
    如何减少block的嵌套层次?
    一些ios牛人的博客
  • 原文地址:https://www.cnblogs.com/huanghanyu/p/13174076.html
Copyright © 2011-2022 走看看