zoukankan      html  css  js  c++  java
  • 2-Pandas数据初探索之数据类型与数据筛选

    一、数据类型

    1、Pandas的数据类型主要结合了pandas和numpy两个模块中的数据类型,包括以下几种:

    • float
    • int
    • bool
    • datetime64[ns]------>日期类型
    • datetime64[ns,tz]--->日期类型
    • timedelta[ns]------->时间差类型
    • category
    • object---->当一个Series仅包括字符串或是包括多种数据类型时为object类型

    2、通过DateFrame对象的dtypes属性,可得到各个特征的数据类型。

      例如:df.dtypes

    3、类型转换:

      (1)通过astype()转换数据类型,默认情况下会产生对象转换后的一个副本

        df['A'] = df['A'].astype('int8')

      (2)对多列进行类型转换时,对astype()传入一个字典。字典的键值对格式为列名:目标数据类型

        df = df.astype({'A':'int8','B':'int32'})

    二、数据筛选

    select_dtypes()筛选出特定数据类型的特征

      包括两个参数:

    • include:筛选时选取的数据类型
    • exclude:筛选时排除的数据类型

    df.select_dtypes(include=['float'],exclude=['int'])

  • 相关阅读:
    稀疏核机
    核方法
    变分法
    拉格朗日乘子
    序列数据
    连续隐含变量
    线性回归模型
    采样方法
    线性分类模型
    一些音乐下的评论
  • 原文地址:https://www.cnblogs.com/Cheryol/p/13381453.html
Copyright © 2011-2022 走看看