zoukankan      html  css  js  c++  java
  • pandas 数据处理入门

    1. pandas的安装
      pip install pandas
    2. 导入pandans
      import pandas as pd    #为了方便使用pandas  采用pd简写
    3. pandas的初体验 (使用DataFrame和Series)
      #DataFrame 是一种二维数据结构,可以在列中存储不同类型的数据
      #手动将数据存储在表中,创建DataFrame
      #使用python的列表字典时,字典键将用作标题,而每个列表中的值用作DataFrame
      import pandas as pd  #导包
      df = pd.DataFrame({
          'Name':['徐欣','张德阳','韩磊'],
          'Age':[22,30,29],
          'Sex':['male','male','male']
      })
      print(df)
      
      #结果为:
      '''
        Name  Age   Sex
      0   徐欣   22  male
      1  张德阳   30  male
      2   韩磊   29  male
      '''
      
      #爬取某一类数据
      print(df['Name'])
      print(df.get('Age'))   #两种方法,根据python字典的特性
      
      #查询表中同学的最大年龄
      print(df['Age'].max())
      
      # 查询数据表中数值数据的基本统计信息
      print(df.describe())
      #a中的每一列DataFrame都是一个Series
      
      #上述例子也可以从头开始创建,Series没有列标签,因为它只是单列的DataFrame,系统只具有行标签
      #这种方法我不怎么喜欢,相对来说较麻烦,单列的,如果创建多个比较麻烦,而DataFrame是多行多列
      import pandas as pd  #导包
      ages = pd.Series([22,35,58],name='Age')
      print(ages)
      '''
      结果为:
      0    22
      1    35
      2    58
      Name: Age, dtype: int64
      '''
      
      #查询表中同学最大的年龄
      print(ages.max())

        

  • 相关阅读:
    C++中的虚函数、重写与多态
    STL中_Rb_tree的探索
    C++11 新用法
    FJUTOJ-3682 LRU算法的实现2 (链表+哈希)
    Windows系统对拍程序
    FOJ-2013 A Short Problem (前缀和)
    HDU-2036 改革春风吹满地 (数学)
    Ubuntu下PostgreSQL的安装和简单操作
    Ubuntu,Linux下goldendict词典安装及配置
    搜狗输入法输入汉字时候选栏乱码
  • 原文地址:https://www.cnblogs.com/u-damowang1/p/13575508.html
Copyright © 2011-2022 走看看