数据分析:Pandas

zoukankan html css js c++ java

数据分析:Pandas
pandas简介

1.pandas是一个强大的Python数据分析的工具包，它是基于Numpy构建的，正因pandas的出现，让Python语言也成为使用最广泛而且强大的数据分析环境之一。

2.

安装方法：

pip install pandas

引用方法：

import pandas as pd

Series

1.简介：

Series是一种类似于一维数组的对象，由一组数据和一组与之相关的数据标签(索引)组成。

2.创建的几种方法

前提：

第一种方式：

将数组索引以及数组的值打印出来，索引在左，值在右，由于没有为数据指定索引，于是会自动创建一个0到N-1（N为数据的长度）的整数型索引，取值的时候可以通过索引取

第二种方式：

自定义索引，index是一个索引列表，里面包含的是字符串，依然可以通过默认索引取值。

第三种方式：

指定索引

第四种方式：

补充：以上方式可通过索引取值

3.缺失数据处理

示例和数据：

因为rocky没有出现在st的键中，所以返回的是缺失值

1.isnull()：判断是否有缺失值，是缺失值返回Ture

2.dropna() # 过滤掉值为NaN的行

3.fillna() # 填充缺失数据

4.Series特性

#1.加减乘除运算

#2.布尔值过滤：sr[sr>0]

5.支持字典的特性

#1.取值

6.整数索引

示例：

7.数据对齐

示例1：

示例2：

DataFrame

1.简介

DataFrame是一个表格型的数据结构，相当于是一个二维数组，含有一组有序的列。他可以被看做是由Series组成的字典，并且共用一个索引。

2.创建的几种方式
第一种： pd.DataFrame({'one':[1,2,3,4],'two':[4,3,2,1]}) # 产生的DataFrame会自动为Series分配所索引，并且列会按照排序的顺序排列运行结果： one two 0 1 4 1 2 3 2 3 2 3 4 1 > 指定列可以通过columns参数指定顺序排列 data = pd.DataFrame({'one':[1,2,3,4],'two':[4,3,2,1]}) pd.DataFrame(data,columns=['one','two']) # 打印结果会按照columns参数指定顺序第二种： pd.DataFrame({'one':pd.Series([1,2,3],index=['a','b','c']),'two':pd.Series([1,2,3],index=['b','a','c'])}) 运行结果： one two a 1 2 b 2 1 c 3 3
3.常用属性

示例：

4.常见获取数据方式

示例1：读取文件

示例2读取后规定展示数量

示例3另存为

5.分组

#1.read_html

示例1：

取值示例：

优化示例：

分组示例：

分组排序示例：

2个列字段分组

6.时间处理

1.时间转换

2.时间格式转换

3.data_range

示例：
查看全文

相关阅读:
javascript运动详解
 jQuery Ajax封装通用类 (linjq)
Bootstrap 字体图标引用示例
 jQuery $.each用法
 jquery中odd和even选择器的用法说明
 JQuery中怎么设置class
HTML5中input背景提示文字(placeholder)的CSS美化
 边框上下左右各部位隐藏显示详解
 纯CSS气泡框实现方法探究
 对比Tornado和Twisted两种异步Python框架

原文地址：https://www.cnblogs.com/tfzz/p/11979604.html

数据分析:Pandas

pandas简介

Series

1.简介：

2.创建的几种方法

第一种方式：

第二种方式：

第三种方式：

第四种方式：

补充：以上方式可通过索引取值

3.缺失数据处理

1.isnull()：判断是否有缺失值，是缺失值返回Ture

2.dropna() # 过滤掉值为NaN的行

3.fillna() # 填充缺失数据

4.Series特性

#1.加减乘除运算

#2.布尔值过滤：sr[sr>0]

5.支持字典的特性

#1.取值

6.整数索引

7.数据对齐

DataFrame

1.简介

2.创建的几种方式

3.常用属性

4.常见获取数据方式

5.分组

#1.read_html

6.时间处理

1.时间转换

2.时间格式转换

3.data_range