zoukankan html css js c++ java

数据类型-Series

Series数据类型由一组数据和数据相关的索引组成，键 -> 值
Series数据类型可视为：一维带标签数组
Series基本操作类似数组和字典

Series数据类型的创建

首先载入库

import numpy as np
import pandas as pd

Python list列表创建Series

a = pd.Series([1,2,3,4]) #默认索引
b = pd.Series([1,2,3,4],index=['a','b','c','d']) #自定义索引
s = pd.Series([True,1,2.3,'a','你好']) #数据类型

标量值创建Series

c = pd.Series(10,index=['a','b','c']) #必须带index

Python字典创建Series

d = pd.Series({'a':9,'b':8,'c':7})

ndarray 创建Series，索引和数据都可以通过ndarray类型生成

n = pd.Series(np.arange(5))
m = pd.Series(np.arange(5),index=np.arange(9,4,-1))

其他函数创建Series

n = pd.Series(range(10))

Series类型的基本操作

index和value操作

b = pd.Series([9,8,7,6,5,4,3],['a','b','c','d','e','f','g'])
b
b.index # 获得索引，输出index类型,就是pandas独有的索引类型
b.values # 获得数据，输出类型为array,就是np的array数组

# 索引
b['b']
b[1] # 与上面相同，自动索引是默认生成的，和自定义索引并存
b.b

b[['c','d','a']]
b[['c','d',0]] #错误，两套索引并存,但不能混用

# 切片
b[:'d']
b['d':]
b[:3]

b[::2]
b[::-1]

类ndarray操作

索引方法相同,都有[]
numpy中的运算和操作可用于Series类型
可以通过自定义索引的列表进行切片
可以通过自动索引进行切片,如果存在自定义索引,则一同被切片

b[3] #第3个值,结果是索引的值
b[:3] #0-3,结果还是Series类型
b[b > b.median()] #所有大于中位数的值

类python字典的操作

通过自定义索引访问
保留字in操作
使用.get()方法

b['b']
'c' in b #判断此键在不在b的索引中
0 in b #in 不会判断自动索引
b.get('f',100) #从b中提取索引f的值,如果存在就取出,不存在就用 100 代替

根据索引对齐操作

series + series

a = pd.Series([1,2,3],['c','d','e'])
b = pd.Series([9,8,7,6],['a','b','c','d'])
a + b #结果为两个值的并集,相加时索引对齐加值,索引不对齐的没值,加完也没值

Series类型在运算中会自动对齐不同索引的数据
ndarray基于维度运算,series基于索引运算,更精确不易出错

Series类型的name属性

Series对象和索引都可以起一个名字,存储在属性.name中

b = pd.Series([9,8,7,6],['a','b','c','d'])
b.name #默认没有
b.name = 'Series对象' #对象命名
b.index.name = '索引列' #索引命名
b

Series类型的修改

Series对象可以随时修改并立即生效

b['a'] = 15
b.name = 'Series'
b
b.name = 'new series'
b['b','c'] = 20 # b[['b','c']] = 20
b

查看全文

相关阅读:
Java沉思录之重识String
【python】爬虫-爬取新闻
 【大数据】水质分析————（数据预处理）对水质图片的处理
 神经网络鸢尾花数集预测
 【python 基础】词云
 【数据结构】字符串匹配
 【算法】分治
 【数据结构】队列
 【数据结构】栈的顺序表示
 【数据结构】线性表的链式存储结构

原文地址：https://www.cnblogs.com/yoyo1216/p/10131710.html