zoukankan      html  css  js  c++  java
  • 数据类型-Series

    数据类型-Series

    • Series数据类型由一组数据和数据相关的索引组成,键 -> 值
    • Series数据类型可视为:一维 带标签 数组
    • Series基本操作类似数组和字典

    Series数据类型的创建

    首先载入库

    import numpy as np
    import pandas as pd

    Python list列表 创建Series

    a = pd.Series([1,2,3,4]) #默认索引
    b = pd.Series([1,2,3,4],index=['a','b','c','d']) #自定义索引
    s = pd.Series([True,1,2.3,'a','你好']) #数据类型

    标量值 创建Series

    c = pd.Series(10,index=['a','b','c']) #必须带index

    Python字典 创建Series

    d = pd.Series({'a':9,'b':8,'c':7})

    ndarray 创建Series,索引和数据都可以通过ndarray类型生成

    n = pd.Series(np.arange(5))
    m = pd.Series(np.arange(5),index=np.arange(9,4,-1))

    其他函数 创建Series

    n = pd.Series(range(10))

    Series类型的基本操作

    index和value操作

    b = pd.Series([9,8,7,6,5,4,3],['a','b','c','d','e','f','g'])
    b
    b.index # 获得索引,输出index类型,就是pandas独有的索引类型
    b.values # 获得数据,输出类型为array,就是np的array数组
    
    # 索引
    b['b']
    b[1] # 与上面相同,自动索引是默认生成的,和自定义索引并存
    b.b
    
    b[['c','d','a']]
    b[['c','d',0]] #错误,两套索引并存,但不能混用
    
    # 切片
    b[:'d']
    b['d':]
    b[:3]
    
    b[::2]
    b[::-1]

    类ndarray操作

    • 索引方法相同,都有[]
    • numpy中的运算和操作可用于Series类型
    • 可以通过自定义索引的列表进行切片
    • 可以通过自动索引进行切片,如果存在自定义索引,则一同被切片
    b[3] #第3个值,结果是索引的值
    b[:3] #0-3,结果还是Series类型
    b[b > b.median()] #所有大于中位数的值

    类python字典的操作

    • 通过自定义索引访问
    • 保留字in操作
    • 使用.get()方法
    b['b']
    'c' in b #判断此键在不在b的索引中
    0 in b #in 不会判断自动索引
    b.get('f',100) #从b中提取索引f的值,如果存在就取出,不存在就用 100 代替

    根据索引对齐操作

    series + series

    a = pd.Series([1,2,3],['c','d','e'])
    b = pd.Series([9,8,7,6],['a','b','c','d'])
    a + b #结果为两个值的并集,相加时索引对齐加值,索引不对齐的没值,加完也没值
    • Series类型在运算中会自动对齐不同索引的数据
    • ndarray基于维度运算,series基于索引运算,更精确不易出错

    Series类型的name属性

    Series对象和索引都可以起一个名字,存储在属性.name中

    b = pd.Series([9,8,7,6],['a','b','c','d'])
    b.name #默认没有
    b.name = 'Series对象' #对象命名
    b.index.name = '索引列' #索引命名
    b

    Series类型的修改

    Series对象可以随时修改并立即生效

    b['a'] = 15
    b.name = 'Series'
    b
    b.name = 'new series'
    b['b','c'] = 20 # b[['b','c']] = 20
    b
  • 相关阅读:
    报错:No module named 'ConfigParser'
    报错:AttributeError: module 'selenium.webdriver' has no attribute 'Chrome'
    报错:selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element:
    去掉“Chrome正在受到自动化测试软件的控制”
    XPath-Helper 的安装和使用
    Chrome您使用的是不受支持的命令行标记:--ignore-certificate-errors
    Message: unknown error: cannot get automation extension
    安装mysql-5.7.22-winx64中出现错误
    pip install 报错 Could not fetch URL
    Spring Boot 报错:Error creating bean with name 'entityManagerFactory' defined in class path resource
  • 原文地址:https://www.cnblogs.com/yoyo1216/p/10131710.html
Copyright © 2011-2022 走看看