重新索引
索引对象是无法进行修改的,重新索引并不是给索引重新命名,而是对索引重新排序
Series重新排序后的索引
填充缺失值(method参数实现,ffill为向前填充,bfill为向后填充)
DataFrame重新索引行
DataFrame重新索引列
reindex函数参数
index |
用于索引新序列 |
method |
填充缺失值的方法 |
fill_value |
缺失值替代值 |
limit |
最大填充量 |
更换索引
DataFrame中将列数据作为行索引(set_index)
DataFrame中恢复默认的行索引(reset_index)
DataFrame中排序改变行索引(sort_values)
DataFrame删除原索引(drop)
索引和选取
Series可以通过0-N-1(N是数据长度)来进行索引,也可以通过设置的索引标签来进行索引
DataFrame选取列
通过列索引标签或以属性的方式可以单独获取DataFrame的列数据,返回的数据为Series结构
选取单独列
选取多列
DataFrame选取行
通过行索引标签或行索引位置(0到N-1)的切片形式可选取DataFrame的行数据
loc方法可以按行索引标签选取数据
iloc方法可以按行索引位置选取数据
DataFrame选取行和列
ix方法同时支持索引标签和索引位置来进行数据的部分选取
布尔选择
为了筛选出某些有共同特征的数据,可以使用布尔选择
操作行和列
增加
如果需要在原有数据的基础上增加一行数据,可以通过append函数传入字典结构数据即可
为一个不存在的列赋值,即可创建一个新列,如果要新增的列中的数值不一样时,可以传入列表或数据结构数据进行赋值
删除
可以通过drop方法删除指定轴上的信息
修改
这里的 ” 改 ” 指的是行和列索引标签的修改,通过rename函数,可完成由于某些原因导致的标签录入错误的问题