可以通过.columns和.index着两个属性返回数据集的列索引和行索引
设data是pandas的一个DataFram类型的数据集。
则data.index返回一个index类型的行索引列表,data.index.values返回的是行索引组成的ndarray类型。
则data.columns返回一个index类型的列索引列表,data.columns.values返回的是列索引组成的ndarray类型。
下面是代码示例
1 import numpy as np 2 import matplotlib.pyplot as plt 3 import pandas as pd 4 from sklearn.preprocessing import StandardScaler 5 6 data = pd.read_csv("C:/学习/python/creditcard/creditcard.csv") 7 print(data.head()) 8 columns = data.columns 9 columns_value = columns.values 10 rows = data.index 11 rows_value = rows.values 12 print(type(columns), columns) 13 print(type(columns_value), columns_value) 14 print(type(rows), rows) 15 print(type(rows_value), rows_value)
运行结果如下
这里columns虽然是Index类型,但是columns != "Class"执行后,返回的是ndarray类型,元素是由“True"和"False"组成。所以可以根据这个语句找出数据集
中的指定行和列。