1、加载数据
和折线图一样,我们首先都要将csv文件中的数据加载出来(代码是来自kaggle微教程中的)
# Path of the file to read flight_filepath = "../input/flight_delays.csv" # Read the file into a variable flight_data flight_data = pd.read_csv(flight_filepath, index_col="Month")
你们可能会注意到,代码比我们在折线图中使用的代码略短。因为在本例中,由于行标签(来自“Month”列)不与日期对应,所以我们不在括号中添加parse_dates=True。
但是,我们像以前一样保留前两段文本,以便同时提供这两段:
数据集的文件路径(在本例中为flight_filepath)和将用于索引行的列的名称(在本例中,index_col="Month")
2、检查数据
print(flight_data)
3、条形图
# 设置长度和宽度 plt.figure(figsize=(10,6)) # 添加条形图的标签 plt.title("Average Arrival Delay for Spirit Airlines Flights, by Month") # 标注X轴和Y轴的数据名 sns.barplot(x=flight_data.index, y=flight_data['NK']) # 添加垂直轴的标签 plt.ylabel("Arrival delay (in minutes)")
第三行代码解析:
它有三个主要组成部分:
sns.barplot就是要告诉笔记本我们想要创建一个条形图。请记住,sns引用seaborn包,本课程中用于创建图表的所有命令都以这个前缀开始。
x = flight_data.index—这决定在水平轴上使用什么。在本例中,我们选择了索引行的列(在本例中,是包含月份的列)。
y=flight_data['NK'] -设置数据中的列,用于确定每个栏的高度。在本例中,我们选择“NK”列。
注意:必须选择索引列flight_data。索引,并且不可能使用flight_data['Month'](它将返回一个错误)。
这是因为当我们加载数据集时,“Month”列用于索引行。我们总是必须使用这种特殊的符号来选择索引列。
4、热图
#设置图形的宽度和高度 plt.figure(figsize=(14,7)) # 添加标签 plt.title("Average Arrival Delay for Each Airline, by Month") # 热图显示了每个航空公司平均每个月的到达延迟 sns.heatmap(data=flight_data, annot=True) # 添加水平轴的标签 plt.xlabel("Airline")
第三行代码解析:
该代码有三个主要组件:
sns.heatmap就是告诉笔记本,我们想创建一个热图。
data=flight_data——这告诉笔记本使用flight_data中的所有条目来创建热图。
annot=True——这确保每个单元格的值都出现在图表上。(省略这一项将删除每个单元格中的数字!)