seaborn画热力图注意的几点问题

zoukankan html css js c++ java

seaborn画热力图注意的几点问题
最近在使用注意力机制实现文本分类，我们需要观察每一个样本中，模型的重心放在哪里了，就是观察到权重最大的token。这时我们需要使用热力图进行可视化。

我这里用到：seaborn

seaborn.heatmap

seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt='.2g', annotkws=None, linewidths=0, linecolor='white', cbar=True, cbarkws=None, cbar_ax=None, square=False, ax=None, xticklabels=True, yticklabels=True, mask=None, **kwargs)
- data：矩阵数据集，可以使numpy的数组（array），如果是pandas的dataframe，则df的index/column信息会分别对应到heatmap的columns和rows
- linewidths,热力图矩阵之间的间隔大小
- vmax,vmin, 图例中最大值和最小值的显示值，没有该参数时默认不显示
data就是我们注意力矩阵的数据。注意，由于注意力的整理数值都偏小，直接使用数据显示的效果难以区分，我们可以将其放大100倍后来获取更加的效果。先上代码吧！
fr = open('./pkl/attention_matrix.pkl', 'rb') tokens, attention = pickle.load(fr) plt.figure(figsize=(30,20)) sns.heatmap(attention, vamx=100, vmin=0) plt.savefig('./log/attention_matrix.png') # 获取数据 import heapq check_file = './log/check_attention_keywords.txt' clean(check_file) fw = open(check_file, 'a', encoding='utf8') for t, a in zip(tokens, attention): temp = [] max_num_index_list = map(list(a).index, heapq.nlargest(5, list(a)) for index in max_num_index_list: word = t[index] print(word) temp.append(word) fw.write(str(temp)+' ')
　　我这里取出注意力值最大的前5个词拿出来看的
查看全文

相关阅读:
leetcode刷题笔记三十九组合总和
 leetcode刷题笔记三十八外观数列
 leetcode刷题笔记三十七解数独
 leetcode刷题笔记三十六有效的数独
 HTML5每日一练之input新增加的六种时间类型应用
 HTML5每日一练之input新增加的5种其他类型1种标签应用
 html5+css3中的background: -moz-linear-gradient 用法
 HTML5新标签解释及用法
 让IE浏览器支持CSS3圆角的方法
 纯CSS3实现的图片滑块程序，效果非常酷

原文地址：https://www.cnblogs.com/demo-deng/p/10375408.html