2017 经典的CVPR 关于ImageCaptioning论文 - 走看看

zoukankan html css js c++ java

2017 经典的CVPR 关于ImageCaptioning论文

1. SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning(2017 CVPR)

主要研究方向：大多数现有的基于注意力的图像字幕模型只考虑了空间特征，本文是对同一层的feature map（特征图）加入了权重考虑。

2. Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning(2017 CVPR)

主要研究内容：更多的关注实体词之间的连词，比如“of”等。

解决思路：在框架中加入一个哨兵门，能够决定在生成实体词的时候应该注意图片，在生成连接词的时候，应该关注于语言。

Most methods force visual attention to be active for every generated word. However, the decoder likely requires little to no visual information from the image to predict non-visual words such as “the” and “of”.

查看全文

相关阅读:
JavaScript坑
 maven学习
 JAVA多线程和并发基础面试问答(转)
Redis与Memcached的区别(一)
poi生成execl综合
 POI操作Excel常用方法总结(转)
java中在创建对象时候的初始化顺序
 [Java Web]敏感词过滤算法
 orcle导入导出
 js动态时间

原文地址：https://www.cnblogs.com/AntonioSu/p/12080110.html

Copyright © 2011-2022 走看看