用于短视频分类及视频特征提取。
聚合视频帧级别图像特征; 减少NetVLAD网络参数。
NeXtVLAD论文
NeXtVLAD与NetVLAD类似,也是一种图像特征编码,可以用于很好的提取视频帧级别的特征。其在NetVLAD的基础上,通过分组的思想来较少最后一层全连接层的参数,从而减少网络的计算复杂度。该网络可以视为视频处理领域的通过网络结构,可以很好的融合多种模态信息。