    Data augmentation via hand-crafted rules is usually used as pre-processing in FSL methods.
    They can introduce different kinds of invariance for the model to capture. For example, on images, one can use translation [12, 76, 114, 119], flipping [103, 119], shearing [119], scaling [76, 160], reflection [34, 72], cropping [103, 160] and rotation [114, 138].


    因此manual data augmentation 不能完全解决FSL问题。

    还有一些数据增强方式依赖于样本是如何转化和添加到训练集的。我们把他们分类在Table 3当中。


    01 Transforming Samples from Dtrain

    这个策略通过转换训练集中原有的((x_i,y_i))为多个样本来增加训练集(D_{train}). 转换过程作为先验知识包含在经验E中,以便生成其他样本。

    02 Transforming Samples from a Weakly Labeled or Unlabeled Data Set


    03 Transforming Samples from Similar Data Sets

    该策略通过汇总和改编来自相似但较大数据集的输入输出对来增强(D_{train})。 聚集权重通常基于样本之间的某种相似性度量。 在[133]中,它从辅助文本语料库中提取聚合权重[133]。 由于这些样本可能不是来自目标FSL类,因此直接将汇总样本增加到(D_{train})可能会产生误导。 因此,生成对抗网络(GAN)[46]被设计为从许多样本的数据集中生成不可区分的合成x [42]。 它有两个生成器,一个生成器将少拍类的样本映射到大规模类,另一个生成器将大规模类的样本映射到少数类(以弥补GAN训练中样本的不足) 。

    Discussion and Summary

    有时,针对目标任务(或类)存在大量弱监督或未标记的样本,但是由于收集注释数据和/或计算成本高昂(这对应于引入的第三种情况)。 在这种情况下,可以通过转换标记较弱或未标记的数据集中的样本来执行增强。 当难以收集大规模的未标记数据集,但few-shot类具有某些相似类时,可以从这些相似类中转换样本。 如果只有一些学习的转换器而不是原始样本可用,则可以通过转换训练集中的原始样本来进行扩充。

    总的来说,通过增强(D_{train})解决FSL问题非常简单明了, 即通过利用目标任务的先验信息来扩充数据。

    最近,AutoAugment [27]提出了自动学习用于深度网络训练的增强策略的来解决这个问题。 除此之外,因为生成的图像可以很容易地被人在视觉上评估,现有的方法主要是针对图像设计的。而文本和音频涉及语法和结构较难生成。 [144]报告了最近对文本使用数据增强的尝试。


