zoukankan      html  css  js  c++  java
  • 05-训练数据不足的影响及处理方式

      一个模型所能提供的信息一般来源于2个方面,一是训练数据中蕴含的信息,二是在模型的形成过程中(包括构造,学习,推理等),人们提供的先验信息。当训练数据不足时,说明模型从原始数据中获取的信息比较少,这种情况下要保证模型的效果,就需要更多的先验信息。先验信息可以作用在模型上,例如让模型采用特定的内在结构,条件假设或添加其他一些约束条件;先验信息也可以直接作用在数据集上,即根据特定的先验假设去调整,变换或扩展训练数据,让其展现出更多的,更有用的信息,以利于后续模型的训练和学习。

    在图像分类任务中,训练数据不足会带来什么问题?

      具体到分类任务上,训练数据不足带来的问题主要体现在过拟合方面。即模型在训练样本上的效果可能不错,但在测试数据集上泛化效果不佳。

    如何缓解数据量不足带来的问题?

      一是基于模型的方法,主要是采用降低过拟合风险的措施,包括简化模型 , (将非线性模型简化为线性模型),添加约束项以缩小假设空间(L1/L2正则项),集成学习,Dropout超参数等。

      二是基于数据的方法:主要通过数据扩充,即根据一些先验知识,在保持特定信息的前提下,对原始数据进行适当变换以达到扩充数据集的效果。

    具体到图像分类任务重,在保持图像类别不变的前提下,可以对训练集中每幅图像进行以下变换。

      1. 一定程度内的随机旋转,平移,缩放,裁剪,填充,左右翻转等,这些变换对应着同一个目标在不同角度的观察结果。

      2. 对图像中像素添加噪声扰动,比如椒盐噪声,高斯白噪声。

      3. 颜色变换。例如在RGB颜色空间上进行主成分分析,得到3个主成分特征向量p1,p2,p3.及其对应的特征值,然后再么给像素的RGB值上添加增量。

      4. 改变图像的亮度,清晰度,对比度,锐度。

      除了直接在图像空间进行变换,还可以先对图像进行特征提取 ,然后再图像的特征空间内进行变换,利用一些通用的数据扩充或上采样技术,例如SMOTE算法。

      抛开上诉这些启发式变化方法,使用生成模型也可以合成一些新样本,例如非常流行的生成式对抗网络模型。

      此外 借助已有的其他模型或数据进行迁移学习在深度学习中也十分常见。例如,对大部分的图像进行分类任务,并不需要从头开始训练模型,而是借用一个在大规模数据集上预训练好的通用模型,并在针对目标任务的小数据集上进行微调,这种微调操作也可以看作一种简单的迁移学习。

  • 相关阅读:
    Java中break和continue跳出指定循环
    Linux命令对应英文全称
    linux 使用 rz 和 sz 命令
    linux tail命令的使用方法详解
    Linux常用命令大全(非常全!!!)
    正则 函数
    行级锁 java||数据库
    mysql插入操作跳过(ignore)、覆盖(replace into)、更新(on duplicate key)
    MYSQL 常用【函数】大全
    MySQL中INFORMATION_SCHEMA
  • 原文地址:https://www.cnblogs.com/zhaopengpeng/p/15515199.html
Copyright © 2011-2022 走看看