初步了解autoencoder
什么是autoencoder?
自编码(autoencoder)是一种神经网络的形式。
例子:一张图片->对其进行打码->最后再将其还原
压缩的时候,图片的质量会缩减,解压还原的时候用信息量小却包含了关键信息的文件来还原出原来的图片。
使用自编码的原因?
神经网络接受大量信息进而学习是一件吃力的事情,所以为了让神经网络的负担没有那么重,所以要从原有信息中提取最有代表性的信息,相当于压缩原有的信息,进而减少信息的输入量,这样学习起来会轻松得多。
自编码是怎样学习的?
- 通过将原数据白色的X 压缩, 解压 成黑色的X
- 然后通过对比黑白 X ,求出预测误差
- 进行反向传递, 逐步提升自编码的准确性
为什么自编码是非监督学习?
训练好的自编码中间这一部分就是能总结原数据的精髓.
可以看出, 从头到尾, 我们只用到了输入数据 X, 并没有用到 X 对应的数据标签(目标值), 所以也可以说自编码是一种非监督学习. 到了真正使用自编码的时候. 通常只会用到自编码前半部分.
编码器(encoder)
编码器可以得到原来数据的精髓。如何使用这些精髓的数据?只需要再创建一个神经网络学习这些精髓的数据就可以减少神经网络的负担,并达到很好的效果。
解码器(decoder)
解码器在训练的时候是要将精髓信息解压成原始信息, 那么这就提供了一个解压器的作用。