神经网络解决多类分类问题的本质是把原分类问题分解为一类对其他类(one-vs-all)的二类分类问题
在二分类中要把标签设置为(0,1),在多分类问题中要把标签设置为ont-hot标签,也就是(0,0,1,0)此类的格式,1表示属于某个类。
分类和回归的损失函数:
分类二分类采用binary_crossentropy,最后一层激活函数选择sigmoid,
优点:
1.Sigmoid函数的输出映射在(0,1)之间,单调连续,输出范围有限,优化稳定,可以用作输出层。
2.求导容易。
缺点:
1.由于其软饱和性,容易产生梯度消失,导致训练出现问题。
2.其输出并不是以0为中心的。
函数图如下:
多分类采用交叉熵,categorical_crossentropy,最后一层激活函数选择softmax
多分类代码可以参考这篇博客的:
https://www.cnblogs.com/arkenstone/p/5943489.html?utm_source=itdadao&utm_medium=referral
回归问题采用mean_squared_error(一般情况),与分类问题不同,回归问题解决的是对具体数值的预测。
这些问题需要预测的不是一个事先定义好的类别,而是一个任意实数。解决回归问题的神经网络一般只有一个输出节点,这个节点的输出值是预测值。