总结一下就是在提升偏差的方面(即贝叶斯最优误差和训练误差的差距)
1、尝试更大更深的网络
2、加入优化算法比如前面提过的momentum、RMSprop、Adam等
3、使用别的神经网络架构比如RNN/CNN等等
在提升方差的方面(即训练误差和测试误差的差距)
1、加大训练集的样本数量
2、正则化操作,如L2、dropout、Data Augmentatio数据扩增、early stop等