Deeper is Better?
是不是深度学习的Hidden layer越多越好,我们并不是单纯的研究参数增多的所带来的性能改善,我们关注的是相同的参数情况下,是不是深度越深越好。

Fat + Short v.s. Thin + Tall


那么是什么样的原因出现上边的情况呢?一个合理的解释就是Modularization。




Deep learning

Modularization把本来复杂的问题变简单,即使training data没那么多也能有较好的performance ,所以deep learning相对所需的data较少。


注:是所有的连续函数,不是指任何一个函数!!!
Analogy
用逻辑电路的表示和神经网络做对比。


用剪窗花做类比


End-to-end Learning

End-to-end Learning- Speech Recognition


End-to-end Learning - Image Recognition


Complex Task




参考:
https://blog.csdn.net/soulmeetliang/article/details/73196259
http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2017/Lecture/Why.pdf