slides 见 http://cs231n.stanford.edu/2017/syllabus.html
neural Networks
1)
h 为 x W1 的 score matrix ,再作用于 max(0,)函数之后所得矩阵
2) assignment2
两层神经网络的 反向传播
3)激活函数