一 框架介绍

那么使用keras框架的Deep Learning 有什么感想呢,下边的一张图就很好的论证了

二 手写数字识别实例



这个时候告诉大家一个秘密,我们实际过程中并不会计算total loss 的最小值,而是将按照下边的方式进行



矩阵运算的加速:

当使用GPU时,下边所示的计算公式用 Mini-batch 比用Stochastic Gradient Descent时间快一倍。


参考:http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2017_2/Lecture/keras.pdf