TensorFlow2_200729系列---4、手写数字识别理论
一、总结
一句话总结:
手写识别数字中,最开始由784(28*28)维降到最后输出的10(10类输出)维,每一层神经网络降一次维
1、p(y=1|x)=0.8表示什么意思:out:[0.1,0.8,0.02,0.08]?
在x的条件下,y=1(也就是y是索引为1那号物品)的概率是0.8
2、手写识别数字中,输出肯定是10个数字,所以对应输出肯定是10类,而手写的图片是28*28,那么怎么构建线性模型中的w和b?
A、out = x@w+b
B、X:[b, 784] W:[784, 10] b:[10]
C、out:[b, 10]
3、手写识别数字中,怎么由784(28*28)维降到10(10类输出)?
a、不断降维,线性相乘的过程也就是不断降维的过程out = x@w+b(B、X:[b, 784] W:[784, 10] b:[10] )
b、经过多次,就可以降到10维了,h1 = relu(x@w+b),h2 = relu(h1@w2 + b)
4、MSE(mean-square error)?
均方误差,就是最小二乘法那个类似的公式
二、手写数字识别理论
转自或参考: