1. https://zhuanlan.zhihu.com/p/54073204(简单理解)
2. https://zhuanlan.zhihu.com/p/34879333 (有举例说明,但是不太理解。)
3. https://zhuanlan.zhihu.com/p/61725100 (关于BN,每一批数据的均值和方差均会有一定的差别,而不是用固定值,这个差别会增加模型的鲁棒性,在一定程度上减少过拟合。)
图 batch_norm, layer_norm, instance_norm, group_norm的可视化理解