https://zhuanlan.zhihu.com/p/39076763
https://zhuanlan.zhihu.com/p/40175178
https://zhuanlan.zhihu.com/p/27919794 (xavier的公式推导,有些地方没看明白,主要思想是输入与输出的方差相等,由此推导出的权重取值,对于normal来说,在权重W的stddev上做文章)
https://blog.csdn.net/huigougou/article/details/84996680 (tensorflow中的conv2d中xavier,he initializer的用法)
https://cloud.tencent.com/developer/article/1437995
https://zhuanlan.zhihu.com/p/57454669(言有三)