深度学习岗位面试题

zoukankan html css js c++ java

深度学习岗位面试题

1: LSTM结构推导，为什么比RNN好？
答案：推导forget gate，input gate，cell state， hidden information等的变化；因为LSTM有进有出且当前的cell informaton是通过input gate控制之后叠加的，RNN是叠乘，因此LSTM可以防止梯度消失或者爆炸；

2：梯度消失爆炸为什么？
答案：略

3：为什么你用的autoencoder比LSTM好？
答案：我说主要还是随机化word embedding的问题，autoencoder的句子表示方法是词袋方法，虽然丢失顺序但是保留物理意义；（?）

4: overfitting怎么解决：
答案：dropout， regularization， batch normalizatin；

5：dropout为什么解决overfitting，L1和L2 regularization原理，为什么L1 regularization可以使参数优化到0， batch normalizatin为什么可以防止梯度消失爆炸；
答案：略
6: 模型欠拟合的解决方法：
答案：我就说到了curriculum learning里面的sample reweight和增加模型复杂度；还有一些特征工程；然后问了常用的特征工程的方法；

7：（简历里面写了VAE和GAN还有RL，牛逼吹大了）VAE和GAN的共同点是什么，解释一下GAN或者强化学习如何引用到你工作里面的；
答案：略

传统机器学习
1：SVM的dual problem推导；
2：random forest的算法描述+bias和variance的分解公式；
3：HMM和CRF的本质区别；
4：频率学派和贝叶斯派的本质区别；
5：常用的优化方法；
6: 矩阵行列式的物理意义（行列式就是矩阵对应的线性变换对空间的拉伸程度的度量，或者说物体经过变换前后的体积比）

查看全文

相关阅读:
python线程的几种创建方式
 python进程之间的通信——Queue
python中进程的几种创建方式
 python中的生成器、迭代器、闭包、装饰器
 java中String和StringBuffer的区别
 python中的元类介绍
 宣传片制作技巧
 树莓派创建WiFi热点
 PCB布线要求
 jsoncpp linux平台编译和arm移植

原文地址：https://www.cnblogs.com/LarryGates/p/7230043.html