zoukankan      html  css  js  c++  java
  • 一份深度学习相关的面试题

    1、请计算数组[1,2,3]中的元素3的Softmax值

    假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的Softmax值就是

    S_i = frac{e^{V_i}}{sum_j{e^{V_j}}}

    也就是说,是该元素的指数,与所有元素指数和的比值

    2、什么是过拟合? 防止过拟合有哪些措施?

    3、对于二分类问题,分别描述逻辑回归、朴素贝叶斯、KNN算法。它们的优劣势是什么?他们自身有什么过拟合的能力? 

    4、支持向量机SVM中支持向量是什么? 这个模型的优劣势有哪些? 模型自身怎么防止过拟合?如何求解(不需要推导过程,只需要写推导思路) , 支持向量核函数的作用及常见的核函数形式?

    5、什么是集成学习? 什么情况下集成学习学习器能够获得较好的泛华性能?

    6、神经网络中常用的激活函数有哪些?如果采用线性激活函数,网络会变成怎样?神经网络的梯度消失和梯度爆炸是什么原因?有哪些神经网络的优化算法?

    7、请解释drop和batch normalization的原理?

    8、训练神经网络时,一般需要调整哪些超参数?这些超参数对训练过程会有哪些影响?

    9、请描述PCA算法的作用。使用哪些场景和数据?使用时需要注意哪些问题? 该算法有哪些实现的形式?

    10、有哪些常见的数据预处理、特征工程、特征筛选的方法?

    11、准确率、查准率(精准率)P、查全率(召回率)R 计算:

      准确率(accuracy) = 预测对的/所有 = (TP+TN)/(TP+FN+FP+TN)
      精确率(precision) = TP/(TP+FP)
      召回率(recall) = TP/(TP+FN)

  • 相关阅读:
    Attention中的qkv与机器翻译中的对应关系
    numpy.copy和torch.tensor的cpu/gpu
    F1值的优化macro
    py中函数是传值还是传引用
    scipy.optimize.minimize||非线性规划
    离散label的优化trick
    python Queue/collections.deque
    tf.pad学习
    tensor2tensor-transformer源码学习
    最早的attention论文学习-通过联合学习进行对齐和翻译的神经机器翻译
  • 原文地址:https://www.cnblogs.com/llfctt/p/9572854.html
Copyright © 2011-2022 走看看