zoukankan      html  css  js  c++  java
  • 2019秋招——百度机器学习面经

    由于百度是秋招的时候面的,现在很多问题都记不住了,这里只写下我还记得的题目吧(当时太懒了,不想写了。。。):

    1.文本分类比赛用的什么模型?为什么?

    答:LR、SVM、XGBoost。。。

    问:最终选用了哪个?

    答:blabla。。。线性核的SVM

    问:为什么选线性核SVM?

    答:效果最好,特征数目远大于样本数目时,选线性核的SVM比较好。

    问:为什么?

    答:LR受全部样本的影响,SVM只受支持向量的影响。(感觉有些牵强)

    2.文本分类的数据是怎样的?类别标签是怎样的?

    答:blabla。。。

    3.LR多分类是怎么实现的?

    答:softmax层

    问:为什么用softmax层,而不用onevsall等多分类策略

    。。。不记得了

    4.SGD如何改进优化?

    答:这里我理解错了,实际上他是想问mini-batch梯度下降。

    5.推导带L1正则项的LR,以及如何进行优化的?

    答。。。

    6.gdbt和xgboost的区别?

    答:(经典面试题)。。。

    7.树模型、xgboost、gbdt哪个需要做特征归一化?

    。。。

    8.面对一个任务,如何选择模型?

    我感觉这里可以理解为模型的使用场景。。。

    9.LR和SVM的区别?

    答:(经典面试题)。。。

    10.过拟合的解决手段?

    。。。

    11.CNN、RNN、LSTM的原理?

    。。。

    12.书写下链表逆序?

    。。。。

    13.书写归并排序,并优化到空间复杂度为O(1)

    。。。双指针

    14.几种梯度下降法的区别?

    。。。

    15.Hadoop相关

  • 相关阅读:
    【转】[fix] Wireshark error: There are no interfaces on which a capture can be done. on Mac OS X
    【转载】Linux 文件系统的目录结构
    postgreSQL使用
    [转载] Linux启动过程详解-《别怕Linux编程》之八
    冒泡排序
    java值类型和引用类型
    冒泡排序法与二分查找法
    关系型数据库
    SQList的建表并添加数据练习
    数据存储——SQLite数据库存储
  • 原文地址:https://www.cnblogs.com/wangkundentisy/p/10575830.html
Copyright © 2011-2022 走看看