zoukankan      html  css  js  c++  java
  • 【转载】 机器学习算法岗的常见面试问题及准备

    原文地址:

    https://blog.csdn.net/weixin_40411446/article/details/80398641

    作者:诶呀吗_Bug 
    来源:CSDN 

    2018年05月21日 21:54:23

    -----------------------------------------------------------------------------------------------

    机器学习常见问题

    1) 几种模型( SVM,LR,GBDT,EM )的原理以及公式推导; 
    2) RF,GBDT 的区别; GBDT,XgBoost的区别(烂大街的问题最好从底层原理去分析回答); 
    3) 决策树处理连续值的方法; 
    4) 特征选择的方法; 
    5) 过拟合的解决方法; 
    6) K-means 的原理,优缺点以及改进; 
    7) 常见分类模型( SVM ,决策树,贝叶斯等)的优缺点,适用场景以及如何选型; 
    8) SVM 为啥要引入拉格朗日的优化方法; 
    9) 假设面试官什么都不懂,详细解释 CNN 的原理; 
    10) 梯度下降的优缺点 
    11) EM与K-means的关系; 
    12) L1与L2的作用,区别以及如何解决L1求导困难; 
    13) 如何用尽可能少的样本训练模型同时又保证模型的性能; 
    14) ID3和C4.5的优缺点,树的融合(RF和GBDT) 
    15) 特征提取方法,如何判断特征是否重要 
    16) BP神经网络以及推导 
    17) HMM模型状态推导 
    18) 过拟合原因以及解决办法(深度学习同) 
    19) 常见损失函数 
    20)机器学习性能评价,准确率,召回率,ROC 
    22)降采样,PCA,LDA

    深度学习常见问题

    1)四种激活函数区别和作用 
    2)过拟合解决方法 
    3)(CNN)卷及神经网络各层作用 
    4)(RNN)循环神经网络 
    5)LSTM 
    6)梯度弥散 
    7)优化算法 adam,SGD等 
    8)分析Alexnet,VGG的网络结构以及各层作用 
    9)XgBoost(好像很多公司也面到了) 
    10)梯度下降的优化 
    12)卷积核参数计算

    算法工程师面试必备

    1. 成为算法工程师,应该学习哪些东西

    首先说算法工程师有几个方向:NLP,推荐,CV,深度学习,然后结合公司业务做得内容各不相同

    传统机器学习算法:感知机,SVM,LR,softmax,Kmeans,DBSCAN,决策树(CART,ID3,C45),GBDT,RF,Adaboost,xgboost,EM,BP神经网络,朴素贝叶斯,LDA,PCA,核函数,最大熵等

    深度学习:CNN,RNN,LSTM,常用激活函数,Adam等优化算法,梯度消失(爆炸)等

    推荐系统:itemBasedCF,userBasedCF,冷启动,SVD(各种变形),FM,LFM等

    NLP:TF-IDF,textrank,word2vec(能推导,看过源码),LCA,simhash

    常见概念:最大似然估计,最小二乘法,模型融合方法,L1L2正则(Lasso,elestic net),判别式模型与生成式模型,熵-交叉熵-KL散度,数据归一化,最优化方法(梯度下降,牛顿法,共轭梯度法),无偏估计,F1(ROC,recall,precision等),交叉验证,bias-variance-tradeoff,皮尔逊系数,

    概率论,高数,线性代数(像我一样懒的人,就可以遇到哪里复习哪里,:D)

    常见问题(具体答案去搜知乎或者百度,最好能在实际项目中总结出来):

    常见损失函数

    SGD与BGD

    如何处理样本非均衡问题

    过拟合原因,以及解决办法

    如何处理数据缺失问题

    如何选择特征

    L1为什么能让参数稀疏,L2为什么会让参数趋于较小值,L1优化方法

    各模型的优缺点,以及适用场景

    学明白上述所有内容你需要多长时间?反正我这么笨的人用了不到一年时间(我本科完全没接触过算法相关,完全是研一学的)

    2. 推荐书籍

    C++:《C++primer5》《STL源码分析》《深度探索C++对象模型》《Effective C++》《Effective STL》 (虽然有些书有点老,不过开卷有益吧)(其他语言就不管了哈)

    python:《python学习手册》《python源码分析》《改善python程序的91个建议》(Python必须要会)

    刷题:《编程之美》《剑指offer》《程序员代码面试指南》《leetcode》

    算法相关:《统计学习方法》(这本多看)《数据挖掘导论》《数学之美》《田林轩视频》《吴恩达视频》《西瓜书》

    参考文献:机器学习面试总结(具体的问题我很早之前在简书上写过)

    ---------------------


  • 相关阅读:
    Verilog 浮点数运算模块
    【MATLAB】设定坐标的轴的范围
    【MATLAB】画平行于坐标轴的曲线
    【Quartus警告】created implicit net for XXX.
    多普勒雷达探测原理
    高斯分布和均匀分布之间的映射关系
    反射设置当前窗体所有控件的Text
    IAR6.1的工程迁移到IAR6.5不能用的解决方法
    C语言实现通用链表初步(二)
    C语言实现通用链表初步(一)
  • 原文地址:https://www.cnblogs.com/devilmaycry812839668/p/10860243.html
Copyright © 2011-2022 走看看