zoukankan      html  css  js  c++  java
  • 大二机器学习算法工程师实习生面经

    投了近20家大厂,由于才大二,简历内容也不算丰富,所以大多数在简历关就挂了.得到笔试机会的有网易,今日头条,百词斩.

    百词斩(一面挂)

    一面:

    1. 平时如何学习相关知识.
    2. 项目经历.
    3. 讲一个最喜欢的机器学习算法.我答了神经网络.
    4. 为什么神经网络的激励函数要用非线性的.没有回答出来.正确答案是线性函数叠加仍是线性函数,非线性函数才能起到层与层之间的变化.
    5. 了解决策树吗,决策树划分结点的方法有哪些.
    6. 详细解释信息增益.
    7. 什么是过拟合?如何防止过拟合?
    8. 讲讲KNN和K-Means的不同.
    9. K-Means一般如何选取K值和初始质心.选取K值应该讲到平均轮廓系数,答得不好.
    10. 一般怎么做交叉验证.
    11. 百词斩题库中有很多阅读题,现在如何判断新出的题目和已有题目的相似度.我的回答是用词袋向量计算夹角余弦值.
    12. 有监督学习和无监督学习的区别是什么.

    总共持续了半小时左右,面试官比较和蔼.由于恰好感冒所以问题回答的都不大好.

    今日头条(二面挂)

    一面:

    1. 手写代码:旋转有序数组的二分查找,磕磕绊绊写出来了
    2. 项目经历
    3. 了解哪些机器学习算法

    二面:

    1. 项目经历
    2. 了解集成学习吗,讲讲bagging和boosting
    3. 随机森林
    4. GBDT
    5. 如果单棵决策树在数据集上的表现很差,还要尝试随机森林吗
    6. 知道哪些分类和回归的算法
    7. 分类和回归常用的损失函数
    8. 手写代码:有20000个词频,如何选出前100个高频词.因为正好看了堆排序就按堆排序的思路答了,但是面试官说20000其实是一个不大的数据量,直接用sort()排序就可以了.
    9. 手写代码:有两个二叉树节点,如何找到他们的最近公共子节点.因为对数据结构有些生疏,最后在面试官提示下才回答上来.

    总结

    不同公司侧重点很不一样,比如百词斩问了很多机器学习基础知识的问题,头条则很注重算法.共同点是项目经历非常重要.通过这次经历看出自己还是有很多知识漏洞的,接下来的学习重点是多参加比赛,多实践,还有了解常用的算法与数据结构.

  • 相关阅读:
    group by 详解
    NHibernte教程(10)--关联查询
    NHibernate教程(9)一1对n关联映射
    NHibernate教程(8)--巧用组件
    NHibernate教程(7)--并发控制
    Git初步配置 ubuntu服务器 windows客户端 虚拟机
    设计模式之GOF23状态模式
    设计模式之GOF23模板模式
    设计模式之GOF23策略
    设计模式之GOF23访问者模式
  • 原文地址:https://www.cnblogs.com/limitlessun/p/8747842.html
Copyright © 2011-2022 走看看