1.美团
一面:
1)一个数组,给出一个值m,用最快的速度找出数组中两个数和为m的数。
2)标准差和方差区别
3)相似度,相关度,距离
4)平时遇到的问题,遇到问题怎么办,平时怎么学习的,学的最好的一门课程,怎么学的。
5)有什么需要问的。
2.CVTE ----2017年9月14日(中央研究院-数据挖掘)
一面:
1)介绍研究生工作,就项目提问。
2)说下最熟悉的机器学习算法,我说kmeans,然后让解释什么是K-means
3)解释下kmeans和dbscan的关系
4)决策树属于判别模型还是生成模型?朴素贝叶斯呢?
6)dropout层有什么作用
7)决策树中ID3、C4.5、Cart有什么区别?
8)随机森林相关的问题,忘了具体怎么问的,我不会
3.链家-----2017年9月15日(数据挖掘)
一开始来一个小时的现场笔试,五道题:redo和undo简单介绍;两棵树的最近公共子节点;取球问题;算法思路和复杂度的题,具体忘了;
1).自我介绍,就提到的项目提问
2).距离计算方法有哪些? (欧氏距离;曼哈顿距离,即两个坐标差值的绝对值之和;夹角余弦距离;相关距离,根据相关系数理论来的)
3).特征工程做过吗?(将数据属性转化为数据特征的过程,属性代表了数据的所有维度,在数据建模时,如果对原始数据的所有属性进行学习,并不能很好的找到数据的潜在趋势,而通过特征工程对数据进行预处理,使用的算法模型能够减少受到噪音的干扰,这样能更好地找到趋势。事实上,好的特征甚至能帮助使用简单的模型达到很好的效果)
4).讲讲随机森林和gbdt
5).手写一个MapReduce程序
6)。手写一个查找两个树是否结构和值一样。(面试官最开始希望看到递归的做法,最后他们透露的)
7)、kmeans和dbscan区别
8).激励函数sigmoid(只有正激励,有区间),tanh(有正负激励,有区间),relu区别
9)baging和boosting区别
特征工程常用方法:
4.腾讯-----2017年9月22日
一面:
1)自我介绍,对项目提问
2)有序数组,输出连续出现次数大于K的所有数
3)真的忘记了
5.顺丰----207年9月23日
一面:
1)自我介绍,各种问项目
2)介绍下CNN
3)介绍LSTM,LSTM与RNN区别,现场画
4)如何防止过拟合
5)激活函数有哪些?什么作用
6)会用Python吗?用过哪些包? --TensorFlow,karas,sklearn等
7)介绍Apriori算法,结合我的项目来说
8)还用过哪些机器学习算法?
9)你的优点是什么?
hr面:(不愉快的面试)
1)自我介绍,简单问了下项目
2)最大优点是什么?你有别人没有的
3)有什么要问的?
6.华为-----2017年9月26
1)Java容器有哪些
2)数据正负样本不平衡怎么解决
3)如何处理数据异常值或者确实值
4)如何做特征选择
5)又不记得了。。。
几个经典问题整理:
1)请说一下PCA原理
2)解释一下SVM核函数的定义与意义
3)阐述一下L1正则和L2正则的区别
4)LR可以作为线性分类器吗?