面试真题 - 走看看

zoukankan html css js c++ java

面试真题

一.互联网公司

阿里系的高德地图，优酷，斑马，饿了吗

高德地图：

1.segnet原理？还知道哪些分割网络？segnet为什么这么设计?相较其它网络有什么优势？有其它类似这种对称结构设计的网络吗？

2.ssd的原理，其它目标检测网络有了解吗？有做过对比吗？ssd为什么快？

3.最新的目标检测网络有了解吗？

4.项目中怎么解决误检的问题？实际产品中怎么评价模型？注重召回率还是准确率？

5.车牌定位为什么分两步？为什么不设计一个检测小目标较好的网络？如果让你设计一个你会怎么做？

6.说一下项目中遇到的困难，你是怎么解决的？

7.项目中承担的职责是？

8.为什么来北京？跳槽为什么这么频繁？

9后期维护这么耗费人力，为什么不做成通用模块？

10.code:给一个一维无序数组，里面有N个正整数，如何快速找出里面重复的数字？给出时间复杂度和空间复杂度。

优酷：

具体问题忘记了，只记得几个

1.dropout原理，能从物理学的角度去解释下吗，测试和训练的时候有区别吗？

测试和训练的那个细节区分当时忘记了，面试官就直接github上拉了caffe的代码下来让我看，然后给他讲

2.code:

2.1卷积实现，可以用传统的图像卷积，也可以用im2col

2.2给一个字符数组，和一个无限大的buffer，从字符数组中删除指定模式的字符串，要求时间复杂度为O(n)

斑马：

笔试，1个小时内选4道题做完，基本是链表，动态规划等

面试：

1.resnet基本结构，这种结构的设计思想，优点，解决了深度学习中哪些难题？

2.ssd anchorbox 的机制？所有boundingbox都参与训练吗？怎么决定哪个boundingbox参与训练？

3.lstm基本结构，怎么做识别的，每个切块怎么决定其属于哪个类别？会不会出现一个字符被切了N刀，然后N个结果不同？如果会，怎么解决？

4.segnet的结构？有什么优缺点？用的基网络是什么？pspnet多尺度融合具体怎么做的？

5.所有项目中认为做过的最好的是？解决了什么问题？遇到的最困难的项目是？怎么解决的？

6.我们现在做的ADAS,受限于车载芯片，更多用传统算法做，能接受吗？有兴趣做吗？

7.车牌识别中不同姿态不同背景不同长度的问题怎么解决？遇到曝光模糊的问题怎么解决？

还问了很多传统图像算法，因为跟上气合作，车载硬件资源有限，很多东西要用传统算法做，问有没有兴趣做传统图像等等

饿了吗

1.电话面试

具体项目问了问

然后问了问深度学习，机器学习相关知识

2.现场面试

原理题都忘记了，基本都是针对目标检测网络，代码如下

面试官1“：

笔试 c++ 三道题

1）二维矩阵行列方向都是递增的然后判断某个值是否存在

2）字符查找相关的，我说用字典，面试官让我自己写个字典，我说只记得hashmap原理，自己设计散列函数不行忘记了

3）忘了。。。。

2.面试官写了一段c风格字符串转化成string的代码然后让我判断是否有错？

3.问了下float class int 等变量在内存中如何分配的，如何排列能高效利用内存。

4.c++多态怎么实现的？虚表里的指针都存放在哪里？类的实例共用虚表吗？

面试官2：

理论问了问机器学习的算法，svm，贝叶斯分类,adaboost等等

代码题：

1.输出二叉树每一层级节点中的最大值

面试官3：

1.ssd anchorbox机制，为什么这么设置？

2.如果我检测自然场景下的文字，可能有多方向的，如何修改ssd? defaultbox需要修改吗？iou规则计算需要修改吗？

3. 写下NMS代码

4.写下IOU计算的代码

面试官4（经理）：

1.项目介绍

2.问了几个外卖机器人目前遇到的问题，比如碰到玻璃了激光雷达接收不到反射信号怎么解决之类的问题。

今日头条—懂车帝业务部门

1.adaboost,gbrt的原理？loss函数是什么？

2.adaboost怎么级联弱分类器的？

3.sift,hog,harr的原理？sift为什么对旋转不敏感？

4.表格识别时，如果倾斜了怎么办？如果倾斜90°怎么办？

5.ssd的原理？

6.segnet的原理是？其他主流的分割网络有哪些？网络结构？

7.给你一张图片，一个亿级的图片库，搜索出最相似的图片，怎么做？

8.svm的原理是什么？怎么推到的？怎么求解的？高效求解算法？

9.防止过拟合的手段?原理是？

10.attention机制？有考虑过在现有的模型中引入attention吗？会有什么益处？

11.code:

给一个二维矩阵，搜索出一条递增的最大路径。即每个相邻的元素必须满足，Xt+1=Xt +1.

hr面：

1.为什么来北京？

2.之前一直做的车辆相关的项目吗？

3.之前公司的规模多大？

4.为什么转行？都面了哪些公司？

5.选择公司的标准是什么？

今日头条AIlab交叉面试（8.3下午）

1.项目介绍

2.网络有做过什么改进？

3.车牌识别用segnet和lstm哪个更快？

4.所有模块显存消耗？

5.线程和进程有什么区别？

6.caffe为什么不支持多线程？线程锁用什么加的，用的哪个接口？

7.你了解的排序算法有哪些，时间复杂度多少？

8.code:

写个简单的二分查找，分析时间复杂度

总结：

提问阶段问了下招人标准（因为已经放弃了，所以随便问了），实际上如果有顶会论文，或者网络方面做过创新性改进工作，编程，操作系统方面的要求可以放低，但如果没有，这些必须过关。。。

实际上他们更关注的是模型效率，以及解决问题方案的效率，如果效率低下，方案是肯定不会被采纳的。

陌陌（7.24下午）

1.关于ocr文字定位的问题：

1.1直线怎么检测的？

1.2 二值化用的什么方法？知道大津法（ostu）的原理吗?怎么去噪的？

1.3如果直线倾斜了，形态学方法失效怎么做？

1.4怎么旋转图像的？

1.5 计算旋转矩阵选的基准点是哪里？最少选几个？图像旋转的原理？

1.6旋转矩阵求出来后，如果新坐标系下坐标不是整数怎么办？

插值

1.7插值具体原理？最近邻的像素点选取规则？双线性插值像素点选取规则？

2.知道图像处理中比较有名的特征提取方法的原理吗？比如sift ,hog,lbp等？

3.边缘检测用的什么方法？

4.人脸特征点用的什么方法？用过什么机器学习方法？SVM的原理知道吗？

5.resnet的结构是什么？为什么这么设计？

6.SSD做了哪些裁剪以及加速？
7.SSD为什么输入图片是固定的300*300？

8.为什么大部分分类网络的图片尺寸为啥是固定的？比如都是224*224或320*320？

9.简述ssd,segnet网络结构。

10.简述翻卷积原理。

11.batch norm作用？

12.ssd怎么学习多个aspect_ratio的类别以及offset的？不同特征层上做class分类以及offset回归用的卷积核大小一样的吗？

13.池化层反传原理？

14.推倒卷积层反向传播公式

15.segnet如何上采样的？相对于fcn有什么优势？segnet有使用多尺度featuremap融合吗？

16.静态变量，全局变量的区别？分别存放在哪块内存？类的实例能操控类里的静态变量吗？

17.怎么动态开辟2维数组？

18.现场code：

18.1知道积分图的原理吗，编程实现。

18.2.给定一组字符串，以及一个字典，判断该字符串是否能由字典中包含的key组成。字典的key是字符串，value是数量。比如：

s=”momotech”

dict={‘mo’:2,’om’:1,’o’:1,’m’:1,’mt’:1,’te’:1,’ch’:1}

bool func(s,d);

18.3：

有两组数据，每组数据按行排列，均有1亿行，每行存放一个图片的url，每个url都是64个字节的大小，现在只有4g内存可以使用，如何找出两组数据中相同的url?

二面：

1.项目中的主要职业是？

2.ssd的结构，对比过其他检测网络吗？

3.最新的目标检测框架有了解吗？

4.机器学习有了解吗？逻辑回归，决策树，贝叶斯分类器，svm，马尔科夫决策有了解吗？

5.编程：

1.一个无序数组，找出其中第k大的数及索引。并分析时间空间复杂度

2.n阶台阶，每次可以迈一步或两步，有多少种走法。

拼多多：

面试官1 图像组技术

1.人脸识别流程是？你特征点回归用的什么方法？你级联的哪些弱分类器是怎么设计的？怎么训练的？用的什么数据集？人脸怎么检测的？

2.ssd 原理，等等。。。。

3.矩阵特征值，特征向量的意义？

4.介绍了下拼多多的图像应用场景，比如以图搜图，广告检测，图片内容理解，违规内容检测等等

面试官2（交叉面试）：

1.请用代码流程表示 ssd的方法。

我一脸懵逼，然后面试官又给我解释，你就把每层 concat ，做NMS时候如何从内存中拿数据，XXX 的代码写一下就行了。我当场表示没看过不会写

2.讲下lstm的原理

3.特征值计算问题

4. 写个 k-means 代码

面试官3（交叉面）

1.目标检测的原理是什么，数据怎么标注？

我讲了然后说听不懂，然后说不懂深度学习，让我给他讲明白

2. 给你个二维图像，里面都是 0 1，把里面连通区域都找出来。（就相当于给个二值图，里面有1 2 3 4 等数字，然后把这几个数字对应的外接矩形框找出来）

这个就用漫水填充算法就行了，深搜，找到所有连通分量，然后不同连通域上不同色就行，当时代码忘记了没写就说了下原理，居然就直接被diss ，说原理我也知道，云云，我就争辩造轮子没有意义，这玩意opencv都有现成的我没必要关注这个，然后就又继续被diss，算法工程师首先是个工程师。

后来想想还是自己编程太弱，虽然我现在认为强行记这些算法没啥意义，工程中很少会自己去写这些，但是直接跟面试官顶撞还是不好的，所以这个面试官3的细节我放出来只是想告诉大家，不要diss面试官

旷世科技上海研究院

一面：

上海研究院院长 weiyichen

1.介绍下主流的目标检测网络的原理

rcnn系列，ssd及改进版，yolo，rfcn,fpn,retina-net,lighted-head rcnn 都介绍了一遍然后说了下优缺点

2.为什么two-stage比one -stage精度高

我先答的正负样本比例控制的问题，这个原因在retina-net里有讲

然后又被问了除了这个还有别的原因吗

我就随便答了下two-stage boundingbox 回归过两次修正更精细，相当于一个级联的过程就随便扯了下

3.还问了几个问题但是忘记了。。。

二面：

1.ssd 数据扩充具体是怎么做的

没看过源代码，就说了下论文里提的，回答面试官感觉不是很满意

2. anchor 比例为什么那么设置？

为了设置几个初值涵盖比较多的可能性，加速收敛？更容易像ground-truth靠近？忘记怎么答得了

3.caffe多卡训练的时候数据怎么交互的？如果一张卡数据训练完了，其他卡没训练完会怎么样？

没了解过，完全懵逼直接说不知道

4.一维 max pooling如何高效实现？

多线程？

5.adaboost 系数权重更新时，指数项上为啥有个负号？

这个看下公式就知道了指数项上负号后面是预测的lable和 groundtruth的乘积，预测对了的话加上负号，相当于削减正确样本比例，同样会扩大误分类样本比例。当时忘记了没说清楚

6.相似目标的识别用什么手段区分？（比如数字“0”和字母“O”）

二.自动驾驶公司汽车相关

驭势科技（自动驾驶）：

1.如果背景中目标存在遮挡，如何提升precision,recall?

2.如果图片中目标存在遮挡，使用什么方法可以提升检测精度？

3.如果把模型改为二值化网络，代码需要做什么修改？

4.模型速度如何加速？

5.如何解决场景中目标大小不一样带来的尺寸变化问题？

驭势科技（二面，7.26下午）

面试形式ppt报告

1.如果在git上push代码，发现git上有人在你之前改变了git上最新的代码，你怎么做？

2.linux上常用哪些指令？

Ls ,ln -s,ldd ,cat ,cp ,mv ,find ,ifconfig ,mount ,grep,tar,zip,

3.debug和release的区别？

4.车载摄像头情形，如何判断强光照射，雨天以及雨刷器运动遮挡行车区域？如何设计一个简单鲁棒的算法检测这些异常情况？

5.车辆压线怎么判断？

6.给你一个单目摄像头，如何估算与前车的距离？可以根据空间坐标信息得出深度吗？

7.有在imagenet上自己训练过vgg googlenet resnet这些基础网络吗？

8.单聊：为什么从上海来北京？为什么从交通安防领域转到自动驾驶领域？近几年的职业规划？最想在新公司得到哪方面的成长？

蔚来汽车（7.30上午）

1.数据怎么获取？怎么标注？中间状态怎么处理？

2.车辆改装检测，用ssd+segnet会很慢，为什么不segnet直接分？

3.训练改装检测的ssd分了多少类？用了多少数据？如果类别样本不均衡，怎么解决？

4.ssd和yolo，faster-rcnn的区别？

5.faster rcnn中的rpn跟one-stage的ssd有区别吗？

6.boundingbox regression时用的什么Loss?

7.为什么用smooth-L1 loss?

8.faster-rcnn中roi-pooling的原理是什么？

9.目标检测模型一般怎么评价精度？

10.MAP怎么计算？

11.SSD前向时，阈值制定标准是什么？

12.ssd的速度怎么优化的？

13.现场code；

写下nms的实现过程 ,

三.其他企业

华为2012 实验室（杭州手机端智能拍照部门，7.27下午电面）

1.如何加深网络？

2.网络初始化能全用0吗？

3.logistic regression初始化参数可以全用0吗？

4.常用的几种防止过拟合的手段？

5.batch-nom 为什么可以防止过拟合？除了batch-norm听说过其他类似的技术吗？比如group-norm,知道原理吗？

6.讲一下常用的目标检测以及场景分割的网络结构。

7.讲一下你做项目遇到的问题，然后是如何解决的。

8.传统图像处理算法有了解吗？

9.传统机器学习有了解吗？

10.PCA的原理是什么，SVM的原理？

11.L1，L2正则化的区别是什么？ L1,L2 loss的区别是什么？

12.为什么用交叉熵做分类的loss? 欧式loss，均方差loss 可以用来做分类loss吗？

13.如何解决车牌因曝光，或者车牌背景颜色变动等原因造成定位不准的问题？

14.训练的时候一般学习率 batchsize都怎么调整的？

15.sgd,momentum sgd,牛顿动量sgd， adam,rmsprop 优化方法有什么区别？

16.对工作地点有什么考虑？

清华同方（7.30下午）

1.笔试

2.传统图像处理了解那些算法，传统机器学习了解哪些算法？

3.svm,adaboost 的loss都是什么/

4.PCA ,SVD的原理是？

5.常用的跟踪算法有哪些？

6.纯虚函数的定义是什么？

7.常用的防止过拟合的技术有哪些？

8.解释下drop-out的机理，为什么可以防止过拟合？

9.从loss设计角度防止过拟合的手段是？

10.从参数数量角度防止过拟合的手段是？

11.常用的激活函数有哪些，优缺点是什么？

12.double 和float哪种显卡计算能力更强？哪种单位时间吞吐量大？

13.vgg16和resnet50哪个网络计算次数更多？

14.矩阵论，泛函分析学过没？概率论学过没？

15.两年大概训练了多少次网络？c++用多久了？python用多久了?

16.一般怎么训练？为什么开始学习率要大一点，batchsize为啥开始也要小一点？

17.优化器一般用什么？adam的原理是？

18.样本不均衡的分类问题怎么解决？怎么做数据增强? 有从loss层面考虑过吗？了解focal-loss吗？

19.了解hard-minning吗？了解tripletloss吗？

20.训练时的方差和偏差有什么区别？

21.了解多线程吗？

查看全文

相关阅读:
小球下落
 时隔半年再设环境变量。。笑哭了！
Quartus+modelsim开发环境的搭建
 因式分解技巧——拆项与添项
 因式分解技巧——分组分解
 因式分解技巧——代公式
 因式分解技巧——提公因式
 一个2014年的数学日历
 用面积来证三角不等式
 一条直线若能平分矩形面积，则它必然经过矩形的中心

原文地址：https://www.cnblogs.com/guweixin/p/14432203.html