zoukankan      html  css  js  c++  java
  • 面试真题

    一.互联网公司

    阿里系的高德地图,优酷,斑马,饿了吗

    高德地图:

    1.segnet原理?还知道哪些分割网络?segnet为什么这么设计?相较其它网络有什么优势?有其它类似这种对称结构设计的网络吗?

    2.ssd的原理,其它目标检测网络有了解吗?有做过对比吗?ssd为什么快?

    3.最新的目标检测网络有了解吗?

    4.项目中怎么解决误检的问题?实际产品中怎么评价模型?注重召回率还是准确率?

    5.车牌定位为什么分两步?为什么不设计一个检测小目标较好的网络?如果让你设计一个你会怎么做?

    6.说一下项目中遇到的困难,你是怎么解决的?

    7.项目中承担的职责是?

    8.为什么来北京?跳槽为什么这么频繁?

    9后期维护这么耗费人力,为什么不做成通用模块?

    10.code:给一个一维无序数组,里面有N个正整数,如何快速找出里面重复的数字?给出时间复杂度和空间复杂度。

    优酷:

    具体问题忘记了,只记得几个

    1.dropout原理,能从物理学的角度去解释下吗,测试和训练的时候有区别吗?

    测试和训练的那个细节区分当时忘记了,面试官就直接github上拉了caffe的代码下来让我看,然后给他讲

    2.code:

    2.1卷积实现,可以用传统的图像卷积,也可以用im2col

    2.2给一个字符数组,和一个无限大的buffer,从字符数组中删除 指定模式的字符串,要求时间复杂度为O(n)

    斑马:

    笔试,1个小时内选4道题做完,基本是链表,动态规划等

    面试:

    1.resnet基本结构,这种结构的设计思想,优点,解决了 深度学习中哪些难题?

    2.ssd anchorbox 的机制? 所有boundingbox都参与训练吗?怎么决定哪个boundingbox参与训练?

    3.lstm基本结构,怎么做识别的,每个切块怎么决定其属于哪个类别?会不会出现一个字符被切了N刀,然后N个结果不同?如果会 ,怎么解决?

    4.segnet的结构?有什么优缺点?用的基网络是什么?pspnet多尺度融合具体怎么做的?

    5.所有项目中认为做过的最好的是?解决了什么问题?遇到的最困难的项目是?怎么解决的?

    6.我们现在做的ADAS,受限于车载芯片,更多用传统算法做,能接受吗?有兴趣做吗?

    7.车牌识别中不同姿态 不同背景 不同长度的问题怎么解决?遇到曝光 模糊的问题怎么解决?

    还问了很多传统图像算法,因为跟上气合作,车载硬件资源有限,很多东西要用传统算法做,问有没有兴趣做传统图像等等

    饿了吗

    1.电话面试

    具体项目问了问

    然后问了问深度学习,机器学习相关知识

    2.现场面试

    原理题都忘记了,基本都是针对目标检测网络,代码如下

    面试官1“:

    笔试 c++ 三道题

    1)二维矩阵 行列方向 都是递增的 然后判断某个值是否存在

    2)字符查找相关的,我说用字典,面试官让我自己写个字典,我说只记得hashmap原理,自己设计散列函数不行 忘记了

    3)忘了。。。。

    2.面试官写了一段c风格字符串转化成string的代码 然后让我判断是否有错?

    3.问了下float class int 等变量在内存中如何分配的,如何排列 能高效利用内存。

    4.c++多态怎么实现的? 虚表里的指针都存放在哪里?类的实例共用虚表吗?

    面试官2:

    理论问了问机器学习的算法,svm,贝叶斯分类,adaboost等等

    代码题:

    1.输出二叉树 每一层级节点中的最大值

    面试官3:

    1.ssd anchorbox机制,为什么这么设置?

    2.如果我检测自然场景下的文字,可能有多方向的,如何修改ssd? defaultbox需要修改吗?iou规则计算需要修改吗?

    3. 写下NMS代码

    4.写下IOU计算的代码

    面试官4(经理):

    1.项目介绍

    2.问了几个外卖机器人 目前遇到的问题,比如碰到玻璃了 激光雷达接收不到反射信号 怎么解决 之类的问题。

    今日头条—懂车帝业务部门

    1.adaboost,gbrt的原理?loss函数是什么?

    2.adaboost怎么级联弱分类器的?

    3.sift,hog,harr的原理?sift为什么对旋转不敏感?

    4.表格识别时,如果倾斜了怎么办?如果倾斜90°怎么办?

    5.ssd的原理?

    6.segnet的原理是?其他主流的分割网络有哪些?网络结构?

    7.给你一张图片,一个亿级的图片库,搜索出最相似的图片,怎么做?

    8.svm的原理是什么?怎么推到的?怎么求解的?高效求解算法?

    9.防止过拟合的手段?原理是?

    10.attention机制?有考虑过在现有的模型中引入attention吗?会有什么益处?

    11.code:

    给一个二维矩阵,搜索出一条递增的最大路径。即每个相邻的元素必须满足,Xt+1=Xt +1.

    hr面:

    1.为什么来北京?

    2.之前一直做的车辆相关的项目吗?

    3.之前公司的规模多大?

    4.为什么转行?都面了哪些公司?

    5.选择公司的标准是什么?

    今日头条AIlab交叉面试(8.3下午)

    1.项目介绍

    2.网络有做过什么改进?

    3.车牌识别用segnet和lstm哪个更快?

    4.所有模块显存消耗?

    5.线程和进程有什么区别?

    6.caffe为什么不支持多线程?线程锁 用什么加的,用的哪个接口?

    7.你了解的 排序算法有哪些,时间复杂度多少?

    8.code:

    写个简单的二分查找,分析时间复杂度

    总结:

    提问阶段问了下招人标准(因为已经放弃了,所以随便问了),实际上如果有顶会论文,或者网络方面做过创新性改进工作,编程,操作系统方面的要求可以放低,但如果没有,这些必须过关。。。

    实际上他们更关注的是模型效率,以及解决问题方案的效率,如果效率低下,方案是肯定不会被采纳的。

    陌陌(7.24下午)

    1.关于ocr文字定位的问题:

    1.1直线怎么检测的?

    1.2 二值化 用的什么方法?知道大津法(ostu)的原理吗?怎么去噪的?

    1.3如果直线倾斜了,形态学方法失效怎么做?

    1.4怎么旋转图像的?

    1.5 计算旋转矩阵选的基准点是哪里?最少选几个?图像旋转的原理?

    1.6旋转矩阵求出来后,如果新坐标系下坐标不是整数怎么办?

    插值

    1.7插值具体原理?最近邻的像素点选取规则?双线性插值像素点选取规则?

    2.知道图像处理中比较有名的特征提取方法的原理吗?比如sift ,hog,lbp等?

    3.边缘检测用的什么方法?

    4.人脸特征点用的什么方法?用过什么机器学习方法?SVM的原理知道吗?

    5.resnet的结构是什么?为什么这么设计?

    6.SSD做了哪些裁剪以及加速?
    7.SSD为什么输入图片是固定的300*300?

    8.为什么大部分分类网络的图片尺寸为啥是固定的?比如都是224*224或320*320?

    9.简述ssd,segnet网络结构。

    10.简述翻卷积原理。

    11.batch norm作用?

    12.ssd怎么学习多个aspect_ratio的类别以及offset的?不同特征层上 做class分类以及offset回归用的卷积核大小一样的吗?

    13.池化层反传原理?

    14.推倒卷积层反向传播公式

    15.segnet如何上采样的?相对于fcn有什么优势?segnet有使用多尺度featuremap融合吗?

    16.静态变量,全局变量的区别?分别存放在哪块内存?类的实例能操控类里的静态变量吗?

    17.怎么动态开辟2维数组?

    18.现场code:

    18.1知道积分图的原理吗,编程实现。

    18.2.给定一组字符串,以及一个字典,判断该字符串是否能由字典中包含的key组成。字典的key是字符串,value是 数量。比如:

    s=”momotech”

    dict={‘mo’:2,’om’:1,’o’:1,’m’:1,’mt’:1,’te’:1,’ch’:1}

    bool func(s,d);

    18.3:

    有两组数据,每组数据按行排列,均有1亿行,每行存放一个图片的url,每个url都是64个字节的大小,现在只有4g内存可以使用,如何找出两组数据中相同的url?


    二面:

    1.项目中的主要职业是?

    2.ssd的结构,对比过其他检测网络吗?

    3.最新的目标检测框架有了解吗?

    4.机器学习有了解吗?逻辑回归,决策树,贝叶斯分类器,svm,马尔科夫决策有了解吗?

    5.编程:

    1.一个无序数组,找出其中第k大的数 及索引。并 分析时间空间复杂度

    2.n阶台阶,每次可以迈一步或两步,有多少种走法。

    拼多多:


    面试官1 图像组技术

    1.人脸识别流程是? 你特征点回归用的什么方法? 你级联的哪些弱分类器是怎么设计的?怎么训练的?用的 什么数据集?人脸怎么检测的?


    2.ssd 原理,等等。。。。

    3.矩阵特征值,特征向量的意义?

    4.介绍了下拼多多的图像应用场景,比如以图搜图,广告检测,图片内容理解,违规内容检测等等

    面试官2(交叉面试):

    1.请用代码流程表示 ssd的方法。

    我一脸懵逼,然后面试官又给我解释,你就把每层 concat , 做NMS时候如何从内存中拿数据 ,XXX 的代码 写一下就行了。 我当场表示 没看过 不会写

    2.讲下lstm的原理

    3.特征值计算问题

    4. 写个 k-means 代码

    面试官3(交叉面)

    1.目标检测的原理是什么,数据怎么标注?

    我讲了然后说听不懂,然后说不懂深度学习,让我给他讲明白

    2. 给你个二维图像 ,里面都是 0 1, 把里面连通区域都找出来。(就相当于给个二值图,里面有1 2 3 4 等数字,然后把这几个数字对应的外接矩形框找出来)

    这个就用漫水填充算法就行了, 深搜,找到所有连通分量,然后不同连通域上不同色就行, 当时代码忘记了 没写 就说了下原理,居然就直接被diss ,说原理我也知道,云云, 我就争辩 造轮子没有意义,这玩意opencv都有现成的我没必要 关注这个,然后 就又继续被diss, 算法工程师 首先是个工程师。

    后来想想还是自己编程太弱,虽然我现在认为强行记这些算法没啥意义,工程中很少会自己去写这些,但是直接跟面试官顶撞还是不好的,所以这个面试官3的细节我放出来只是想告诉大家,不要diss面试官

    旷世科技上海研究院

    一面:

    上海研究院院长 weiyichen

    1.介绍下主流的目标检测网络的原理

    rcnn系列,ssd及改进版,yolo,rfcn,fpn,retina-net,lighted-head rcnn 都介绍了一遍 然后说了下优缺点


    2.为什么two-stage比one -stage精度高

    我先答的 正负样本比例控制的问题,这个原因在retina-net里有讲

    然后 又被问了 除了这个还有别的原因吗

    我就随便答了下two-stage boundingbox 回归过两次 修正更精细,相当于一个级联的过程 就随便扯了下

    3.还问了几个问题 但是 忘记了。。。


    二面:

    1.ssd 数据扩充具体是怎么做的

    没看过源代码 ,就说了下论文里提的,回答面试官感觉不是很满意


    2. anchor 比例为什么那么设置?

    为了设置几个初值 涵盖比较多的可能性,加速收敛? 更容易像ground-truth靠近?忘记怎么答得了

    3.caffe多卡训练的时候 数据怎么交互的?如果一张卡数据训练完了 ,其他卡没训练完 会怎么样?

    没了解过,完全懵逼 直接说不知道


    4.一维 max pooling如何高效实现?

    多线程?

    5.adaboost 系数权重更新时,指数项 上为啥有个负号?

    这个看下公式就知道了 指数项上 负号 后面是 预测的lable和 groundtruth的乘积, 预测对了 的话 加上负号,相当于削减 正确样本比例, 同样 会扩大误分类样本比例。 当时忘记了 没说清楚

    6.相似目标 的识别用什么手段区分?(比如 数字“0”和字母“O”)


    二.自动驾驶公司汽车相关

    驭势科技(自动驾驶):

    1.如果背景中目标存在遮挡,如何提升precision,recall?

    2.如果图片中目标存在遮挡,使用什么方法可以提升检测精度?

    3.如果把模型改为二值化网络,代码需要做什么修改?

    4.模型速度如何加速?

    5.如何解决 场景中 目标大小不一样 带来的尺寸变化问题?


    驭势科技(二面,7.26下午)

    面试形式ppt报告

    1.如果在git上push代码,发现git上有人在你之前改变了git上最新的代码,你怎么做?

    2.linux上常用哪些指令?

    Ls ,ln -s,ldd ,cat ,cp ,mv ,find ,ifconfig ,mount ,grep,tar,zip,

    3.debug和release的区别?

    4.车载摄像头情形,如何判断强光照射,雨天以及雨刷器运动遮挡 行车区域?如何设计一个简单鲁棒的算法 检测这些异常情况?

    5.车辆压线 怎么判断?

    6.给你一个单目摄像头,如何估算与前车的距离?可以根据空间坐标信息得出深度吗?

    7.有在imagenet上 自己训练过vgg googlenet resnet这些基础网络吗?

    8.单聊:为什么从上海来北京?为什么从交通安防领域转到自动驾驶领域?近几年的职业规划?最想在新公司得到哪方面的成长?

    蔚来汽车(7.30上午)

    1.数据怎么获取?怎么标注?中间状态怎么处理?

    2.车辆改装检测,用ssd+segnet会很慢,为什么不segnet直接分?

    3.训练改装检测 的ssd分了多少类?用了多少数据?如果类别样本不均衡,怎么解决?

    4.ssd和yolo,faster-rcnn的区别?

    5.faster rcnn中的rpn跟one-stage的ssd有区别吗?

    6.boundingbox regression时用的什么Loss?

    7.为什么用smooth-L1 loss?

    8.faster-rcnn中roi-pooling的原理是什么?

    9.目标检测模型一般怎么评价 精度?

    10.MAP怎么计算?

    11.SSD前向时,阈值制定标准是什么?

    12.ssd的速度 怎么优化的?

    13.现场code;

    写下nms的实现过程 ,

    三.其他企业

    华为2012 实验室(杭州手机端智能拍照部门,7.27下午 电面)

    1.如何加深网络?

    2.网络初始化能全用0吗?

    3.logistic regression初始化参数可以全用0吗?

    4.常用的几种防止过拟合的手段?

    5.batch-nom 为什么可以防止过拟合?除了batch-norm听说过其他类似的技术吗?比如group-norm,知道原理吗?

    6.讲一下常用的目标检测以及场景分割的网络结构。

    7.讲一下你做项目遇到的问题,然后是如何解决的。

    8.传统图像处理 算法有了解吗?

    9.传统机器学习有了解吗?

    10.PCA的原理是什么,SVM的原理?

    11.L1,L2正则化的区别是什么? L1,L2 loss的区别是什么?

    12.为什么用交叉熵做分类的loss? 欧式loss,均方差loss 可以用来做分类loss吗?

    13.如何解决车牌因曝光,或者车牌背景颜色变动 等原因造成定位不准的问题?

    14.训练的时候 一般学习率 batchsize都怎么调整的?

    15.sgd,momentum sgd,牛顿动量sgd, adam,rmsprop 优化方法有什么区别?

    16.对工作地点有什么考虑?

    清华同方(7.30下午)

    1.笔试

    2.传统图像处理了解那些算法,传统机器学习了解哪些算法?

    3.svm,adaboost 的loss都是什么/

    4.PCA ,SVD的原理是?

    5.常用的跟踪算法有哪些?

    6.纯虚函数的定义是什么?

    7.常用的防止过拟合的技术有哪些?

    8.解释下drop-out的机理,为什么可以防止过拟合?

    9.从loss设计角度防止过拟合的手段是?

    10.从参数数量角度 防止过拟合的手段是?

    11.常用的激活函数有哪些,优缺点是什么?

    12.double 和float哪种显卡计算能力更强?哪种单位时间 吞吐量大?

    13.vgg16和resnet50哪个网络计算次数 更多?

    14.矩阵论,泛函分析学过没?概率论学过没?

    15.两年大概训练了多少次网络?c++用多久了?python用多久了?

    16.一般怎么训练?为什么开始学习率要大一点,batchsize为啥开始也要小一点?

    17.优化器一般用什么?adam的原理是?

    18.样本不均衡的分类问题 怎么解决?怎么做数据增强? 有从loss层面考虑过吗?了解focal-loss吗?

    19.了解hard-minning吗?了解tripletloss吗?

    20.训练时的方差 和偏差 有什么区别?

    21.了解多线程吗?

  • 相关阅读:
    SmartJS 第一期(0.1)发布
    smartJS 0.1 API 讲解
    smartJS 0.1 API 讲解
    20160113006 asp.net实现ftp上传代码(解决大文件上传问题)
    20151224001 GridView 多按钮的各种使用方法
    20151221001 GridView 模板
    20151218001 雕爷自白:我为什么非要这么干
    20151210001 DataGridView 选中与被选中
    20151126001 网页中嵌入谷歌动态地图
    20151125001 询问对话框 中的文字换行
  • 原文地址:https://www.cnblogs.com/guweixin/p/14432203.html
Copyright © 2011-2022 走看看