zoukankan      html  css  js  c++  java
  • 百度feed 寒假实习 一面二面(offer)

    一面(1小时)

    自我介绍,研究方向,本科学校,家乡等等。。

    1 介绍了jdd风险登录的比赛,问题背景,建模,特征构建,特征选择,模型等。

    个人觉得介绍项目一定要高大上一点,把自己创新或者有创意的点子讲出来。

    2 介绍360 机器文章识别的比赛。问题背景,建模啥的。

    答:这个地方 ,我们是用的cnn,又分char cnn word cnn。问:哪个效果好?为什么?答:char 的好,因为我觉得机器文章

    写得不一定符合语法,分词之后可能会有一些奇怪的,不是词的词,这样的词可能只会在某一篇文章里有,泛化能力差一些。

    3 看你简历机器学习算法了解一些,那就讲讲朴素贝叶斯吧。

    公式记得不全,在面试官的提醒下,勉强写出来了。。

    4 用朴素贝叶斯做情感分类。说一下思路,从构建词典说起。

    这个答得也不是很好,也是在面试官提醒下 勉强说出来了。

    这个答案 在机器学习实战上有,当时没看完。。

    5 手写代码

    倒排索引相关。

    也是在面试官提醒下,写出来的。

    二面(40分钟)

    自我介绍。

    聊比赛,搜狗用户画像构建的。

    tfidf 是什么,idf 的公式是什么?

    公式也给忘了,大概说了一下思想。

    lda 主题模型中 采样是什么?为什么要采样?

    采样是为了参数估计,具体也给忘了。

    svm用过吗?原理是什么?自己编的程序还是掉的包?掉的啥包?

    本来打算手推公式,推了一半,就不让我推了。

    lr是什么?原理是什么?

    360机器文章识别的比赛、跟一面问的差不多。

    本科学过数据结构么?

    答:没学过,学过通信原理。

    通信原理是什么?

    哈哈,把面试官引导到这里来。给他讲了讲通信原理的框架。

    手撕代码

    给一个文本文件。每一行是一篇文章,已经分好词,用空格分割,统计每个词都在哪些文章中出现过。

    跟一面的题差不多,就是建个词典,词典的key是词,value是文章id.,暴力的循环。 感觉时间复杂度比较高

    我问面试官有木有简单点的方法 ,他也不知道。

    总结:第一次去现场面试,而且是百度这样的公司,因为自己本硕双非,又不是科班,之前一直没有自信,但是现场并没有那么难。

    尤其是手写代码,不用运行,思路正确应该就没啥问题。

    等明天的结果吧。good luck.

    今天看的一个面经名言:把面试官当成未来的同事,幽默一点。

  • 相关阅读:
    10 行Python代码实现批量压缩图片500 张,面试必学
    用Python邮件发送,新手必学
    用Python监控男女朋友每天都在看哪些网站?这招绝了
    不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据?新手必学
    用Python做一个520表白神器,值得收藏
    微分不等式
    零点问题
    2019英语一 Text4分析
    A1065. A+B and C(64bit)
    A1046. Shortest Distance
  • 原文地址:https://www.cnblogs.com/zle1992/p/8040416.html
Copyright © 2011-2022 走看看