zoukankan      html  css  js  c++  java
  • 百度大搜 算法的实习

    百度大搜 rank实习一面

    面了2个小时,面到怀疑人生。

    算法题: 

    • 手写快排
    • .最长公共子串

    懵逼的题:

    • learn2rank
    • 短串匹配:有一些短串,如 杨幂 刘翔 (几万),还有很多query(几亿),比如刘翔夺冠(命中),刘夺冠(没命中),删除没命中的query。

                   字典树+KMP字符串匹配(ac自动机)

          将 几万短串 构建一颗trie树,然后依次将query进行多模匹配(ac自动机)

    • 点击率特征如何设计?

    clicks/views   

    需要注意 1/1 这种点击率为1的情况,如果view很小的话,可能点击率比较大,比如说1个人看到了1个人点击,点击率是100%。

    背诵题:

    • 特征选择方法?
    • CNN RNN区别?
    • TFIDF?
    • LR GBDT特征注意事项?

        归一化,缺失值,onehot

    • 深度学习避免过拟合?

        dropout BN .L1 L2

    贴几个别人的面经,没答上来的题竟然在别人面经里!!!

    https://www.cnblogs.com/qscqesze/p/6509450.html

    https://blog.csdn.net/hopeztm/article/details/7818775

    https://blog.csdn.net/koudaidai/article/details/7620190

     百度大搜 网页搜索部一面

    20180509

    图片搜索应该 挂了,今天又面了个网页搜索部,估计也是挂。。。

    自我介绍。问我NLP是怎么学的?研究方向是啥,导师啥的

    2道算法题

    1、判断链表是否回文

    2 剑指第一题

    题目不难,自己答得太烂了, 回文那个链表逆转没写好,奇偶也没判断。

    第二题思路是对的,但是不是面试官想要的答案,面试官也一直想说我的思路是错的,结果就gg

    总结:之前面的算法题都没有思路,现在有思路了却写不出来,真的不能背题,怎也也得自己手写一遍,最好是在纸上画画,另外写代码的时候可以一遍写一遍讲讲?

     百度核心搜索部 

    一面:

    项目介绍
    GBDT树特征重要性如何计算
    learn2rank point wise par wise 区别

    c++ static 关键字

    算法题:

    无序数组找出中位数
    对只含1-n的n数组排序。

    一面面试官超级好,会不断的提醒你,


    二面:
    L1 L2正则化区别,应用场景
    树模型如何控制过拟合
    树模型调参经验

    二面答得不是很好,会冷场哦。

    PS:他们主要做leran2rank 深度学习传统学习都会用。

  • 相关阅读:
    用GDB调试程序(一)
    vim添加删除多行注释
    python binary lib on win/各种python库的二进制包
    python使用libssh2连接linux
    python xpath
    splinter python浏览器自动化操作,模拟浏览器的行为
    pytesser图片文本识别
    python验证码识别
    Python 之 使用 PIL 库做图像处理
    Connection reset by peer问题分析
  • 原文地址:https://www.cnblogs.com/zle1992/p/8849567.html
Copyright © 2011-2022 走看看