操作系统的调度算法
搜索引擎的优化
linux 查看内存 磁盘 进程 端口 命令
mysql查看数据库连接,执行进度命令
java序列化和hadoop序列化区别
Storm原理
Hadoop 的任务分配
hadoop1.0与2.0架构区别
网络协议
为什么不采取除了geohash之外的算法
机器学习 数据挖掘
为什么mapreduce是全表扫描
要求:
熟悉java语言,同时掌握Scala,Python,了解jvm内存优化优先
对计算机网络、操作系统熟悉,熟悉多线程、分布式编程优先
从复杂系统表象中分析问题
熟练掌握分析工具:SAS/SPSS/R等分析工具(其一)
熟悉J2EE技术平台及主要的JAVA框架,有高并发系统开发/性能调优经验者优先;
熟悉linux环境,熟悉shell命令,有过Python开发经验优先;
熟悉常见的负载均衡实现方案
有扎实的数据结构和算法功底;
熟悉MySQL或Oracle数据库,能熟练编写SQL查询、存储过程,熟悉SQL优化;
memcached