在《零基础小白,如何入门计算机视觉?》中我提到过,计算机视觉的研究目前主要分为两大方向:基于学习的方法和基于几何的方法。其中基于学习的方法最火的就是深度学习,而基于几何方法最火的就是视觉SLAM。
SLAM将成为计算机视觉的下一个风口
在前几年计算机视觉的三大顶级会议(CVPR,ICCV,ECCV)上,几乎全是深度学习的研究,而这样的情况在这两年出现了新的变化:在2018年计算机视觉国际顶级会议 CVPR论文录用名单中,其中涉及SLAM/三维视觉 的工作超过 90 篇,占据了全体收录论文的近 1/10。
而今年参加校招和社招的小伙伴也向我透露,今年深度学习方向的竞争非常激烈,想要拿到较好的offer,要么有牛叉闪闪的论文,要么是大牛实验室有过硬的项目经验,难度比前几年大大提升。而今年SLAM方向的需求量上升而相关从业者相对较少,相对还比较容易,类似几年前深度学习刚刚火起来之前的样子。可以预见,SLAM将成为继深度学习之后计算机视觉领域的下一个风口。主要有以下几个依据:
1、深度学习在检测、识别领域具有无比强大的能力,但是在涉及多视角几何相关的SLAM领域,深度学习的作用非常有限。究其原因是因为在多视角几何为基础的SLAM领域,需要明确清晰的理论基础保证,而深度学习的「黑盒子」模型目前还不太奏效。
2、SLAM技术门槛较高。深度学习爆发后,很多非计算机视觉领域的从业者纷纷转而学习深度学习,由于深度学习本身黑盒子的特点,很多从业者不需要了解图像处理、计算机视觉的基础知识便可以得到一个相对较好的结果,因此入门门槛并不是很高。
而学习SLAM则需要具备三维空间刚体变换、相机成像模型、特征点提取与匹配、多视角几何、捆集调整等内容。这对于非该领域的从业者来说还是具有较高的门槛。
3、消费级RGB-D相机快速发展催生了以三维视觉为基础的商业化应用。以微软Kinect系列、Intel realsense系列、苹果、英飞凌、TI等为代表的消费级RGB-D相机逐渐形成成熟的产业链,国内也涌现出大量的优秀企业并量产,如orbbec、pico、human+、爱观、图漾、艾芯智能、知微传感等。此外,2017年iPhone X前置结构光深度相机面世后,更是激发了手机产业链RGB-D相机的热潮,目前华为、小米、OPPO、VIVO等手机大厂都在积极推动RGB-D相机在手机上的应用。
4、目前计算机视觉领域主要还是通过二维的图片来感知世界,而三维视觉才是人类感知理解世界的正确方式,因此以三维视觉为基础的SLAM技术是智能移动机器人、无人驾驶、AR等人工智能细分领域的核心技术。
目前对SLAM技术需求强烈的公司包括:互联网公司如百度、腾讯、阿里、京东等,计算机视觉算法公司如旷世、虹软、商汤等,自动驾驶创业公司如图森、momenta、景驰、驭势、滴滴及各大汽车厂商等,无人机/机器人公司如大疆、思岚、高仙等,AR移动终端应用相关公司如三星、华为、悉见等。
总之,SLAM前景光明但学习道路曲折,这也是笔者打算和读者一起从零开始学习SLAM的初衷。
从零开始一起学习SLAM系列规划
目前关于SLAM学习的资料不多,而且参差不齐,初学者推荐高翔博士的《视觉SLAM十四讲》,虽然本书写的已经比较基础,但很多小伙伴在学习期间仍然会遇到很多问题,因此,笔者《从零开始一起学习SLAM》系列文章规划如下:
1、技术介绍全面,不枯燥。该系列从最基础的知识开始介绍,分为多篇文章,每篇文章只介绍一个具体的知识点,尽量以形象生动的图文辅以适当的推导,一点点深挖SLAM的各个重要技术点。
2、每篇文章都有习题,重视实践。笔者会根据每篇文章内容设计一些实用性的练习题(推导、编程等),俗话说,光看不做假把式,适当的练习能够加深读者的理解,把知识消化吸收为自己所用。
3、高质量的交流学习社区。每篇文章练习题参考答案笔者会放到知识星球「从零开始一起学习SLAM」里。星球内所有成员都可以进行发布问题、分享知识、上传资源、点赞、留言、赞赏、收藏等操作。而所有的交流讨论、资源分享等都可以沉淀下来并方便日后查询。星主还会额外布置作业,和大家一起学习讨论。
知识星球需付费加入,越早加入价格越优惠。星球还会红包奖励积极分享、解答问题的成员,只要花费一顿聚餐的钱,就能够和一群优秀的SLAM从业者一起交流进步,甚至解决就业问题。
关注公众号“计算机视觉life”,点击菜单栏 “知识星球”,了解《从零开始学习SLAM》介绍,加入一起学习吧~
作业
如果我们想要了解一个领域,最好的方法就是先看该领域比较著名的综述论文,先从宏观上把握该领域的整体面貌。
1、请列举几篇最近几年SLAM领域经典的综述论文。
2、阅读综述,并列举至少三个SLAM的具体应用场景。
欢迎留言讨论,或者进入知识星球「从零开始学习SLAM」一起学习交流~
相关阅读