2016 年,围棋程序 AlphaGo 击败人类顶尖选手,让大众了解到深度学习的概念。不仅如此,在计算机视觉和自然语言处理领域,深度学习已经有了广泛而成熟的应用场景。人脸识别、自动驾驶、安全防范,都有深度学习的身影。语音识别、问答系统、机器翻译,都是深度学习技术的模范实践。
下面收集了一些深度学习的创意应用,希望能够帮助大家开开脑洞,并感受下深度学习在生活中的应用潜力。当然也会提供了尽可能多的学习资料,让各位学霸能够享受尽情折磨自己,不断进步的快感。
1.Photo Wake-Up
华盛顿大学的博士生 Chung-Yi Weng 和他的朋友们共同开发的一种新形式的 3D 角色动画,他们将深度学习中的 Mask R-CNN(实例分割模型)与 SMPL 模板(一种参数化人体模型)模型相结合,让图像中的人物从图片走进我们的现实中。
通过从 2D 图像中剪切出主体,将其装配到预先构建的骨架上,这样就可以让图像中的主体进行一系列预定动作,如跑步、走路、跳跃。当与智能设备(例如智能手机或平板电脑)一起使用时,3D 动画可以通过 2D 的照片或者图画“唤醒”并走向现实。
资料推荐:
[1] 论文参考:https://arxiv.org/abs/1812.02246?context=cs
[2] 视频资料:https://youtu.be/hs9K3eNkQOo
2.Let there be color!
自动为黑白照片/视频内容进行上色。该项目运用深度学习网络学习自然存在于照片中的某些模式——比如,天通常是蓝的,云是白的或者灰的,草是绿的。通过这类规则,完全不需要人为操作就能够对照片进行重新上色。赶紧偷偷的告诉爷爷去,"家里的黑白老照片马上就要变彩色了!“
资料推荐:
[1] GitHub:https://github.com/satoshiiizuka/siggraph2016_colorization
[2] 论文参考:http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/data/colorization_sig2016.pdf
[3] 官方网站:http://iizuka.cs.tsukuba.ac.jp/projects/colorization/en/
3.LipNet
牛津大学和 Deepmind 的科学家共同完成了这一项目,通过“观看”人类说话的视频,以及输入相应文字,对唇语的解读准确率高达93.4%,远超人类读唇者52%的平均水平。对于听力障碍的人来说这个简直是福音。
资料推荐:
[1] GitHub:https://github.com/bshillingford/LipNet
[2] 论文参考:https://arxiv.org/pdf/1611.01599.pdf
4.Handwriting Generation
根据一些书写笔迹,学习出笔的移动轨迹和文字之间的关系。然后生成一摸一样的笔迹,并能过模仿多种笔迹。小朋友从此不再害怕老师要家长签字了!
资料推荐:
[1] 论文参考:https://arxiv.org/pdf/1308.0850v5.pdf
[2] Demo展示:http://www.cs.toronto.edu/~graves/handwriting.html
5.Deep Dreaming
Google 的研究者找到了一种用深度学习来增强图像特征的方法,随后,他们就开发了 Deep Dreaming ——它能够在图片中生成一些不可思议的幻象。因为有些和梦境十分相似,因此取名 Deep Dreaming。具体生成什么样的幻想与这个深度学习系统最近被暴露在什么样的环境下有关,有时它甚至能生成吓人的噩梦。
资料推荐:
[1] 项目首页:https://research.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
[2] 影集:http://www.telegraph.co.uk/technology/google/11730050/deep-dream-best-images.html?frame=3370674
[3]GitHub:https://github.com/google/deepdream
6.Pix2Pix
这个点子与之前提到的 Let there be color!有点类似,不过要更有创造力一点。你可以往电脑中输入一幅简笔画,甚至一些色块,然后让电脑发挥自己的创造力输出新的图片。类似地,你也可以把衣服航拍照片变成一幅地图,将白天的场景变成夜晚。
资料推荐:
[1] GitHub:https://github.com/phillipi/pix2pix
[2] 论文参考:https://arxiv.org/pdf/1611.07004v1.pdf
7.DeepWarp
不管你手里拿到了谁的照片,用 Ganin 等人开发的这个深度学习网络过一下,你就可以让他的眼睛动起来:你可以让他上下看、左右看,甚至绕着圈看...这么好用的表情包生产利器,赶紧收藏!
资料推荐:
[1] Demo:http://163.172.78.19/
[2] 参考论文:http://sites.skoltech.ru/compvision/projects/deepwarp/files/deepwarp_eccv2016.pdf
[3] 官方网站:http://sites.skoltech.ru/compvision/projects/deepwarp/
8. Pixel Recursive Super Resolution
谷歌大脑的研究者们训练了一个深度学习网络,根据一些分辨率极低的人脸图像来预测这些面孔真实的样子。从此马赛克什么的统统都走开!
资料推荐:
[1] 论文参考:https://arxiv.org/abs/1702.00783
看了这么多优秀有趣的深度学习应用,我唯一能肯定以及确定的就是这样的项目对我来说还是太难了!自己什么技术水平,心里还是有点逼数的。
现在搞不定不代表以后搞不定,万丈高楼平地起,还是要先从基础的开始整!!!
实验楼近期上线的《楼+之深度学习实战第 1 期》9月3日正式开课,特别适合对深度学习有兴趣,想要快速系统入门的朋友。
课程主要分为4个阶段(6周内容):
1.课程准备阶段:
Python 作为代码实战过程中的唯一编程语言,需要你熟悉 Python 的基础语法,并掌握 NumPy,Pandas 及其他基础工具模块。
2.深度学习理论阶段(1周):
围绕深度学习基础原理展开,内容将涵盖线性回归、逻辑回归、感知机、人工神经网络等算法的理论及应用。你会对深度学习的基本概念,以及模型的构建、训练、评估有初步的了解,为后续深度神经网络的学习打下基础。
3.深度学习应用阶段(3周):
涉及到应用和实践。你将学习业界有着广泛应用的深度学习开源框架,并进一步掌握不同深度神经网络的原理和实际应用。
- 第一周:使用 Python 从 0 到 1 构建神经网络。但深度神经网络如果按此方法构建将会变得异常麻烦。本周,我们将学习深度学习通用的网络构建方法,掌握业界最常用的两大著名深度学习框架 TensorFlow 和 PyTorch。
- 第二周:将学习卷积神经网络和生成对抗网络的原理及构建方法。同时,课程将从图像分类、图像生成、目标检测等场景出发,运用深度学习技术进行实践。
- 第三周:学习循环神经网络的原理和构建方法,尝试探索自然语言处理相关应用。你不仅能接触到机器写诗的奇妙,还将学会利用最前沿的预训练技术来完成假新闻分类任务。
4.深度学习工程阶段(2周):
了解深度学习相关的工程实践方法,包括前沿的自动化深度学习技术以及深度学习模型部署方法。最终,我们将通过项目挑战比赛来检验课程的学习成果。
-
第一周:涉及到自动化深度学习技术,自动化深度学习可以一定程度上降低深度学习模型的开发门槛,算法的选择、训练、调优、部署等一系列过程都可以交给自动化组件来完成。与此同时,我们将掌握深度学习模型持久化方法,并独立设计部署一个图像分类云端模型推理 RESTful API。
-
第二周:我们依托于 Kaggle 建立了实战化的比赛,你将体会到竞争带来的乐趣。如果你能够出色完成项目挑战内容,将有机会获得课程设置的现金奖学金。除此之外,认真完成项目挑战的学员,也将收到课程组给出的评阅意见。