到目前为止,深度学习是被炒得很火热的一个词,我一个刚出茅庐的小菜鸟,甚至还不能说全面了解深度学习的情况下,仅以个人有限的见解以及跟其他人的交流,说说我的看法。
为什么是过热呢?看看无论是互联网市场,还是大小商品市场,无论是做硬件的,还是倒腾软件的,只要跟信息相关,总想跟大数据或者深度学习扯上关系。貌似在这些人眼中,这些词已经成了高科技的象征,能获得人们无限的任何和认同,或者严重点,崇拜!我不认为国内有多少公司有这样的人力、物力和财力投入到深度学习的研究中来,因为其需要强大的数据,而且目前为止是带标签的有效数据的支撑,这是个关键的问题。可能有人会说,市场上那么多搞数据挖掘和机器学习的公司,他们生存的依赖点在哪里呢?曾经看过一篇文章,我很赞同其中对这个问题的点点看法。国内除了bat这样的团队可能会有在这个课题上烧钱的能力,其他团队若想靠此获利,突破点在哪里呢?只要切入一个点去做,不能放大方向,可能还有一线生机。这样说得抽象了,我举个例子具体点讲。
就说图像识别领域,百度是在早期就成立了深度学习研究院的,他们在这方便算是技术投资相当靠前而且特别下狠劲的,博友们可以去《最强大脑》上看到百度公司的机器人产品“小度”在图像识别上的效果,跟有天赋异禀的人类可以一战。我所了解的小公司呢?比如某公司是做解决方案的,只要有不多的技术大咖支持,他们的产品可以识别车,可以识别人,但是也仅仅停留在是不是、有没有的层面,当然可以在识别之后做一系列的辅助算法来实现业务对接,若想使这套解决方案的效果很棒,那就对使用这个方案的客户场景进行训练,在正负样本数量达到一定,调整训练参数较优之时,完全可以训练出满意的模型。区别在哪里呢?第一是海量的精准数据;第二是优秀人才和N多近似天才之间的差别啊。所以说大公司有实力在最多最好的数据上实践多种抓信息的方法,也是最有可能把真正的深度学习工程化的地方,而不是打着深度学习的旗号实际在用一个层数增加了的有监督学习。
说说今天跟一个美容行业的朋友的聊天心得吧,他们公司是做美容行业的,有自己的美容产品,包括护肤品和仪器。他们目前就是使用传统的图像算法来对使用他们产品的人进行皮肤检测等等,未来也想将数据挖掘和深度学习用到他们的产品中来,其一是可以增加可信度,另一是可以对更多的客户做出更有的护肤方案。但是我觉得,这个难度太大了,首先,他所说以后的数据来源于专业公司收集的数据,且不说这个数据的可信度有多少,其数据对自身产品的契合度就不一定好;其次,影响皮肤的因素太广太杂,硬是强行归出类别给出解决方案,恐怕也是很难做到的;最后,美容产品对皮肤的影响肯定不是即时可见的,得考虑这个效果有滞后期的可能,消费者会不会有这个耐心呢?