最近在写机器学习的白话系列主题文章,突然有人问我,机器学习到底有什么用,如何才能用到实际生活中。我觉得很有必要停下脚步,来认真思考一下这个问题:机器学习,包括深度学习,自然语言处理,如何真正应用到实际生活中去。希望大家能够踊跃讨论。
说到机器学习,最出名的无非就是Google的AlphaGo这样的项目,机器在人类传统的智力游戏中,无情而残酷的战胜了人类。当然,对于大部分正在读这篇文章的你来说,对于大部分正在学习机器学习的人来说,那只是一个终极目标。支撑着AlphaGo的服务器资源和海量数据不是任何机构可以获得的。
在没有大量数据资源和服务器资源的情况下,机器学习到底可以怎么应用到生活中呢?
随着Tensorflow的发布,其实我们已经可以在手机程序中使用人工智能了,下面的图就是Tensorflow通过ImageNet进行图像识别的例子。
当然,图像识别只是一个基础功能,如何使得图像识别应用在实际生活中,则是一个需要研究的课题。同时,由于手机这样的设备,运算能力有限,精度不是很高的情况下,如何满足实际需要,也是一个课题。
当然,如果你懂一些硬件的话,也可以和树莓派一起做一个智能硬件,做一个小车到处逛,顺便执行一些简单的任务。
http://www.leiphone.com/news/201703/2MCSRGD5XpPNbK8c.html
机器学习,一般来说,能做的事情,一种是分类任务,一种是回归任务。
分类的话,在Tensorflow发布的时候,日本有个大叔做了一个智能黄瓜分类器,将原本农作物的分类分拣工作,交给了机器去完成。但是我看了一下,除了垃圾分类之外,暂时也没有什么需要我们去分类的东西。当然,如果能够做到机器学习的自动垃圾分类,也是一个好的主意,做一个智能垃圾回收站。
http://www.infoq.com/cn/news/2016/09/tensorflow-cucumbers
如果你的工作有需要分类的任务,而且对于结果精度要求不高,则可以尝试一下,例如茶叶的分拣。
做HR的或许可以将简历信息和最后录取情况作为数据,训练出一个简历筛选的工具,帮助降低工作强度,当然也可能导致自己失业。
说到回归任务,也就是预测。说到预测,呵呵,股票预测。
股票预测到底靠不靠谱,我觉得,中国股市是一个政策导向的市场,这种市场的预测基本没戏。
其他预测,我也暂时没有想到什么好的项目。原因就是,找到带有标签的大量数据源是一件成本非常高的事情。用爬虫去抓取数据,然后进行标签的整理,也是相当耗时间的事情。
真的要用好机器学习,在这个框架泛滥的时代,可能领域专家比机器学习专家更加重要。Keras这样的框架,如果加上一个可视化的UI,普通人都可以做神经网络了。
自然语言处理,也是机器学习的一个分支。大致有两种模型,一个是LDA主题模型。一个是情感分析模型。
实际生活中的应用,一般也就是抓取各种点评文字,然后通过点评分值,归纳出分值和文字之间的特征。我遇到过一个项目,是金融业的。金融网站会有各种行业里面的针对公司的新闻(相当于数据),证券公司会有对于公司股票级别的评定(买入,持有,卖出,相当于标签),然后将历年的新闻和评级收集起来,做成一个新闻VS评级的模型(输入新闻,输出评级)。有了这个模型之后,通过爬虫去抓取实时新闻,计算出新闻中出现的公司可能出现的股票评级变化情况,推送通知相关客户。这个项目的效果还不知道,或许没有什么实际价值。
现在流行创业,很多人,包括我在内,也希望抓住机器学习这个风口,做一个创业项目。我也深深知道,其实当今资本时代,技术的地位没有那么重要了。除非能够潜心研究一个高大上,无法被抄袭的东西出来。机器学习的核心价值,是大数据和模型。如果有机会拿到一些很有价值的,稀缺性的数据,然后训练,调整出一个高精度的模型,则就离成功很近了。高价值,没有被人利用的数据在哪?能够训练出什么独特的模型,解决实际的问题?找到问题的答案,这个是关键。
关注公众号 TensorFlow教室 深度学习,机器学习,自然语言处理。