什么是机器学习?
利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
学习模式?
离线学习
在线学习
机器学习的典型应用?
关联规则:“啤酒+尿布”
聚类:全球通(针对经常全球出行的人)、动感地带(针对在校学生用流量比较多)、神州行(针对工人、白领经常打长途电话)
朴素贝叶斯:垃圾邮件
决策树:信用卡欺诈
ctr预估:互联网广告
协同过滤:推荐系统
自然语音处理:情感分析与实体识别
深度学习:图像识别
更多应用:
语音识别
个性化医疗
情感分析
人脸识别
自动驾驶
智慧机器人
私人虚拟助理
手势控制
视频内容自动识别
机器实时翻译
数据特点
交易数据(使用关系型数据)VS行为数据(NOSQL数据的发展)
少量数据VS海量数据
采量分析VS全量分析
数据分析(报告过去的事情)、分析方法(用户驱动、交互式分析)、参与者(数据分析师:数据+算法)
机器学习(预测未来的事情)、分析方法(数据驱动、自动进行知识发现)、参与者(算法)
算法分类(1):
有监督学习:分类算法、回归算法
无监督学习:聚类
半监督学习:小孩走路
算法分类(2):
分类与回归
聚类
标注
算法分类(3):
生成模型
判别模式