概述
人工智能很火,各国出台政策
有趣的图灵测试
人工智能包括——计算智能(“深蓝”对战卡斯帕罗夫,国际象棋,暴力搜索,本质是计算)、感知智能(能听会说,能看会认,类似于人的视觉、听觉、触觉等感知能力
)、认知智能(逻辑推理、知识理解、决策思考,概念、意识、观念都是认知智能的表现 )
相对于知识工程,机器学习具有减少主观性,可信度高等优点
机器学习更适合用来处理“规则复杂、问题规模大”的问题,至于“规则简单、问题规模大”的问题,可以通过手工建立规则的专家系统来解决。
机器学习的定义分为以下几类:
什么样的问题适合用机器学习,应当具有以下几个特点:
- 需要自动化处理(如果不需要则可采用手动方式)
- 规则比较复杂(如果规则简单可以使用专家系统)
- 有明确的判定规则(比如母亲的行为和胎儿性别之间的关系,就可以用机器学习;但是如果想预测孩子什么时间哭,就做不到)
- 要有足够多的数据
- 有规则的模式和有意义的特征
- 问题不存在解析解(如果存在解析解,应当求解方程组,哪怕会复杂一些;机器学习得到的结果是近似解)
=========================2019.11.18更新===================================
模型分类
半监督学习——出发点是未标注的数据比较容易获得摒弃成本低,最大的作用是在标记样本比较少的情况下辅助判决(比如正例反例各一个,中间有一个待判决样本,这时就很难判定该样本属于哪一个分类,若此时加入大量未标记样本,可以发现未标注样本更多是提供数据分布方面的信息,据此我们就更有信心判断该样本属于正例)
强化学习——最大的特点是数据虽然没有标注,但是可以得到关于数据目标相关的反馈,时刻决策类问题
生成模型、判别模型的区别
书籍推荐:
西瓜书——大而全,深入浅出,适合作为工具书,不适合一开始就抱着啃
统计学方法——从模型、策略、方法介绍机器学习,从概率的方法做了介绍,字字珠玑
机器学习 从公理到算法——从公理角度推出主流方法
machine learning——和西瓜书有点像,讲理论但不讲推导,只讲思路
pattern classfication——比较经典。很多前沿方法没介绍
PRML——从贝叶斯角度介绍机器学习办法,如果能看完,你博士论文一定能写的很出色
数学之美——给了很多工程案例,是入门的好教材
从左到右——从入门到进阶
不同方法分支
传统机器学习——特征比分类器重要
前两种,特征依赖于人的手工筛选。后两种方法,特征不依赖于手工选取,深度学习在表示学习的基础上,多层提取特征,由简单到复杂;比如人脸方面——简单特征包括脸的边缘,复杂一些的特征包括眼睛、鼻子、嘴巴,再复杂一些的包括人脸全貌或者表情
神经网络的几条发展路线
拒绝做调参侠
工程门槛低,科研门槛高