1.机器学习的定义
Machine Learning (ML) is a scientific discipline that deals with the construction and study of algorithms that can learn from data
机器学习是一门从数据中研究算法的科学学科
根据已有的数据,进行算法选择,并给予算法与数据构建模型,最终对未来进行预测
2.机器学习理性认识
个人理解(主要分为两块):
(1).对新的问题,通过经验(主体应该是人)对新的问题进行归纳总结出规律,并用此规律对未来进行预测.
(2).对相应的历史数据建模并进行训练(对机器进行训练),找到适合的模型,当新问题出现时通过模型对新数据进行预测.
(机器学习只能学习代码(0,1),故需要对一些概念进行定义)
机器学习涉及都的基本概念:
输入: x (属性值.特征值)
输出: y (目标值)
获取一个目标函数: f :X-->Y(理想的公式) 找一个映射 ---可对函数进行迭代,找到最优的目标函数
输入数据: D={(x1,y1),(x2,y2),......,(xn,yn)}(l历史记录数据)
最终具有 最优性能的假设公式:
g: X--->Y(学习得到最终的公式)
机器学习中无法找到一个完美的函数f
从数据中获得一个假设的函数g,使其非常接近目标函数f的效果
(在测试集上面预测效果最好)
A program can be said to learn from experience E with respect to some class of tasks Tand
performance measure P , If its performance at tasks in T , as measured by P , improves with experience E.
对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;醉着提供合适.优质.大量的经验E,该程序对于任务T的性能逐步提高.
算法(T):根据业务需要的数据特征选择的相关算法,也就是一个数学公式
模型(E):基于数据和算法构建出来的模型
评估/测试(P):对模型进行评估的策略