zoukankan      html  css  js  c++  java
  • 超智能体笔记--什么是机器学习

    从小学到高中,每天上学时又是为了什么?

    有人说,是为了考上理想的大学,那考上理想的大学又是为了什么?有人说,为了找份好的工作。

    可思考的顺序却应该是反过来的:找到好工作的前提是可以胜任这分工作,而可以胜任这份工作的前提是可以解决工作中所遇到的问题。

    在遇到问题时,应用自己掌握问题的方法,获得一个预测,但预测的结论不一定正确,我们希望可以利用已经掌握的方法得到与正确答案一致的预测。但是方法并不能凭空产生,需要从以往的经验种学习,找到问题和答案之间的正确关系。

    高考学习

    应用是用问题和方法来预测答案,而学习是用问题和答案来获得方法。获得方法才是学习得目的,才是从小到大你我每天上学的目的。比如我们从大量历年的高考问题和其对应答案中学习某个问题的解题方法,高考的目的是希望学到一个能解决高考种任意该类问题的方法,可在高考之前,我们并不知道已学到方法是否有效。所以需要模拟考来测试,用已经学到的方法预测模拟问题的答案。通过和模拟答案的对比得出考试分数,从而衡量学习得有效性。而决定一切的并非是否可以解决学习时所用的就问题,也并非是否可以解决模拟题,而是能否解决最后的高考题。然而高考也只是验证自己所学方法有效性的一次模拟。不同之处在于,该次模拟的结构是给他人参考而用的,各个大学和企业会用改次模拟的结构来判断你说学方法的有效性,来判断你将来解决问题的能力,更多的也是判断你的学习能力。

    机器学习

    上述过程时高考学习,同时也是机器学习中重要的监督学习。
    监督学习,是指有明确答案,可供寻找问题与答案之间关系的学习方式。不过以上的概念在机器学习中有了新的名字。

    描述问题与答案之间关系的方法叫做模型。
    学习问题与答案之间关系的过程叫做训练。
    解决问题的过程叫做预测。
    衡量模型好坏的过程叫做评估。
    训练所用的问题和答案叫做训练集。
    评估所用的问题和答案叫做测试集。
    训练集合测试机都是数据,需要提前搜集。
    而当前人工智能的核心,也就是将你我从小学到高中做了12年的事情搬到计算机上来做,最终的目的是希望得到一个可以解决该任务下任意新问题的模型,也就是:用数据来训练处模型再应用。

    未来工作

    阿法狗战胜李世石之后,人们更多的是担忧未来自己的工作会被取代。这种担忧在历史上循环出现,每当出现新技术出现替代人某项能力的主导地位之际。例如,机器对人体能上的超越,计算机对人模拟能力上的超越。

    可是即便没有人工智能,随着时间的推移,所要解决的问题必然会随之改变,想要保持自身的价值,就需要再次学习,这也是为什么我们需要终身学习的原因。这也意味着,虽然高考学习得东西,可能将来某些同学不会用到,但以考核学习能力的高考来筛选人才确实是有一定的道理的。

    而这次的人工智能的技术却是扩充了人类的学习能力,它允许我们在计算机上来学习解决问题的方法,所学到的方法的好坏决定了你我是否可以有效的解决问题,决定了你我可以找到什么样的工作,创造多少价值,获得多少工资。

    学习能力才是我们获得方法,解决问题,创造价值的原动力、不管是高考学习还是机器学习,你是否认为机器学习仅仅是一个新兴行业呢。

    这是一项人人都应该掌握的技术,但市面上绝大多数的教程都是从抽象的数学开始,线性代数,概率统计,微积分,随后又是编程算法,光学处理,光是预备课就足够学习好几年,这些都是非常有用的工具,是精通和推动人工智能的必要技能,但却不是入门的最好学习顺序。

    说起来,没有人是先搞清楚自己大脑的学习原理再去学习?况且并非所有人都要推动人工智能的发展,而事实上,你我早已掌握了理解机器学习技术的全部只是,只是你并未察觉。虽然研究和推动人工智能的发展十分困难,但学习如何使用人工智能技术却是出乎意料的简单,这要归功于人工智能研究的开源,允许人们不断的更新和推动更方便简单的工具。

    TensorFolw是谷歌的机器学习工具,现在市面上的TensorFolw书籍虽然在知识概念上依然有效,但实现的方法都已经过时,因为知识总是不断迭代的。

    重要的并不是知识本身,而是学习知识的能力,这项能力是我们的祖先在无数次被残酷的自然选择之后说留下的,这项能力支撑了我们在地球上的存在。

    知识点

    image.png-133.7kB

    • 监督学习:有明确答案,可供寻找问题与答案之间关系的学习方式
    • 模型:描述问题与答案之间关系的方法
    • 训练:学习问题与答案之间关系的过程
    • 预测:解决问题的过程
    • 评估:衡量模型好坏的过程
    • 训练集:训练所用的问题和答案
    • 测试集:评估所用的问题和答案
    • 数据:训练集和测试集都是数据。需要提前搜集
    • 机器学习:用数据来训练出模型并再应用
  • 相关阅读:
    background之你不知道的background-position
    ES6学习笔记(二)
    ES6学习笔记(一)
    将博客搬至CSDN
    Mongodb的性能优化问题
    使用AngularJS实现的前后端分离的数据交互过程
    输出JS代码中的变量内容
    程序生成word与PDF文档的方法(python)
    python 2.7安装某些包出现错误:"libxml/xmlversion.h:没有那个文件或目录"
    Linux中安装配置spark集群
  • 原文地址:https://www.cnblogs.com/eveblog/p/10243173.html
Copyright © 2011-2022 走看看