zoukankan      html  css  js  c++  java
  • 机器学习一

    一  机器学习概念: 

           机器学习是人工智能一个年轻的分支。机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论凸分析算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

      发展史:第一阶段是在20世纪50年代中叶到60年代中叶,属于热烈时期。

          第二阶段是在20世纪60年代中叶至70年代中叶,被称为机器学习的冷静时期。
          第三阶段是从20世纪70年代中叶至80年代中叶,称为复兴时期。
          机器学习的最新阶段始于1986年
      机器学习所采用的策略大体上可分为4种——机械学习、通过传授学习、类比学习和通过事例学习。学习中所用的推理越多,系统的能力越强。
      神经网络是机器学习的一种形式。
           遗传算法是机器学习的一个种类。机器学习分为六类: 经验性归纳学习/分析学习/类比学习/遗传算法/联结学习(神经网络)/增强学习。
      一般说数据挖掘时,等同于机器学习。
      模式识别=机器学习
      监督学习算法:线性回归,逻辑回归,神经网络,SVM
      无监督学习算法:聚类算法,降维算法
      特殊算法:推荐算法

    二 大数据

      机器学习与大数据紧密联系。但是,必须清醒的认识到,大数据并不等同于机器学习,同理,机器学习也不等同于大数据。大数据中包含有分布式计算,内存数据库,多维分析等等多种技术。

      单从分析方法来看,大数据也包含以下四种分析方法:

      1.大数据,小分析:即数据仓库领域的OLAP分析思路,也就是多维分析思想。
      2.大数据,大分析:这个代表的就是数据挖掘与机器学习分析法。
      3.流式分析:这个主要指的是事件驱动架构。
      4.查询分析:经典代表是NoSQL数据库。

      图1机器学习准确率与数据的关系

      通过这张图可以看出,各种不同算法在输入的数据量达到一定级数后,都有相近的高准确度。于是诞生了机器学习界的名言:成功的机器学习应用不是拥有最好的算法,而是拥有最多的数据!

      在大数据的时代,有好多优势促使机器学习能够应用更广泛。例如随着物联网和移动设备的发展,我们拥有的数据越来越多,种类也包括图片、文本、视频等非结构化数据,这使得机器学习模型可以获得越来越多的数据。同时大数据技术中的分布式计算Map-Reduce使得机器学习的速度越来越快,可以更方便的使用。种种优势使得在大数据时代,机器学习的优势可以得到最佳的发挥。

    三 机器学习与人工智能

      人工智能是机器学习的父类。深度学习则是机器学习的子类。如果把三者的关系用图来表明的话,则是下图:

      

      总结起来,人工智能的发展经历了如下若干阶段,从早期的逻辑推理,到中期的专家系统,这些科研进步确实使我们离机器的智能有点接近了,但还有一大段距离。直到机器学习诞生以后,人工智能界感觉终于找对了方向。基于机器学习的图像识别和语音识别在某些垂直领域达到了跟人相媲美的程度。机器学习使人类第一次如此接近人工智能的梦想。

  • 相关阅读:
    二分法查找
    重构方法之一:提炼方法(Extract Method)读书笔记
    使用SQL命令手动写入Discuz帖子内容
    调整linux系统时间和时区
    怎样给访问量过大的mysql数据库减压
    MySQL提示“too many connections”的解决办法
    CentOS 6安装php加速软件Zend Guard
    CmsTop 大众版运行环境搭建 (CentOS+Nginx+PHP FastCGI)
    LEMP构建高性能WEB服务器(CentOS+Nginx+PHP+MySQL)
    CentOS-6.3安装配置Nginx
  • 原文地址:https://www.cnblogs.com/wangyuqin/p/7474432.html
Copyright © 2011-2022 走看看