zoukankan      html  css  js  c++  java
  • 机器学习十讲----第一讲

    介绍:

    我们将机器学习定义为一组能够自动检测模式数据的方法,然后利用未发现的模式来预测未来的数据,或者在不确定的情况下执行各种决策(例如计划如何收集更多的数据)!

    大数据分析和人工智能已经成为整个社会发展最主要的基础推动力,两者的基础都是机器学习。大数据分析火热的深刻原因

    ·数据源︰非结构化数据(语音、视频、文本、网络数据)

    ·模型和计算能力∶深度学习、GPU、分布式系统

    . 广泛的应用场景∶营销、广告、金融、交通、医疗等

    大数据:

    是指数据采集、数据清洗、数据分析和数据应用的整个流程中的理论、技术和方法。

    机器学习:

    是大数据分析的核心内容。机器学习解决的是找到将X和Y关联的模型F,从Data到X的步骤通常是人工完成的(特征工程)。

    深度学习:

    是机器学习的一部分,其核心是自动找到对特定任务有效的特征,也即自动完成Data到X的转换。如果我们的任务Y是模拟人类(自动驾驶、围棋AlphaGo )的行为,则这类任务称为人工智能。深度学习也是目前Al中的核心技术。

    机器学习方法分类:

    有监督学习( supervised learning )

    ●数据集中的样本带有标签,有明确目标
    ●回归和分类

    无监督学习( unsupervised learning )

    ●数据集中的样本没有标签,没有明确目标
    聚类、降维、排序、密度估计、关联规则挖掘

    强化学习( reinforcement learning ),

    智慧决策的过程,通过过程模拟和观察来不断学习、提高决策能力
    例如: AlphaGo

    典型方法

    ●回归模型:线性回归、岭回归、L ASSO和回归样条等
    ●分类模型:逻辑回归、K近邻、决策树、支持向量机等

     

     

     

     

     案例:

    使用KNN对新闻主题进行自动分类:

     

    使用PageRank对全球机场进行排序:

     

  • 相关阅读:
    CocosIDE导出Android APK的注意事项
    C++14尝鲜:Generic Lambdas(泛型lambda)
    silverlight调用WebService传递json接收绑定数据
    解决考试系统高并发数据载入不对问题
    汇编入门学习笔记 (九)—— call和ret
    Java SerialPort SDK
    how tomcat works 总结 二
    linux下多线程的调试
    垃圾回收GC:.Net自己主动内存管理 上(二)内存算法
    HDU-4973-A simple simulation problem.(线段树)
  • 原文地址:https://www.cnblogs.com/dazhi151/p/14337332.html
Copyright © 2011-2022 走看看