zoukankan      html  css  js  c++  java
  • 机器学习:一些概念的通俗理解

    模型:输入到输出之间的“映射”

    监督学习/非监督学习/增强学习:

    学霸:“有效地”刷越多的题,学霸的学习成绩就越好

    学神: 对各种输出未知问题的建模能力很强

    老干部:“察言观色”,对周围环境的变化有很好的理解

    非监督学习工业界很少应用,主要是在研究机构

    监督学习场景下,机器需要的四要素:

    模型,数据,目标函数(损失函数),优化算法

    对应于——人,试题,评分标准和答案,改进方案

    深度学习的崛起:

    大数据时代来临,(信息的)原始数据维数急剧上升

    让计算机用浅层的模型在原始信息上解决问题存在困难,即不容易获得很高的精度

    “特征工程”:

    (利用人工来设计方法)将原始特征转换为更容易处理的特征

    实际上相当于前若干层神经元的工作由人脑完成,这时用浅层模型就可以处理很多复杂的问题

    特征工程也就是这些特征生成的过程和方法,让浅层模型可以更好的完成最后的任务。

    通过加大模型深度,深度学习能从原始数据学习出特征生成的方法,而不需要人工设计

    相对于浅层模型,深度学习最大优势——效果提升显著(很多达到95%+)

    深度两大难点

    一:计算量,参数数量庞大

    二:模型复杂度成倍增长,训练过程中不可控问题增多

    浅层模型的损失函数往往可以满足凸函数的性质,数学特性非常好

    深层模型中凸函数性质不再满足,优化曲面也变得不那么友好,优化过程中出现很多问题

    凸函数:

    通过“Jensen不等式”来判定,一阶导数条件+二阶导数条件

    良好的数学性质:只要找到一个导数为0的局部最优值,就找到了全局最优值。

    目标函数(损失函数)

    通常采用平方损失函数,即与真实结果的方差

    优化目标:最小化损失函数

    优化三步骤(迭代):

    一:为参数设定一些初始值

    二:利用梯度信息计算参数的更新值

    三:判断参数优化是否完成,如果完成则停止优化,否则回到第二步

    优化的重点在第二步

    如何判断优化是否完成?几种方法如下,

    一:判断参数所在位置的梯度是否靠近0(梯度收敛)

    二:判断参数的更新量是否靠近0(柯西列收敛)

    三:判断预设的迭代轮数是否已完成

    #数据挖掘

    大数据三大关键技术:机器学习、云计算、众包

    数据挖掘关键技术:机器学习+数据库

  • 相关阅读:
    Python爬虫入门一之综述
    关于 PHP 7 你必须知道的五件事
    10个用于Web开发的最好 Python 框架
    如何用Python编写一个聊天室
    无需操作系统直接运行 Python 代码
    使用Python开发chrome插件
    Python下用Scrapy和MongoDB构建爬虫系统(1)
    python 目录操作
    用主题模型可视化分析911新闻(Python版)
    React Native通信机制详解
  • 原文地址:https://www.cnblogs.com/eniac1946/p/7837705.html
Copyright © 2011-2022 走看看