zoukankan      html  css  js  c++  java
  • 深度学习基本概念简介

    深度学习基本概念简介

    1. 从线性模型说开去

    Linear models 存在的问题:y与x始终呈线性关系(Model Bias:模型偏差)

    我们需要更加复杂的模型(如何拟合出上图红色线类似的形状)

    constant表示常数,当x1的值达到某一threshold(阈值)的时候,set1的分段值会发生改变,即产生斜坡。

    0+1=red(1)

    0+1+2= red(2)

    0+1+2+3 = red(3)

    red(1)、red(2)和red(3)分别表示上图中红线的三个分段

    所有的分段线性曲线(Piecewise Linear Curves)都可以用常数加上蓝色函数实现。(分段线性曲线的转折越多,对应蓝色函数的分段也越多)

    如果不是分段线性曲线,可以用点分割的方式转换成分段线性曲线。

    2-1. 如何表示蓝色函数

    (1)Sigmoid函数作为激活函数

    (2)调整b,w,c使得产生的sigmoid function不断地逼近真实的蓝色函数

    (3)新模型:加入更多的特征

    (4)r的线性代数表示

    (5) r通过sigmoid函数得到ai

    (6)最后ai与常数ci相乘的时候重点注意ci需要转置。

    x表示feature

    WbcTb都表示未知参数

    (7)将以上所有参数竖直排,形成参数矩阵

    2-2 求新模型的最优解

    θ* 表示最优解,与之前机器学习的步骤相同,随机挑选θ0

    倒三角形表示Gradient

    将数据量为N的数据集随机分为若干个batch(B)小数据组,每个batch算出的Loss都用来更新参数(并非直接使用N对应的Loss)

    每更新一次参数叫做Update

    将所有的batch都看过一遍叫做一个epoch

    为什么要将hard sigmoid换成soft sigmoid

    其实不用换,hard sigmoid可以由两个ReLU函数叠加

    S型函数转变为线性整流函数(激活函数:Activation 的选择)

    使用ReLU作为激活函数进行实验

    对模型修改的思考:

    (1)更改我们所使用的激活函数

    (2)多层调参,多个不同激活函数可以嵌套,多个相同激活函数也可以嵌套

    Neuron指的是神经元(激活函数得出的值)

    Neuron Netword指的是神经网路

    每排Neuron叫做一个hidden layer:隐藏层

    很多的hidden layer叫做deep

    deep的整套技术称为Deep Learning

    不一直将layer更加深入的原因在于会出现过拟合现象

  • 相关阅读:
    epoll的LT和ET模式
    linux搭建java环境
    【第三方SDK】百度地图实现最简单的定位功能(无地图界面)
    闲云控制台(二)查看文件功能,支持十六进制查看文件
    ios8 swift开发:显示变量的类名称
    cocos2dx的runAction: 反复运行,多个动作连接运行,多个动作同一时候运行的实现
    myeclipse设置凝视
    2-06. 数列求和(20)(ZJUPAT 数学)
    【IPC进程间通信之四】数据复制消息WM_COPYDATA
    条件熵定义推导公式
  • 原文地址:https://www.cnblogs.com/MurasameLory-chenyulong/p/14812275.html
Copyright © 2011-2022 走看看