zoukankan      html  css  js  c++  java
  • (CS229)监督学习应用和梯度下降

    监督学习:基于标记数据的学习

    监督学习又举了两个例子:回归问题regression在连续数据上的模型构建问题  和 分类问题 classification 在离散数据上的问题

    无监督学习:未标记的学习 经典方法是聚类cluster

     应用:使用聚类算法对图像进行处理,聚类处理,使图像更为明显像素分组;

                使用聚类算法将图像分成不同的部分 计算机集群组织 消费人群的划分 星系的组成

                鸡尾酒会问题: 多人说话的情况下 那个人的声音从声音中分离出来 可使用无监督学习的方法

    强化学习: 利用监督学习进行预测; 通过评价函数,决定作出的决策是否是正确的,通常做出一系列的决策; 飞行控制器使用的就是强化学习
    如何定义一个好的行为和一个坏的学习 通过学习性算法进行控制。

    定义:

    $m$为训练数据大小

    $x$为输入变量,是向量

    $y$为输出变量,是实数

    $(x,y)$为一个训练实例

    $(x^{i},y^{i})$是第i个训练实例,i是上标;

    为了方便说明,又添加了一个变量,问题变为房屋面积和卧室数目(可以理解为向量由两个参数组成)与房屋价格的关系

    训练集中的数据使用线性回归问题进行解决:

    $h(x)= heta_{0}+ heta_{1}x_{1}+ heta_{2}x_{2}=sum_{i=0}^{2} heta_{i}x_{i}=h_{ heta}(x)$

    其中,$h_{ heta}(x)$ 表示以$ heta$为参数的。公式如下:

    $h_{ heta}(x)=sum_{i=0}^{n} heta_{i}x_{i}= heta^{T}x$  ==》单个样本的前向推导,也看看作是矩阵的相乘,x由多个变量组成,相应的定义多个参数$ heta$进行线性相乘再累加,相当于进行加权求和,得到输入向量对应于的输出变量的表征,不同的特征具有不同的权重$ heta$。

    x是向量,n是x的长度,从而定义目标函数

    $J( heta)=1/2sum_{i=0}^{m}(h_{ heta}(x^(i))-y^{i})^2$ ==》对整个数据集m 进行优化,使用了平方损失,前面加上一个1/2方便BP时反向的求导,加快计算。

  • 相关阅读:
    卡特兰数
    Tree
    关于树上DP的转移方式与复杂度证明
    Tarjan进阶
    排队
    Perm 排列计数
    [bzoj1227]虔诚的墓主人
    [BZOJ1195]最短母串
    ValueError: Variable vgg_16/conv1/conv1_1/weights already exists, disallowed
    《链家网技术架构的演进之路》读后感
  • 原文地址:https://www.cnblogs.com/ChenKe-cheng/p/11282792.html
Copyright © 2011-2022 走看看