zoukankan      html  css  js  c++  java
  • 初识机器学习——吴恩达《Machine Learning》学习笔记(十二)

    支持向量机(Support Vector Machines)

    优化目标(Optimization objective)

    SVM与logistic回归

    SVM假设函数

    直观上对大间隔的理解(Large Margin Intuition)

    SVM也被称为大间距分类器,SVM代价函数的图像分析:

    大间距分类,间距

    大间隔分类器的数学原理(The mathematics behind large margin classification)

    核函数1(Kernels)

    通过把相似度核函数的f1,f2,f3等做为新的特征,那么,离特定的标记点近,可以使边界函数大于0,离特定的标记点远,可以使边界函数小于0,从而定义了标记点空间中的边界,也就是有了边界函数。

    相似度函数是一种核函数,这里用的相似度函数是高斯核函数。

    具体实例

    核函数2(Kernels)

    标记点的选取,选取训练样本作为标记点。把训练数据的每个数据点看做一个标记点(landmark),于是有数据量m个标记点。每个数据点x(i)都由它自己的若干个老特征量组成,每个数据点又与所有的标记点做一次相似度函数运算(高斯函数运算),每次运算形成一个新的特征量f,那么每个老的数据点就变换出了m个新特征量的一个新点。

    SVM with Karnels

    SVM with Karnels

    SVM参数的选择,C参数的选择,大C:低偏差,高方差;小C:高偏差,低方差

    使用SVM

    使用已经成熟的SVM软件包(如liblinear,libsvm)来获取参数。SVM函数是一个凸函数,所以不用担心,一定会有全局最优解。线性核函数(linear kernel)——没有核函数的函数

    注意,使用高斯核函数前,一定记得进行特征缩放。否则,某个特征就会表现得比较突出!

    还有其他类型的核函数,如String kernel、Polynomial kernel等,但主要还是使用高斯核函数以及线性核函数。此外,SVM里面有专门的软件包来处理多元分类问题!

    那么,什么使用Logistic回归、线性核函数和高斯核函数呢?

    n很大,n>=m,n=10,000,m=10……1000,用logistic回归或不带核函数的SVM。
    n小,m适中,n=1—1000,m=10—10,000,用高斯核函数的SVM。
    n小,m很大,n=1—1000,m=50,000+,创造更多特征,然后使用logistic回归或不带核函数的SVM。

    此外,以上的这些,神经网络也可以处理,但是,速度会比较慢!

  • 相关阅读:
    初学OptaPlanner-01- 什么是OptaPlanner?
    初学推荐系统-05-Wide&Deep [附tensorflow的WideDeepModel代码简单实践]
    初学推荐系统-04-FM (因子分解机:多特征的二阶特征交叉)
    初学推荐系统-03- 隐语义模型与矩阵分解
    初学推荐系统-02-协同过滤 (UserCF & ItermCF) -附简单示例和优缺点分析
    [Datawhale 10月] 初学推荐系统-01-概述
    TiDB-BR数据备份和恢复工具
    Oracle-估算运行时间长的耗时操作语句
    Hadoop、Spark——完全分布式HA集群搭建
    Hadoop——集群参数配置详解
  • 原文地址:https://www.cnblogs.com/haifengbolgs/p/9409891.html
Copyright © 2011-2022 走看看