zoukankan      html  css  js  c++  java
  • 参数与超参数

    作为机器学习攻城狮(咳咳:调参员),参数和超参数是最最基础的常识。

    1、参数(模型根据数据可以自动学习出的变量)

    参数指的是模型内部的配置变量(configuration variable),可通过数据来估计其取值。

    从数据中估计或学习得到

    通常不被人为设定

    常作为最终模型的一部分被保存

    参数是机器学习算法的关键,它们是从历史训练数据中学习到的,属于模型的一部分。

    在经典的机器学习文献中,我们可以把模型看作是假设,把参数看作是针对某特定数据实现假设的工具,通常来说,模型参数是算法考虑所有可能取值后得到的最优解。

    统计学:在统计学中,我们可能会为一个变量假设服从某个分布,如高斯分布。高斯分布具有两个参数,分别是均数和标准差。这样的理解在机器学习中也是成立的,这些参数可以通过数据进行估计,并且作为预测模型的一部分。

    编程:在编程中,我们可能把参数传递给函数。在这个情况下,参数作为函数变量(function argument)可以取一系列值中的一个。在机器学习中,我们使用模型就是在外部数据中进行预测所需的函数和参数。

    模型具有固定个数的参数,叫做参数模型,若具有可变个数的参数,则为非参数模型。

    下面是几个关于模型参数的例子:

    人工神经网络的权重

    支持向量机中的支持向量

    线性回归及logistic回归中的回归系数

    2、超参数(用来确定模型的一些参数)

    模型超参数指的是模型外部的配置变量,不能通过数据来估计其取值

    常用于帮助估计模型参数的过程

    通常由人为设定

    可用探索的方法对其进行设定

    可针对给定的预测建模问题对超参数进行调整

    我们不能获得针对某个特定问题的模型参数的最优取值。但我们可以采用经验法则,参考用于其他问题的取值,或者通过反复尝试寻找最佳值。

    当机器学习算法用于解决特定问题时,我们正是采用规则搜寻或者随机搜寻的方式,对模型的超参数进行调整,来发现模型的参数,从而得到最优的预测。

    下面是几个关于模型超参数的例子:

    训练神经网络的学习率(learning rate)

    支持向量机中的C(惩罚系数)和sigma(与支持向量的个数有关)

    k最近邻算法(k-nearest neighbors)中的k(邻居个数)

  • 相关阅读:
    pyenv: python2.7: command not found The `python2.7' command exists in these Python versions: 2.7.5
    Gazebo_02_build_a_robot
    Gazebo_01_getting_start
    vscode等编辑器中报Exception has occurred: ModuleNotFoundError No module named 'requests'
    Ubuntu16.04安装Python3.8以后出现lsb_release/No LSB modules are available的错误
    C语言字符串定义(数组&指针)
    电脑软件更新管理
    VS2017自定义新建模板
    《SQL必知必会-第四版》--学习摘抄
    实体类封装数据库查询信息(工具一)
  • 原文地址:https://www.cnblogs.com/dearL/p/9470858.html
Copyright © 2011-2022 走看看