zoukankan      html  css  js  c++  java
  • Nesterov方法的python实现

    牛顿动量法,相比于上一篇Momentum,不一样的地方是应用了临时更新

    这里用python对其进行简单实现,如下:

    # coding=utf-8
    """
    基于小批量梯度下降来实现的Nesterov
    参考:https://blog.csdn.net/bvl10101111/article/details/72615961
        相比于上一篇的Momentum,不一样的地方是应用了临时更新
    @author: Reynold
    @date: 2018-08-21
    """
    import numpy as np
    import random
    
    # 构造训练数据
    x = np.arange(0., 10., 0.2)
    m = len(x)
    x0 = np.full(m, 1.0)
    input_data = np.vstack([x0, x]).T  # 将偏置b作为权向量的第一个分量
    target_data = 3 * x + 8 + np.random.randn(m)
    
    # 两种终止条件
    max_iter = 10000
    epsilon = 1e-5
    
    # 初始化权值
    np.random.seed(0)
    w = np.random.randn(2)
    v = np.zeros(2)  # 更新的速度参数
    
    alpha = 0.001  # 步长
    diff = 0.
    error = np.zeros(2)
    count = 0  # 循环次数
    
    eps = 0.9  # 衰减力度,可以用来调节,该值越大那么之前的梯度对现在方向的影响也越大
    
    while count < max_iter:
        count += 1
    
        sum_m = np.zeros(2)
        index = random.sample(range(m), int(np.ceil(m * 0.2)))
        sample_data = input_data[index]
        sample_target = target_data[index]
    
        # 应用临时更新,先更新一下参数w的值
        tmp_w = w + eps * v
        for i in range(len(sample_data)):
            dif = (np.dot(tmp_w, input_data[i]) - target_data[i]) * input_data[i]
            sum_m = sum_m + dif
        v = eps * v - alpha * sum_m  # 在这里进行速度更新
        w = w + v  # 使用动量来更新参数
    
        if np.linalg.norm(w - error) < epsilon:
            break
        else:
            error = w
    print 'loop count = %d' % count, '	w:[%f, %f]' % (w[0], w[1])

    结果,由于数据量太小,相比于Momentum提升不是很大:

    loop count = 437     w:[7.930222, 3.088267]
  • 相关阅读:
    【2017-06-20】Linux应用开发工程师C/C++面试问题记录之一:Linux多线程程序的同步问题
    April 14 2017 Week 15 Friday
    April 13 2017 Week 15 Thursday
    April 12 2017 Week 15 Wednesday
    【2017-06-17】QtGui基础控件:QSpinBox及QDoubleSpinBox
    April 11 2017 Week 15 Tuesday
    April 10 2017 Week 15 Monday
    April 9 2017 Week 15 Sunday
    April 8 2017 Week 14 Saturday
    April 7 2017 Week 14 Friday
  • 原文地址:https://www.cnblogs.com/leixingzhi7/p/9520135.html
Copyright © 2011-2022 走看看