zoukankan      html  css  js  c++  java
  • Theano学习笔记(二)——逻辑回归函数解析

    有了前面的准备,能够用Theano实现一个逻辑回归程序。逻辑回归是典型的有监督学习

    为了形象。这里我们如果分类任务是区分人与狗的照片

     

    首先是生成随机数对象

    importnumpy
    importtheano
    importtheano.tensor as T
    rng= numpy.random

    数据初始化

    有400张照片,这些照片不是人的就是狗的。

    每张照片是28*28=784的维度。

    D[0]是训练集。是个400*784的矩阵,每一行都是一张照片。

    D[1]是每张照片相应的标签。用来记录这张照片是人还是狗。

    training_steps是迭代上限。

    N= 400
    feats= 784
    D= (rng.randn(N, feats), rng.randint(size=N, low=0, high=2))
    training_steps= 10000

    #Declare Theano symbolic variables
    x= T.matrix("x")
    y= T.vector("y")
    w= theano.shared(rng.randn(feats), name="w")
    b= theano.shared(0., name="b")
    print"Initial model:"
    printw.get_value(), b.get_value()

    x是输入的训练集,是个矩阵,把D[0]赋值给它。

    y是标签,是个列向量,400个样本所以有400维。把D[1]赋给它。

    w是权重列向量。维数为图像的尺寸784维。

    b是偏倚项向量,初始值都是0。这里没写成向量是由于之后要广播形式。

     

    #Construct Theano expression graph
    p_1= 1 / (1 + T.exp(-T.dot(x, w) - b))   #Probability that target = 1
    prediction= p_1 > 0.5                    # Theprediction thresholded
    xent= -y * T.log(p_1) - (1-y) * T.log(1-p_1) # Cross-entropy loss function
    cost= xent.mean() + 0.01 * (w ** 2).sum()# The cost to minimize
    gw,gb = T.grad(cost, [w, b])             #Compute the gradient of the cost
                                              # (we shall return to this in a
                                              #following section of this tutorial)

    这里是函数的主干部分,涉及到3个公式

    1.判定函数


    2.代价函数


    3.总目标函数


    第二项是权重衰减项,减小权重的幅度。用来防止过拟合的。

    #Compile
    train= theano.function(
              inputs=[x,y],
              outputs=[prediction, xent],
              updates=((w, w - 0.1 * gw), (b, b -0.1 * gb)))
    predict= theano.function(inputs=[x], outputs=prediction)

    构造预測和训练函数。

     

    #Train
    fori in range(training_steps):
        pred,err = train(D[0], D[1])
    print"Final model:"
    printw.get_value(), b.get_value()
    print"target values for D:", D[1]
    print"prediction on D:", predict(D[0])

    这里算过之后发现,经过10000次训练,预測结果与标签已经全然同样了。


    欢迎參与讨论并关注本博客微博以及知乎个人主页兴许内容继续更新哦~

    转载请您尊重作者的劳动,完整保留上述文字以及文章链接,谢谢您的支持。

  • 相关阅读:
    Xcode8中Swift3.0适配问题
    Swift3.0语法变化
    一起聊聊 Swift 3.0
    Swift 3.0 的 open,public,internal,fileprivate,private 关键字
    leetcode先刷_Binary Tree Level Order Traversal II
    java + memcached安装
    POJ 2533-Longest Ordered Subsequence(DP)
    网络协议——IP
    使用百度地图——入门
    取消延时功能
  • 原文地址:https://www.cnblogs.com/mengfanrong/p/5185129.html
Copyright © 2011-2022 走看看