Theano学习笔记（二）——逻辑回归函数解析

zoukankan html css js c++ java

Theano学习笔记（二）——逻辑回归函数解析
有了前面的准备，能够用Theano实现一个逻辑回归程序。逻辑回归是典型的有监督学习。

为了形象。这里我们如果分类任务是区分人与狗的照片。

首先是生成随机数对象

importnumpy importtheano importtheano.tensor as T rng= numpy.random

数据初始化

有400张照片，这些照片不是人的就是狗的。

每张照片是28*28=784的维度。

D[0]是训练集。是个400*784的矩阵，每一行都是一张照片。

D[1]是每张照片相应的标签。用来记录这张照片是人还是狗。

training_steps是迭代上限。

N= 400 feats= 784 D= (rng.randn(N, feats), rng.randint(size=N, low=0, high=2)) training_steps= 10000

#Declare Theano symbolic variables x= T.matrix("x") y= T.vector("y") w= theano.shared(rng.randn(feats), name="w") b= theano.shared(0., name="b") print"Initial model:" printw.get_value(), b.get_value()

x是输入的训练集，是个矩阵，把D[0]赋值给它。

y是标签，是个列向量，400个样本所以有400维。把D[1]赋给它。

w是权重列向量。维数为图像的尺寸784维。

b是偏倚项向量，初始值都是0。这里没写成向量是由于之后要广播形式。

#Construct Theano expression graph p_1= 1 / (1 + T.exp(-T.dot(x, w) - b)) #Probability that target = 1 prediction= p_1 > 0.5 # Theprediction thresholded xent= -y * T.log(p_1) - (1-y) * T.log(1-p_1) # Cross-entropy loss function cost= xent.mean() + 0.01 * (w ** 2).sum()# The cost to minimize gw,gb = T.grad(cost, [w, b]) #Compute the gradient of the cost # (we shall return to this in a #following section of this tutorial)

这里是函数的主干部分，涉及到3个公式

1.判定函数

$</p><p>{h_ heta }left( x ight) = frac{1}{{I + {e^{ - { heta ^T}X}}}}$

2.代价函数

$</p><p>Costleft( {{h_ heta }left( x ight),y} ight) = left{ egin{array}{r}egin{array}{*{20}{c}}{ - log left( {{h_ heta }left( x ight)} ight)}&{egin{array}{*{20}{c}}{if}&{y = 1}end{array}}end{array}\egin{array}{*{20}{c}}{ - log left( {1 - {h_ heta }left( x ight)} ight)}&{egin{array}{*{20}{c}}{if}&{y = 0}end{array}}end{array}end{array} ight.$

3.总目标函数

$Jleft( heta ight) = - frac{1}{m}left[ {sumlimits_{i = 1}^m {left( {{y^{left( i ight)}}log {h_ heta }left( {{x^{left( i ight)}}} ight) + left( {1 - {y^{left( i ight)}}} ight)log left( {1 - {h_ heta }left( {{x^{left( i ight)}}} ight)} ight)} ight)} } ight] + frac{lambda }{2}sumlimits_{i = 1}^m {W_i^2}$

第二项是权重衰减项，减小权重的幅度。用来防止过拟合的。

#Compile train= theano.function( inputs=[x,y], outputs=[prediction, xent], updates=((w, w - 0.1 * gw), (b, b -0.1 * gb))) predict= theano.function(inputs=[x], outputs=prediction)

构造预測和训练函数。

#Train fori in range(training_steps): pred,err = train(D[0], D[1]) print"Final model:" printw.get_value(), b.get_value() print"target values for D:", D[1] print"prediction on D:", predict(D[0])

这里算过之后发现，经过10000次训练，预測结果与标签已经全然同样了。

欢迎參与讨论并关注本博客和微博以及知乎个人主页兴许内容继续更新哦~

转载请您尊重作者的劳动，完整保留上述文字以及文章链接，谢谢您的支持。
查看全文

相关阅读:
ubuntu14.04 安装 zoom.us
【JulyEdu-Python基础】第 8 课：Python第三方库
 【JulyEdu-Python基础】第 7 课：Python并发编程以及系统常用模块
 【JulyEdu-Python基础】第６课：高级面向对象
 【JulyEdu-Python基础】第４课：面向对象基础
 【深度学习笔记】第７课：文本和序列的深度模型
 【深度学习笔记】第６课：卷积神经网络简介
 【JulyEdu-Python基础】第３课：容器以及容器的访问使用
 【JulyEdu-Python基础】第 2 课：关键字和循环控制
 【JulyEdu-Python基础】第 1 课：入门基础

原文地址：https://www.cnblogs.com/mengfanrong/p/5185129.html