-0.机器学习常用的模型:
例如,线性模型、逻辑回归、Softmax、神经网络/深度学习、SVM、决策树、随机森林、GBDT、矩阵分解。
-1.神经网络
在一个数据集上训练成型的深度神经网络,在另外一个完全不同的数据集上只需稍加训练,就有可能
适应和完成那个新的任务。(迁移学习 Transfer Learning)
1.1
线性神经元:指输出和输入呈线性关系的一种简单模型。
1.2
线性阈值神经元(也称为 McCulloch-Pitts神经元)
特征如以下:
(1)输入和输出都是二值。
(2)每个神经元都具有一个固定的阈值a。
(3)每个神经元都从带有权重的激活突触接收输入信息。
(4)抑制突触对任意激活突触有绝对否决权。
(5)每次汇总带权突触的和,如果大于阈值a,而且不存在抑制突触输入,则输出为1,否则为0。
1.3
Sigmoid神经元
可以使输出平滑而连续地限制在0~1的范围内,他靠近0的区域接近于线性,而远离0的区域非线性,
Sigmoid神经元可以将实数“压缩”至0~1的范围内,大的负数趋向于0,大的正数则趋向于1.
1.4
Tanh神经元
1.5
ReLU
-2.神经网络的训练步骤
常用:基于梯度下降法的神经网络
训练步骤:
(1)从训练集随机训练样本 X
(2)将 X 在当前参数 W 下进行前向传播得到损失值(loss)
(3)根据链式法则,进行后向传播得到梯度值 (求导loss)/(求导W)
(4)更新参数值 W = W- n* (求导loss)/(求导W)
(5)循环步骤1-4,直至loss满足目标,网络训练完成。
-2.2.1线性神经元
y=wx+b
-3.初始化模型
受限玻尔兹曼机(Restricted Boltzmanm Machine,RBM)
自动编码器(AutoEncoder,AE)
深度信念网络(Deep Belief Network,DBN)
-4.卷积神经网络
-5.循环神经网络