概率论与贝叶斯先验学习记录
矩阵和线性代数学习记录
梯度
梯度本意是一个向量,具有向量的属性,既有方向也有大小,大小为最大方向导数,方向为沿着梯度向量的方向,最大值为梯度向量的方向,最小值为梯度向量相反的方向。
梯度下降
梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以),找到最小值X0,如:
在这个简单的二次函数中,分段求取最小值,这时我们分成三段
情况1:单调下降,导数为负(梯度为负),要想找到函数的最小值所对应的自变量的值(曲线最低点对应x的值)怎么走?水平向右滑,也就是让x增大,此时随着x增大,函数值是减小的(梯度下降)
情况2:单调上升,导数为正(梯度为正),要想找到函数的自变量的值(曲线最低点对应x的值)怎么走?水平向左滑,也就是让x减小,此时随着x减小,函数值减小的(梯度下降)。
综上所述:
1.梯度下降:两个意思,1.根据梯度(导数)的符号来判断最小值点x在哪; 2. 让函数值下降(变小)。
2.梯度就是导数(对于多维就是偏导数)
3.梯度下降作用是找到函数的最小值所对应的自变量的值(曲线最低点对应x的值)。
我们的目的就是找x,找到当x等于某个值时,f(x)'=0。
贝叶斯定理
贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。其中P(Bi|A)是在A发生的情况下,Bi发生的可能性。
公式为: