问题描述:m examples : (x(1),y(1)), (x(2),y(2)),..., (x(m),y(m)) and n features;
计算方法:θ = (XTX)-1XTy;
计算过程:
(1) x(i) = [ x0(i)
x1(i)
...
xn(i)
]
为列矩阵;
(2)design matrix:
X = [
(x(1))T
(x(2))T
(x(3))T
...
(x(n))T
]
(3)compute with the format
θ = (XTX)-1XTy;
和梯度下降比较
(1)梯度下降:
需要选择速率α;
需要许多迭代;
当n取值很大(n >= 106)时效果更好;
(2)正规方程:
不需要选择速率α;
不需要很多次的迭代;
需要进行矩阵计算,复杂度为O(n3)
适用于n比较小的情况;