分类
分类问题无法用线性函数来表达,分类问题更像一个只有很少离散值的回归问题。
这里我们聚焦在只有两个值(0或者1)的二元分类问题上。
Hypothesis 函数
对于分类问题,我们用 Sigmoid 函数(即逻辑函数)作为 hypothesis 函数
Sigmoid函数的曲线图如下:
函数 g(z) 的值始终在(0,1)之间。
hθ(x) 表示输出为1的概率是多少。譬如 hθ(x) = 0.7 就表示我们输出为1的概率是70%,输出为0的概率就是30%。
Decision Boundary
为了得到0或者1的分类输出,我们可以这么表示 hθ(x)
逻辑函数 g 表示,当它的输入大于或者等于0时,输出会大于或者等于0.5
如果我们的输出 g 为 θTX,那么
那么可以推导出:
decision boundary 就是把 y = 0 和 y = 1 区域分开的那条线。它是由 hypothesis 函数生成的。
例如:
在这个例子里,我们的 decision boundary 是 x1 = 5 的那条直线,直线的左边 y = 1,直线右边 y = 0。
sigmoid 函数 g(z) 的输入不需要是线性的,可能会是一个圈或者任意其他形状来适配我们的数据。