分类问题举例(Classification)
- Email: Spam / Not Spam?
- 判断邮件是不是垃圾邮件
- Online Transactions: Fraudulent(Yes / No)?
- 在线交易是不是欺诈
- Tumor: Malignant / Benign?
- 肿瘤是良性还是恶性
二分类问题
y∈{0, 1} 0:"Negative Class" (e.g., benign tumor)
1:"Positive Class"(e.g., malignant tumor)
y=1 一般指的是我们期望的输出
y=0 一般指的是不期望的输出
但是并没有严格规定
多分类问题
y∈{0, 1, 2, 3}
特殊情况下,尝试用线性回归进行分类
Threshold classifier output hθ(x) at 0.5:
if hθ(x) ≥ 0.5, predict "y=1"
if hθ(x) < 0.5, predict "y=0"
设置分类门槛 hθ(x) = 0.5
如果hθ(x)≥0.5,就认为“y=1”
如果hθ(x)<0.5,就认为“y=0”
如果是以下情况就不好
如果把门槛值设置成0.5就不合理