机器学习西瓜书白话解读笔记---0216-0223、还是模型评估
一、总结
一句话总结:
娱乐可以用音乐和【好玩的】运动【代替】游戏
1、多分类方法?
可以【直接多分类】,或者转化为【二分类】,
转化为二分类的话,【第一种就是(1,2)、(1,3)、(1,4)、...、(2,3)、(2,4)】,【另一种就是(1和其它)、(2和其它)......】
2、P-R模型作用?
【多个模型之间比较优劣】,比如ABC三个模型之间比较
图中B肯定是好于C的,【无论precision还是recall】,B都好于C
对于AB出现交叉的情况,比较方式有三种:方法一:【比较AB面积的大小,在一定程度上表征了模型的优劣,但是这个值不容易估算】;方法二:【F1点】;方法三:【Fbeta点】
3、ROC曲线和P-R曲线是不同的?
【P-R曲线是1/(1+2),1/(1+3)】:通俗理解就是正样本的一些情况
【ROC曲线是1/(1+2),3/(3+4)】:通俗理解就是正样本和负样本综合情况,3/(3+4)就是负样本情况,相当于坏人,1/(1+2)就是好人
4、排序损失:rank-loss?
5、AUC和rank-loss的关系?
$$AUC = 1 - ell _ { rank }$$:直接看下面的图即可得
6、代价曲线基本思路?
【目的】:对于一个模型,根据p不同,找到使得【代价总期望最小】的模型的阈值
【横轴】:归一化的【正概率代价期望】
【纵轴】:归一化的【总代价期望】
二、内容在总结中
博客对应课程的视频位置: