机器学习知识总结---2、如何画roc曲线
一、总结
一句话总结:
改变阈值,算出tp和fp
1、roc曲线中,为什么tp(把正样本识别为正样本数)增加,fp(把负样本识别为正样本)也会增加?
鉴别能力一定,让更多好的东西进来,同时也会让更多不好的东西进来,就像小平同志说的,改革开放过后,好的东西会进来,同时苍蝇蚊子也会进来
2、支持向量机映射到高维实例?
比如x=[a,b] => φ(x)=[a^2,b^2,a,b,ab],就将2维映射到了5维
3、如何理解凸函数代数定义:对于任意的w1和w2,λ属于[0,1],有 f(λw1+(1-λ)w2) <= f(λw1) + f((1-λ)w2)?
其实λ等于0,就是w2点,如果λ等于1,就是w1点,而λ在0和1之间,所以点就在w1和w2之间
4、svm的φ(x)是无限维的?
φ(x)的设定是无限维的,但是计算可以不用用到这个无限维度
5、roc图(一般tp为纵轴,fp为横轴)中,如果人脸识别开门应用,那么厂商最看重的是哪个点?
fp(把负样本识别为正样本)为0的点的tp(把正样本识别为正样本数)的值
6、机器学习算法识别率高,算法就一定好么?
机器学习算法识别率高,不一定好,有专门的判别方式,也要根据具体的场景
7、svm(svm本身就是处理二分类问题的算法)如何处理多分类的问题?
分成一类或者其它类,其它类里面可以根据情况再分
8、归一化方法选择?
高斯的这个归一化比较好:减均值,除标准差
二、内容在总结中
博客对应课程的视频位置: