模型预测流程(Predictive Modelling Process):
评估矩阵:对于不均衡样本,我们选用F1值而非准确性(accuracy score)来评估,精确度和召回率也可用于本分类问题。
逻辑回归是一种广义的线性回归分析模型。
回归就是表明自变量x与因变量y的关系,即y=f(x)。如医生治病时的望、闻、问、切,之后判定病人是否生病或生了什么病,其中的望闻问切就是获取自变量x,即特征数据,判断是否生病就相当于获取因变量y,即预测分类。
最简单的回归是线性回归,然而线性回归的鲁棒性很差。这是因为线性回归在整个实数域内敏感度一致,而分类范围,需要在[0,1],所以我们在线性回归的基础上,套用了一个逻辑函数(sigmoid函数),把整个实数域映射到[0,1]范围上。
逻辑回归可用于概率预测,也可用于分类。
可能性预测的好处是结果有可比性:比如我们得到不同广告被点击的可能性后,就可以展现点击可能性最大的N个。这样一来,哪怕得到的可能性都很高,或者可能性都很低,我们都能取最优的topN。当用于分类问题时,仅需要设定一个阈值即可,可能性高于阈值是一类,低于阈值是另一类。