一开始对于机器学习,主要是有监督学习,我的看法是:
假定一个算法模型,然后它有一些超参数,通过喂多组数据,每次喂数据后计算一下这些超参数。最后,数据喂完了,参数取值也就得到了。这组参数取值+这个算法,就是模型文件,后续能够用来预测,也就是直接用这个算法+这个参数取值的组合,能投入实际使用,做分类/回归。
但是后来出现了inference,以及指出和learning是不同的过程。这就有点让人发晕了。learning是啥?inference是啥?learning不是inference的一种吗?
好吧,与其纠结不如去找别人的解释,搬运quora的回答:
"To summarize, the difference between inference and learning depends on the eye of the modeler. If you think like a statistician, then learning/parameter estimation is a type of inference. If you think like a traditional machine learning researcher, then learning is usually parameter estimation and inference is usually prediction. Different perspectives are useful in different situations."
简单说,learning就是计算算法模型超参数取值的过程;inference往往是预测的过程。
醉了,感觉这脱离了inference的本质。《统计学习导论》里面说,inference是为算法模型寻找一个合理解释的过程。我认为:估计隐含变量取值从而解释算法的合理性,或者用采样算法找个别样本来说明“算法模型是合理的”,都算是inference。想不到有时候就把inference当作prediction解释就可以,那还不如就用prediction呢,或者对于具体问题用classification或者regression更合理,反倒用inference会引起混淆。