当提到 Linear Regression 或是 Logistic regression 等关键词时,都会涉及一个概念,叫做 Likelihood Function 以及 Maximum Likelihood Estimation 等等。中文的翻译叫做『似然估计』,按照我自己的理解,认为这个翻译并不是那么的贴切,就如同『鲁棒性』一样。
以下是我对这个概念的理解和解读,如果能促进你的理解,是我的荣幸,如果有错误,还请及时支出:
义务教育阶段的数学,卷子上面的题目,都是直接把条件给你了,例如让你解一个方程:y = 2x+1 and y = 0 或者是解 y = ax+b,但是答案里面允许你带着 参数a 和 参数b 的。我们可以把它们叫做模型。
进入到了大学,我们要进步,要更加贴合实际。在实际应用中,我们不可能信手拈来的就获得了一个完美的模型,或一个带有所有确切参数的模型。这就类似于世界上的感情指导书有很多,但是哪一本都没法把你的女朋友整的服服帖帖的(前提是你有)。
那我们应该如何获得一个好模型?那就可以利用手上现有的资源,经验或者是数据,然后把它们代入你提前假设好的模型,然后获得一个比较满意和理想的参数。注意,这个假设的模型也是基于经验。一个小鸟依人的,和一个暴脾气的女孩子,提前假定的模型是天差地别的。
在概率论中,这个模型就是 概率密度,数据就是 数据(x,y),参数就是 系数 $ heta$。这就是Linklihood Function,参数是未知量,x和y是已知量,而且是很多的x,y。
Maximum 则意味着,我们最终求得的 概率密度,是最接近真实情况的。当然了,最真实的情况,谁也不知道,大概就不是数学的领域,而是哲学的领域了吧。