我们经常在算法中提到鲁棒性(robustness)和稳定性(stability)。经过询问朋友,才了解到它们之间的区别:
鲁棒性就是耐粗耐糙特性,适应性的意思,相当于汽车里说的美国汽车皮实耐用。
稳定性就是计算过程中的波动幅度,有些剧烈,有些平稳。
补充:
虽然二乘法是机器学习最实用的学习法,但是当训练样本包含异常值时,学习效果或多或少会受到影响。对于线性模型y=ax+b,
以10个训练样本进行最小二乘法学习的例子。如下图所示:
左图是没有异常值时的学习结果,右图是存在一个异常值的学习结果。
从上图可以看出,它们的学习结果发生了极大的变化。
结论:最小二乘法学习易受异常值的影响。
在实际中,样本数量很多的时候,或多或少存在异常值。这种情况下应用最小二乘法学习,并不能得到令人信赖的结果。
在统计学习和机器学习领域,对异常值保持可靠、稳定的性质,称为鲁棒性。