转自:https://www.jianshu.com/p/c21c0e2c403a
1.min-max归一化
针对每一个特征,最小-最大缩放:x-min/(max-min),
这样就缩放到了[0,1]之间,就会有一个范围,对应sklearn.preprcessing中的MinMaxScaler 。
2.z-score标准化
减去均值之后除以方差。
使得服从均值为0,方差为1的标准正态分布。对应sklearn.preprcessing中的StandardScaler :为使各特征的均值为0,方差为1.
3.Normalization
- Normalizer :使每条数据各特征值的和为1
对每个特征的和归一化到一个特定的值。
4.PCA需要做什么归一化?
http://sofasofa.io/forum_main_post.php?postid=1000375
引用的两个链接中都提到,需要先做z-score的归一化,均值为0,方差为1。
from sklearn.preprocessing import StandardScaler scaler = StandardScaler()
有助于求解更准确。