一、用自己的话描述出其本身的含义:
1、特征选择
含义:从给定的特征集合中选择出相关特征子集的过程,称为特征选择。也可以说,选择出一些最有效特征以降低数据集维度的过程
2、PCA
含义:它是一种简化数据集的技术。也是一个线性变化。可想象成它将原来的样本数据投影到一个新的空间中,把一组坐标转换到另外一组坐标系下,但是在新的坐标系下,不需要那么多的变量,只需要原来样本的最大的一个线性无关组的特征值对应的空间的坐标即可。
二、并用自己的话阐述出两者的主要区别
区别:
②特征选择就是从所有特征中提取部分特征作为训练集特征,但是特征值不变
②PCA就是从一个维度空间到另一个维度空间,在映射的过程仲特征值会发生变化;