一、用自己的话描述出其本身的含义:
1、特征选择
2、PCA
答:特征选择:选择部分特征当做机器学习的相关数据。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。
PCA是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据。这是一种在尽可能减少信息损失的情况下找到某种方式降低数据的维度的方法。
二、并用自己的话阐述出两者的主要区别
特征选择没有改变特征的形式。特征选择后的新特征是原来特征的一个子集。
PCA改变了特征的形式。特征提取后的新特征是原来特征的一个映射。