一、用自己的话描述出其本身的含义:
1、特征选择
从原来的多组特征里面进行筛选,选择出一些特征来降低特征量。通过特征选择来过滤掉一些冗杂的特征以达到降低数据集维度的目的。
2、PCA(主成分分析)
是一种分析和简化数据集的技术,主要目的是为了将数据维护压缩,尽可能的降低原本数据的复杂。程度,不过会因此损失少量信息。当使用数据进行回归分析或者聚类分析的时候可以减少数据集的特征数量。
二、并用自己的话阐述出两者的主要区别
特征选择:减少特征数量,不改变数据的本身。
PCA:数据过大时使用,在数据简化的同时,数据会被改变,特征数量也将减少