主成分分析的目的

如题所述

第1个回答  2023-05-06

主成分分析的主要目的是希望使用较少的变量去解释原来资料中的大部分的变异,将我们手上许多相关性很高的变量转化成彼此相互独立或不相关的变量

1、通常是选用比原始变量个数少,且新变量能解释大部分资料中变异的几个新变量即所谓的主成分,且以解释资料的综合性指标。综上所述,主成分分析法实际上式一种降维方法。

2.特点

(1)维度灾难

使用过多的变量时,需要估计的参数个数也在增加,在训练集保持不变的情况下待估参数的方差也会随之增加,导致学习量上升、学习效率下降。维度灾难简单来说就是变量的个数多。

(2)变量之间的相关性高

变量之间的相关性高,说明数据是有冗余的,数据中的信息是有重叠的。

相关性高是我们利用主成分进行降维的前提条件,一个基本的适用经验:

观察变量的相关系数矩阵,一般来说相关系数矩阵中多数元素绝对值大于0.5,非常适合做主成分分析,但也不是说小于的就不可以用这种方法。

原文链接:https://blog.csdn.net/chengdong996/article/details/108409320

相似回答