La Red de Conocimientos Pedagógicos - Conocimientos históricos - ¿Qué es el análisis de componentes principales? ¿Cuáles son los pasos del análisis de componentes principales?

¿Qué es el análisis de componentes principales? ¿Cuáles son los pasos del análisis de componentes principales?

El análisis de componentes principales se refiere a convertir un conjunto de variables que pueden estar correlacionadas en un conjunto de variables linealmente no correlacionadas. El conjunto convertido de variables se denomina componentes principales.

Pasos del análisis de componentes principales: 1. Estandarizar los datos originales, 2. Calcular el coeficiente de correlación, 3. Calcular las características, 4. Determinar los componentes principales, 5. Sintetizar los componentes principales.

El principio del análisis de componentes principales es intentar recombinar las variables originales en un nuevo conjunto de varias variables integrales independientes y, al mismo tiempo, de acuerdo con las necesidades reales, se pueden eliminar varias variables de suma más pequeñas. reflejar tanto como sea posible El método estadístico original de información variable se llama análisis de componentes principales o análisis de componentes principales, que también es un método de procesamiento matemático de reducción de dimensionalidad. Información ampliada

El papel principal del análisis de componentes principales

1. El análisis de componentes principales puede reducir la dimensionalidad del espacio de datos bajo estudio.

2. A veces, algunas relaciones entre X variables pueden aclararse mediante las conclusiones de la carga factorial aij.

3. Una representación gráfica de datos multidimensionales.

4. El modelo de regresión se construyó mediante análisis de componentes principales. Es decir, cada componente principal se utiliza como una nueva variable independiente para reemplazar la variable independiente original x para el análisis de regresión.

5. Se utilizó el análisis de componentes principales para seleccionar los regresores.

La forma más clásica es expresarlo mediante la varianza de F1 (la primera combinación lineal seleccionada, es decir, el primer indicador integral), es decir, cuanto mayor Va (rF1), más información F1 contiene. . Por lo tanto, F1 seleccionado entre todas las combinaciones lineales debe tener la mayor varianza, por lo que F1 se denomina primer componente principal.

Enciclopedia Baidu: análisis de componentes principales