Análisis de aplicación del análisis de componentes principales
Al utilizar el análisis de componentes principales para resolver factores, puede obtener tantos factores como el número de elementos de medición. Si se mantienen todos los factores, no se logrará el propósito de la reducción de dimensionalidad. Pero conocemos el tamaño de los factores y podemos descartarlos. ¿Dónde hay tantos pequeños factores que descartar? En la investigación del comportamiento general, a menudo utilizamos dos métodos de juicio: el método de raíz característica mayor que 1 y el método de pendiente de grava.
Debido a que la información de los factores se puede representar mediante raíces características, tenemos la regla de que las raíces características son mayores que 1. Si la raíz característica de un factor es mayor que 1, se conserva; en caso contrario, se descarta. Aunque esta regla es simple y fácil de usar, es sólo una regla general y no tiene una prueba estadística clara. Desafortunadamente, en la práctica, los métodos de prueba estadísticos no son más efectivos que esta regla general (Gorsuch, 1983). Por tanto, esta regla general sigue siendo la más utilizada. Como regla general, no siempre es cierto. Puede sobreestimar o subestimar el número real de factores. Su rango de aplicación es de 20 a 40 medidas, cada factor teórico corresponde a 3 a 5 medidas y el tamaño de la muestra es grande (3100).
El método del talud de grava es un método de dibujo. Si el orden de los factores se toma como el eje X y el tamaño de las raíces características es el eje Y, el cambio de las raíces características con los factores se puede trazar en una coordenada y las raíces características de los factores se muestran una tendencia a la baja. La cabeza de esta línea de tendencia cae rápidamente, mientras que la cola se aplana. Dibuja una línea de regresión desde la cola. Los puntos más arriba de la línea de regresión representan factores primarios y los puntos a cada lado de la línea de regresión representan factores secundarios. Pero el método de la pendiente de grava tiende a sobreestimar el número de factores. Este método es menos confiable que el primero, por lo que generalmente no se utiliza en investigaciones reales.
Después de descartar los factores pequeños y retener los factores grandes, se logra el propósito de reducir la dimensionalidad. Cuando los investigadores analizan datos de encuestas sociales, además de sintetizar cuestiones relacionadas en factores y retener factores grandes, a menudo necesitan probar la relación entre los factores y los elementos de medición para garantizar que cada factor principal (componente principal) corresponda a un conjunto significativo de factores. elementos de medición. Para mostrar más claramente la relación entre los factores y los elementos de medición, los investigadores deben rotar los factores. Un método de rotación común es la rotación VARIMAX. Después de la rotación, es aceptable si un elemento de medida está altamente correlacionado (>0,5) con el factor correspondiente. Si la correlación entre una medida y un factor no correspondiente es demasiado alta (>:0,4), es inaceptable y es posible que dicha medida deba modificarse o eliminarse.
El proceso de obtener factores mediante el análisis de componentes principales y medir la relación entre elementos y factores mediante el análisis de rotación de factores suele denominarse análisis factorial exploratorio.
Una vez aceptado el análisis factorial exploratorio, los investigadores pueden probar más a fondo la relación entre estos factores, como el análisis de ecuaciones estructurales para probar hipótesis. 1 El análisis proposicional de componentes principales (PCA) del problema es un método de reducción de dimensionalidad que facilita el análisis del problema y se ha utilizado ampliamente en muchos campos. Sin embargo, algunos libros de texto y artículos tienen algunos errores y deficiencias al utilizar el análisis de componentes principales y no pueden resolver problemas prácticos. Por ejemplo, en algunos libros de texto de análisis estadístico multivariado, aparecen los siguientes errores y deficiencias en el análisis de componentes principales de las matrices de covarianza: ① No está claro si se establecen las condiciones de reducción de dimensionalidad de los datos. ②La suma de los cuadrados de los coeficientes del componente principal no es 1. ③No hay un juicio claro sobre si los datos utilizados son adecuados para un análisis independiente de componentes principales. ④Los componentes principales seleccionados no representan las variables originales. Los problemas anteriores se resolverán a su vez a partir de teorías y resultados relevantes, y se darán las sugerencias correspondientes. Datos En la investigación conductual y psicológica, a menudo es necesario analizar las características conductuales de personas con una determinada identidad, como en este caso las características conductuales diarias de los estudiantes de primaria, para guiar a los estudiantes de primaria a desarrollar actitudes conductuales más positivas. en base a estas características. Los datos de la literatura [1] utilizados aquí se muestran en la Tabla 1. Los datos provienen de los resultados de la encuesta de un determinado grupo de investigación. El equipo de investigación investigó los comportamientos diarios de 480 estudiantes de quinto y sexto grado de una escuela primaria en el norte. * * * Los 11 indicadores investigados son los siguientes: S10~ ~Respuesta a las preguntas del profesor, S2 ~ Preocupación por los asuntos de clase, S3 ~ Rendimiento en clases de autoestudio, S4 ~ Actitud hacia las tareas, S5 ~ Preocupación por los compañeros, S6 ~ Actitud hacia el trabajo, S7 ~Particularmente interesado en aprender, S8~.
Similitudes y diferencias entre el análisis de componentes principales y el proceso de jerarquía analítica
1. Principio de selección de indicadores basado en el análisis de correlación
El coeficiente de correlación entre dos indicadores refleja la correlación entre dos indicadores [1]. Cuanto mayor sea el coeficiente de correlación, mayor será la correlación de la información reflejada por los dos indicadores [1]. Para que el sistema de índices de evaluación sea conciso y eficaz, es necesario evitar la duplicación de la información reflejada por los indicadores [1]. Al calcular los coeficientes de correlación entre indicadores de evaluación en el mismo nivel de criterio y eliminar indicadores con coeficientes de correlación mayores, se evita la duplicación de información reflejada por los indicadores de evaluación [2]. Mediante el análisis de correlación, el sistema de indicadores se simplifica, haciéndolo conciso y eficaz [2].
2. Principio de selección de indicadores basado en el análisis de componentes principales.
(1) Principio de carga factorial
A través del análisis de componentes principales del resto de indicadores se obtiene la carga factorial de cada indicador. El valor absoluto de la carga factorial es menor o igual a 1. Cuanto más cercano esté el valor absoluto a 1, más importante será el indicador para los resultados de la evaluación [3].
(2) Principio de selección de índices basado en el análisis de componentes principales.
La carga factorial refleja el grado de influencia de los indicadores en los resultados de la evaluación. Cuanto mayor sea el valor absoluto de la carga factorial, más importante será el indicador para los resultados de la evaluación y más deberá retenerse. Al contrario, debería eliminarse. 1. Realizar un análisis de componentes principales de los indicadores seleccionados mediante análisis de correlación para obtener la carga factorial de cada indicador, eliminando así indicadores con cargas factoriales pequeñas para garantizar que se eliminen los indicadores importantes [2].
3. Similitud entre el análisis de correlación y el análisis de componentes principales
En primer lugar, la selección de indicadores basada en el análisis de correlación y la selección de indicadores basada en el análisis de componentes principales se realizan dentro de la capa de criterios. mientras que no entre capas de pautas. La razón de esto es que dividir artificialmente diferentes capas de criterios puede reflejar los diferentes niveles de evaluación de las cosas y evitar la eliminación errónea de indicadores importantes con información diferente [2].
2. La idea de la selección de índices basada en el análisis de correlación y el análisis de componentes principales es seleccionar un pequeño número de indicadores representativos [2].
4. La diferencia entre el análisis de correlación y el análisis de componentes principales
1 El propósito de las dos evaluaciones es diferente: el propósito de la evaluación del índice basado en el análisis de correlación es eliminar evaluaciones que. Refleja el índice de redundancia de información. El propósito de la selección de indicadores basada en el análisis de componentes principales es eliminar los indicadores de evaluación que tienen poco impacto en los resultados de la evaluación [2].
En segundo lugar, las dos evaluaciones tienen funciones diferentes: la función de la evaluación de indicadores basada en el análisis de correlación es garantizar que el sistema de indicadores de evaluación de selección de pezuñas sea conciso y claro. El propósito de una simple selección de indicadores basada en el análisis de componentes principales es descartar indicadores importantes [2].
[1]Zhang Kun, ciudad de Cao Tingting, Chi Guotai. Construcción de un sistema de índices de evaluación para el desarrollo humano integral basado en el análisis de componentes principales correlacionados [J]. Teoría y práctica de la ingeniería de sistemas, 2013, 32(1):112-119.
[2]Li Hongxi. Investigación sobre evaluación de la logística portuaria basada en análisis de componentes principales correlacionados [Dalian, Liaoning: Universidad Tecnológica de Dalian, 2013].
[3] Sun Hui, Li Yuanyuan, Zhang Nana. Estudio empírico sobre la competitividad de la industria del carbón basado en el análisis de componentes principales [J Resources and Industry, 2012, 14(1):145-149.