¿Qué es el análisis factorial en el tutorial de SPSS? ¿Cómo hacerlo?
¿Cuál es la definición de análisis factorial? ¿Cuáles son las características del método de análisis factorial? ¿Cuáles son los pasos del análisis factorial en SPSS?
Definición de análisis factorial
El análisis factorial es una técnica estadística para estudiar la extracción de factores únicos de grupos de variables. Es un método de cooperación y análisis de información múltiple relacionada y superpuesta en la realidad. La síntesis es un método de análisis que transforma múltiples variables e indicadores originales en menos variables e indicadores completos. Suele ser un método de análisis que selecciona un número menor de variables que el original y puede explicar las variables originales y los indicadores completos.
Características del método de análisis factorial
1. El número de variables factoriales es mucho menor que el número de variables indicadoras originales, y el análisis de variables polifonéticas puede reducir la carga de trabajo de cálculo en el análisis.
2. Las variables factoriales no son una compensación de las variables originales, sino una reorganización basada en la información de las variables originales, que puede reflejar la mayor parte de la información de las variables originales
3. No existe una correlación lineal entre las variables de los factores y es más conveniente analizar las variables.
4. La variable del factor tiene denominación e interpretabilidad, es decir, la variable es integral; reflejo de alguna información variable original.
Pasos del análisis factorial en SPSS
Principios básicos:
El análisis factorial sobre variables se denomina análisis factorial tipo R. El análisis factorial sobre muestras se denomina Es Q; -análisis factorial tipo.
Pasos básicos:
Paso 1: Confirmar si existe una fuerte correlación entre las variables originales a analizar. Se pueden utilizar métodos como el cálculo de la "matriz de coeficientes de correlación", la "prueba de esfericidad de Bartlett" y la "prueba KMO" para probar si los datos candidatos son adecuados para el análisis factorial.
"Análisis" - "Reducción de dimensionalidad" - "Análisis factorial" - "Descripción"
Análisis factorial - Correlación entre variables
Pasos 2: Construir variables factoriales Sintetizar las variables originales en unos pocos factores es el contenido central del análisis factorial. Resuelva la matriz de carga factorial según el número de muestras. El método para resolver la matriz de carga factorial: "Método de análisis de componentes principales basado en el modelo de componentes principales", "Método de factores principales basado en el modelo de análisis factorial", "Método de máxima verosimilitud". "Método del factor alfa", etc.
"Análisis" - "Reducción de dimensionalidad" - "Análisis factorial" - "Extracción"
gt; need-to-insert-img
Análisis factorial - cálculo de carga factorial
Paso 3: utilice la rotación para hacer que las variables de los factores sean más interpretables. Después de sintetizar las variables originales en algunos factores, si el significado real de los factores no está claro, no se utilizará. análisis posterior. La rotación de factores se puede utilizar para hacer que una variable tenga cargas relativamente altas en la menor cantidad de factores posible, de modo que los factores extraídos tengan una mejor interpretabilidad.
El test KMO se utiliza para comprobar la correlación y correlación parcial entre variables, con valores entre 0 y 1. Cuanto más cerca esté el estadístico KMO de 1, más fuerte será la correlación entre las variables, más débil será la correlación parcial y mejor será el efecto del análisis factorial. En el análisis real, el efecto es mejor cuando la estadística KMO está por encima de 0,7; cuando la estadística KMO está por debajo de 0,5, no es adecuado aplicar el método de análisis factorial en este momento y se debe considerar rediseñar la estructura de variables o utilizar otras estadísticas. métodos de análisis.
Si las variables son independientes entre sí, no se pueden extraer factores comunes de ellas, y no se puede aplicar el análisis factorial. La prueba de esfericidad de Bartlett determina que si la matriz de correlación es una matriz unitaria, el método de análisis factorial independiente de cada variable no es válido. Los resultados de la prueba SPSS muestran que cuando Sig.lt;0.05 (es decir, p-valuelt;0.05), indica que existe correlación entre las variables y el análisis factorial es válido.
"Análisis" - "Reducción de dimensionalidad" - "Análisis factorial" - "Rotación"
Análisis factorial - Rotación
Paso 4: Calcular la puntuación de la variable de los factores. Una vez determinados los factores, se pueden calcular los valores específicos de cada factor en cada muestra.
En análisis posteriores, las puntuaciones de los factores se pueden utilizar para clasificar o evaluar muestras, logrando así los objetivos de reducción de dimensionalidad y simplificación del problema.
"Análisis" - "Reducción de dimensionalidad" - "Análisis factorial" - "Puntuación"
gt; need-to-insert-img
Análisis factorial - puntuación
Comparta un sitio web, que está bien discutido: Aplicación de SPSS en el análisis factorial
Condiciones aplicables para el análisis factorial:
(1) El tamaño de la muestra no puede ser demasiado pequeño, al menos 5 veces el número de variables.
(2) Debe haber correlación entre las variables. Si son independientes entre sí, no se pueden extraer factores comunes. Juzgado por la prueba de esfericidad de Bartlett.
(3) Prueba KMO: se utiliza para examinar la correlación parcial entre variables, con un valor entre 0 y 1, cuanto más cerca esté la estadística KMO de 1, más fuerte será la correlación parcial entre las variables y el efecto; del análisis factorial será el mejor. Generalmente, una estadística superior a 0,7 es adecuada para el análisis factorial. <0,5 no es adecuado para el análisis factorial.
(4) Cada factor común en el análisis factorial debe tener importancia práctica.
Caso: Análisis adicional de datos económicos provinciales
En el cuadro de diálogo "Descripción", seleccione "Prueba de esfericidad de KMO y Bartlett" en la casilla de verificación del grupo de opciones "Coeficiente de correlación"; en el cuadro de diálogo Extracción, seleccione la casilla de verificación Gráfico de grava en el grupo Formulario de salida.
gt; need-to-insert-img
Prueba de correlación del análisis factorial
gt; >Gráfico de pantalla
Resultados:
Tabla 1: Prueba de KMO y Bartlett
gt need-to-insert-img
It; Se puede observar que la significancia es <0.05, rechazando el supuesto de que cada variable es independiente, y creyendo que existe una fuerte correlación entre variables.
Tabla 2: Varianza del factor común
gt; need-to-insert-img
Indica el factor común a partir del cual se puede obtener la información original contenida en cada variable. a extraer El grado representado es la proporción de información variable extraída.
Tabla 3: Varianza total explicada
gt; necesidad de inserción-img
necesidad de inserción-img
Gráfico de pedregal
El diagrama de pedregal se utiliza para mostrar la importancia de cada factor. La abscisa es el número del factor y el eje vertical representa el tamaño de raíz característico. Cuanto más pronunciada sea la pendiente, mayor será la raíz característica correspondiente y más evidente será el efecto. Generalmente se seleccionan como factores aquellos con raíces características mayores a 1.
Tabla 4: Tabla de matriz de componentes
gt; need-to-insert-img
es la variable estandarizada.
Sin embargo, los tres factores componentes no se pueden explicar bien y el significado de los factores componentes no es obvio, por lo que se necesitan múltiples factores para la rotación.
Rotación de factores
gt; need-to-insert-img
Rotación
El cuadro de diálogo "Rotación" se utiliza para implementar función de rotación de factores para interpretar mejor los factores extraídos.
El método más utilizado es: "rotación ortogonal varimax", de modo que cada factor permanece ortogonal, pero la diferencia de varianzas de cada factor alcanza el máximo, es decir, la suma de los cuadrados de las cargas relativas alcanza el máximo.
gt; need-to-insert-img
Después de "rotación", se obtiene la matriz del componente de rotación. Se puede ver que el primer factor común tiene un gran coeficiente de carga en el PIB, el valor total de la producción industrial, la inversión en activos fijos y la rotación de carga, y puede definirse como el "factor total".
El segundo factor común tiene un coeficiente de carga mayor sobre el salario promedio de los empleados y el nivel de consumo de los residentes, y se define como el "factor de consumo"; el tercer factor común tiene un coeficiente de carga mayor sobre el "índice de precios al consumidor" y el precio de las materias primas; índice, y se define como "factor de precio".
Expresión de factores
En la matriz de componentes rotados, la expresión de la estructura factorial puede expresar cada variable como una forma lineal de un factor común. Pero necesitamos que los factores comunes se expresen como formas lineales de cada variable. También se llama función de factor de puntuación. El método de estimación más utilizado es el "método de regresión". En el grupo de casillas de verificación Puntuación.
gt; need-to-insert-img
Resultado:
gt; need-to-insert-img
Factor de ejemplo Expresión de 1:?
SPSS calculará automáticamente el valor de puntuación de cada factor como una nueva variable en la casilla de verificación "Guardar como variable".
Guarde las puntuaciones del factor común para una evaluación integral.
Los tres factores reflejan el nivel general de desarrollo económico local desde diferentes aspectos. Es difícil hacer una evaluación integral utilizando un determinado factor común. Por lo tanto, considere calcular la puntuación integral en función de la proporción de la tasa de contribución de la varianza correspondiente a cada factor común como ponderación.
gt; necesita-insertar-img
Según la fórmula:
gt; > Así se puede calcular la puntuación integral de cada región. y dar una explicación razonable.