Explicación de ejemplos de correlación típica (CCA)
El análisis de correlación es un método para estudiar la relación entre dos variables. En la vida real, la relación entre variables suele ser más compleja. Por ejemplo, si queremos examinar la correlación entre múltiples variables y múltiples variables (es decir, dos grupos de variables), ¿cómo deberíamos analizarla? Si se utiliza el análisis de correlación ordinario, no solo requiere mucho tiempo y trabajo, sino que tampoco puede explicar bien los resultados. La mejor manera de afrontar dichos datos es utilizar el análisis de correlación canónico.
El análisis de correlación canónica (CCA) se utiliza para estudiar la correlación entre un conjunto de datos X y un conjunto de Y. Utiliza la idea del análisis de componentes principales para extraer una o algunas variables integrales (es decir, variables típicas) de dos grupos de variables, concentrando así la relación entre los dos grupos de variables en la relación entre unos pocos pares de variables típicas.
En términos de pasos: el análisis de correlación típico se divide en tres pasos.
El primer paso: Es muy importante extraer las variables de correlación canónicas
El segundo paso: Encontrar la expresión de relación entre las variables canónicas y las variables de investigación, así como la relación entre las variables canónicas y las variables de investigación. Estado de la relación
Paso 3: Análisis de redundancia típico
A continuación se utiliza un caso para brindarles a todos una comprensión más intuitiva de las correlaciones típicas.
(1) Antecedentes
Estudiar la correlación entre la fuerza física y la capacidad atlética de los deportistas. ***Se recolectaron 38 muestras de estudiantes para su análisis. Los datos de la prueba incluyen ***7 indicadores físicos (saltos laterales repetidos, saltos verticales, fuerza de la espalda, fuerza de agarre, índice de prueba de pasos, flexión hacia adelante de pie, flexión del cuerpo boca abajo hacia atrás ***5 indicadores de capacidad atlética (tiempo de carrera de 50 metros); , salto de longitud, lanzamiento, dominadas, carrera de resistencia).
Desde el contexto anterior, X*** está representado por 7 elementos e Y está representado por 5 elementos. Si se estudia la correlación entre los dos conjuntos de indicadores X e Y, no se puede estudiar directamente mediante el análisis de correlación convencional, por lo que se utiliza el análisis de correlación canónica para la investigación.
(2) Pasos de operación
Si es necesario, las variables típicas se pueden guardar para investigaciones posteriores durante el análisis.
(3) Análisis de resultados
SPSSAU*** genera 4 tablas: La Tabla 1 se utiliza para variables típicas para expresar la correlación entre las variables típicas. Se utilizan las Tablas 2 y 3; para mostrar la relación de expresión matemática y la correlación entre las variables típicas y las variables de investigación, se puede utilizar la Tabla 4 para el análisis de redundancia típico.
① Coeficiente de correlación canónica y resultados de significancia
La tabla 1 muestra la extracción de variables típicas La tabla anterior *** muestra que *** se extrajeron 5 variables típicas. En la prueba de significancia, dos variables típicas mostraron significancia (Plt; 0,01), por lo que, en última instancia, las dos variables típicas se utilizaron como base para investigaciones posteriores.
Las variables típicas aparecen en pares, es decir, estas dos variables típicas en realidad se dividen en variables típicas X1, variables típicas Y1 y variables típicas Y2;
Analice los valores del coeficiente de correlación entre las variables de correlación típicas que muestran significancia. El valor del coeficiente de correlación del primer par de variables típicas es 0,763 y el segundo par de variables típicas es 0,706. El valor es relativamente alto. Muestra que existe una estrecha correlación positiva entre las variables típicas.
② Coeficiente típico y coeficiente de carga típico (X)
La Tabla 2 muestra la relación entre la variable típica X y los elementos de análisis del grupo X original. El coeficiente típico se utiliza para construir la fórmula del modelo entre las variables típicas y el grupo X de indicadores. El coeficiente de carga típico se utiliza para comprender específicamente la correlación entre las variables típicas y los 7 indicadores del grupo X.
Dado que en la Tabla 1 se ha concluido que sólo las variables de correlación típicas X1 y X2 pasan la prueba de significancia, basta con centrarse en la correlación entre cada indicador y las variables típicas X1 y X2. Cuanto mayor sea el valor absoluto del coeficiente de carga típico, más fuerte será la correlación entre el ítem y las variables típicas:
Los valores del coeficiente de correlación (coeficiente de carga) de la variable típica X1 y el 7 Los elementos del grupo X son: -0,598, -0,751, -0,316, -0,380, -0,296, -0,306, -0,277.
Los valores del coeficiente de correlación (coeficiente de carga) de la variable típica X2 y los siete ítems del
Utilice un diagrama esquemático para expresarlo, como se muestra en la siguiente figura:
Obviamente, la variable típica tiene una fuerte relación con X1 (salto lateral inverso) y X2 (salto vertical). ), es decir, típico La variable extrae más información sobre el salto lateral inverso y el salto vertical.
La relación entre las variables típicas y X2 (salto vertical) y X5 (índice de prueba de paso) es muy fuerte, es decir, las variables típicas extraen más información sobre el salto vertical y el índice de prueba de paso.
③ Coeficiente típico y coeficiente de carga típico (Y)
En el mismo paso, analice la relación entre la variable típica y y los elementos de análisis del grupo y original. La relación entre la variable típica Y1 y las variables originales Y1 (tiempo de carrera de 50 metros), Y2 (salto de longitud), Y3 (lanzamiento) e Y4 (dominadas) es muy fuerte, y los valores absolutos de la Los coeficientes de carga son todos superiores a 0,5, es decir, se extraen variables más típicas. Información sobre 4 ítems: tiempo de carrera de 50 metros, salto de longitud, lanzamiento y dominadas.
La relación entre las variables típicas y Y2 (salto de longitud) es muy fuerte, y el valor absoluto del coeficiente de carga es 0,446, es decir, las variables típicas extraen más información sobre Y2 (salto de longitud).
Expréselo con un diagrama esquemático, como se muestra en la siguiente figura:
④Análisis de redundancia típico
La Tabla 4 muestra el análisis de redundancia típico, es decir, comprender Las variables típicas son muy importantes para la investigación. La cantidad de información extraída de los datos. La tabla anterior muestra la extracción de información de 5 variables típicas para los indicadores del grupo La cantidad de información del indicador 11.826.
Como se puede observar en la tabla anterior: los montos de extracción de información de las variables típicas X1 y las variables típicas X2 para los 7 indicadores del grupo X son 20.325 y 14.293 respectivamente, con un total de 34.62; La información extraída por la variable Y2 para los cinco indicadores del grupo Y es 46.751 y 7.760 respectivamente, con un total de 54.51.
(4) Resumen del análisis
En este punto del análisis, se puede resumir a grandes rasgos: el Grupo X y el Grupo Y realizaron un análisis de correlación canónica y se extrajeron dos pares de variables típicos. .
El par de variables típico 1 extrae más información sobre el salto lateral inverso y el salto vertical; el par de variables típico 2 extrae más información sobre el salto vertical y el índice de prueba de paso. El par de variables típico 1 extrae más información sobre los cuatro elementos de; tiempo de carrera de 50 metros, salto de longitud, lanzamiento y dominadas; el par 2 de variables típicas extrae más información sobre el salto de longitud.
Además, el valor del coeficiente de correlación entre el par de variables típico 1 es 0,763 y el valor del coeficiente de correlación entre el par de variables típico 2 es 0,703. Los valores del coeficiente de correlación de los pares de variables típicos son todos superiores a 0,7. , lo que significa que existe una correlación positiva muy estrecha entre los 7 indicadores del grupo X y los 5 indicadores del grupo Y.
El análisis final se puede resumir en las dos figuras siguientes:
Inicie sesión en el sitio web oficial de SPSSAU para experimentar el análisis de datos en línea