La Red de Conocimientos Pedagógicos - Conocimientos de formación/capacitación - El significado de la covarianza

El significado de la covarianza

¿Qué es la covarianza y por qué se utiliza en algunos lugares?

Significado central: Mide el grado en que cada dimensión se desvía de su media. Si el valor de la covarianza es positivo, significa que los dos están correlacionados positivamente (la definición de "coeficiente de correlación" se puede derivar de la covarianza. Si el resultado es negativo, significa que existe una correlación negativa). es 0, también es estadísticamente hablando "mutuamente independiente".

Comprensión intuitiva de la correlación positiva y la correlación negativa:

Características: cuando la distribución conjunta de X e Y es como la figura anterior, podemos ver que aproximadamente: cuanto mayor X, mayor Y es, cuanto más pequeño es X y más pequeño es Y. Esta situación se denomina "correlación positiva".

Características: Cuando se distribuye conjuntamente, lo llamamos "correlación negativa".

Características: Cuando la distribución conjunta de Lo llamamos "irrelevante".

¿Cómo expresar estas tres situaciones relacionadas con un número simple?

En el área (1) de la figura, hay X>EX, Y-EY>0, por lo que (X-EX)(Y-EY)>0;

En el área (2) de la figura, hay X0, por lo que (X-EX)(Y-EY)<0;

en el área (3) en la figura, hay X0;

En el área (4) de la figura, hay EY <0, entonces (X-EX)(Y-EY)<0.

Explicación clave: la llamada correlación positiva. Simplemente significa que una determinada distribución cubre principalmente el área (1) y el área (3). Por ejemplo, el 99,7% de los datos tienen esta característica, y muy pocos datos cubren el área (2) y el área (4).

De la misma manera, la llamada correlación negativa debería ser que una determinada distribución cubra principalmente (2) y (4), y una parte muy pequeña cubra (1) y (3).

La llamada irrelevancia significa que las distribuciones de (1)(2)(3)(4) son casi iguales.

El valor absoluto del valor debe indicar la fuerza de esta correlación.

De la fórmula:

La figura anterior es la fórmula de varianza, que se utiliza para medir el grado de desviación de cada dimensión de su media.

La fórmula de covarianza se generaliza a partir de la fórmula de varianza y se utiliza para describir la correlación lineal entre dimensiones.

De la definición de covarianza, también podemos ver algunas propiedades obvias, como:

¿Cómo calcularla específicamente?

Por ejemplo, existen los siguientes datos:

Cada columna representa una dimensión y cada fila representa una muestra.

¿Cómo calcular la covarianza? Por supuesto, tenemos una API. Si no usamos la API, ¿podemos escribirla nosotros mismos? Escribimos el siguiente programa de prueba de acuerdo con la fórmula:

Después de calcular la covarianza entre dimensiones, podemos organizar la matriz de covarianza. La matriz de covarianza puede localizar rápidamente la covarianza entre dimensiones.

Consulte el siguiente artículo para obtener la explicación anterior:

# Finalmente comprenda el significado de la covarianza