La Red de Conocimientos Pedagógicos - Conocimientos históricos - ¿Qué es la estandarización de datos?

¿Qué es la estandarización de datos?

La importancia de la estandarización de datos:

1. Las dimensiones de los datos son diferentes;

Después de la estandarización, los datos originales se convierten en valores de evaluación de índice adimensionales. Cada valor de índice está en el mismo nivel cuantitativo y puede evaluarse y analizarse de manera integral.

Si los valores de los indicadores originales se utilizan directamente para el análisis, se resaltará el papel de los indicadores con valores más altos en el análisis integral, y el papel de los indicadores con valores más bajos será relativamente debilitado.

2. Evite los problemas numéricos: Los números demasiado grandes causarán problemas numéricos.

3. Equilibra la contribución de cada característica.

Algunos clasificadores necesitan calcular la distancia entre muestras (como la distancia euclidiana), como KNN.

Si el rango de valores de una característica es muy grande, entonces el cálculo de la distancia depende principalmente de esta característica, lo cual es contrario a la situación real (por ejemplo, la situación real es que la característica con un valor pequeño el rango es más importante).

4. La necesidad de resolver algunos modelos: acelerar el descenso del gradiente para encontrar la solución óptima.

Métodos de estandarización de datos:

1. Estandarización Min-Max.

2. Estandarización de la desviación estándar, también llamada estandarización de puntuación z.

3. Normalización no lineal.