La Red de Conocimientos Pedagógicos - Conocimientos históricos - ¿Qué es la minería de datos?

¿Qué es la minería de datos?

La minería de datos es el proceso de extraer información y conocimientos ocultos, desconocidos pero potencialmente útiles a partir de una gran cantidad de datos incompletos, ruidosos, confusos y aleatorios.

Proceso de minería de datos:

Defina el problema: defina claramente el problema empresarial y determine el propósito de la minería de datos.

Preparación de datos: la preparación de datos incluye: selección de datos: extracción de conjuntos de datos de destino para la extracción de datos de grandes bases de datos y objetivos de almacenamiento de datos; preprocesamiento de datos: reprocesamiento de datos, incluida la verificación de la integridad y coherencia de los datos, eliminación de ruido y llenado de campos faltantes; , eliminar datos no válidos, etc.

Minería de datos: según el tipo de función de datos y las características de los datos, seleccione el algoritmo correspondiente para realizar la minería de datos en el conjunto de datos purificados y convertidos.

Análisis de resultados: Interpretar y evaluar los resultados de la minería de datos, y transformarlos en conocimiento que en última instancia pueda ser entendido por los usuarios.