La Red de Conocimientos Pedagógicos - Aprendizaje de redacción de artículos/tesis - ¿Cuáles son los algoritmos de resolución de árboles de decisión?

¿Cuáles son los algoritmos de resolución de árboles de decisión?

Los algoritmos de resolución de árboles de decisión incluyen: ID3, C4.5, CART, etc.

El algoritmo del árbol de decisión es un método de aproximación del valor de una función discreta. Este es un método de clasificación típico. Primero, los datos se procesan para generar reglas legibles y árboles de decisión mediante algoritmos inductivos, y luego se realiza un análisis de decisiones sobre los nuevos datos. Básicamente, un árbol de decisión es el proceso de clasificar datos mediante un conjunto de reglas.

El método del árbol de decisión se desarrolló por primera vez en los años 60 y llegó a finales de los 70. El algoritmo ID3 fue propuesto por J Ross Quinlan y tiene como objetivo reducir la profundidad del árbol. Pero se han descuidado los estudios sobre el número de hojas. El algoritmo C4.5 se mejora sobre la base del algoritmo ID3 y tiene grandes mejoras en el procesamiento de valores faltantes de variables predictivas, técnicas de poda y reglas de derivación.

Es adecuado para problemas de clasificación y regresión. El algoritmo del árbol de decisión descubre las reglas de clasificación contenidas en los datos mediante la construcción de un árbol de decisión. Cómo construir un árbol de decisión con alta precisión y pequeña escala es el contenido central del algoritmo del árbol de decisión. La construcción del árbol de decisión se puede realizar en dos pasos.

El primer paso es la generación de árboles de decisión: el proceso de generar árboles de decisión a partir del conjunto de muestras de entrenamiento. En términos generales, el conjunto de datos de muestra de entrenamiento es un conjunto de datos histórico y completo que se utiliza para el análisis y procesamiento de datos de acuerdo con las necesidades reales. El segundo paso es la poda del árbol de decisión: la poda del árbol de decisión es el proceso de verificar, revisar y revisar el árbol de decisión generado en la etapa anterior.

Método de construcción

La entrada para la construcción del árbol de decisión es un conjunto de ejemplos con etiquetas de categoría, y el resultado de la construcción es un árbol binario o un árbol de múltiples ramas. El nodo interno de un árbol binario generalmente se representa como un juicio lógico, como a = aj, donde A es un atributo y aj son todos los valores del atributo. Los bordes del árbol son los resultados de la rama lógica; juicio.

Los nodos internos de un árbol múltiple (ID3) son atributos y los bordes son todos valores de atributos. Hay tantos bordes como valores de atributos. Los nodos de hoja del árbol son todos etiquetas de categoría. Los árboles de decisión serán demasiado grandes debido a una representación de datos incorrecta, ruido o subárboles duplicados producidos durante la generación del árbol de decisión.