Principio del árbol de decisión
El principio del árbol de decisión es el siguiente:
El árbol de decisión es el principal método para calcular las decisiones de toma de riesgo en nuestra gestión. Su principio básico es utilizar puntos de decisión para representar problemas de toma de decisiones, ramas de programa para representar programas alternativos y ramas de probabilidad para representar varios resultados posibles del programa. Después de calcular los valores de pérdidas y ganancias de varios programas en diversas condiciones de resultado. La comparación proporciona a quienes toman decisiones una base para la toma de decisiones.
Varias condiciones importantes son que es necesario que haya puntos de decisión y ramas de decisión. Al mismo tiempo, la probabilidad de cada rama de decisión se conoce, se puede calcular y se puede comparar. Finalmente, también debemos realizar una poda, lo que significa que comparamos los valores de pérdidas y ganancias de cada opción para tomar una decisión.
El modelo de árbol de decisión de clasificación es una estructura de árbol que describe la clasificación de instancias. El árbol de decisión se compone de nodos y bordes dirigidos. Hay dos tipos de nodos: nodos internos y nodos hoja. Los nodos internos representan una característica o atributo.
Un nodo hoja representa una clase. Utilice la clasificación del árbol de decisión, comenzando desde el nodo raíz, para probar una determinada característica de la instancia y asigne la instancia a sus subnodos en función de los resultados de la prueba. En este momento, cada subnodo corresponde a un valor de la característica; .
Las instancias se prueban y asignan de forma recursiva de esta manera hasta que se alcanza un nodo hoja. Finalmente, las instancias se dividen en clases de nodos hoja. El algoritmo de aprendizaje del árbol de decisión es un algoritmo de aprendizaje inductivo basado en ejemplos.
Esencialmente, se trata de inducir un conjunto de reglas de clasificación a partir del conjunto de datos de entrenamiento. Puede haber múltiples árboles de decisión que no sean inconsistentes con el conjunto de datos de entrenamiento, o puede que no haya ninguno. Lo que necesitamos es un árbol de decisiones que sea menos inconsistente con el conjunto de datos de entrenamiento y que tenga una buena capacidad de generalización.