Traducción agrupada
Resumen y trabajo futuro
Este artículo propone un nuevo método para agregar información de agrupamiento agregando características relevantes al conjunto de entrenamiento, mejorando así la clasificación básica y la capacidad de predicción. de la máquina en conjuntos de datos desequilibrados.
Este artículo propone un método completamente nuevo para agregar una característica relevante a la información de agrupamiento auxiliar del conjunto de entrenamiento para mejorar su capacidad de razonamiento para la clasificación básica de conjuntos de datos desequilibrados.
En nuestro enfoque, se identifican ejemplos difíciles de los grupos mayoritarios y minoritarios
durante la ejecución del algoritmo de agrupamiento de un solo paso, por lo que los ejemplos son tanto fáciles como difíciles
Se distinguirán ejemplos de nuevas funciones adicionales.
En nuestro enfoque, identificamos ejemplos de la mayoría y la minoría mientras realizamos una operación de clúster única. Por lo tanto, los ejemplos fáciles y los ejemplos difíciles estarán claramente marcados en las nuevas funciones adicionales.
Por lo tanto, la distribución de datos original no cambia y se mitiga la asimetría de las características hacia la clase mayoritaria.
Como resultado, la distribución de datos original no se verá afectada y se mitigará el sesgo en las características de asimetría.
Los resultados experimentales en la biblioteca de aprendizaje automático de UCI y los conjuntos de datos del clasificador básico muestran que el método de adición de funciones adicionales basado en agrupaciones logra un rendimiento satisfactorio.
La comparación de los resultados experimentales con la clasificación básica en la base de datos de aprendizaje automático de la UCI muestra que el método de adición de características adicionales basado en agrupaciones logra resultados satisfactorios.
En futuras investigaciones, nuestra preocupación será qué clasificador es más adecuado para nuestro método de resolver el problema de clasificación desequilibrada.
En futuras investigaciones, nuestra preocupación será qué método de clasificación es más adecuado para que las empresas resuelvan el problema del desequilibrio de clasificación.
Gracias
Este trabajo fue financiado por la Fundación Nacional de Ciencias Naturales de China (No. 61070061),
Proyecto de Planificación de Ciencia y Tecnología de Guangzhou (No. 2011J5100004 ). El autor quisiera agradecer a Xie y Bangmiao por ayudar con algunas pruebas de datos del artículo de Zhaoqing.
Expresión formal de gratitud
Este trabajo fue financiado por la Fundación Nacional de Ciencias Naturales de China (Nº 61070061) y el Proyecto de Planificación de Ciencia y Tecnología de Guangzhou (Nº 201110004). El autor quisiera agradecer a Zhaoqing y Bangmiao por su ayuda y por brindarme algunos datos para probar este artículo.
Lo he traducido cuidadosamente para ti. Espero que te sea de ayuda y espero que puedas adoptarlo con satisfacción. Gracias.