La Red de Conocimientos Pedagógicos - Currículum vitae - Notas de lectura de retropropagación adaptable de dominio sin servidor

Notas de lectura de retropropagación adaptable de dominio sin servidor

Acerca de este artículo

Título: Retropropagación de adaptación de dominio no supervisada

Autores: Jaroslav Ganin, Victor Lempitsky

Tema: Adaptación de dominio

Lugar de salida: ICML 2015

La principal contribución de este artículo es proponer un nuevo método para medir la diferencia en la distribución de datos entre el dominio de origen y el dominio de destino (basado en el método adversarial).

Entonces, ¿cómo optimizar un modelo tan poco convencional? Primero explique intuitivamente y luego agregue fórmulas.

En primer lugar, para la rama anterior, solo se anotan los datos del dominio de origen, por lo que solo se entrenarán los datos del dominio de origen. Tanto los extractores de características como los clasificadores de etiquetas minimizarán el error de clasificación para obtener buenos resultados de clasificación en los datos del dominio de origen.

En segundo lugar, para las siguientes ramas, se entrenarán tanto los datos del dominio de origen como los datos del dominio de destino. El extractor de características maximizará el error de clasificación del dominio para obtener características invariantes del dominio, mientras que el clasificador de dominio minimizará el error de clasificación del dominio para garantizar que la categoría de dominio de la característica pueda juzgarse con precisión. La idea de confrontación plasmada aquí (¡muy parecida a Gan!).

En resumen, las funciones de las tres partes del modelo son:

(1) Clasificador de etiquetas: minimiza el error de clasificación y clasifica con precisión los datos del dominio de origen.

(2) Clasificador de dominio: minimiza el error de clasificación de dominio, para poder clasificar la categoría de dominio de la característica.

(3) Extractor de características: Por un lado, minimiza el error de clasificación y obtiene características discriminativas. Por otro lado, el error de clasificación del dominio se maximiza para hacer que el dominio de características sea invariante.