Serie de estimación de profundidad monocular: lectura de los artículos de Dorn
[Contenido]
El texto original es:
Regresión ordenada en profundidad para la red de estimación de profundidad monocular
Huan Fu 1 Ming Ming Gong 2, 3 Chao Hui Wang 4 Kaihan Batt Manghelish 2 Dacheng Tao 1
Trabajo preliminar (especialmente el uso de redes neuronales profundas: DCNN) Tres fallas del método:
La idea detrás de esto es utilizar una clasificación de grano grueso para objetos distantes.
Luego, sobre la base de que "cuanto más lejos esté el SID, más gruesa será la granularidad de la clasificación", el problema de regresión se puede transformar en un problema de clasificación.
Las distancias continuas discretas se convierten en algunos intervalos de distancia.
Dividido en tres módulos
Incluyendo:
Codificador de imagen completo
Convolución de agujeros
Aquí es donde se usa SID
define nuestra función de pérdida única:
Algoritmo de optimización iterativo, retropropagación, finalmente podemos obtener una clasificación de etiquetas ordenada, cada clase es una distancia, como: 1 m, 1,1 m , 1,2 m, 1,4 m, 2 m, 10 m, 50 m Esta distancia está relacionada con el SID anterior.
Uso: clasificación de etiquetas ordenadas para inferir distancia.
Utilice la siguiente fórmula:
La punta D es la profundidad/distancia supuesta.
l es una etiqueta aprendida
En el artículo original de 18, hay tales datos:
En el ranking de 21 kitti, es muy alto.
De hecho, según absRel, Dorn ocupa el primer lugar.