La Red de Conocimientos Pedagógicos - Currículum vitae - Explicación en papel de Neurips

Explicación en papel de Neurips

Paper:pelee: ¿Un sistema de detección de objetos en tiempo real en dispositivos móviles

? Basado en la idea de conexión densa de DenseNet y a través de una serie de optimizaciones estructurales, se propone una estructura de red PeleeNet para dispositivos móviles y una red de detección de objetivos Pelee mediante la integración de SSD. Desde una perspectiva experimental, PeleeNet y Pelee son buenas opciones en términos de velocidad y precisión.

? Basado en las ideas de DenseNet, PeleeNet agrega varias mejoras clave.

? Inspirándose en GoogLeNet, la capa densa original se cambia a una capa densa bidireccional, como se muestra en la Figura 1b. La nueva ruta apila dos convoluciones para aprender y obtener diferentes características del campo receptivo, especialmente características de objetos grandes.

? DenseNet utiliza convolución con zancada = 2 para el procesamiento inicial de la entrada. Inspirado en Inception-v4 y DSOD, este artículo diseña un bloque de vástago eficiente. Su estructura se muestra en la Figura 2. Dos rutas pueden extraer características diferentes. Esto puede mejorar la capacidad de expresión de características de la red sin requerir demasiados cálculos que consuman mucho tiempo.

? En DenseNet, la capa de cuello de botella se usa para comprimir las características de entrada, pero la salida de la capa de cuello de botella se fija en 4 veces la de la capa densa. En las primeras capas de la red, la salida de la capa de cuello de botella será mayor que la entrada, lo que dará como resultado una disminución de la eficiencia. Por lo tanto, este artículo vincula la escala de salida de la capa de cuello de botella con la escala de entrada para garantizar que no sea mayor que la escala de entrada. Como puede verse en la Figura 4, la eficiencia del cálculo se ha duplicado después de la modificación.

? DenseNet utiliza capas de transición entre capas densas para comprimir tamaños de entidades con una relación de compresión de 0,5. A través de experimentos, el artículo descubrió que esta operación debilitará la capacidad expresiva de las características de la red, por lo que la dimensión de salida de la capa de transición se fija al tamaño de la entrada y ya no está comprimida.

? DenseNet utiliza el modo de activación previa de Conv-Relu-BN. Este artículo lo cambia al modo de activación posterior de Conv-BN-Relu, de modo que la capa convolucional y la capa BN se combinan durante el razonamiento, mejorando la velocidad de cálculo. Además, se agrega convolución a la capa densa final para obtener capacidades de expresión de características más sólidas.

? La estructura de PeleeNet se muestra en la Tabla 1, que incluye un bloque de tallo, cuatro etapas de extracción de características y una capa de agrupación con una extensión promedio de 2. En este artículo, resulta muy confuso si utilizar tres etapas de extracción de características o cuatro etapas de extracción de características. Estas tres etapas requieren bloques de raíz para reducir aún más el tamaño del mapa de características. Teniendo en cuenta que reducir demasiado rápido el tamaño del mapa de características al principio debilitará la capacidad expresiva de la red, todavía se utilizan cuatro etapas.

? Sobre la base de SSD, utilizando PeleeNet como red troncal, se llevaron a cabo una serie de optimizaciones y se propuso la red de detección de objetivos Pelee. Los principales puntos de optimización son los siguientes:

? Verifique las características clave de PeleeNet.

? En comparación con otras redes ligeras.

? Comparación de la velocidad de inferencia real de PeleeNet en diferentes dispositivos.

? Pelee se compara con otras configuraciones de red.

? Comparación del rendimiento de varias medidas de mejora.

? En comparación con otras redes en rendimiento de COV.

? Comparación de la velocidad de inferencia entre dispositivos.

? Comparación de rendimiento en COCO con otras redes.

? Peleet es una variante de DenseNet que no utiliza las populares convoluciones separables en profundidad. Peleet y Pelee han logrado muy buen rendimiento y velocidad simplemente mediante la optimización estructural. Después de leer el artículo, podrán aprender muchas habilidades de diseño de redes.

?

?

?