La Red de Conocimientos Pedagógicos - Aprendizaje de inglés - Una revisión de los métodos de detección de objetivos pequeños

Una revisión de los métodos de detección de objetivos pequeños

En primer lugar, el nivel de entrada de la imagen

Con base en la conclusión anterior, en el proceso de uso del entrenamiento multiescala, debemos considerar evitar los efectos adversos del mínimo y el máximo (después de la multiescala) mientras garantizamos suficiente diversidad de objetivos. Por lo tanto, durante la capacitación multiescala, se ignoran las propuestas y anclajes que no cumplen con los requisitos en cada escala de entrada. Este artículo utiliza tres escalas, como se muestra en la figura, que es mayor que el rango de escala del entrenamiento general de múltiples escalas.

Parte 2: Cuello (con plan de mejora de la estructura piramidal)

La estructura general de la red FPN es la estructura más a la derecha, y la estructura utilizada en este artículo es

En primer lugar, este método sin duda aumenta la cantidad de cálculo. La ventaja es que las características de cada capa de la salida final no son transformaciones lineales (debe decirse que no son directamente de las características de una capa a las características de otra capa), sino que utilizan * * * multicapa compartida. características. Al final, será aproximadamente un punto más alto que RetinaNet y el efecto es medio. El equipo ganador de la inspección VisDrone2020 adoptó esta estructura.

Este artículo utiliza varios módulos TUM para crear una estructura de red piramidal de funciones. El giro frontal proporciona características poco profundas, el giro medio proporciona características medias y el giro hacia atrás proporciona características profundas. De esta manera, las características oscuras y superficiales se pueden fusionar varias veces con más parámetros. Al comparar RetinaNet, podemos ver que la entrada 512 no utiliza razonamiento de múltiples escalas, el mapa aumenta de 33 a 37,6 y la precisión de los objetivos pequeños también mejora un poco utilizando la cantidad de parámetros y cálculos para mejorar la precisión; de superposición no es una buena manera.

Este artículo cree que la importancia de las diferentes capas debe estar relacionada con la distribución de escala absoluta del objetivo, por lo que al fusionar FPN de arriba a abajo, se agrega un factor de escala para equilibrar la importancia de las diferentes capas en la pirámide. Personalmente, creo que tiene poca importancia y la mejora real no es obvia.

3. Plan de mejora de cabeza

El plan campeón de VisDrones y varios otros planes adoptan este plan de "doble cabeza". Soft-NMS parece mejorar algunos puntos.

4. La detección de objetivos pequeños actualmente no es buena. La razón principal no es que sean pequeños, sino que son pequeños y están cerca del fondo, y el contraste no es alto. Entonces podemos aprender de la idea de detección de objetos camuflados;