Descripción general del campo receptivo
1. Definición
El campo receptivo se define como el área donde las características de la red neuronal convolucional pueden ver la imagen de entrada. En otras palabras, la salida de la función se ve afectada por los píxeles del campo receptivo.
Por ejemplo, como se muestra en la figura siguiente (dos dimensiones se simplifican a una dimensión por conveniencia), el núcleo de convolución de cada capa de esta red neuronal convolucional neuronal de tres capas es _ = 3. , = 1, entonces el campo receptivo correspondiente a la característica superior es 7x7 como se muestra en la figura.
2. Método de cálculo
Campo receptivo de la capa 1 [1]
La característica de la segunda capa es que el campo receptivo es 5.
La segunda capa de campo receptivo [1]
La tercera capa se caracteriza por un campo receptivo de 7.
La tercera capa del campo receptivo [1]
Si hay una conversión expandida, la fórmula de cálculo es
Tercero, sube un tramo de escaleras
Lo que se describe arriba es el campo receptivo teórico. El campo receptivo efectivo de la característica (campo receptivo efectivo real) es en realidad mucho más pequeño que el campo receptivo teórico, como se muestra en la siguiente figura. El análisis matemático específico es relativamente complicado, por lo que no entraré en detalles. Si está interesado, consulte el artículo [2].
Ejemplo de campo receptivo efectivo[2]
Diagrama de flujo de cálculo de conv 3x3 de dos capas
Cuarto, aplicación
Clasificación p> p>
Cao Xudong escribió un informe técnico titulado "Teoría práctica para diseñar redes neuronales convolucionales extremadamente profundas", que menciona que al diseñar un clasificador de imágenes basado en una red neuronal convolucional profunda, se deben cumplir dos condiciones. puede garantizar buenos resultados:
En primer lugar, para cada capa convolucional, se debe garantizar su capacidad para aprender patrones más complejos; en segundo lugar, el campo receptivo de la capa superior no debe ser mayor que el área de la imagen;
La segunda condición es la limitación del tamaño del campo receptivo de características de la red de capa más alta de la red neuronal convolucional.
Detección de objetivos
La mayoría de las redes de detección de objetivos populares se basan en anclajes, como la serie SSD, yolo después de v2 y la serie rcnn más rápida.
La red de detección de objetivos basada en anclajes preestablecerá un conjunto de puntos de anclaje de diferentes tamaños, como 32x32, 64x64, 128x128, 256x256. Con tantas anclas, ¿dónde deberían colocarse? En este momento, el tamaño del lugar es una consideración importante.
El campo receptivo característico de la capa de anclaje debe coincidir con el tamaño del anclaje. No es bueno que el campo de sentimiento sea demasiado grande que el ancla, y no es bueno que sea demasiado pequeño. Si crees que los salvajes son mucho más pequeños que las anclas, es como darte un solo pie para decirte qué tipo de pájaro es. Si crees que Ye es mucho más grande que el ancla, es como darte un mapa del mundo y pedirte que indiques dónde está la Ciudad Prohibida.
El artículo "S3FD: Detector de rostros invariante de escala de disparo único" es un ejemplo de diseño del tamaño del punto de anclaje en función del campo receptivo. Las palabras originales del artículo son las siguientes
Diseñamos la escala de anclaje en función del campo receptivo efectivo
Caja facial: el detector facial en tiempo real de CPU de alta precisión se basa en La misma sensación al diseñar anclajes salvajes de múltiples escalas. Una contribución de este artículo es que
Introducimos capas convolucionales de múltiples escalas
(MSCL) para manejar varias proporciones faciales mediante relleno
Campos receptivos y capas discretas. Anclas
Cita:
[1] Redes neuronales convolucionales
[2] Comprensión del campo receptivo efectivo en redes neuronales convolucionales profundas
Lectura recomendada:
Siga la cuenta oficial de SIGAICN WeChat, responda al artículo para obtener el código y podrá obtener el enlace de texto completo.
[1] Aprendizaje automático: magníficos 40 años de adquisición código SIGAI0413.
[2]¿Qué conocimientos matemáticos se necesitan para aprender bien el aprendizaje automático? Código de colección SIGAI0417.
[3] Código de recopilación de historia evolutiva del algoritmo de reconocimiento facial SIGAI0420.
[4] Una revisión de los algoritmos de detección de objetivos basados en aprendizaje profundo.
【5】¿Por qué las redes neuronales convolucionales pueden dominar el campo de la visión por computadora? Obtenga el código SIGAI0426.
[6] Utilice una imagen para comprender el código de adquisición de contexto SIGAI0428 de SVM.
[7] Descripción general del algoritmo de detección de rostros. Código de colección SIGAI0503.
[8] Comprenda el código de recopilación de la función de activación SIGAI0505 de la red neuronal.
[9] La historia evolutiva y las mejoras estructurales de las redes neuronales convolucionales profundas: 40 páginas de interpretación integral del código de adquisición SIGAI0508.
【10】Comprenda el método de descenso de gradiente y obtenga el código SIGAI0511.
[11] Descripción general de las redes neuronales recurrentes: una poderosa herramienta para el reconocimiento de voz y el procesamiento del lenguaje natural: sigai 0515.
【12】Comprenda el código de adquisición de optimización convexa SIGAI0518.
[13] Comprensión experimental de la función del kernel SVM y el código de adquisición de parámetros SIGAI0522.
[14] Descripción general de SIGAI Código de recopilación del algoritmo de detección de peatones SIGAI0525.
[15] Aplicación del aprendizaje automático en la conducción autónoma: tomando como ejemplo la plataforma Baidu Apollo (Parte 1) Obtenga el código SIGAI0529.
[16] Comprensión del método de Newton SIGAI 2018.5.31
[17] Colección de temas grupales de mayo: varios temas en los que vale la pena pensar en el aprendizaje automático y el aprendizaje profundo. Obtenga el código SIGAI0601.
[18]El algoritmo Adaboost obtuvo el código SIGAI0602.
[19] FlowNet a FlowNet2.0: Algoritmo de predicción de flujo óptico basado en red neuronal convolucional obtenido código SIGAI0604.
[20] Comprenda el código de adquisición del análisis de componentes principales (PCA) SIGAI0606.
[21]Una revisión de la detección de puntos clave del esqueleto humano. Código de colección SIGAI0608.
[22] Comprenda el código de colección del árbol de decisión SIGAI0611.
[23] Resuma los algoritmos de aprendizaje automático más utilizados en una oración para obtener el código SIGAI0613.
[24] Algoritmo de detección de objetivos del código de adquisición YOLO SIGAI0615.
【25】Comprenda el código de adquisición de sobreajuste SIGAI0618.
[26] Comprensión de los cálculos: de √2 a alfa go - Hablando del código de adquisición SIGAI0620 de √2 en 1 temporada.
[27] Detección de texto de escena - Introducción - Código de adquisición del algoritmo CTPN SIGAI0622.
[28] Compresión de red neuronal convolucional y adquisición acelerada código SIGAI0625.
[29] El algoritmo de k vecino más cercano obtuvo el código SIGAI0627.
[30] Una revisión de la tecnología de detección y reconocimiento de texto de escenas naturales obtuvo el código SIGAI0629.
【31】Comprensión de la informática: de √2 a alfa go: código de recopilación de antecedentes históricos de la temporada 2 de informática neuronal SIGAI0702.
[32] Código de adquisición del diagrama de algoritmo de aprendizaje automático SIGAI0704.
Derivación del algoritmo de retropropagación: código de adquisición de red neuronal completamente conectada SIGAI0706.
[34] Descripción general del código de adquisición del modelo de red adversarial de producción SIGAI0709.
【35】Cómo convertirse en un excelente ingeniero de algoritmos código de colección SIGAI0711.
[36] Comprensión de la informática: de √2 a alfa: el modelo matemático de red neuronal de la Sección 3 se obtiene con el código SIGAI0702.
[37] El código de colección SIGAI6 del algoritmo de detección de rostros S3FD
[38] El método de conteo de multitudes basado en el aprendizaje de correlación negativa profunda obtuvo el código SIGAI0718.
[39] Descripción general del código de adquisición de aprendizaje múltiple SIGAI0723
Enlace: /p/7caf6bb6d621
Fuente: