¿Qué son las convoluciones y las redes neuronales convolucionales?
La red neuronal convolucional (CNN) es una red neuronal de avance con una estructura profunda, que incluye cálculos de convolución, y es uno de los algoritmos representativos del aprendizaje profundo.
La investigación sobre redes neuronales convolucionales comenzó en las décadas de 1980 y 1990. Las primeras redes neuronales convolucionales fueron las redes de retardo y LeNet-5, con la introducción de la teoría del aprendizaje profundo y la mejora numérica. En el ámbito de los equipos informáticos, las redes neuronales convolucionales se han desarrollado rápidamente y se aplican en campos como la visión por computadora y el procesamiento del lenguaje natural.
Natural
Las conexiones entre capas convolucionales en redes neuronales convolucionales se denominan conexiones dispersas, es decir, en comparación con las conexiones completas en redes neuronales feedforward, las conexiones en capas convolucionales son neuronas. conectados sólo a un subconjunto de sus capas adyacentes, no a todas ellas. Específicamente, cualquier píxel (neurona) en el mapa de características de la capa L de la red neuronal convolucional es solo una combinación lineal de píxeles en el campo receptivo definido por el núcleo de convolución de la capa l-1.
Las conexiones escasas de las redes neuronales convolucionales tienen un efecto de regularización, lo que mejora la estabilidad y la capacidad de generalización de la estructura de la red y evita el sobreajuste. Al mismo tiempo, las conexiones escasas reducen la cantidad total de parámetros de peso, lo que favorece un aprendizaje rápido de las redes neuronales y reduce la sobrecarga de memoria en los cálculos.