Imagen binaria, en escala de grises y en color
Métodos básicos de representación de imágenes binarias, imágenes en escala de grises e imágenes en color.
Una imagen binaria es una imagen que contiene sólo dos colores: blanco y negro.
En los ordenadores, las imágenes se representan y procesan a través de un conjunto de datos (matriz) dispuestos en una cuadrícula.
Por ejemplo, la Figura 2-1 es una imagen de la letra A. Cuando la computadora procesa la imagen, primero la dividirá en pequeños cuadrados. Cada pequeño cuadrado es una unidad de procesamiento independiente llamada píxeles.
A continuación, la computadora procesará los píxeles blancos (área del cuadrado pequeño blanco) como "1" y los píxeles negros (área del cuadrado pequeño negro) como "0" para facilitar las operaciones de procesamiento y almacenamiento posteriores.
Según el método de procesamiento anterior, la letra A en la Figura 2-1 se almacena en la computadora como se muestra en la Figura 2-2.
La imagen de arriba es relativamente simple. Solo hay dos colores diferentes, blanco y negro, en la imagen, por lo que solo se puede representar con un bit (0 o 1).
Las imágenes binarias son simples y convenientes de representar, pero debido a que solo tienen colores blanco y negro, las imágenes que representan no son lo suficientemente delicadas. Si desea mostrar más detalles, debe utilizar más colores. Por ejemplo, la imagen de Lena en la Figura 2-3 es una imagen en escala de grises. Utiliza más valores para reflejar diferentes colores, por lo que la imagen tiene detalles más ricos.
Por lo general, las computadoras procesan la escala de grises en 256 niveles de escala de grises, representados por el intervalo numérico [0, 255]. Entre ellos, el valor "255" representa el blanco puro, el valor "0" representa el negro puro y los valores restantes representan diferentes niveles de escala de grises, desde el blanco puro hasta el negro puro. Los valores 0 ~ 255 utilizados para representar 256 niveles de gris se pueden representar exactamente con un byte (valor binario de 8 bits).
En comparación con las imágenes binarias y las imágenes en escala de grises, las imágenes en color son un tipo de imagen más común y pueden expresar información detallada más rica.
Experimentos neurofisiológicos han descubierto que hay tres receptores de color diferentes en la retina, que pueden detectar tres colores diferentes: rojo, verde y azul, los tres colores primarios. Se pueden formar varios colores de luz que se ven comúnmente en la naturaleza mezclando tres colores primarios en una determinada proporción. Además, desde una perspectiva óptica, el color se puede analizar en longitud de onda principal, pureza, brillo, etc. Desde una perspectiva psicológica y visual, el color se puede analizar en tono, saturación, brillo, etc. Por lo general, nos referimos a los modos mencionados anteriormente de expresar colores de diferentes maneras como espacios de color, o espacios de color, modos de color, etc.
Aunque los diferentes espacios de color tienen diferentes métodos de representación, se pueden convertir varios espacios de color según las fórmulas según sea necesario. Aquí solo presentamos el espacio de color RGB más utilizado.
En el espacio de color RGB, existen el canal R (rojo, rojo), el canal G (verde, verde) y el canal B (azul, azul), tres canales. El rango de valores de cada canal de color está entre [0, 255] y utilizamos la combinación de estos tres canales de color para representar el color.
Para explicarlo de una manera más popular, hay tres cubos de pintura, que contienen pintura roja, verde y azul respectivamente. Tomamos una capacidad de 0 a 255 unidades de cada cubo de pintura. nuevo color mezclando tres pinturas sin usar diferentes cantidades de pintura. A través de diferentes combinaciones de las tres pinturas, se pueden producir todos los colores comunes de 256×256×256=16777216.
Por lo tanto, generalmente se utiliza una matriz tridimensional para representar una imagen en color en el espacio de color RGB. Generalmente, en el espacio de color RGB, el orden de los canales de imagen es R → G → B, es decir, el primer canal es el canal R, el segundo canal es el canal G y el tercer canal es el canal B.
Es importante tener en cuenta que en OpenCV, el orden de los canales es B→G→R, es decir:
Durante el proceso de procesamiento de la imagen, el orden de los canales de la imagen puede cambiarse según sea necesario. Realice la conversión.
Además, también puede realizar conversión de tipos en imágenes en diferentes espacios de color según sea necesario, por ejemplo, procesar imágenes en escala de grises en imágenes binarias, procesar imágenes en color en imágenes en escala de grises, etc.