La Red de Conocimientos Pedagógicos - Currículum vitae - ¿Qué significa la reducción de ruido MPEG?

¿Qué significa la reducción de ruido MPEG?

La reducción de ruido MPEG es un método que utiliza software para suavizar las imágenes de video, reducir el ruido y mejorar la calidad de la imagen.

Tecnología de compresión de vídeo y reducción de ruido MPEG

En teoría, la calidad de imagen de la televisión digital (DTV) es mejor que la de la televisión analógica tradicional y no hay fantasmas, copos de nieve ni temblores. , distorsión del color, etc. pregunta. Y se puede argumentar que el mayor inconveniente de las señales de televisión analógica es que hay demasiadas manchas en la imagen, una respuesta insuficiente a las señales de alta frecuencia, la imagen no es lo suficientemente delicada y, en resumen, el ancho de banda no es suficiente. Cuanto más fina sea la imagen y mayor la resolución, mayor será el ancho de banda requerido.

Hace mucho tiempo, los funcionarios estadounidenses asignaron cada 6 MHz de ancho de banda en el espectro disponible a cada uno de los canales de ABC para proporcionar señales de televisión analógica. Esta limitación del ancho de banda de vídeo y su correspondiente estándar de visualización (espacio de color NTSC) determinó durante décadas las características de los televisores convencionales y la calidad de las imágenes televisivas.

Con la llegada de la televisión digital, las emisoras vieron la oportunidad de aprovechar al máximo el ancho de banda que se les había asignado. De hecho, desde su perspectiva, la ventaja más destacada de la televisión digital es que permite transmitir más canales dentro del mismo ancho de banda y también puede admitir programas de televisión de alta definición (HDTV) posteriores.

Datos largos

La televisión HD tiene requisitos técnicos muy altos. Las señales NTSC tradicionales que transmiten señales analógicas deben utilizar un ancho de banda mínimo de 4,2 MHz dentro de un ancho de banda de canal de 6 MHz y escanear 525 líneas a una frecuencia de campo de 29,97 Hz. Después de la cuantificación digital y la compresión de codificación, la señal se puede grabar en DVD. van desde 2 Mbits/s a 10 Mbits/s (adaptativo), con un promedio de 4 mbits/s. En comparación, un HDTV típico tiene cinco veces la resolución de un televisor analógico.

Por lo tanto, en las mismas condiciones, la velocidad de transmisión de datos debe ser 5 veces mayor que la de la señal analógica para lograr el mismo rendimiento.

Ya sea una transmisión tradicional por aire (OTA), un descodificador de una compañía de cable o televisión por satélite, la transmisión de la señal está limitada por el ancho de banda. Al ancho de banda limitado, tienen que conectar servicios que consumen ancho de banda, incluidas transmisiones interactivas, canales de pago y listados de televisión.

Entonces, ¿cómo podemos solucionar el problema? Usar tecnología de compresión es una forma de hacerlo.

La compresión de vídeo digital puede causar distorsión.

Actualmente, el algoritmo de compresión de vídeo digital más utilizado es el MPEG-2. Desde la transmisión de televisión por satélite existente, la transmisión de televisión digital por cable hasta la transmisión digital por aire, MPEG-2 se ha utilizado ampliamente en diversas aplicaciones a nivel internacional.

MPEG-2 primero elimina la redundancia temporal mediante compensación de movimiento, luego divide un cuadro de imagen en una red de 8 × 8 píxeles y utiliza DCT (transformación de coseno discreto) para eliminar la redundancia espacial en cada red. Una vez completada la DCT, se completa mediante cuantificación y recompresión, luego codificación de longitud variable y finalmente codificación de Huffman. Todo el proceso de compresión reduce en gran medida la tasa de bits (>: relación de compresión 10:1). Sin embargo, la reducción de la tasa de bits también trae problemas, porque la codificación pierde parte de la información del video original, lo que puede causar efectos negativos graves, por lo que MPEG-2. se llama codificación con pérdidas. Descarta la información de la imagen que se considera menos importante visualmente. Cuanto mayor sea la relación de compresión, mayor será la diferencia entre la imagen codificada y la imagen original. La calidad y fidelidad de la imagen ahora dependen del nivel de compresión seleccionado (o típicamente aplicado). Debido a que está directamente relacionado con el ancho de banda disponible, debemos preguntarnos ¿cuándo dejará de haber una compresión excesiva del vídeo?

Distorsión visible

Las limitaciones del ancho de banda y la compresión excesiva de la imagen en la transmisión de señales digitales hacen que las imágenes comprimidas sean completamente diferentes de las que se ven en el mundo analógico.

Por lo general, la degradación (o ruido) de la imagen simulada suele aparecer en forma de ruido gaussiano. Su ventaja es que conserva el contenido básico y no es fácilmente detectado por los defectos visuales humanos. A menudo vemos algunas imágenes de simulación borrosas e incómodas, pero esto no causa un disgusto evidente.

El ruido digital sigue diferentes patrones de distribución y, lo que es más importante, su forma especial hace que las personas se sientan visualmente antinaturales.

Cuando la codificación MPEG-2 (o cualquier códec basado en módulos DCT) se utiliza al límite, existen dos formas principales de distorsión: ruido de mosquito y bloqueo.

El ruido de los mosquitos y el efecto Gibbs

El ruido de los mosquitos

El ruido de los mosquitos es mayor alrededor de objetos prominentes, objetos simulados por computadora o personajes que se desplazan sobre fondos de colores claros y obvios. Parece algo nebuloso o un destello alrededor de un límite de alta frecuencia entre el objeto y el fondo (un salto brusco entre el objeto en primer plano y el fondo) y, a veces, incluso puede confundirse con un sonido envolvente. Desafortunadamente, este efecto sutil también se puede observar en formas más naturales, como el cuerpo humano.

El equipo del proyecto VIRIS (Video Reference Injury System) define el ruido de los mosquitos como “la distorsión asociada con los bordes de los objetos en movimiento, manifestada por una capa de material alrededor del objeto que se asemeja a objetos voladores y/o burbujas difusas ( como mosquitos) Lo mismo que volar alrededor de la cabeza y los hombros de una persona)".

El ruido de mosquito ocurre cuando se reconstruye una imagen y algunos datos se descartan debido al uso de la transformada arcocoseno. Los "mosquitos" también se pueden encontrar en otras partes de la imagen; por ejemplo, el ruido de los mosquitos también puede aparecer en límites de textura específicos u objetos granulados. El resultado es algo similar al ruido aleatorio, como si estuviera mezclado con textura o partículas, y se parece a la característica original de la imagen.

Efecto de bloqueo

El efecto de bloqueo, fiel a su nombre, es la aparición de bloques molestos y antinaturales en una imagen. A veces se produce un bloqueo, que es una distorsión de la imagen causada por la estructura de codificación del bloque.

Cuando se maximiza la codificación, cada matriz de píxeles se promediará aproximadamente, haciendo que parezca un píxel grande. El cálculo de cada red de píxeles es diferente, lo que da como resultado límites obvios de la red.

Este efecto es más evidente cuando el objeto o la cámara se mueven rápidamente. El mejor ejemplo de esto es durante las transmisiones de la NFL, cuando los jugadores que corren con el balón se parecen a los hermanos Maglio de la antigua consola de juegos de Nintendo.

Suavizado previo

Aunque el suavizado previo no es uno de los algoritmos de procesamiento de compresión de imágenes, se ha utilizado para eliminar esta distorsión digital.

Las emisoras y proveedores de contenidos se han vuelto cada vez más conscientes de las deficiencias de sus sistemas de distribución y algunos han adoptado una solución controvertida a las limitaciones existentes del ancho de banda: el suavizado previo.

Al eliminar las partes de alta frecuencia de la imagen antes de que la señal entre en el canal, el codificador tiene más tiempo para procesar su tarea y la imagen resultante se ve menos afectada por el bloqueo y el ruido de los mosquitos. Por otro lado, este tipo de filtrado excesivo también pierde todos los cambios sutiles y texturas de la imagen original.

Por ejemplo, un jugador de fútbol que lleva una semana dejándose barba ahora parece tener una barba limpia (aunque esté parado), mientras que el estadio parece una gran alfombra verde.

Se puede demostrar que, aunque algunas personas piensan que el suavizado previo también es bueno, es un algoritmo irreversible. Una vez que se abordan los detalles, no es posible reconstruirlos.

Sin embargo, el efecto bloqueo y el ruido de los mosquitos sí desaparecen.

MNR: Almandine

Solución empresarial

Desde una perspectiva académica, se han realizado muchas investigaciones sobre la compresión y corrección de imágenes, pero hasta ahora, No hay muchas soluciones prácticas para los usuarios finales.

Algolith es una de las primeras empresas en ofrecer soluciones en tiempo real para el ruido de los mosquitos y sus efectos de bloqueo. El producto de Algolith es MNR (MPEG Noise Reducer - MPEG Noise Eliminator).

MNR implementa cuatro tecnologías únicas de procesamiento de imágenes:

1-Reducción de ruido de regresión en tiempo real para cada píxel.

2- Utilice técnicas de agrupación inteligentes para reducir el ruido de los mosquitos

3- Basado en la compresión DCT, reduzca los bloques detectando, mezclando y reduciendo gradualmente la cuadrícula.

4-Utiliza filtrado no lineal para ajustar el volumen de la imagen.

La esencia de MNR radica en su módulo de análisis de imágenes espaciales. Cada píxel se define en un área diferente, como un borde, textura, plano o área de intersección. MNR también se centra en el estado instantáneo de las imágenes en movimiento.

Después de tener en cuenta todos estos factores, MNR seleccionará uno de los diversos filtros para aplicar.

La aplicabilidad única de MNR lo convierte en un sistema avanzado de procesamiento de imágenes. MNR puede operar en el área particular en cuestión sin afectar el resto de la imagen. Saber cuándo y dónde usar un filtro es tan importante como cuándo y dónde no usarlo. En base a esta idea se diseñó MNR. Por lo tanto, MNR sólo se utiliza para mejorar la experiencia visual y es especialmente adecuado para monitores de pantalla grande y pantallas de proyección.

Su naturaleza altamente adaptable también permite mejorar la calidad de la imagen sin reconstruir la infraestructura de transmisión establecida. MNR se ha diseñado teniendo en cuenta la implementación en tiempo real y la viabilidad del hardware para que pueda integrarse perfectamente en el equipo de cine en casa existente del usuario final.

El ruido de los mosquitos (izquierda) es procesado por la tecnología MNR de Algolith (derecha).

El efecto de bloqueo (izquierda) es procesado por la tecnología BAR de Algolith (derecha).

Desarrollo de la tecnología de visualización

Una vez, el estándar NTSC representaba el estándar en el campo de visualización. La televisión analógica se mantiene desde hace años con la misma resolución, sin mejoras sustanciales en la calidad visual. En la actualidad, debido a que las autoridades gubernamentales no han aplicado los nuevos estándares de televisión digital, para bien o para mal, los estándares de los televisores comunes han mejorado constantemente.

Las mejoras en los estándares de resolución no tienen fin. Con el rápido desarrollo de tecnologías de visualización emergentes (LCOS, DLP, etc.). ), algunos monitores nuevos ahora pueden exceder la resolución máxima de la señal. Es más, los nuevos monitores tienen una mayor relación de contraste, lo que permite pantallas más grandes que eran inimaginables hace apenas unos años.

Estos imponen mayores exigencias en la mejora de la calidad de la imagen porque actúan como lupas para esas interferencias y distorsiones.

A medida que la tecnología de visualización continúa avanzando, las soluciones originales de corrección de señal de imagen, como la tecnología MNR patentada de Algolith, se volverán más atractivas.

Utilice SD DVD cuando sea posible hasta que el polvo HD se asiente.

El cambio hacia el mundo digital no sólo se refleja en la industria de la radiodifusión y la televisión frente al vídeo DVD (Digital Versatile Disc) totalmente digital (si no en todos), las anticuadas cintas de vídeo domésticas. Los sistemas también se acelerarán hacia su desaparición. Sin embargo, incluso esta técnica es insegura bajo los requisitos de compresión.

De hecho, la adición de contenido nuevo, duración extendida de las películas y pistas de audio multicanal pueden hacer que la reproducción de un disco, que ya es sustancial, sea menos clara. A medida que se agregue más contenido, el espacio en disco será insuficiente y será necesario aumentar la tasa de compresión. Como resultado, los consumidores comenzaron a quejarse de efectos poco claros, lo que llevó a la aparición de DVD de "súper contenido", que se centraban en maximizar el contenido de películas que podía contener el disco.

Esta acción de la industria editorial de DVD no sólo confirma las posibles deficiencias de la compresión, sino que también muestra la comprensión por parte del público. Por lo tanto, los soportes DVD comunes pueden beneficiarse de un procesamiento de vídeo adicional, como la solución MNR de Algolith. NHR permite que la generación actual de medios siga existiendo hasta que esperemos al ganador de la batalla entre Blu-ray, HD DVD y HVD.

Perspectivas de futuro

El ganador de la guerra de nuevos formatos se centra en ofrecer contenidos de alta definición con la máxima calidad visual, algo que por supuesto no se puede conseguir con la tecnología DVD existente. Además, estos nuevos formatos incluirán tecnología de codificación y decodificación de próxima generación además de las tecnologías de codificación y decodificación existentes:

MPEG-2, un esquema común de alta definición.

VC-1, un borrador informal del estándar MPTE 421M, se basa en la tecnología Windows Media Player (WMV) de Microsoft.

MPEG-4/AVC, también conocido como H.264, es la solución de códec más prometedora.

Pero estos diferentes estándares relacionados con cuestiones de derechos de autor pueden generar una confusión similar a la del lanzamiento de la DTV. Queda por ver cómo se verá afectada la calidad de la imagen final.

Cuanto mejor sea el códec, mayor será la demanda de los usuarios.

La televisión digital y la HDTV inicialmente parecían el "santo grial" de la calidad de imagen, pero la realidad es que todavía es demasiado pronto para transformar completamente nuestra calidad de imagen. La necesidad de compresión trae consigo sus propios problemas y, a medida que estén disponibles mejores tecnologías de visualización, estos problemas se volverán más evidentes para el espectador de televisión promedio.

Toda la industria reconoce la dura realidad del ancho de banda de video limitado y las mejoras en la eficiencia del códec a medida que las soluciones de próxima generación muestran el potencial para mejorar la calidad de la imagen. Sin embargo, como el futuro parece estar dominado por demandas de ancho de banda cada vez mayores (con IPTV aumentando la interactividad y la personalización de contenidos), uno puede preguntarse: ¿la innovación en la tecnología de compresión por sí sola satisfará las expectativas de los consumidores?

A medida que la brecha entre la realidad y la demanda crece, el desarrollo de mejores algoritmos de procesamiento de vídeo se convertirá en otro campo de batalla en la búsqueda de pantallas de alta definición en el futuro.