Compartir

En nuestra novena entrega sobre gestión de color, compresión y flujo de trabajo hablamos de los esquemas de compresión intercuadro.

Esquemas de compresión intercuadro

En este tipo de compresión los algoritmos toman como referencia a un único fotograma –denominado, en ocasiones, “fotograma clave” o “key frame”– para a continuación comparar los cambios entre el mismo y una serie preestablecida de fotogramas subsiguientes. Durante este proceso se busca cualquier cambio y se descarta toda aquella información que permanezca idéntica entre fotogramas. Tal procedimiento funciona a la hora de comprimir una película porque, por regla general, la mayor parte de la imagen no cambia entre fotograma y fotograma. Tan sólo una pequeña porción de la imagen registra movimiento.

Fotograma de "La silla de Fernando" (Luis Alegre, David Trueba, 2006), ejemplo de imagen de entrevista donde existen muy pocas variaciones en la información de la imagen entre un fotograma y el siguiente.
Fotograma de “La silla de Fernando” (Luis Alegre, David Trueba, 2006), ejemplo de imagen de entrevista donde existen muy pocas variaciones en la información de la imagen entre un fotograma y el siguiente. A título informativo, cabe destacar que este documental constituye también la demostración definitiva de que Fernando Fernán Gómez era el puto amo.

Por ejemplo, en una entrevista a un sujeto en primer plano o plano medio corto con la cámara situada en una posición fija –sobre trípode–, los únicos elementos que cambian entre un fotograma y el siguiente son la cabeza, los ojos, la boca, etc. El fondo es idéntico fotograma tras fotograma. La compresión intercuadro analiza la información redundante y concluye que no es necesario mantenerla en cada fotograma. La emplea como referencia y la descarta en todos aquellos fotogramas en los que se repite.

Ejemplo de GOP
Ejemplo de GOP

De esta manera se crea lo que denominamos como un “grupo de imágenes (group of pictures o GOP)”. El nombre responde al hecho de que los sucesivos fotogramas dependen de la inicial que empleamos como referencia. Todos ellos quedan recogidos en un grupo –de entre siete a quince fotogramas, en la mayoría de los casos– antes de que se seleccione un nuevo fotograma de referencia y se cree un nuevo GOP.

Al fotograma de referencia se le llama intra frame o fotograma I y los fotogramas subsiguientes se llaman fotogramas predictivos o fotogramas P. El sistema de decodificación tiene que analizar el fotograma P y recoger la información que falta a partir del fotograma I más cercano. Cuando la compresión es más acentuada también entran en juego los fotogramas bidireccionales o fotogramas B, que requieren que el decodificador analice tanto el fotograma I previo como el fotograma P y, en ambos casos, que lo haga antes y después del analizar el fotograma B.

Estructura básica de un Long-GOP
Estructura básica de un Long-GOP

Como resultado se obtiene información más precisa de los detalles que faltan en la imagen y el codec resulta más eficiente, aunque según la tasa de transferencia de datos final es más que probable que la calidad de dicha imagen se resienta. La estructura típica de un GOP avanzado tiene la siguiente apariencia: IBBPBBPBBPBB, y la secuencia se repite con un nuevo fotograma I.

En su origen, esta tecnología se creó para la compresión del Grupo de Expertos en Codificación de Imágenes en Movimiento (MPEG), el codec que subyace tras la codificación que se adoptó en la generación de los DVD y en la distribución de vídeo digital –cable, satélite e internet– en general. Se diseñó como un formato de exhibición en el cual el tamaño de los archivos podía ser muy pequeño y en el que se dejaba la decodificación de los GOP en manos del hardware. Por ejemplo, un reproductor de DVD realizaba la decodificación del DVD, completando la información ausente en los fotogramas comprimidos en tiempo real. De este modo, la industria se aseguraba de que los datos en el disco físico no tenían que incluir ni los algoritmos de decodificación ni la información en sí misma, y su cantidad podía ser significativamente pequeña en comparación con la de información final que decodificaba el reproductor.

Utilización de protocolos MPEG en la emisión broadcast
Utilización de protocolos MPEG en la emisión broadcast

Se han utilizado variaciones de MPEG para vídeo en soporte CD y DVD, plataformas de distribución de vídeo por satélite y cable y también para discos Blu-ray, que usan el estándar actualizado de codificación MPEG-4.

Se conoce, asimismo, al MPEG por su número estándar de codificación para la Unión Internacional de Telecomunicaciones (ITU): H.261 (MPEG-1), H.262 (MPEG-2) y H.264 (MPEG-4). Los formatos de definición estándar 720 x 486 y 720 x 576 (Rec 601) estaban cubiertos por el H.262 (MPEG-2) y el MPEG-4/H.264 es una versión actualizada que incluye el formato 1.920 x 1.080 Rec 709.

Niveles de MPEG-4
Niveles de MPEG-4

Insistimos en que todos estos estándares se crearon para la exhibición -reproducción- permitiendo a los productores de contenidos distribuir archivos de datos muy pequeños que se decodificaban con el hardware del consumidor final. Así se pudo almacenar películas en CD y DVD con tasas de transferencia de datos extremadamente bajas con calidad equivalente a la de la emisión estándar en broadcast.

No obstante, los fabricantes de cámaras no tardaron en darse cuenta de lo útiles que podían resultar las codificaciones MPEG y GOP a la hora de crear archivos de imágenes en movimiento de peso muy reducido. Así es como la codificación MPEG empezó a emplearse como formato de adquisición. Los primeros resultados de esta tendencia en popularizarse fueron los del formato HDV, adoptado por Panasonic, Canon, Sony y otras compañías. Permitía a los usuarios grabar imágenes de resolución 1.920 x 1.080 en pequeñas cintas Mini DV a 25 Mbps –recordemos que una imagen en alta definición sin comprimir equivale a 1137,9 Mbps, lo que significa que el HDV presentaba una altísima compresión MPEG de proporción 46:1–.

Cinta magnética Mini DV
Cinta magnética Mini DV

En ese momento, se generó un verdadero boom de cámaras baratas de alta definición que podían grabar en cintas magnéticas estándar de DV. Como consecuencia, las imágenes en alta definición se adoptaron rápidamente tanto por los consumidores como por los profesionales.

Fotograma de "Lo bueno de llorar" (Matías Bize, 2007), una de las primeras películas rodadas en España en HDV
Fotograma de “Lo bueno de llorar” (Matías Bize, 2007), una de las primeras películas rodadas en España en HDV

Sin embargo, hay un problema de importancia cuando se intenta montar un vídeo codificado en GOP. Si el montador decide detenerse en una imagen que coincide con un fotograma P o B, no está tratando con un fotograma completo de vídeo. Ese fotograma sólo contiene información parcial y precisa de la referencia de un fotograma I para completar las partes que le faltan.

Matías Bize con una Canon XL-H1 de HDV durante el rodaje de "Lo bueno de llorar" en Barcelona
Matías Bize con una Canon XL-H1 de HDV durante el rodaje de “Lo bueno de llorar” en Barcelona

Esto significa que o bien limitamos la precisión del sistema de edición no lineal a cortes sólo en los fotogramas I –cada séptimo o decimoquinto fotograma– o el software debe decodificar esos fotogramas P o B sobre la marcha –lo que requiere más potencia computacional–. A día de hoy, la mayoría de los programas de edición soportan la edición “nativa” de GOP, pero los montadores profesionales siguen prefiriendo transcodificar el material a un codec intracuadro –que contiene sólo fotogramas I– antes de montar.

No hay comentarios

Dejar una respuesta