|
MPEG: La compresión de
Vídeo

MPEG (Moving Pictures Experts Group) es el acrónimo del Grupo
de Expertos en Imágenes en Movimiento creado por la ISO (Organización
Internacional de Estándares, International Standards Organization) para redactar
los estándares para la compresión y transmisión del audio y del vídeo. El primer
resultado fue el MPEG-1, que al ser una aplicación bastante limitada fue
evolucionado al MPEG-2, pudiendo abarcar un ámbito de trabajo más grande.
El volumen de la información en el origen es reducido por el
compresor, esta información comprimida pasa a través de un canal de comunicación
y retorna a su valor original gracias ahora a un proceso de descompresión, con
la particularidad que este proceso se realiza casi a tiempo real. La relación
entre el valor original y el comprimido se conoce como el factor de
compresión.
Si en la compresión Audio/Vídeo el codificador es más complejo
que el decodificador, el sistema se llama asimétrico. En la figura 1, vemos como
el MPEG trabaja asimétricamente. El codificador necesita ser algorítmico o
adaptable, mientras que el decodificador es \'mudo\', realizando siempre
funciones fijas. Esto es una ventaja en ciertas aplicaciones como en el mundo de
la teledifusión, donde los caros compresores son pocos delante del gran número
de decodificadores con precios relativamente baratos.
Las ventajas de estandarizar el decodificador es
que pueden aparecer diferentes codificadores que tendrán que dar siempre el
mismo resultado. Las industrias pueden presentar codificadores con algoritmos de
su propiedad sin tener que dar a conocer sus detalles técnicos. Por lo tanto,
puede existir una amplia gama de diferentes codificadores, ya que el usuario
final podrá escoger entre diferentes gamas sabiendo que todos ellos funcionaran
en un mismo decodificador.
Por lo tanto, el MPEG es mucho más que un esquema de compresión
ya que estandariza el protocolo y la sintaxis por el cual es posible combinar o
multiplexar audio y vídeo para producir el equivalente digital en un programa de
televisión.
Compresión, factor de reducción y reducción de información son
términos que significan lo mismo en este contexto. En esencia, la misma (o casi
la misma) información es transportada mediante una pequeña parte de la misma. En
Audio la compresión tradicional equivaldría al proceso donde la dinámica del
sonido es reducida. En el contexto del MPEG, la compresión equivaldría a una
reducción del flujo de datos (bitrate).
¿Por qué comprimir?
Hay bastantes motivos para comprimir la señal:
1. Comprimir alarga el tiempo de reproducción en los sistemas
de almacenaje. 2. Comprimir permite la miniaturización. Con menos información
almacenada, el mismo tiempo de reproducción se obtiene con menos hardware. Es
muy útil en periodismo electrónico o ENG (Electronic News Gathering) y en usos
domésticos. 3. Menos problemas de tolerancia. Al tratar de almacenar menos
información, la capacidad de almacenamiento puede ser reducida con equipamientos
más resistentes al clima y que necesiten de menos mantenimiento. 4. En la
transmisión, la compresión permite una reducción del ancho de banda, que genera
una reducción en el precio de coste. 5. Si un canal de transmisión está
preparado para emitir señales sin comprimir, el uso de señal comprimida permite
enviar mas rápidamente que en tiempo real (o más canales a la vez). 6. La
compresión permite mejorar notablemente la señal.
Codificación del MPEG:
Las aplicaciones del MPEG son ilimitadas. En vídeo abarca desde
una sola fotografía, a imágenes de videoconferencia hasta a alta definición
necesaria en el cine electrónico. En la codificación de audio, desde la palabra
monoaural hasta el multicanal presente en los sistemas de sonido envolvente.
Existen muchas técnicas de compresión. En la codificación con mínima pérdida
(lossless) la información en el decodificador es idéntica bit a bit que la
original. La codificación en lossless está generalmente restringida a un factor
de compresión alrededor de 2:1.
En la compresión con pérdida (lossy) la información en el
decodificador no es idéntica bit a bit con la original, existiendo alguna
diferencia al ser comparadas. Estas codificaciones lossy no son convenientes
para informática, pero se usa en MPEG ya que permiten un gran factor de
compresión. Un codificador lossy ideal está basado en el conocimiento de la
percepción psicoacústica y psicovisual, por esto también se conocen como
codificadores perceptivos.
La gran mayoría de las técnicas de codificación de vídeo usan
el subsampleado y cuantificación antes de la codificación. La función básica es
reducir el tamaño de la señal de entrada videográfica (horizontal y
verticalmente) así como el número de pixels. No es un procedimiento del todo
negativo en aplicaciones de vídeo. En el receptor final las imágenes
decodificadas son interpoladas en la pantalla, y gracias a los conocimientos
sobre la visión humana, se perciben casi idénticas. La vista humana, recordemos,
es más sensible a los cambios de brillo que a los cromáticos, por eso el MPEG
utiliza una división de las imágenes en las componentes YUV (una de luminancia y
dos de crominancia). Esto lo veremos más tarde.
En un sistema PCM digital, la cadena de bits es la resultante
del muestreo de ciertos valores en un determinado tiempo a partir de una señal
continua. No se almacena el total de la señal original, sino sólo una parte,
dejando que la parte obviada sea interpretada por el receptor como continua, y
en la mayoría de los casos, se recrea esa información de una manera única.
Si las características de un receptor perceptivo son conocidas,
el transmisor puede omitir partes del mensaje con el conocimiento que el
receptor tendrá la habilidad de recrearlas a la perfección. Por eso todos los
codificadores tienen el modelo del decodificador.

La diferencia entre el valor de la información y todo el
conjunto entero de la información se conoce como redundancia. Los sistemas de
compresión están diseñados para eliminar la mayor cantidad de redundancia
posible. El contenido de información o entropía es una función resultante de la
eliminación de todos esos valores no previsibles. Una forma de onda es muy
previsible, ya que todas sus ondas son idénticas, cualquier señal que sea
previsible no contiene información. En el caso de la onda está claro, ya que
representa a una frecuencia sola y por lo tanto no tiene ancho de banda. En un
caso totalmente contrario encontramos una señal como el ruido que es totalmente
impredecible, provocando en los codificadores graves problemas.
Entropía y Redundancia:
Todas las posibles señales reales se pueden dividir en señales
previsibles o señales no previsibles o ruidos. Si el ancho de banda y el rango
dinámico del sistema de transmisión los usamos para delimitar una área, los dos
tipos de señales anteriores se encuadran dentro de ésta. En la figura 2 se
muestra como la señal real ocupa una parte de esta área. La señal puede no
contener todas las frecuencias o no trabajar con todo el ancho de banda posible
en ciertas frecuencias.
La Entropía es la señal que contiene información, ya que la
señal redundante no suma información alguna o simplemente peca de ésta. Un
codificador ideal tendría que ser capaz de delimitar estas áreas y poderlas
emitir, así como un decodificador tendría que recrear una impresión original de
la información obtenida. Mientras nos vamos acercando a los ideales, la
complejidad de los codificadores y el tiempo de trabajo (delay) van apareciendo.
En la figura 3 vemos como se incrementa la complejidad con el factor de
compresión (3.A) y como crece el tiempo de trabajo con el factor de compresión
(3.B). Naturalmente tendríamos que trabajar con un canal que aceptase cualquier
tipo de entropía que el codificador extrajera para así tener una calidad
transparente. Como resultado de la ganancia de una codificación moderada dónde
sólo eliminamos la redundancia sin la necesidad de sumarle elementos
artificiales, diremos que hemos codificado con una pérdida mínima subjetiva. Si
el canal no es suficiente para esto, el codificador tendrá que eliminar de
cierta manera información propia de la entropía, resultando artificial. Un
codificador imperfecto puede errar en la separación de esta información.

Cuando se usa el mismo tipo de información entrante, un estudio
de la misma permite que los diferentes resultantes posibles tengan determinados
sus valores resultantes. Como que los resultantes son de longitudes variables,
se puede determinar con un estudio anterior cuales serán los mas utilizados para
otorgarles los valores más cortos. Por ejemplo en el código Morse se creó
basándose en el Inglés, así la letra e (la más usada) sólo tiene un pulso,
mientras que el carácter z, que es poco utilizado, es uno de los que más pulsos
tiene. Claro que el lenguaje Morse en otro contexto geográfico pierde tal
facilidad, ya que si se usa en Checoslovaquia la letra más utilizada es la
z.
El código Huffman es un código utilizado cuando se conoce el
tipo de información entrante. La probabilidad de diferentes valores codificados
para ser trasmitidos es estudiada y los códigos más frecuentes son preparados
para ser transmitidos con las palabras más cortas. Cuanto menos probable un
código puede ser transmitido, es más probable que tenga una palabra larga.
Compresión del MPEG-1
La técnica de compresión de vídeo desarrollada por el MPEG-1
cubre muchas de las aplicaciones en sistemas interactivos, como el CD-ROM. Para
soportar el gran rango de aplicaciones, una diversidad de parámetros de entrada
pueden ser manipulados por el usuario, aunque cualquier decodificador MPEG-1
tiene que soportar una señal de vídeo similar al de la televisión: 720 pixels
mínimos por línea, 576 líneas mínimas por cuadro, un mínimo de 30 cuadros (o
frames) por segundo y un bitrate de 1,86 Mb/s. La entrada de vídeo estándar
consiste en una señal no entrelazada de vídeo.

El algoritmo del MPEG-1 se ha desarrollado respetando el JPEG y
el H.261, por lo tanto los soporta. La compresión básica del MPEG-1 está basada
en una estructura de MacroBlock, compensación del movimiento y un
reemplazamiento condicional de MacroBlocks. En primer lugar codifica el primer
cuadro de una secuencia de vídeo mediante la codificación Intra-Frame
(I-Picture). Los siguientes cuadros se codifican mediante la predicción
Inter-Frame (P-../pictures). Cada color de entrada de cuadro en una secuencia de
vídeo se divide en diferentes bloques no superpuestos como vemos en la figura 4.
Cada MacroBlock contiene bloques de datos de la luminancia y las bandas de
crominancia vecinas (cuatro de luminancia -Y1, Y2, Y3, Y4-, y dos de crominancia
-U, V) con un tamaño de 8x8 p. Así que el valor de muestreo entre Y:U:V
luminancia y crominancia es 4:1:1.

El diagrama de bloque básico de un híbrido DPCM/DCT MPEG1
codificador y decodificador lo podemos ver en la figura 5. El primer cuadro en
una secuencia de vídeo (I-Picture) está codificado en el modo INTRA sin ninguna
referencia a anteriores o posteriores cuadros. Al codificador, el DCT se aplica
para cada bloque 8x8 de luminancia y crominancia y, después de la salida del
DCT, cada uno de los 64 coeficientes DCT son uniformemente cuantificados
(Q).
El cuantificador stepsize (sz) suma los coeficientes DCT con
los que un MacroBlock es transmitido al receptor. Después de la cuantificación,
el coeficiente DCT menor es tratado diferentemente de la resta de los
coeficientes. El coeficiente DCT corresponde a la intensidad promedia del bloque
y es codificada mediante un método de predicción diferente. Los valores
cuantificados No-Zero restantes al coeficiente DCT y sus localizaciones son
ahora barridos en \'zig-zag\' en la entropía.
Para codificar las P-pictures, la anterior I-Picture o
P-Picture (el cuadro N-1) queda almacenado y memorizado al FS (Frame Store) ya
sea en el codificador o el decodificador. La compensación de movimiento (Motion
Compensation - MC) se realiza en el MacroBlock básico - sólo un vector de
movimiento es estimado entre el cuadro n y el cuadro n-1. Este vector de
movimiento será codificado y transmitido al receptor. El error de predicción del
movimiento compensado está calculado substrayendo cada pixel en una MacroBlock
con el movimiento cambiado en el anterior cuadro. Un búfer de Vídeo (VB) es
necesario para asegurar un constante flujo continuo de salida.
En cierta manera se evita el almacenamiento en cuadros
diferentes de toda esa información que en el anterior cuadro no varía.
IntraCodificación
La IntraCodificación trabaja con las tres dimensiones
(horizontal, vertical y espacial) y con los valores cuantificados. En vez de
enviar información, en una secuencia en movimiento videográfica, por cada cuadro
independientemente, los intercodificadores envían sólo la diferencia entre el
cuadro anterior y el cuadro actual en una codificación a parte.
En la figura 6 se muestra como el cuadro inicial (I-Picture o
Intra-Picture) es interpolado con otros cuadros que están creados haciendo
servir datos diferentes (P-Picture o Predicted-picture). El cuadro I pide mucha
mas información mientras que P necesita mucha menos. Como resultado, el flujo de
datos varía dramáticamente y por lo tanto se tiene que usar un búffer para
conseguir una transmisión constante (no variable). La I-Picture y las P-Pictures
posteriores anteriores a la siguiente I-Picture forman un grupo de cuadro
(GOP).

Compensación de Movimiento
Pero a veces el movimiento no es solo de una parte pequeña del
cuadro. A veces es el movimiento mismo de la cámara, ya sea desde un eje fijo o
el mismo movimiento de ella (lo que aquí conocemos como travelling, aunque es
más profesional decir panorámica). La "Compensación del Movimiento" (Motion
Compensation) es un proceso que mide eficazmente el movimiento de un objeto de
un cuadro al siguiente, por lo tanto permite discernir entre el movimiento de un
objeto y el redundante. En la figura 7 se muestra como los cuadros en movimiento
se pueden expresar en tres dimensiones (horizontal, vertical y temporal). En el
caso de objetos estáticos el único movimiento sería en el eje temporal.

Naturalmente, si el objeto se mueve el eje óptico no será
paralelo al eje temporal. La compensación del movimiento trabaja de esta manera:
mientras retiene la I-Picture compara el siguiente cuadro con el anterior para
encontrar los vectores de movimiento según diferentes áreas del cuadro (tanto en
MPEG1 y MPEG2 se pueden distinguir áreas de hasta 16x16 pixeles). Después
reposiciona la I-Picture según estos vectores y se compara con el cuadro
original para obtener los errores de predicción también conocidos como
redundantes. Los errores de predicción son transmitidos juntamente con los
vectores de movimiento. En el receptor, la I-Picture sigue en memoria, esperando
los vectores de movimiento y la información redundante (errores de predicción)
para recrear la imagen original. Los algoritmos de compresión del MPEG
referentes a la compensación del movimiento son usados para reducir la
redundancia temporal entre cuadro y sólo los errores de predicción (las
diferencias entre la imagen original y la imagen de predicción de la
compensación del movimiento) son codificados. Generalmente la correlación entre
pixels en una imagen de errores de compensación del movimiento IntraFrame para
ser codificada es de tamaño reducido comparada con la resultante en la
codificación IntraFrame basada en la predicción basada sólo con la imagen
anterior. Cuando una imagen es codificada en este sentido, el MPEG la llama
imagen P.
Tipos de Macroblocks
La información redundante pues puede ser espacial o temporal.
Es espacial por ejemplo cuando aparece un cielo despejado (se repiten muchos
pixels idénticos del mismo color), lo es temporal cuando en una secuencia no hay
movimiento alguno. En una secuencia videográfica codificada, en su reproducción,
los MacroBlocks son sólo actualizados si es necesario (si el contenido del
MacroBlock ha cambiado en comparación con el contenido del mismo MacroBlock en
el cuadro anterior -Conditional Macroblock Replenishment). La clave de una
eficiente codificación videográfica para un bajo flujo de datos es la selección
del modo de predicción apropiado. El MPEG estándar distingue entre tres tipos de
codificación diferentes de MacroBlock: Skipped MB, Inter MB y el Intra MB. El
Skipped MB predice desde el anterior cuadro a partir de un vector de movimiento
cero. No se codifica información del MacroBlock y por lo tanto no se transmite
(no hay cambio y por lo tanto se repite el mismo MacroBlock). El Inter MB la
predicción de la compensación del movimiento es usada, el tipo de MacroBlock, su
dirección y, si es necesario, su vector de movimiento, el coeficiente DCT y la
cuantificación de pasos (stepsize) son transmitidos. El Intra MB no usa ninguna
predicción desde el cuadro anterior, sólo el tipo de MacroBlock, su dirección,
el coeficiente DCT y el cuantificador de pasos son transmitidos. Cuando se usa
la compresión temporal, el fotograma actual no es enviado entero al receptor, ya
que es necesario para poder ser comparado con el siguiente fotograma. El
decodificador aun tendrá el fotograma anterior para poder añadir las diferencias
siguientes. Un fotograma diferente es creado al sustraer cada pixel de uno por
el nuevo del otro. Esto parece bastante sencillo, pero el MPEG-2 desarrolla una
gran complejidad posible hasta con imágenes entrelazadas. A partir de un
fotograma, el siguiente es analizado para detectar la entropía (dejando lo otro
como redundancia). Es entropía lo que cambia, por ejemplo un objeto en
movimiento. El siguiente fotograma, más que un fotograma entero, sólo contendrá
la información necesaria para que a partir del anterior fotograma se recree el
siguiente con la mínima modificación de información.La codificación predictiva
no puede usarse indefinidamente.
Codificación Bidireccional
Para acceder al vídeo desde su almacenamiento, el algoritmo de
compresión del MPEG ha estado diseñado para poder soportar las funciones más
comunes como el acceso aleatorio, avance rápido o retroceso rápido. Estos
requerimientos nos presentan las B-Pictures (bidireccionales). En un GOP (Grupo
de Imágenes -pictures) tenemos pues hasta tres tipos de imágenes. Las I-Pictures
(imágenes codificadas sin ninguna referencia anterior) permiten los puntos de
acceso para los accesos remotos, así como las funciones de avance/retroceso
rápido. Las P-Pictures (imágenes referencia de predicción entre diferentes
I-Pictures), al no contener la información completa de un cuadro, no permiten su
acceso aleatorio ni su edición videográfica. Las imágenes bidireccionales de
predicción/interpolación (B-Pictures) necesitan la referencia de los cuadros
anteriores y posteriores. Para realizar la alta compresión, la compensación de
movimiento puede usarse basándose en el más cercano o lejano cuadro P o I. Las
imágenes B nunca pueden usarse como referencia. Como norma general, una
secuencia de vídeo codificada únicamente con imágenes I (I I I I I I...) permite
trabajar con muchos puntos de acceso aleatorio permitiendo una mayor facilidad
en su proceso de edición, aunque en contrapartida el factor de compresión será
muy bajo. Una secuencia codificada mediante imágenes I regulares sin imágenes B
(I P P P I P P P I P P ...) realiza una moderada compresión aun con bastantes
puntos de acceso remoto y funciones de avance/retroceso rápido. Incorporando los
tres tipos de imágenes (I B B P B B P B B I B B P ...) tendremos una alta
compresión y también un conjunto razonable de puntos de acceso pero también
incrementará significativamente el tiempo de trabajo de codificación (delay).
Este delay o retardo temporal no es tolerable en aplicaciones como la
videotelefonía o videoconferencia.
Otra característica importante que soporta la codificación
algorítmica del MPEG es la posibilidad de ajustar a medida el flujo de datos
(bitrate) para específicas aplicaciones, ajustando el cuantificador de pasos
(stepsize) para la cuantificación de los coeficientes DCT. El MPEG permite la
codificación de diferentes selecciones de valores de cuantificación para cada
MacroBlock, permitiendo transmitir imágenes en tiempo real. Almacenar o
transmitir vídeo mediante un constante flujo de datos es necesario para obtener
una continuidad lógica en la decodificación (buffer). El MPEG define una
capacidad mínima del buffer de vídeo para que sea aplicable en todos los tipos
de decodificadores. Este valor es idéntico al valor máximo de la capacidad del
buffer de vídeo que el codificador usa para generar el flujo de datos. Para
reducir el tiempo de trabajo (delay) o la complejidad del codificador es posible
trabajar con una capacidad de buffer de vídeo virtual en el codificador menor
que el mínimo necesario para soportar el decodificador. El tamaño de este buffer
virtual es transmitido al decodificador antes de la señal de vídeo
codificada.
MPEG-2
Anteriormente hemos dicho que el estándar de entrada de la
señal de vídeo en el MPEG-1 es una señal no interlazada. La codificación de una
señal interlazada de televisión en color de 525 o 625 líneas a 29,97 o 25
cuadros por segundo respectivamente es una aplicación importante para el
MPEG-11. Para realizar tal compresión sólo un campo horizontal es subsampleado
de cada secuencia interlazada de vídeo de entrada. En el receptor el campo
faltante es predecido e interpolado. El MPEG2 nace para dar mas cualidad y
funcionalidad, desarrollando mas modos de predicción así como aceptando la señal
interlazada. También soporta la TV digital y la HDTV. El MPEG2 introduce el
concepto de imagen de cuadro e imagen de campo. Para secuencias interlazadas se
asume que la señal de entrada del codificador consiste en una serie de cuadros
(superiores e inferiores) separados por el tiempo de campo. Dos cuadros de un
campo ahora se codifican por separado. En las predicciones capa cuadro superior
será, por ejemplo, el referente de su posterior cuadro posterior. Respeto a los
formatos de crominancia, el MPEG2 ha desarrollado sus especificaciones
adicionales para los formatos de vídeo de alta calidad (4:2:2).
|
|
SIMPLE |
PRINCIPAL |
4:2:2 |
SNR |
ESPACIAL |
ALTO |
|
ALTO |
|
4:2:0 1920x1152 90 Mb/s |
|
|
|
4:2:0 4:2:2 1920x1152 100 Mb/s |
|
ALTO 1440 |
|
4:2:0 1440X1152 60 Mb/s |
|
|
4:2:0 1440X1152 60 Mb/s |
4:2:0 4:2:2 1440x1152 80 Mb/s |
|
PPAL |
4:2:0 720x576 15 Mb/s No B |
4:2:0 720x576 15 Mb/s |
4:2:2 720x608 50 Mb/s |
4:3:0 720x576 15 Mb/s |
|
4:2:0 4:2:2 720x576 20 Mb/s |
|
BAJO |
|
4:2:0 352x288 4 Mb/s |
|
4:2:0 352x288 4 Mb/s |
|
|
El MPEG2 tiene muchas aplicaciones donde usarse como un
standard simple, y por eso esta subdividido en Perfiles y Niveles. Los Perfiles
describen el grado de complejidad, mientras que los Niveles describen el tamaño
de la imagen o la resolución que va con cada perfil. No todos los niveles
soportan todos los perfiles. La Figura 8 muestra las combinaciones posibles. Un
decodificador MPEG con un Perfil y un Nivel tiene que ser capaz de poder
trabajar con todos sus inferiores.
El perfil simple no soporta la codificación bidireccional, por
lo tanto sólo puede dar imágenes P y I. Este reduce el delay de la codificación
y descodificación y permite un hardware sencillo (doméstico). El Perfil simple
está solo definido por el nivel principal
El Perfil principal está diseñado para usos muy diversos. Los
niveles bajos usan una resolución de entrada muy baja con sólo 352 píxels por
línea. La mayoría de las aplicaciones teledifusivas necesitan del (Main Profile
at Main Level). Aquí entra el SDTV (standard definition television).
El Nivel alto 1440 (High1440) es un esquema de alta definición
que dobla la definición si la comparamos con la del nivel principal. El Nivel
Alto no sólo dobla la resolución si no que mantiene esta resolución con el
formato 16:9 incrementando el número de muestras horizontales de 1440 a
1920.
En sistemas de compresión que transformen el espaciado y
recuantifiquen es posible crear señales escalables. Un proceso escalable es ese
donde la señal de entrada resulta en una principal y una segunda señal de ayuda.
La señal principal puede ser decodificada sola dando a la imagen cierta
cualidad, pero si la información de la señal de ayuda es añadida, algunos
aspectos de la calidad mejoran notablemente. En la figura 9 vemos una señal
convencional MPEG con un alto coeficiente de recuantificación y con una moderada
relación señal/ruido. Si comparamos la imagen resultante pixel a pixel con la
original encontraremos ruido de cuantificación. Esta señal la podemos comprimir
y transmitir como una señal de ayuda. Un decodificador simple solo lo
decodificará como el ruido principal de esta imagen, pero un decodificador más
complejo podrá decodificar ambas señales para después combinarlas y obtener una
imagen con muy poco ruido. Este es el principio del SNR. Como alternativa, en la
figura 10.B vemos que codificando las bajas frecuencias espaciales en una imagen
en HDTV, obtenemos una decodificación correcta para SDTV.
El Alto Perfil soporta tanto el SNR como el espacial, así como
el 4:2:2 (permitiendo pues la compatibilidad con todos los sistemas digitales de
procesado de señal de vídeo). El MPEG2 nace como una evolución del MPEG1, así
que permite que un MPEG1 pueda ser decodificado perfectamente en un MPEG2.
El celuloide en MPEG
Las películas cinematográficas pueden ser usadas como material
videográfico y ser comprimidas en MPEG. Antes haría falta su telecinado (el
proceso por el cual una película en celuloide es registrada a un formato
videográfico). En cine se trabaja normalmente a 24fps (fotogramas por segundo) -
aunque las proyecciones en las salas es de 48fps, se repite el mismo fotograma
dos veces -, mientras que la frecuencia de la señal televisiva es de 50Hz o
60Hz. Esta incompatibilidad se soluciona de dos maneras. Los telecines a 50Hz,
la película es proyectada un cuadro más rápido por segundo, a 25 fps (la
diferencia es casi nula). De esta manera cada cuadro fotosensible se convierte
en dos campos videográficos, solucionando el problema para estos casos. En los
telecines a 60Hz, la proyección se hace a 24fps, pero se alternan a dos cuadros,
luego a tres y luego a dos (una relación 3:2), convirtiendo dos cuadro en tres
campos, consiguiendo la frecuencia deseada. El problema reside en que en este
momento el movimiento no es continuo, y por lo tanto, en las codificaciones MPEG
el movimiento aparece "raro". La mejor solución recae en evitar las
modificaciones del telecinado, intentando mantener las características
originales de la película. La solución es tan sencilla como obviar los cuadros
pares en 50Hz, entendiendo que son repeticiones del anterior. Más complejo es el
paso en los telecinados en 60Hz, pues seguramente la copia final habrá sido
editada en vídeo y será difícil saber si se ha cortado en medio de una
combinación 2-3-2. En este caso sería necesario dar toda la información posible
de los cortes para poder detectar los campos correctos. De la misma manera, una
película en MPEG puede ser emitida tanto en 60Hz como en 50Hz con el mismo
resultado.
Artículo creado por Ramón
Sendra
|