La conversión de estándares de televisión es el proceso de cambiar una transmisión o grabación de televisión de un sistema de televisión a otro. El más común es de NTSC a PAL o al revés. Esto se hace para que los programas de televisión de una nación puedan verse en una nación con un estándar diferente. El video se alimenta a través de un convertidor de estándares de video , que realiza una copia en un sistema de video diferente.
La conversión entre diferentes números de líneas y diferentes velocidades de cuadro en imágenes de video es un problema técnico complejo. Sin embargo, el intercambio internacional de programación de televisión hace que la conversión de estándares sea necesaria y en muchos casos obligatoria.
Historia
El primer caso conocido de conversión de sistemas de televisión fue en Europa unos años después de la Segunda Guerra Mundial , principalmente con RTF (Francia) y BBC (Reino Unido) tratando de intercambiar su programación de 441 líneas y 405 líneas .
El problema empeoró con la introducción de PAL , SECAM (ambas 625 líneas) y el servicio francés de la línea 819 .
Hasta la década de 1980, la conversión de estándares era tan difícil que la película de 24 fotogramas / s de 16 mm o 35 mm era el medio preferido de intercambio de programación.
Descripción general
Quizás la conversión más desafiante desde el punto de vista técnico es la de PAL a NTSC.
- PAL es 625 líneas a 50 campos / s
- NTSC es de 525 líneas a 59,94 campos / s (60.000 / 1.001 campos / s)
Los dos estándares de TV son a todos los efectos prácticos, temporal y espacialmente incompatibles entre sí. Aparte de que el recuento de líneas es diferente, la conversión a un formato que requiere 60 campos por segundo de un formato que tiene solo 50 campos presenta dificultades. Cada segundo, se deben generar 10 campos adicionales; el convertidor debe crear nuevos marcos (a partir de la entrada existente) en tiempo real.
Señales ocultas: no siempre se transfieren
La televisión contiene muchas señales ocultas. Un tipo de señal que no se transfiere, excepto en algunos convertidores muy costosos, es la señal de subtítulos . Las señales de teletexto no necesitan ser transferidas, pero el flujo de datos de subtítulos debería serlo si es tecnológicamente posible hacerlo.
Con la transmisión de HDTV, esto es un problema menor, en su mayor parte significa que solo se pasa el flujo de datos de subtítulos al nuevo material de origen. Sin embargo, DVB y ATSC tienen tipos de flujo de datos de subtítulos significativamente diferentes.
Papel de la teoría de la información
Teoría detrás de la conversión de sistemas
La teoría de la información y el teorema de muestreo de Nyquist-Shannon implican que la conversión de un estándar de televisión a otro será más fácil si la conversión
- es de una velocidad de fotogramas más alta a una velocidad de fotogramas más baja ( NTSC a PAL o SECAM , por ejemplo)
- es de una resolución más alta a una resolución más baja ( HDTV a NTSC )
- es de una fuente de exploración progresiva a otra fuente de exploración progresiva ( PAL y NTSC entrelazados son temporal y espacialmente incompatibles entre sí)
- tiene relativamente poco movimiento entre cuadros, lo que reduce la vibración temporal o espacial
- proviene de una fuente cuya relación señal / ruido no es perjudicialmente alta [¿baja?]
- proviene de una fuente que no tiene un defecto de señal continuo (o periódico) que inhibiría la traducción.
Sistemas y ratios de muestreo
El submuestreo en un sistema de video generalmente se expresa como una proporción de tres partes. Los tres términos de la relación son el número de muestras de brillo ("luminancia", "luma", " Y ") y el número de muestras de los componentes de dos colores ("croma") ( U / Cb y luego V / Cr ) para cada área de muestra completa.
Para la comparación de la calidad, solo es importante la relación entre esos valores, por lo que 4: 4: 4 podría llamarse fácilmente 1: 1: 1; pero tradicionalmente el valor de brillo es siempre 4, con el resto de los valores escalados en consecuencia.
Los principios de muestreo anteriores se aplican tanto a la televisión digital como a la analógica.
Vibración de Telecine
El proceso de conversión de "pulldown 3: 2" para películas de 24 fotogramas / s a televisión (telecine) crea un ligero error en la señal de vídeo en comparación con los fotogramas de la película original. Esta es una de las razones por las que el movimiento en películas de 24 fps visualizadas en un equipo doméstico NTSC típico puede no parecer tan fluido como cuando se ven en un cine. El fenómeno es particularmente evidente durante los movimientos lentos y constantes de la cámara, que parecen ligeramente entrecortados cuando se telecine. Este proceso se denomina comúnmente vibración de telecine .
El material PAL en el que se ha aplicado pulldown 2: 2: 2: 2: 2: 2: 2: 2: 2: 2: 2: 3, adolece de una falta similar de suavidad, aunque este efecto no se suele denominar trepidación de telecine. Cada duodécimo fotograma de película se muestra durante 3 campos PAL (60 milisegundos), mientras que cada uno de los otros 11 fotogramas se muestra durante 2 campos PAL (40 milisegundos). Esto provoca un ligero "contratiempo" en el video aproximadamente dos veces por segundo.
Los convertidores de sistemas de televisión deben evitar crear efectos de vibración de telecine durante el proceso de conversión. Evitar esta vibración es de importancia económica, porque gran parte del material con resolución NTSC (60 Hz, técnicamente 29,97 fotogramas / s) que se origina en una película tendrá este problema cuando se convierta a PAL o SECAM (ambos a 50 Hz, 25 fotogramas / s).
Técnicas de conversión de estándares históricos
Orticón a Orticón
Irlanda utilizó este método para convertir el servicio de 625 líneas en un servicio de 405 líneas. Es quizás la técnica de conversión estándar de televisión más básica. RTÉ utilizó este método durante los últimos años de su uso del sistema de línea 405.
Se utilizó un convertidor de estándares para proporcionar el servicio de la línea 405, pero según más de una fuente de ingeniería anterior de RTÉ, el convertidor explotó y luego el servicio de la línea 405 fue proporcionado por una cámara de la línea 405 apuntando a un monitor. Esta no es la mejor técnica de conversión, pero puede funcionar si se pasa de una resolución más alta a una más baja, a la misma velocidad de fotogramas. Se requieren fósforos lentos en ambos orticones .
Los primeros convertidores de estándares de video fueron analógicos . Es decir, una cámara de video profesional especial que usa un tubo de cámara de video apunta a un monitor de video de tubo de rayos catódicos . Tanto la cámara como el monitor se pueden cambiar a NTSC o PAL, para convertir en ambos sentidos. La división Fernseh de Robert Bosch GmbH fabricó un gran convertidor de estándares de video analógico de tres bastidores . Estos fueron los convertidores de gama alta de las décadas de 1960 y 1970. Image Transform en Universal City, California, utilizó el convertidor Fernseh y en la década de 1980 fabricó su propio convertidor digital personalizado. Este también era un dispositivo de tres bastidores más grande. A medida que el tamaño de la memoria digital se hizo más grande en paquetes más pequeños, los convertidores adquirieron el tamaño de un horno microondas . Hoy en día, se puede comprar un convertidor de consumo muy pequeño para uso doméstico.
SSTV a PAL y NTSC
Las misiones lunares Apolo (finales de la década de 1960, principios de la de 1970) utilizaron televisión de barrido lento (SSTV) en lugar de la televisión de ancho de banda normal; esto se hizo principalmente para ahorrar energía de la batería (y ancho de banda de transmisión, ya que el video SSTV de las misiones Apollo se multiplexó con todas las demás comunicaciones de voz y telemetría de la nave espacial). La cámara usó solo 7 vatios de potencia.
SSTV se utilizó para transmitir imágenes desde el interior del Apolo 7 , Apolo 8 y Apolo 9 , así como la televisión del Módulo Lunar del Apolo 11 desde la Luna ; consulte la cámara de televisión Apollo .
- El sistema utilizado en SSTV NASA misiones Apolo primeros 's transfiere diez fotogramas por segundo con una resolución de 320 líneas del marco utilizando menos ancho de banda que una transmisión de televisión normal.
- Los primeros sistemas SSTV utilizados por la NASA difieren significativamente de los sistemas SSTV actualmente en uso por los entusiastas de la radioafición en la actualidad.
- La conversión de estándares era necesaria para que las misiones pudieran ser vistas por una audiencia mundial en resoluciones PAL / SECAM (625 líneas, 50 Hz) y NTSC (525 líneas, 60 Hz).
Las misiones Apollo posteriores incluyeron cámaras secuenciales de campo de color que emitían video de 60 cuadros / s. Cada cuadro correspondía a uno de los colores primarios RGB. Este método es compatible con NTSC en blanco y negro, pero incompatible con NTSC en color. De hecho, incluso la compatibilidad con televisores monocromáticos NTSC es marginal. Un conjunto monocromático podría haber reproducido las imágenes, pero las imágenes habrían parpadeado terriblemente. El video en color de la cámara se ejecutó a solo 10 cuadros / s. Además, el cambio Doppler en la señal lunar habría provocado que las imágenes se rompieran y se voltearan. Por estas razones, las imágenes de la luna de Apolo requirieron técnicas de conversión especiales.
Los pasos de conversión fueron completamente electromecánicos y se llevaron a cabo casi en tiempo real. Primero, la estación de enlace descendente corrigió las imágenes para el desplazamiento Doppler. A continuación, en una grabadora de discos analógica, la estación de enlace descendente grabó y reprodujo cada campo de video seis veces. En la grabadora de seis pistas, la grabación y la reproducción se realizaron simultáneamente. Después de la grabadora, los procesadores de video analógicos agregaron los componentes faltantes de la señal de color NTSC: Estos componentes incluían:
- La ráfaga de color de 3,58 MHz
- La señal monocromática de alta resolución
- El sonido
- Las señales de color I y Q
El retraso de conversión duró solo unos 10 segundos. Luego, las imágenes de la luna en color salieron de la estación de enlace descendente para su distribución mundial.
Métodos de conversión de estándares de uso común
Submuestreo de Nyquist
Esta técnica de conversión puede volverse popular entre los fabricantes de HDTV -> NTSC y HDTV -> convertidores PAL para la conversión global en curso a HDTV.
- El submuestreo múltiple de Nyquist fue utilizado por el desaparecido sistema MUSE HDTV que se utilizó en Japón.
- Existen conjuntos de chips MUSE que pueden usarse para la conversión de sistemas, o pueden revisarse para las necesidades de HDTV -> Convertidores de TV analógica.
Cómo funciona
En una configuración típica de transmisión de imágenes, todas las imágenes estáticas se transmiten a resolución completa. Las imágenes en movimiento poseen una resolución visual más baja, basada en la complejidad del contenido de la imagen entre cuadros.
Cuando se utiliza el submuestreo de Nyquist como técnica de conversión de estándares, la resolución horizontal y vertical del material se reduce; este es un método excelente para convertir HDTV a televisión de definición estándar, pero funciona muy mal a la inversa.
- A medida que el contenido horizontal y vertical cambia de un cuadro a otro, las imágenes en movimiento se verán borrosas (de una manera similar al uso de una película de 16 mm para la proyección de HDTV).
- De hecho, las panorámicas de toda la cámara resultarían en una pérdida del 50% de la resolución horizontal.
El método de submuestreo de Nyquist de conversión de sistemas solo funciona para HDTV a televisión de definición estándar , por lo que como tecnología de conversión de estándares tiene un uso muy limitado. Por lo general, se prefiere la correlación de fase para HDTV a conversión de definición estándar.
Conversión de velocidad de fotogramas
Existe una gran diferencia en la velocidad de fotogramas entre la película (24,0 fotogramas por segundo) y NTSC (aproximadamente 29,97 fotogramas por segundo). A diferencia de los otros dos formatos de video más comunes , PAL y SECAM , esta diferencia no se puede superar con una simple aceleración , porque la aceleración requerida del 25% sería claramente perceptible.
Para convertir una película de 24 fotogramas / s en 29,97 fotogramas / s (presentados como 59,94 campos entrelazados por segundo) NTSC, se utiliza un proceso llamado " 3: 2 pulldown ", en el que cada dos fotogramas de la película se duplican en un campo entrelazado adicional para lograr una velocidad de fotogramas de 23,976 (el audio se ralentiza imperceptiblemente desde la fuente de 24 fotogramas / s para que coincida). Esto produce irregularidades en la secuencia de imágenes que algunas personas pueden percibir como un tartamudeo durante las panorámicas lentas y constantes de la cámara en el material de origen. Consulte telecine para obtener más detalles.
Para ver material PAL o SECAM nativo (como series de televisión europeas y algunas películas europeas) en equipos NTSC, debe realizarse una conversión de estándares. Básicamente, hay dos formas de lograr esto:
- La velocidad de fotogramas se puede reducir de 25 a 23,976 fotogramas por segundo (una ralentización de aproximadamente un 4%) para aplicar posteriormente un pulldown de 3: 2 .
- Interpolación del contenido de cuadros adyacentes para producir nuevos cuadros intermedios; esto introduce artefactos , e incluso los ojos más modestamente entrenados pueden detectar rápidamente videos que se han convertido entre formatos.
Interpolación linear
Al convertir PAL (625 líneas a 25 cuadros / s) a NTSC (525 líneas a 30 cuadros / s), el convertidor debe eliminar 100 líneas por cuadro. El convertidor también debe crear cinco fotogramas por segundo.
Para reducir la señal de 625 líneas a 525, los convertidores menos costosos eliminan 100 líneas. Estos convertidores mantienen la fidelidad de la imagen espaciando uniformemente las líneas eliminadas. (Por ejemplo, el sistema podría descartar cada sexta línea de cada campo PAL. Después del 50º descarte, este proceso se detendría. Para entonces, el sistema habría pasado el área visible del campo. En el siguiente campo, el proceso se repetiría, completando un fotograma.) Para crear los cinco fotogramas adicionales, el convertidor repite cada quinto fotograma.
Si hay poco movimiento entre cuadros, este algoritmo de conversión es rápido, económico y efectivo. Muchos convertidores de sistemas de televisión de consumo económicos han empleado esta técnica. Sin embargo, en la práctica, la mayoría de los videos presentan un movimiento significativo entre cuadros. Para reducir los artefactos de conversión, los equipos más modernos o costosos pueden utilizar técnicas sofisticadas.
Doblador
La forma más básica y literal de duplicar líneas es repetir cada línea de exploración, aunque los resultados de esto son generalmente muy crudos. La interpolación lineal utiliza la interpolación digital para recrear las líneas faltantes en una señal entrelazada, y la calidad resultante depende de la técnica utilizada. En general, la versión bob del desentrelazador lineal solo se interpolará dentro de un solo campo, en lugar de fusionar información de campos adyacentes, para preservar la suavidad del movimiento, lo que da como resultado una velocidad de fotogramas igual a la velocidad de campo (es decir, una señal 60i se convertiría a 60p .) La primera técnica en áreas en movimiento y la segunda en áreas estáticas, lo que mejora la nitidez general.
Interpolación entre campos
La interpolación entre campos es una técnica en la que se crean nuevos fotogramas combinando fotogramas adyacentes, en lugar de repetir un solo fotograma. Esto es más complejo y computacionalmente costoso que la interpolación lineal, porque requiere que el interpolador tenga conocimiento de las tramas anterior y siguiente para producir una trama combinada intermedia. También puede ser necesario desentrelazar para producir imágenes que se puedan interpolar sin problemas. La interpolación también se puede utilizar para reducir el número de líneas de exploración en la imagen promediando el color y la intensidad de los píxeles en las líneas vecinas, una técnica similar al filtrado bilineal , pero aplicada a un solo eje.
Hay convertidores simples de 2 y 4 líneas. El convertidor de 2 líneas crea una nueva línea comparando dos líneas adyacentes, mientras que un modelo de 4 líneas compara 4 líneas para promediar la quinta. La interpolación entre campos reduce la vibración, pero a expensas de las manchas de la imagen. Cuanto mayor sea la mezcla aplicada para suavizar la vibración, mayor será la mancha causada por la mezcla.
Interpolación de movimiento adaptativo
Algunas técnicas más avanzadas miden la naturaleza y el grado de movimiento entre cuadros en la fuente y utilizan algoritmos adaptativos para combinar la imagen en función de los resultados. Algunas de estas técnicas se conocen como algoritmos de compensación de movimiento y computacionalmente son mucho más costosas que las técnicas más simples, por lo que requieren un hardware más potente para ser efectivo en la conversión en tiempo real.
Los algoritmos de Adaptive Motion aprovechan la forma en que el ojo humano y el cerebro procesan las imágenes en movimiento; en particular, los detalles se perciben con menos claridad en los objetos en movimiento.
La interpolación adaptativa requiere que el convertidor analice múltiples campos sucesivos y detecte la cantidad y el tipo de movimiento de diferentes áreas de la imagen.
- Cuando se detecta poco movimiento, el convertidor puede utilizar la interpolación lineal.
- Cuando se detecta un mayor movimiento, el convertidor puede cambiar a una técnica entre campos que sacrifica los detalles para un movimiento más suave.
La interpolación de movimiento adaptativo tiene muchas variaciones y se encuentra comúnmente en convertidores de rango medio . La calidad y el costo dependen de la precisión en el análisis del tipo y la cantidad de movimiento y de la selección del algoritmo más apropiado para procesar el tipo de movimiento.
Interpolación de movimiento adaptativo + coincidencia de bloques
La coincidencia de bloques implica dividir la imagen en bloques de mosaico, digamos, tal vez por el bien de la explicación, 8x8 píxeles. Luego, los bloques se almacenan en la memoria. El siguiente campo leído también se divide en el mismo número y tamaño de bloques de mosaico. La computadora del convertidor luego se pone en funcionamiento y comienza a hacer coincidir los bloques. Los bloques que permanecieron en la misma posición relativa (léase: no hubo movimiento en esta parte de la imagen) reciben relativamente poco procesamiento.
- Para cada bloque que cambió, el convertidor busca en todas las direcciones a través de su memoria, buscando una coincidencia para averiguar dónde fue el "bloque" (si hay movimiento, el bloque obviamente tuvo que haber ido a alguna parte ...).
- La búsqueda comienza en los bloques circundantes inmediatos (asumiendo poco movimiento).
- Si no se encuentra una coincidencia, busca más y más hasta que encuentra una coincidencia.
- Cuando se encuentra el bloque coincidente, el convertidor sabe qué tan lejos se movió el bloque y en qué dirección.
- Luego, estos datos se almacenan como un vector de movimiento para este bloque.
- Dado que el movimiento entre cuadros es a menudo predecible debido a las leyes de movimiento de Newton en el mundo real, el vector de movimiento se puede usar para calcular dónde probablemente estará el bloque en el siguiente campo.
- El método newtoniano ahorra mucho tiempo de búsqueda y procesamiento.
Cuando se realiza una panorámica de izquierda a derecha (por ejemplo, en 10 campos), es seguro asumir que el undécimo campo será similar o muy cercano.
- La coincidencia de bloques puede verse como "cortar y pegar" bloques de imágenes.
La técnica es muy eficaz pero requiere una enorme cantidad de potencia informática. Considere un bloque de solo 8x8 píxeles. Para cada bloque, la computadora tiene 64 direcciones posibles y 64 píxeles para hacer coincidir con el bloque en el siguiente campo. También considere que cuanto mayor sea el movimiento, más lejos debe realizarse la búsqueda. Solo encontrar un bloque adyacente en el siguiente campo implicaría realizar una búsqueda de 9 bloques. 2 bloques de salida requerirían una búsqueda y coincidencia de 25 bloques - 3 bloques más distantes y crece a 49, etc.
El tipo de movimiento puede aumentar exponencialmente la potencia de cálculo requerida. Considere un objeto giratorio, donde un vector de movimiento en línea recta simple es de poca ayuda para predecir dónde debe coincidir el siguiente bloque. Se puede ver rápidamente que cuanto más movimiento entre cuadros se introduce, mayor es la potencia de procesamiento requerida. Este es el concepto general de coincidencia de bloques. Los convertidores de coincidencia de bloques pueden variar ampliamente en precio y rendimiento según la atención al detalle y la complejidad.
Un extraño artefacto de coincidencia de bloques se debe al tamaño del bloque en sí. Si un objeto en movimiento es más pequeño que el bloque de mosaico, considere que es todo el bloque el que se mueve. En la mayoría de los casos, no es un problema, pero considere una pelota de béisbol lanzada. La bola en sí tiene un vector de movimiento alto, pero su fondo que forma el resto del bloque podría no tener ningún movimiento. El fondo también se transporta en el bloque movido, basado en el vector de movimiento de la pelota de béisbol. Lo que puede ver es la pelota con una pequeña cantidad de campo o lo que sea, acompañándola. Mientras está en movimiento, el bloqueo puede ser "suave" dependiendo de las técnicas adicionales que se hayan utilizado y apenas perceptible a menos que lo esté buscando.
La coincidencia de bloques requiere una asombrosa cantidad de potencia de procesamiento, pero los microprocesadores actuales la están convirtiendo en una solución viable.
Correlación de fase
La correlación de fase es quizás el más complejo computacionalmente de los algoritmos generales.
El éxito de la correlación de fases radica en el hecho de que es eficaz para hacer frente al movimiento rápido y al movimiento aleatorio. La correlación de fase no se confunde fácilmente al girar o girar objetos que confunden a la mayoría de los otros tipos de convertidores de sistemas. La correlación de fases es elegante, además de compleja técnica y conceptualmente. Su operación exitosa se deriva de la realización de una transformada de Fourier en cada campo de video.
Una transformada rápida de Fourier (FFT) es un algoritmo que se ocupa de la transformación de valores discretos (en este caso, píxeles de imagen). Cuando se aplica a una muestra de valores finitos, una transformada rápida de Fourier expresa cualquier cambio (movimiento) en términos de componentes de frecuencia.
Dado que el resultado de la FFT representa solo los cambios entre cuadros en términos de distribución de frecuencia, hay muchos menos datos que deben procesarse para calcular los vectores de movimiento.
Convertidores de DTV a analógico para consumidores
Un adaptador de televisión digital , ( CECB ), o de digital a analógico (caja), es un dispositivo que recibe, por medio de una antena , una televisión digital (DTV) de transmisión , y convierte esa señal en una televisión analógica señal que se puede recibir y visualizar en un televisor analógico.
Estas cajas convierten de forma económica HDTV (16: 9 a 720 o 1080) a (NTSC o PAL a 4: 3). Se sabe muy poco sobre las tecnologías de conversión específicas utilizadas por estas cajas convertidoras en las zonas PAL y NTSC.
Por lo general, se requiere una conversión descendente, por lo que los espectadores perciben muy poca pérdida de calidad de imagen a la distancia de visualización recomendada con la mayoría de los televisores.
Conversión sin conexión
Gran parte de la conversión de televisión de formato cruzado se realiza sin conexión. Hay varios paquetes de DVD que ofrecen conversión PAL ↔ NTSC sin conexión , incluida la conversión cruzada (técnicamente MPEG ↔ DTV ) de la miríada de formatos de video web basados en MPEG .
La conversión cruzada puede utilizar cualquier método comúnmente utilizado para la conversión de formatos de sistemas de TV, pero normalmente (para reducir la complejidad y el uso de la memoria) se deja en manos del códec la conversión. La mayoría de los DVD modernos se convierten de 525 <--> 625 líneas de esta manera, ya que resulta muy económico para la mayoría de la programación que se origina en resolución EDTV .
Ver también
- Conversión de estándares inversos
- Documentos IEEE sobre conversión de sistemas
- Documentos de AES / EBU sobre conversiones de sistemas
- Sintonizador ATSC
- Televisión digital
- Adaptador de televisión digital
- Transición a la DTV en los Estados Unidos
- Fijar la caja de encima
enlaces externos
- http://www.hawestv.com/moon_cam/moonctel.htm