En el procesamiento de señales , el muestreo es la reducción de una señal de tiempo continuo a una señal de tiempo discreto . Un ejemplo común es la conversión de una onda de sonido (una señal continua) en una secuencia de muestras (una señal de tiempo discreto).
Una muestra es un valor o conjunto de valores en un momento y / o espacio. Un muestreador es un subsistema u operación que extrae muestras de una señal continua . Un muestreador ideal teórico produce muestras equivalentes al valor instantáneo de la señal continua en los puntos deseados.
La señal original se puede recuperar de una secuencia de muestras, hasta el límite de Nyquist , pasando la secuencia de muestras a través de un tipo de filtro de paso bajo llamado filtro de reconstrucción .
El muestreo se puede realizar para funciones que varían en el espacio, el tiempo o cualquier otra dimensión, y se obtienen resultados similares en dos o más dimensiones.
Para las funciones que varían con el tiempo, sea s ( t ) una función continua (o "señal") a muestrear, y deje que el muestreo se realice midiendo el valor de la función continua cada T segundos, lo que se denomina intervalo de muestreo o el período de muestreo . [1] Entonces la función muestreada viene dada por la secuencia :
La frecuencia de muestreo o la frecuencia de muestreo, f s , es el número promedio de las muestras obtenidas en un segundo ( muestras por segundo ), por lo tanto f s = 1 / T .
La reconstrucción de una función continua a partir de muestras se realiza mediante algoritmos de interpolación. La fórmula de interpolación de Whittaker-Shannon es matemáticamente equivalente a un filtro de paso bajo ideal cuya entrada es una secuencia de funciones delta de Dirac que se modulan (multiplican) por los valores de la muestra. Cuando el intervalo de tiempo entre muestras adyacentes es una constante ( T ), la secuencia de funciones delta se denomina peine de Dirac . Matemáticamente, el peine de Dirac modulado es equivalente al producto de la función peine con s ( t ). Esa abstracción puramente matemática a veces se denomina muestreo por impulsos . [2]
La mayoría de las señales muestreadas no se almacenan y reconstruyen simplemente. Pero la fidelidad de una reconstrucción teórica es una medida habitual de la eficacia del muestreo. Esa fidelidad se reduce cuando s ( t ) contiene componentes de frecuencia cuya periodicidad es menor que dos muestras; o de manera equivalente, la relación de ciclos a muestras excede ½ (ver Aliasing ). La cantidad ½ ciclos / muestra × f s muestras / seg = f s / 2 ciclos / seg ( hercios ) se conoce como la frecuencia de Nyquist del muestreador. Por lo tanto, s ( t) suele ser la salida de un filtro de paso bajo , conocido funcionalmente como filtro anti-aliasing . Sin un filtro anti-aliasing, las frecuencias más altas que la frecuencia de Nyquist influirán en las muestras de una manera que el proceso de interpolación malinterpreta. [3]
En la práctica, la señal continua se muestrea utilizando un convertidor de analógico a digital (ADC), un dispositivo con varias limitaciones físicas. Esto da como resultado desviaciones de la reconstrucción teóricamente perfecta, denominada colectivamente distorsión .
Pueden producirse varios tipos de distorsión, que incluyen:
Aunque el uso de sobremuestreo puede eliminar por completo el error de apertura y el alias al desplazarlos fuera de la banda de paso, esta técnica no se puede utilizar prácticamente por encima de unos pocos GHz y puede resultar prohibitivamente cara a frecuencias mucho más bajas. Además, aunque el sobremuestreo puede reducir el error de cuantificación y la no linealidad, no puede eliminarlos por completo. En consecuencia, los ADC prácticos en frecuencias de audio normalmente no presentan aliasing, error de apertura y no están limitados por errores de cuantificación. En cambio, domina el ruido analógico. En frecuencias de RF y microondas donde el sobremuestreo no es práctico y los filtros son costosos, el error de apertura, el error de cuantificación y el aliasing pueden ser limitaciones significativas.
La fluctuación, el ruido y la cuantificación a menudo se analizan modelándolos como errores aleatorios agregados a los valores de la muestra. Los efectos de retención de integración y de orden cero se pueden analizar como una forma de filtrado de paso bajo . Las no linealidades de ADC o DAC se analizan reemplazando el mapeo de función lineal ideal con una función no lineal propuesta .
El audio digital utiliza modulación de código de pulso (PCM) y señales digitales para la reproducción de sonido. Esto incluye conversión de analógico a digital (ADC), conversión de digital a analógico (DAC), almacenamiento y transmisión. En efecto, el sistema comúnmente denominado digital es de hecho un análogo de nivel discreto en tiempo discreto de un análogo eléctrico anterior. Si bien los sistemas modernos pueden ser bastante sutiles en sus métodos, la utilidad principal de un sistema digital es la capacidad de almacenar, recuperar y transmitir señales sin pérdida de calidad.
Una unidad de frecuencia de muestreo que se ve comúnmente es Hz, que significa Hertz y significa "muestras por segundo". Por ejemplo, 48 kHz son 48.000 muestras por segundo.
Cuando es necesario capturar audio que cubra todo el rango de audición humana de 20 a 20 000 Hz , [5] como cuando se graba música o muchos tipos de eventos acústicos, las formas de onda de audio se muestrean típicamente a 44,1 kHz ( CD ), 48 kHz, 88,2 kHz o 96 kHz. [6] El requisito de aproximadamente el doble de tasa es una consecuencia del teorema de Nyquist . Las velocidades de muestreo superiores a 50 kHz a 60 kHz no pueden proporcionar más información útil para los oyentes humanos. Los primeros fabricantes de equipos de audio profesionales eligieron frecuencias de muestreo en la región de 40 a 50 kHz por este motivo.
Ha habido una tendencia en la industria hacia frecuencias de muestreo mucho más allá de los requisitos básicos: como 96 kHz e incluso 192 kHz [7] Aunque las frecuencias ultrasónicas son inaudibles para los humanos, grabar y mezclar a frecuencias de muestreo más altas es efectivo para eliminar la distorsión que puede ser causado por aliasing de repliegue . Por el contrario, los sonidos ultrasónicos pueden interactuar y modular la parte audible del espectro de frecuencias ( distorsión de intermodulación ), degradando la fidelidad. [8] Una ventaja de las tasas de muestreo más altas es que pueden relajar los requisitos de diseño del filtro de paso bajo para ADC y DAC , pero con un sobremuestreo moderno.Convertidores sigma-delta esta ventaja es menos importante.
La Audio Engineering Society recomienda una frecuencia de muestreo de 48 kHz para la mayoría de las aplicaciones, pero reconoce 44,1 kHz para discos compactos (CD) y otros usos del consumidor, 32 kHz para aplicaciones relacionadas con la transmisión y 96 kHz para un mayor ancho de banda o filtrado de suavizado relajado . [9] Tanto Lavry Engineering como J. Robert Stuart afirman que la frecuencia de muestreo ideal sería de unos 60 kHz, pero como no es una frecuencia estándar, recomendamos 88,2 o 96 kHz para fines de grabación. [10] [11] [12] [13]
Una lista más completa de frecuencias de muestreo de audio comunes es:
Tasa de muestreo | Utilizar |
---|---|
8.000 Hz | Teléfono y walkie-talkie encriptado , intercomunicador inalámbrico y transmisión de micrófono inalámbrico ; adecuado para el habla humana pero sin sibilancias ( ess suena como eff ( / s / , / f / )). |
11,025 Hz | Una cuarta parte de la frecuencia de muestreo de los CD de audio; se utiliza para audio PCM, MPEG de menor calidad y para análisis de audio de pasabandas de subwoofer. [ cita requerida ] |
16.000 Hz | Extensión de frecuencia de banda ancha sobre un teléfono estándar de banda estrecha de 8.000 Hz. Se utiliza en la mayoría de los productos de comunicación VoIP y VVoIP modernos . [14] |
22.050 Hz | La mitad de la frecuencia de muestreo de los CD de audio; se utiliza para audio PCM y MPEG de menor calidad y para análisis de audio de energía de baja frecuencia. Adecuado para digitalizar formatos de audio de principios del siglo XX, como 78 y radio AM . [15] |
32.000 Hz | videocámara digital miniDV , cintas de video con canales adicionales de audio (por ejemplo, DVCAM con cuatro canales de audio), DAT (modo LP), Digitales Satellitenradio de Alemania , audio digital NICAM , utilizado junto con el sonido de televisión analógica en algunos países. Micrófonos inalámbricos digitales de alta calidad . [16] Adecuado para digitalizar radio FM . [ cita requerida ] |
37.800 Hz | Audio CD-XA |
44,056 Hz | Utilizado por audio digital bloqueado en señales de vídeo en color NTSC (3 muestras por línea, 245 líneas por campo, 59,94 campos por segundo = 29,97 fotogramas por segundo ). |
44 100 Hz | CD de audio , también más comúnmente utilizado con audio MPEG-1 ( VCD , SVCD , MP3 ). Originalmente elegido por Sony porque podría grabarse en un equipo de video modificado que funcione a 25 cuadros por segundo (PAL) o 30 cuadros / s (utilizando una grabadora de video monocromática NTSC ) y cubrir el ancho de banda de 20 kHz que se considera necesario para coincidir con el equipo de grabación analógica profesional. del tiempo. Un adaptador PCM encajaría muestras de audio digital en el canal de video analógico de, por ejemplo, cintas de video PAL usando 3 muestras por línea, 588 líneas por cuadro, 25 cuadros por segundo. |
47,250 Hz | Primera grabadora de sonido PCM comercial del mundo de Nippon Columbia (Denon) |
48.000 Hz | La frecuencia de muestreo de audio estándar utilizada por equipos de video digital profesional, como grabadoras de cinta, servidores de video, mezcladores de visión, etc. Se eligió esta velocidad porque podía reconstruir frecuencias de hasta 22 kHz y trabajar con 29,97 fotogramas por segundo de vídeo NTSC, así como con sistemas de 25 fotogramas / s, 30 fotogramas / sy 24 fotogramas / s. Con sistemas de 29,97 fotogramas / s, es necesario manejar 1601,6 muestras de audio por fotograma entregando un número entero de muestras de audio solo cada quinto fotograma de video. [9] También se utiliza para sonido con formatos de video de consumo como DV, TV digital , DVD y películas. La interfaz digital en serie profesional (SDI) y la interfaz digital en serie de alta definición (HD-SDI)utilizado para conectar equipos de transmisión de televisión juntos utiliza esta frecuencia de muestreo de audio. La mayoría de los equipos de audio profesionales utilizan un muestreo de 48 kHz, incluidas las mesas de mezclas y los dispositivos de grabación digital . |
50.000 Hz | Primeras grabadoras de audio digitales comerciales de finales de los 70 de 3M y Soundstream . |
50 400 Hz | Frecuencia de muestreo utilizada por la grabadora de audio digital Mitsubishi X-80 . |
64.000 Hz | Se utiliza con poca frecuencia, pero es compatible con algún hardware [17] [18] y software. [19] [20] |
88.200 Hz | Frecuencia de muestreo utilizada por algunos equipos de grabación profesionales cuando el destino es un CD (múltiplos de 44,100 Hz). Algunos equipos de audio profesional utilizan (o pueden seleccionar) muestreo de 88,2 kHz, incluidos mezcladores, ecualizadores, compresores, reverberación, cruces y dispositivos de grabación. |
96 000 Hz | DVD-Audio , algunas pistas de DVD LPCM , pistas de audio BD-ROM (Blu-ray Disc), pistas de audio HD DVD ( DVD de alta definición). Algunos equipos profesionales de grabación y producción pueden seleccionar un muestreo de 96 kHz. Esta frecuencia de muestreo es el doble del estándar de 48 kHz que se usa comúnmente con audio en equipos profesionales. |
176 400 Hz | Frecuencia de muestreo utilizada por grabadoras HDCD y otras aplicaciones profesionales para la producción de CD. Cuatro veces la frecuencia de 44,1 kHz. |
192.000 Hz | DVD-Audio , algunas pistas de DVD LPCM , pistas de audio BD-ROM (Blu-ray Disc) y pistas de audio HD DVD ( DVD de alta definición), dispositivos de grabación de audio de alta definición y software de edición de audio. Esta frecuencia de muestreo es cuatro veces el estándar de 48 kHz que se usa comúnmente con audio en equipos de video profesionales. |
352800 Hz | Digital eXtreme Definition , que se utiliza para grabar y editar CD de Super Audio , ya que Direct Stream Digital (DSD) de 1 bit no es adecuado para la edición. Ocho veces la frecuencia de 44,1 kHz. |
2.822.400 Hz | SACD , proceso de modulación delta-sigma de 1 bit conocido como Direct Stream Digital , desarrollado conjuntamente por Sony y Philips . |
5.644.800 Hz | DSD de doble velocidad, transmisión digital directa de 1 bit a 2 veces la velocidad del SACD. Se utiliza en algunas grabadoras DSD profesionales. |
11.289.600 Hz | DSD de cuatro velocidades, transmisión digital directa de 1 bit a 4 veces la velocidad del SACD. Se utiliza en algunas grabadoras DSD profesionales poco comunes. |
22.579.200 Hz | DSD de tasa de octuple, Direct Stream Digital de 1 bit a 8 veces la tasa de SACD. Utilizado en raras grabadoras DSD experimentales. También conocido como DSD512. |
El audio se graba típicamente a una profundidad de 8, 16 y 24 bits, lo que produce una relación máxima teórica de señal a ruido de cuantificación (SQNR) para una onda sinusoidal pura de, aproximadamente, 49,93 dB , 98,09 dB y 122,17 dB. . [21] El audio con calidad de CD utiliza muestras de 16 bits. El ruido térmico limita el número real de bits que se pueden utilizar en la cuantificación. Pocos sistemas analógicos tienen relaciones señal / ruido (SNR) superiores a 120 dB. Sin embargo, las operaciones de procesamiento de señales digitales pueden tener un rango dinámico muy alto, por lo que es común realizar operaciones de mezcla y masterización con una precisión de 32 bits y luego convertirlas a 16 o 24 bits para su distribución.
Las señales de voz, es decir, las señales destinadas a transportar sólo el habla humana , normalmente se pueden muestrear a una velocidad mucho más baja. Para la mayoría de los fonemas , casi toda la energía está contenida en el rango de 100 Hz a 4 kHz, lo que permite una frecuencia de muestreo de 8 kHz. Esta es la frecuencia de muestreo utilizada por casi todos los sistemas de telefonía , que utilizan las especificaciones de cuantificación y muestreo G.711 . [ cita requerida ]
Esta sección necesita citas adicionales para su verificación . ( Junio de 2007 ) |
La televisión de definición estándar (SDTV) utiliza 720 por 480 píxeles (US NTSC 525 líneas) o 720 por 576 píxeles (UK PAL 625 líneas) para el área de imagen visible.
La televisión de alta definición (HDTV) utiliza 720p (progresivo), 1080i (entrelazado) y 1080p (progresivo, también conocido como Full-HD).
En el video digital , la frecuencia de muestreo temporal se define como la frecuencia de fotogramas , o más bien la frecuencia de campo , en lugar del reloj de píxeles teórico . La frecuencia de muestreo de la imagen es la tasa de repetición del período de integración del sensor. Dado que el período de integración puede ser significativamente más corto que el tiempo entre repeticiones, la frecuencia de muestreo puede ser diferente de la inversa del tiempo de muestreo:
Los convertidores de video digital a analógico operan en el rango de megahercios (desde ~ 3 MHz para escaladores de video compuesto de baja calidad en las primeras consolas de juegos, hasta 250 MHz o más para la salida VGA de mayor resolución).
Cuando el vídeo analógico se convierte en vídeo digital , se produce un proceso de muestreo diferente, esta vez a la frecuencia de píxeles, correspondiente a una frecuencia de muestreo espacial a lo largo de las líneas de exploración . Una frecuencia de muestreo de píxeles común es:
El muestreo espacial en la otra dirección está determinado por el espaciado de las líneas de exploración en el ráster . Las velocidades y resoluciones de muestreo en ambas direcciones espaciales se pueden medir en unidades de líneas por altura de imagen.
El alias espacial de los componentes de vídeo cromático o de luminancia de alta frecuencia se muestra como un patrón muaré .
El proceso de renderizado de volumen muestra una cuadrícula 3D de vóxeles para producir renderizados 3D de datos cortados (tomográficos). Se supone que la cuadrícula 3D representa una región continua del espacio 3D. La reproducción de volumen es común en las imágenes médicas, la tomografía computarizada de rayos X (CT / CAT), la resonancia magnética (MRI), la tomografía por emisión de positrones (PET) son algunos ejemplos. También se utiliza para tomografía sísmica y otras aplicaciones.
Cuando una señal de paso de banda se muestrea más lentamente que su tasa de Nyquist , las muestras son indistinguibles de las muestras de un alias de baja frecuencia de la señal de alta frecuencia. A menudo, esto se hace a propósito de tal manera que el alias de la frecuencia más baja satisface el criterio de Nyquist , porque la señal de paso de banda sigue estando representada y recuperable de forma única. Este submuestreo también se conoce como muestreo de paso de banda , muestreo armónico , muestreo de IF y conversión de IF directa a digital. [22]
El sobremuestreo se utiliza en la mayoría de los convertidores analógicos a digitales modernos para reducir la distorsión introducida por los convertidores digitales a analógicos prácticos , como una retención de orden cero en lugar de idealizaciones como la fórmula de interpolación de Whittaker-Shannon . [23]
El muestreo complejo ( muestreo I / Q ) es el muestreo simultáneo de dos formas de onda diferentes pero relacionadas, lo que da como resultado pares de muestras que posteriormente se tratan como números complejos . [A] Cuando una forma de onda es la transformada de Hilbert de la otra forma de onda, la función de valor complejo se denomina señal analítica , cuya transformada de Fourier es cero para todos los valores negativos de frecuencia. En ese caso, la tasa de Nyquist para una forma de onda sin frecuencias ≥ B se puede reducir a solo B (muestras complejas / seg), en lugar de 2 B (muestras reales / seg).[B] Más aparentemente, la forma de onda de banda base equivalente , también tiene una tasa de Nyquist de B , porque la totalidad de su contenido de frecuencia no cero se ha desplazado en el intervalo [-B / 2, B / 2).
Aunque se pueden obtener muestras de valor complejo como se describió anteriormente, también se crean manipulando muestras de una forma de onda de valor real. Por ejemplo, la forma de onda de banda base equivalente se puede crear sin calcular explícitamente procesando la secuencia del producto [C] a través de un filtro de paso bajo digital cuya frecuencia de corte es B / 2. [D] El cálculo de cada dos muestras de la secuencia de salida reduce la frecuencia de muestreo en proporción con la frecuencia de Nyquist reducida. El resultado es la mitad de muestras de valor complejo que el número original de muestras reales. No se pierde información y la forma de onda s (t) original se puede recuperar, si es necesario.
en muchos casos, podemos escuchar el sonido de frecuencias de muestreo más altas no porque sean más transparentes, sino porque lo son menos.
De hecho, pueden introducir una distorsión involuntaria en el espectro audible.
Aunque 60 KHz estaría más cerca del ideal;
dados los estándares existentes, 88,2 KHz y 96 KHz son los más cercanos a la frecuencia de muestreo óptima.
Estoy tratando de acomodarme a todos los oídos, y hay informes de pocas personas que realmente pueden escuchar un poco por encima de los 20 KHz.
Creo que 48 KHz es un compromiso bastante bueno, pero 88,2 o 96 KHz dan un margen adicional.
Hoy en día, hay una serie de buenos diseñadores y especialistas en oído que encuentran que la frecuencia de muestreo de 60-70 KHz es la frecuencia óptima para el oído.
Es lo suficientemente rápido para incluir lo que podemos escuchar, pero lo suficientemente lento como para hacerlo con bastante precisión.
tanto el análisis psicoacústico como la experiencia nos dicen que el canal rectangular mínimo necesario para garantizar la transparencia utiliza PCM lineal con muestras de 18,2 bits a 58 kHz.
... existen fuertes argumentos para mantener relaciones enteras con las frecuencias de muestreo existentes, lo que sugiere que se deberían adoptar 88,2 kHz o 96 kHz.
Para la mayoría de los registros, una frecuencia de muestreo de 22050 en estéreo es adecuada.
Es probable que una excepción sean las grabaciones realizadas en la segunda mitad del siglo, que pueden necesitar una frecuencia de muestreo de 44100.
Frecuencias de muestra admitidas: internamente 32, 44,1, 48, 64, 88,2, 96, 176,4, 192 kHz.
Tasas de muestreo admitidas: 44,1 kHz, 48 kHz, 64 kHz, 88,2 kHz, 96 kHz, 176,4 kHz, 192 kHz
Frecuencias de muestreo comunes: 64 000 Hz
[Captura de pantalla de Cubase]