La tasa de cruce por cero (ZCR) es la tasa a la que una señal cambia de positivo a cero a negativo o de negativo a cero a positivo. [1] Su valor ha sido ampliamente utilizado tanto en el reconocimiento de voz como en la recuperación de información musical , siendo una característica clave para clasificar los sonidos de percusión. [2]
ZCR se define formalmente como
dónde es una señal de longitud y es una función indicadora .
En algunos casos, sólo se cuentan los cruces "positivos" o "negativos", en lugar de todos los cruces, ya que entre un par de cruces por cero positivos adyacentes debe haber un solo cruce por cero negativo.
Para señales tonales monofónicas , la tasa de cruce por cero se puede utilizar como un algoritmo de detección de tono primitivo . Las tasas de cruce por cero también se utilizan para la detección de actividad de voz (VAD), que determina si el habla humana está presente en un segmento de audio o no.
Ver también
Referencias
- ^ * Chen, CH, Manual de procesamiento de señales, Dekker, Nueva York, 1988
- ^ Gouyon F., Pachet F., Delerue O. (2000), Sobre el uso de la tasa de cruce por cero para una aplicación de clasificación de sonidos de percusión , en Actas de la Conferencia COST G-6 sobre efectos de audio digitales (DAFX-00 - DAFX-06), Verona, Italia, 7 al 9 de diciembre de 2000 . Consultado el 26 de abril de 2011.