12 de noviembre de 2008

AUDIO DIGITAL


Actualmente, el avance de la tecnología computacional ha permitido la digitalizacion de la información, entre la que tambien encontramos al sonido. Esta evolucion en el sonido ha implicado la mejora notoria en la calidad de sonido en equipos de alta fidelidad (Hi-Fi), sin embargo el cambio delo analogico a lo digital ha provocado una serie de problemas diversos, los cuales han sido corregidos en su gran mayoria. He aquí una introducción y algunos conceptos indispensables para los interesados en procesamiento de señales y aficionados al audio digital.

En el procesamiento de señales es común encontrar este término, y muchas veces incluso confundido por la mayoría de las personas. En esta sección trataremos de despejar algunas dudas respecto a este término para profundizar mas adelante en el desarrollo de temas más complejos.

La frecuencia de muestreo viene a ser el número de muestras por unidad de tiempo que se toman de una señal continua (analógica) para poder producir una señal discreta (digital), durante el proceso necesario para transformarla de analógica a digital.

La frecuencia de muestreo, como todas las frecuencias, se expresa en Hz (hercios o ciclos por segundo).

Obviamente, la transformación de una onda analógica a digital ocasiona la perdida de información, pero matemáticamente es demostrable la reconstrucción completa de una onda bajo el Teorema de muestreo de Nyquist-Shannon.

TEOREMA DE NYQUIST - SHANNON

Según este teorema, para poder reconstruir con exactitud la forma de una onda, es necesario que la frecuencia de muestreo sea siempre el doble de la frecuencia a muestrear. Atendiendo al margen audible de los humanos, que va desde los 20 Hz hasta los 20 kHz, es necesario que la frecuencia de muestreo sea como mínimo de 40 000 muestras por segundo. Por otro lado, cada bit de una muestra de audio añade 6 dB de margen dinámico (margen que hay entre el nivel de referencia y el ruido de fondo de un determinado sistema, medido en decibelios), por lo que con 8 bits obtendríamos 48 dB, con 16 bits 96 dB y con 24 bits 144 dB. Ahora, como el margen dinámico útil es aproximadamente 110 dB ( sin llegar al umbral del dolor ) y el de los sistemas analógicos de cinta magnética de unos 72 dB, pareció en principio que codificar a 16 bits era una buena alternativa.

La alta tasa de muestreo de otro formato de audio de reciente aparición, el SACD o Super Audio CD, es una consecuencia del uso de una tecnología denominada modulación Sigma-Delta (Direct Stream Digital). Si bien la tasa de muestreo es 64 veces la del CD-Audio, es necesario tener presente que se trata de una cuantificación de 1 bit (en lugar de los 16 empleados en el CD-Audio) y basado en técnicas de Noise Shaping (modelado de ruido). No es posible, por tanto, establecer comparaciones superficiales con el PCM de CD-Audio, ya que en este caso la relación señal-ruido no es constante respecto de la frecuencia (en CD-Audio el ruido de cuantificación es independiente de la frecuencia y sólo depende de los intervalos de amplitud empleados en el proceso de cuantificación, es decir, de unos 98,09 dB constantes para los 16 bits de este estándar CD-Audio en todo el espectro útil).

Un SACD puede registrar y reproducir señales con componentes de hasta 33 kHz con una relación señal-ruido equivalente al de un CD-Audio (aunque 33 kHz está casi una octava por encima del máximo audible y, por tanto, una ventaja sobre el CD-Audio de dudosa utilidad) y mantener una relación señal-ruido de aproximadamente 122 dB para el espectro audible (un potencial, el equivalente aproximado a 20 bits,3 también de dudosa utilidad práctica como formato final de usuario). Entre las ventajas objetivas de estos formatos recientes (DVD-Audio y SACD) se encuentra el potencial multicanal (registro de más de dos canales) y la capacidad para el empleo de técnicas de protección de copia (algo de extraordinario interés para las compañías discográficas). Ninguna prueba doble-ciego realizada en condiciones controladas ha probado que existan diferencias audibles entre estos formatos denominados de "alta resolución"


ALIASING

Todo lo explicado anteriormente es correcto, sin embargo existen sonidos que el oído humano no puede escuchar (aquellos armónicos que se generan más allá de los 20 000 Hz). Cuando digitalizamos una onda con tales armónicos presentes, según Nyquist, se produce el fenómeno de aliasing, el cual convierte esas frecuencias no audibles y las cuales no las percibimos en frecuencias que si lo son y que no se encuentran presentes en el sonido original.

Cito un ejemplo no mío pero muy didáctico: Lo que ocurre cuando vemos la rueda de un carro en una película, aunque el carro va hacia adelante nosotros vemos que los aros de la rueda van en sentido inverso. No hay concordancia entre el periodo de rotación de la rueda y la frecuencia de muestreo del cine (que es de 24 frames/sec). Para evitar este tipo de problemas se tiene que añadir un filtro de paso bajo de corte por encima de la frecuencia que se corresponda con la mitad de frecuencia de muestreo. Este tipo de filtro es conocido como “filtro anti-aliasing”. Para este problema, en los CD’s de audio se estandarizó que la frecuencia de muestreo sea de 44.1 kHz para poder utilizar filtros con una pendiente desde los 22.050 kHz.


FRECUENCIAS TIPICAS DE MUESTREO


Las investigaciones en esta rama continuan, los sistemas de audio tienden a tener mayor capacidad de mustreo y mayor resolucion, asimismo los medios para almacenar esa informacion avanzan a la misma velocidad, con costes mas asequibles a los usuarios.

Continuaremos proximamente con aplicaciones DSP en ondas de audio, espero les haya motivado con esta introduccion a este inmenso campo de procesamiento de señales.

Fuentes:

[1] Los males del audio digital. Jitter, aliasing, errores de cuantización

[2] http://es.wikipedia.org/wiki/Frecuencia_de_muestreo