Frecuencia de muestreo y profundidad de bits: los parámetros que determinan la calidad del audio digital

Jesús Sánchez, 11 mayo 2020

Ya han llegado los Prime Days de Amazon con las mejores ofertas del año! No las dejes escapar!

Ver las mejores ofertas

Cuando lees las especificaciones de los formatos de audio hay dos cifras destacadas cuyo significado no siempre es conocido. Por ejemplo, 32-bit/192kHz o 24-bit/96kHz. Estos dos parámetros son la frecuencia de muestreo y la profundidad de bit.

El Hi-Res audio tiene 96kHz/24-bit y el audio de un CD 44.1kHz/16-bit

Y es que, la calidad del audio digital se define por estos dos parámetros que cuando se ajustan correctamente, nos proporcionan la cantidad correcta de rango dinámico y respuesta de frecuencia para representar perfectamente cualquier señal de audio.

Resumido

  • Tasa de muestreo: en el mundo digital todo es discreto. Por ejemplo, al reproducir una canción desde un fichero digital, el reproductor no trabaja con un flujo continuo de información, sino que suele trabajar con pedazos o muestras (samples) muy pequeños. El sample rate es la cantidad de samples por segundo que se procesan. Cuanto mayor sea el número de samples por segundo, mayor será la calidad del sonido.
  • Profundidad de bits: es la cantidad de datos de cada muestra. La profundidad de bits de un audio sería como los megapíxeles de una cámara de fotos. Cuantos más píxeles, más información en cada muestra.

Tasa de muestreo, frecuencia de muestreo o sample rate

La frecuencia de muestreo nos dice cuántas veces por segundo tomamos la medida de la forma de onda de audio analógica cuando se convierte en una señal digital.

Esto es importante, porque dado que la frecuencia de muestreo tiene una velocidad, o frecuencia, la frecuencia de muestreo define la respuesta de frecuencia de una grabación de audio. Específicamente, el Teorema de Nyquist-Shannon establece que la frecuencia más alta que podemos grabar es la mitad de la tasa de muestreo.

Si la frecuencia más alta contenida en una señal analógica es:

Y la señal se muestrea a una tasa:

Entonces:

Esto significa que una frecuencia de muestreo de 44,1 kHz puede grabar señales de audio de hasta 22,05 kHz. En consecuencia, una frecuencia de muestreo de 96 kHz permite un ancho de banda de audio de 48 kHz.

Pero, si sabemos que el oído humano cubre de 20 a 20 kHz, ¿por qué necesitaríamos frecuencias de muestreo superiores a 44,1 kHz? Algunas personas creen que los humanos pueden percibir sonidos de hasta 50 kHz a través de la conducción ósea. Sin embargo, aunque puede ser correcta en teoría, en la práctica los humanos solo puede escuchar hasta 20 kHz a través del aire, sin embargo…

Tasas de muestreo recomendadas

Ya que nuestra audición solo es capaz de 20 kHz, ¿no podemos mantener una frecuencia de muestreo de 44,1 kHz? Sí y no. A la hora de grabar el audio, si aumentamos la frecuencia de muestreo por encima de 44,1 kHz y añadimos un filtro analógico antialiasing en el ADC el sonido puede ser mejor. Por esta y otras razones, se recomienda grabar audio a 48 kHz:

  • En primer lugar, 48 kHz permite que los filtros antialiasing suenen mejor que 44,1 kHz.
  • En segundo lugar, 48 kHz utiliza solo un poco más de espacio de almacenamiento que 44.1.
  • En tercer lugar, los vídeos suelen requerir un audio de 48 kHz y no hay que olvidar que gran parte del audio que se escucha en el mundo está alojado en YouTube.

Para el jazz audiófilo, la música clásica y algunos proyectos de diseño de sonido, se suelen recomendar la frecuencia de muestreo de 96 kHz. Esta frecuencia de muestreo casi elimina el aliasing de alta frecuencia audible y las distorsiones inducidas por el filtro. Además, una grabación de 96 kHz puede reducirse sin problemas a 48 kHz.

Profundidad de bits

La profundidad de bits se relaciona con otra importante cualidad del sonido: el rango dinámico. El rango dinámico es solo un término elegante para nombrar la diferencia entre los sonidos más fuertes y los más leves.

Específicamente, cada bit representa aproximadamente 6dB de rango dinámico, por lo que 16 bits proporcionan 96dB de rango dinámico, y 24 bits proporcionan 144dB de rango dinámico. Los bits, o dígitos binarios, se basan en la matemática exponencial, y un archivo de 16 bits puede medir 65.536 valores (216), mientras que un fichero de 24 bits mide más de 16,7 millones de valores (224).

En el mundo real, los estudios y equipos profesionales tienen un ruido típico medido entre -120dB y -90dB, por lo que en lo que respecta a la grabación de audio analógico, no aprovechamos al máximo los 144dB de rango dinámico que proporcionan los 24 bits. Sin embargo, una vez que el audio se digitaliza en el software de producción donde procesamos y mezclamos las señales juntas, el rango dinámico adicional de las operaciones matemáticas de 24 bits o más se vuelve muy importante.

En otras palabras, las grabaciones de 16 bits pueden capturar todo el rango dinámico de las señales de audio analógicas típicas, pero se necesitan más bits una vez que empezamos a procesar el audio dentro de un DAW (Digital Audio Workstation).

¿Qué es Dither?

No podemos discutir la profundidad de bits sin mencionar el dither. La captura de una forma de onda de audio como señal digital es un proceso que convierte una forma de onda continua (analógica) en muchas mediciones individuales (digitales). Estas mediciones discretas no miden cada punto a lo largo de la suave forma de onda analógica y, por lo tanto, crean una distorsión llamada errores de cuantificación.

Podemos aleatorizar estos errores, haciendo efectivamente indetectable la distorsión al añadir una cantidad muy pequeña de ruido aleatorio a nuestra señal digital. Este ruido se denomina “dither” y suele estar solo 3dB por encima del nivel de ruido, o alrededor de -93dB para el audio de 16 bits.

Lo que obtenemos después de la cuantificación es una representación perfecta de la forma de onda analógica más un poco de ruido de muy bajo nivel.

Bitrate y conclusiones

La tasa de bits (o bitrate) hace referencia al número de bits transportados o procesados por segundo. Es algo así como la tasa de muestreo, pero en cambio, lo que se mide es el número de bits en lugar del número de muestras.

El bitrate se utiliza más comúnmente en un contexto de reproducción/transmisión que en la grabación.

Como puedes adivinar, podemos calcular el bitrate a partir del sample rate y de la profundida de de bits: tasa de bits = frecuencia de muestreo x profundidad de bits x Nº de canales

Por ejemplo, supongamos que tenemos un fichero estéreo (2 canales):

  • Si nuestro audio es 44.1kHz/16-bit el bitrate será: 44.100 x 16 x 2 = 1.411.200 bits por segundo (1,4 Mbps)
  • Si nuestro audio es 192kHz/24bit el bitrate será: 192.000 X 24 X 2 = 9.216.000 bits por segundo (9,2 Mbps)

En principio, una tasa de bits más alta se asocia comúnmente con una mayor calidad ya que cuantos más bits puedan caber en una unidad de tiempo, más se acerca a la recreación de la onda sonora original continuamente variable, y por lo tanto más precisa es como representación de la canción. Desafortunadamente, una mayor tasa de bits también significa un mayor tamaño de archivo y por eso surgieron los códecs de audio.

Sin embargo, en el audio digital también debemos tener en cuenta los códecs a la hora de valorar la calidad de sonido.

Los códecs de sonido se encargar de comprimir y descomprimir el audio para ahorrar espacio de almacenamiento. Existen códecs con pérdida y códecs sin pérdida. Por supuesto, no todos los códecs son igual de buenos y hay algunos que consiguen mayor calidad de audio a menos bitrate que otros.

Por ejemplo, el audio que oímos en un CD normal (16bit/44,1kHz) no está comprimido y tiene un bitrate de 1,4 Mbps.

Los servicios de streaming tienen un bitrate mucho más bajo porque utilizan códecs:

  • Spotify limita la tasa de bits de los archivos de audio a 160 kbps para los usuarios de ordenador y 96 kbps para los usuarios de móviles. Sin embargo, los suscriptores premium tienen la opción de escuchar audio a 320 kbps en el ordenador.
  • Los suscriptores de Apple Music están “limitados” a una tasa de bits de 256 kbps.

Fuentes

  1. es.wikipedia.org

Jesús Sánchez

Redactor

Entusiasta del mundo del audio y la imagen. Con un agudo oído para la calidad del sonido y un buen ojo para la excelencia visual, desentraño la magia que se esconde tras los últimos gadgets de audio y las tecnologías de televisión más punteras. Acompáñame en un viaje para mejorar tu entretenimiento.

Consentimiento