Cada formato de audio hace un compromiso diferente entre tamaño de archivo, calidad de audio y compatibilidad. Ya sea que estés archivando una grabación de estudio, planificando el almacenamiento de un podcast o estimando cuántas canciones caben en un teléfono, entender cómo se calcula el tamaño del archivo te ayuda a elegir el formato correcto. Esta guía explica la matemática detrás de cada formato y las implicaciones prácticas para grabación, streaming y almacenamiento.

Audio sin Comprimir vs. Comprimido

Los archivos de audio caen en tres categorías: sin comprimir (WAV, AIFF), comprimidos sin pérdida (FLAC, Apple Lossless) y comprimidos con pérdida (MP3, AAC, OGG). Los archivos sin comprimir almacenan datos PCM crudos — cada valor de muestra se preserva exactamente. La fórmula es simple: size = sample_rate × bit_depth × channels × duration ÷ 8. Una grabación estéreo de 3 minutos a 44.1 kHz / 16 bits ocupa exactamente 31.1 MB sin importar el contenido de audio real.

La compresión sin pérdida (FLAC) aplica algoritmos que reducen el tamaño del archivo sin descartar ninguna información de audio — como un archivo ZIP para audio. La proporción de compresión depende del contenido: una onda sinusoidal sostenida comprime drásticamente, mientras que el ruido denso de banda ancha comprime poco. Una reducción típica es del 40–55% comparado con el WAV sin comprimir. La compresión con pérdida (MP3, AAC, OGG) va más allá descartando permanentemente información de audio que los modelos psicoacústicos predicen que los humanos no notarán — principalmente en las frecuencias altas y los sonidos suaves enmascarados por otros más fuertes. Esto permite proporciones de compresión de 10:1 o mayores con una pérdida de calidad perceptible mínima a tasas de bits altas.

Frecuencia de Muestreo y Profundidad de Bits: Qué Afectan Realmente

La frecuencia de muestreo determina la frecuencia más alta que puede captarse. Según el teorema de Nyquist, una frecuencia de muestreo de 44.1 kHz capta frecuencias de hasta 22.05 kHz — ligeramente por encima del límite superior de 20 kHz de la audición humana. La frecuencia común de 48 kHz usada en producción de video proporciona el mismo ancho de banda audible con un pequeño margen de seguridad. Las frecuencias de 96 kHz y 192 kHz usadas en grabación profesional no proporcionan un beneficio audible para la reproducción, pero son útiles en producción porque el procesamiento digital (ecualización, cambio de tono) introduce artefactos que son más fáciles de manejar al trabajar a una frecuencia de muestreo más alta.

La profundidad de bits controla el rango dinámico — la proporción entre los sonidos más fuertes y más suaves que una grabación puede contener. Cada bit añade aproximadamente 6 dB de rango dinámico. El audio de 16 bits proporciona 96 dB de rango dinámico, lo que coincide con los entornos de escucha más silenciosos. El audio de 24 bits proporciona 144 dB, muy por encima de los límites físicos de cualquier entorno de escucha, pero el margen extra es útil en grabación cuando los niveles de entrada son inciertos. Para distribución, 16 bits es el estándar; 24 bits es una elección de archivo y producción.

Elegir el Formato Correcto para tu Caso de Uso

Para grabación y archivo, WAV de 24 bits a 48 kHz o 96 kHz es el estándar profesional. El costo de almacenamiento es el único compromiso — una sesión de 2 horas a 96 kHz / 24 bits estéreo es de unos 41 GB. FLAC con los mismos ajustes reduce esto a aproximadamente 23 GB mientras permanece bit a bit idéntico para una futura reedición. Evita MP3 o AAC para el archivo porque cada recodificación introduce pérdida de calidad adicional.

Para la distribución de podcasts, MP3 mono a 128 kbps es el estándar de la industria. La inteligibilidad de la voz es excelente a esta tasa de bits, y un episodio de una hora es de unos 58 MB — lo bastante pequeño para descargas rápidas a nivel mundial. El estéreo no añade beneficio para el contenido solo de voz y duplica el tamaño del archivo.

Para el streaming de música, AAC a 256 kbps es el formato usado por Apple Music y YouTube Music para su nivel estándar, mientras que servicios como Tidal y Amazon Music HD transmiten FLAC a 44.1 kHz o más para los suscriptores sin pérdida. A 256 kbps, una canción de 3 minutos es de unos 5.5 MB; en FLAC 44.1 kHz / 16 bits estéreo, la misma canción es de unos 31 MB — seis veces más grande, con calidad verdaderamente sin pérdida.