La historia de Internet está plagada de códecs de audio, esos programitas que sirven para compactar los archivos y facilitar su transferencia por la red. Sin embargo, el rey indiscutido fue y sigue siendo el MP3.
Con más de 30 años a cuestas, nadie ha podido desbancar al MP3 como método de compresión preferido aunque hayan aparecido otras opciones de mejor calidad como AAC y OGG. Pero esto puede cambiar en breve: Meta ha presentado un nuevo formato con el que intentará dejar atrás al sistema más popular hasta el momento.
Es que un nuevo rival del MP3 aparece en el horizonte y avanza a pasos agigantados gracias a la inteligencia artificial. Se llama ENCODEC, está desarrollado por Meta, y promete una compresión de audio 10 veces superior. ¿Será éste el códec de audio que revolucionará el mercado y reclamará la corona para sí mismo?
La compresión es fundamental en Internet ya que permite compartir archivos de alta calidad a través de la Red a una velocidad aceptable. Para que esto ocurra se requiere una conexión a rápida y mucho espacio de almacenamiento.
Así, las experiencias multimedia actuales y futuras -como el metaverso, por ejemplo- necesitan opciones de alta calidad y sin interrupciones. Con ese objetivo, Meta acaba de publicar los primeros detalles de ENCODEC su códec hipercompresor de audio impulsado por la IA.
Esta nueva tecnología ha sido desarrollada por el equipo de inteligencia artificial de la empresa y, aunque podría utilizarse para cualquier ámbito, está diseñado para mejorar las comunicaciones en situaciones de mínima conectividad.
Por ejemplo, el nuevo códec será ideal para cuando se esté en una llamada de WhatsApp con mala conexión. Actualmente, en estos casos la llamada se interrumpe o directamente se cancela por problemas de conectividad. Con ENCODEC, la empresa de Mark Zuckerberg promete que eso no ocurrirá.
Según informó Meta en un documento publicado esta semana, ENCODEC es capaz de conseguir una tasa de compresión 10 veces superior a la de MP3 a 64 kbps, sin pérdida de calidad perceptible.
El MP3 es un códec de compresión con pérdidas y conseguir un archivo 10 veces más pequeño sin perder nada es toda una hazaña. Además, ya se ha probado comprimiendo un archivo de audio estéreo de 48 KHz (calidad de CD, el estándar de la industria musical) y los resultados fueron sorprendentes.
Cómo funciona ENCODE
El nuevo códec funciona a través de una red neuronal -inteligencia artificial- de extremo a extremo que se encarga de deconstruir y reconstruir las señales auditivas en tres etapas.
- Un codificador: que toma los datos sin comprimir y los transforma en una representación de mayor dimensión, pero de menor frecuencia de cuadro.
- Un cuantificador: que se encarga de comprimir la representación anterior en el tamaño deseado, manteniendo la información más importante para reconstruir la señal original. El archivo comprimido resultante de este paso es el que se almacena en disco o se envía por Internet.
- Un decodificador: que convierte la señal comprimida en una forma de onda lo más parecida posible a la original.
Todos estos pasos se realizan en tiempo real en un solo núcleo de la computadora. La clave del proceso, según describió Meta, es identificar los cambios que no pueden ser percibidos por los humanos, ya que “la reconstrucción perfecta es imposible a bajas velocidades de bits”.
La mayoría de los códecs (como MP3, AAC y otros) descomponen las señales de audio en frecuencias que luego se codifican de forma más eficiente. Se utiliza un algoritmo cuya base, para que los cambios no sean perceptibles, es el conocimiento de la psicoacústica humana. Sin embargo, los algoritmos clásicos de los códecs son rígidos: no cambian en absoluto más allá de un par de ajustes.
Por el contrario, los modelos de Inteligencia Artificial aprenden y mejoran constantemente, adaptándose a las necesidades del momento y consiguiendo resultados mucho más eficaces./TN