Nvidia anuncia nuevo modelo de IA capaz de modificar voces y generar nuevos sonidos
Nvidia anunció un nuevo modelo de inteligencia artificial (IA) para generar música y audio capaz de modificar voces y generar sonidos novedosos, tecnología dirigida a los productores de música, películas y videojuegos.
Nvidia anunció este lunes un nuevo modelo de inteligencia artificial (IA) para generar música y audio capaz de modificar voces y generar sonidos novedosos, tecnología dirigida a los productores de música, películas y videojuegos.
El mayor proveedor mundial de chips y software utilizados para crear sistemas de IA declaró que no tiene planes inmediatos de hacer pública esta tecnología, que denomina Fugatto (abreviatura de Foundational Generative Audio Transformer Opus 1).
Se une así a otras tecnologías mostradas por startups como Runway y grandes empresas como Meta Platforms, capaces de generar audio o video a partir de un texto.
La versión de Nvidia genera efectos de sonido y música a partir de una descripción de texto, incluidos sonidos novedosos como hacer que una trompeta suene como el ladrido de un perro.
Lo que la distingue de otras tecnologías de IA es su capacidad para captar y modificar el audio existente, por ejemplo, tomando una línea tocada en un piano y transformándola en una línea cantada por una voz humana, o tomando una grabación de una palabra hablada y cambiando el acento utilizado y el estado de ánimo expresado.
“Si pensamos en el audio sintético de los últimos 50 años, la música suena diferente ahora gracias a los sintetizadores”, dijo Bryan Catanzaro, vicepresidente de investigación aplicada de aprendizaje profundo en Nvidia. “Creo que la IA generativa va a aportar nuevas capacidades a la música, a los videojuegos y a la gente corriente que quiere crear cosas”.
El nuevo modelo de Nvidia fue entrenado con datos de código abierto, y la compañía dijo que todavía está debatiendo si y cómo darlo a conocer públicamente.
“Cualquier tecnología generativa siempre conlleva ciertos riesgos, porque la gente podría utilizarla para generar cosas que preferiríamos que no hicieran”, afirmó Catanzaro. “Tenemos que tener cuidado con eso, por eso no tenemos planes inmediatos de hacerla pública”.