Microsoft crea IA para imitar voces con un audio de tres segundos

Microsoft tiene planes de integrar ChatGPT, la Inteligencia Artificial que te ayuda a escribir artículos o te da respuestas a partir de la idea que quieras, a su paquete de Microsoft Office. Además, también está trabajando en desarrollar su propio sistema que te permitirá generar audios con la voz que quieras.

VALL-E es el nuevo "modelo de lenguaje para la síntesis de texto a voz (TTS)" creado por Microsoft, según información de Xataka. El sistema puede imitar la voz de alguien lo único que necesitas es contar con una grabación de tres segundos de audio.

Te puede interesar: Nueva York veta a la Inteligencia Artificial "ChatGPT" de las escuelas, alumnos la usaban para hacer sus tareas

Así funciona VALL-E, la nueva IA de Microsoft

Microsoft quiere que VALL-E funcione con otros modelos de Inteligencia Artificial generativa como GPT-3 para que las personas puedan insertar el audio de tres segundos con la voz de alguien para que el sistema pueda imitarla.

De esta manera, el sistema de Chat GPT-3 tendrá integrada esta nueva función para ofrecerte resultados de voz una vez que VALL-E esté listo.

La empresa ya mostró algunos ejemplos para que viéramos cuál ha sido la entrada de audio que se tomó como base, los procesos intermedios y el resultado final de VALL-E. El modelo no imita la voz con una forma robótica sino que es capaz de tener los matices del lenguaje como el tono con el que se ha grabado el audio.

Esta herramienta nos recuerda a la función de Alexa anunciada por Amazon que es capaz de imitar la voz de un familiar muerto para que te cuente una historia y a otros modelos creados por Google. 

Noticias Relacionadas

TE PUEDE INTERESAR

MÁS NOTICIAS

MÁS NOTICIAS