15°C New York
04/19/2024
La nueva IA de Microsoft simula la voz de cualquier persona
blog Blogs Sociedad

La nueva IA de Microsoft simula la voz de cualquier persona

Ene 17, 2023
Spread the love

NOTICIACRISTIANA.COM.- El último modelo de Microsoft, VALL-E,  supone un importante paso adelante en el modelo de texto a voz.

Microsoft denomina a esta herramienta como un «modelo de lenguaje de códec neural», y se basa en una tecnología llamada EnCodec, que Meta anunció en octubre de 2022. 

A diferencia de otros métodos de conversión de texto en voz que suelen sintetizar el habla manipulando las formas de onda, VALL-E genera códigos de códec de audio a partir de texto e indicaciones acústicas, así lo informó Computerhoy.

Este modelo, analiza cómo suena una persona, descompone esa información gracias a EnCodec, y utiliza datos de entrenamiento para hacer coincidir lo que ha aprendido sobre cómo sonaría esa voz si pronunciara otras frases fuera de la muestra dada.

Microsoft entrenó las capacidades de síntesis de voz de VALL-E con una biblioteca de audio, creada por Meta, llamada LibriLight. Contiene 60.000 horas de habla inglesa de más de 7.000 hablantes, en su mayoría extraídas de audiolibros de dominio público de LibriVox.


Publicado por: NOTICIACRISTIANA.COM.- Agradecemos su fidelidad con nuestro medio de comunicación. Le invitamos a suscribirse al boletín informativo y activar la sección de notificaciones en la portada de nuestra página web.


Post Visitors:306

You cannot copy content of this page