La IA de Microsoft requiere solo una imagen estática un fragmento de audio y crea avatares que se sincronizan con la voz.
Los rostros que simulan ser personas reales han sido generados por herramientas de IA StyleGAN2 y DALL·E-3,
VASA requiere solo una imagen estática un fragmento de audio con voz para crear vídeos con un tamaño de 512 x 512 píxeles a 45 fotogramas por segundos en el modo ‘offline’, aunque ‘online’ soporta 40fps con una latencia de 170ms. La compañía lo ha evaluado con un ordenador de escritorio equipado con una GPU NVIDIA RTX 4090.
No piensa lanzarla al mercado por el mal uso que se puede dar de ello.
Es decir Microsoft nos vende un avance que luego no saca.
Vendehumos.
También te puede interesarGraduado por la Universidad Internacional de la Rioja. Formó parte de la primera edición de 7 Noticias y clasificados. Diversos estudios en Derecho, Psicología e inserción laboral. Desde entonces informa sobre noticias nacionales, locales y deportivas.Soy Especialista SEO, Copywriter