La nueva frontera en la generación de rostros parlantes en tiempo real.

En el campo de la inteligencia artificial, un nuevo desarrollo conocido como VASA-1 está cambiando las reglas del juego a la hora de generar caras parlantes.

Este modelo innovador, desarrollado por Microsoft Research Asia, utiliza una única imagen estática y un clip de audio para crear avatares virtuales que no sólo sincronizan perfectamente los movimientos de los labios con el audio, sino que también capturan una amplia gama de matices faciales y movimientos de la cabeza. que aumentan su realismo y vivacidad.

Imagen Investigación de Microsoft

VASA-1: Enfoque Revolucionario

El modelo VASA-1, desarrollado por un equipo de investigadores de tecnología visual, introduce un enfoque revolucionario para generar dinámicas faciales y movimientos de cabeza holísticos.

Este sistema no sólo mejora la calidad del vídeo y la dinámica facial respecto a métodos anteriores, sino que también permite la generación online de vídeos de alta resolución (512×512) a 40 fotogramas por segundo, con una latencia casi imperceptible, como se puede ver en el siguiente videoclip:

La clave del éxito de VASA-1 radica en su capacidad para manejar entradas de audio y fotografías fuera de distribución, incluidas fotografías artísticas y audio en diferentes idiomas.

Según los creadores de VASA-1, «Nuestro método no sólo mejora significativamente la sincronización entre los labios y el audio, sino que también enriquece la gama de expresiones faciales y movimientos naturales de la cabeza, ofreciendo un nuevo nivel de realismo en los avatares virtuales.«.

A pesar de las posibles aplicaciones positivas, como la mejora de la equidad educativa y el apoyo terapéutico, existe una preocupación constante por el uso indebido de esta tecnología en la creación de contenido engañoso.

Los investigadores son conscientes de estos riesgos y están comprometidos a desarrollar inteligencia artificial de manera responsable, con el objetivo de promover el bienestar humano y avanzar en la detección de falsificaciones.

El modelo VASA-1 representa un avance significativo en la tecnología de avatar de IA, ofreciendo posibilidades que podrían transformar sectores como la educación y la salud.

Aunque el equipo ha decidido no publicar una demostración en línea ni detalles adicionales hasta que esté seguro de que la tecnología se utilizará de manera responsable, el potencial de VASA-1 para influir positivamente en la sociedad es indiscutible. Con este desarrollo, estamos un paso más cerca de crear interacciones más naturales y significativas con las máquinas.

En el siguiente vídeo puedes ver cómo funciona la interfaz VASA-1:

Síguenos en las redes sociales para estar al día de todas las novedades, cursos gratuitos y otros artículos interesantes. Aquí te dejamos varias opciones:

* En Twitter, puedes encontrarnos como @Geeksroom.

* Para videos, suscríbete a nuestro canal de YouTube.

* En Instagram, disfruta de nuestras imágenes.

*También puedes disfrutar de Geek’s Room a través de Pinterest.

For Latest Updates Follow us on Google News