La icónica Mona Lisa, inmortalizada por Leonardo da Vinci, ahora puede hacer más que solo sonreír, gracias a los avances en inteligencia artificial de Microsoft.
Investigadores de Microsoft presentaron recientemente un innovador modelo de inteligencia artificial, VASA-1, capaz de tomar una imagen fija de una cara y un clip de audio para crear un vídeo atractivo de la persona que habla.
Este proceso incluye desde rostros fotorrealistas hasta ilustracionesproporcionándoles sincronización de labios y movimientos faciales naturales, informa CNN.
Una Mona Lisa que recita rap
En una demostración impresionante, los investigadores animaron a la Mona Lisa a recitará un rap cómico de la actriz Anne Hathawaydestacando el potencial creativo y divertido de esta tecnología.
El modelo VASA-1 promete aplicaciones en educación y accesibilidad para personas con dificultades de comunicación, así como la creación de acompañantes virtuales. Sin embargo, también plantea preocupaciones sobre la posible abuso y proliferación de desinformación.
Microsoft, siguiendo los pasos de OpenAI con su herramienta Sora, planea una implementación cuidadosa del modelo VASA-1. La compañía prioriza la responsabilidad y el cumplimiento normativo para evitar un mal uso de esta tecnología.
Detalles técnicos
El entrenamiento modelo incluyó un amplia gama de videos faciales, lo que permite a VASA-1 reconocer movimientos naturales como el parpadeo, la expresión facial y la mirada. Aunque los vídeos generados muestran realismo, todavía muestran signos de su origen artificial.
Microsoft destaca que su modelo supera a herramientas similares y sienta las bases para interactuar en tiempo real con avatares realistas, que impulsan la conversación entre humanos y sistemas de inteligencia artificial.
Este avance tecnológico, aunque apasionante, plantea importantes cuestiones éticas y regulatorias que deben abordarse antes de su implementación generalizada.