Microsoft së fundmi ka prezantuar një model të ri me Al që mund të gjenerojë video realiste të fytyrave njerëzore që flasin.
I quajtur VASA-1, modeli imazh-në-video transformon fotot e palëvizshme të fytyrave njerëzore në video, përcjell Telegrafi.
Së fundmi, një video që demonstron aftësitë e aplikacionit është bërë virale në rrjete sociale.
Videoja shfaq pikturën ikonike të Leonardo da Vincit, Mona Lizën, duke kënduar.
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
— Min Choi (@minchoi) April 18, 2024
Ndërsa disa u argëtuan nga klipi qesharak, të tjerë shprehën shqetësimet e tyre për përdorimin e aplikacionit për të krijuar falsifikime të thella.
“Klipi i Mona Lizës më bëri të rrokullisesha në dysheme duke qeshur”, shkroi një përdorues. /Telegrafi/