Mentre le tecnologie di intelligenza artificiale si evolvono rapidamente e ampliano i confini, il nuovo progetto di Microsoft, VASA-1, può trasformare le foto in video e aggiungere loro suoni realistici. Sì, hai sentito bene.
Questa entusiasmante tecnologia utilizza una foto ritratto e un file audio per creare un video di un volto parlante con sincronizzazione labiale, espressioni facciali e movimenti della testa realistici.
La potenza promessa di VASA-1 solleva alcune preoccupazioni che hanno reso Microsoft riluttante a rilasciarlo. Ecco cosa sappiamo…
Abilità e impatto di VASA-1
La caratteristica più sorprendente di VASA-1 è la sua capacità di produrre animazioni facciali realistiche. A differenza dei precedenti modelli AI, VASA-1 offre un aspetto più naturale riducendo al minimo gli errori intorno alla bocca. Ciò potrebbe portare a video deepfake più realistici che si diffondono più ampiamente online.
Con la nuova tecnologia di Microsoft sono possibili risultati realistici e di alta qualità. I video dimostrativi dell’azienda forniscono esempi impressionanti che sfumano i confini tra realtà e contenuti generati dall’intelligenza artificiale.
Sarà interessante vedere cosa ci riserveranno Sora di OpenAI e VASA-1 di Microsoft nei prossimi anni…
Nota: tutte le immagini dei ritratti in questa pagina sono identità virtuali e inesistenti generate da StyleGAN2 o DALL·E-3 (ad eccezione di Mona Lisa). Stiamo esplorando la generazione di abilità visive emotive per personaggi virtuali e interattivi che NON imitano nessuna persona del mondo reale. Questa è solo una dimostrazione di ricerca e non è previsto il rilascio di prodotti o API.
Aree di utilizzo di VASA-1
Gli usi di VASA-1 sono vasti e possono ampliare i confini della creatività. Ad esempio, può essere utilizzato per offrire esperienze di gioco migliorate. Rendere i personaggi del gioco più realistici con movimenti delle labbra sincronizzati ed espressioni facciali espressive potrebbe trasformare il mondo dei giochi. Anche adesso, i personaggi nei giochi sono incredibilmente ottimizzati. Tuttavia, con questa tecnologia, è probabile che migliorino ancora di più.
D’altro canto si potrebbero anche creare avatar virtuali personalizzati. Gli utenti potrebbero fare la differenza sui social media creando avatar realistici che riflettono il proprio aspetto. Anche l’industria cinematografica potrebbe vedere cambiamenti sorprendenti. VASA-1 potrebbe ampliare i confini del cinema creando primi piani realistici, espressioni facciali e sequenze di dialoghi naturali.
Come funziona la tecnologia e il futuro
Microsoft afferma che VASA-1 offre un nuovo framework per creare volti parlanti realistici e animare personaggi virtuali. La tecnologia mira a ottenere risultati impressionanti utilizzando solo una foto ritratto e un file audio. Tuttavia, l’uso diffuso di questa tecnologia solleva alcune preoccupazioni. In particolare, il rischio di un uso improprio di tecnologie come il deepfake spinge Microsoft a essere cauta.
Una delle sfide che Microsoft deve affrontare è bilanciare innovazione e responsabilità. Riconoscendo i potenziali vantaggi offerti dalla tecnologia, l’azienda adotta un approccio responsabile allo sviluppo e cerca di informare gli utenti sui potenziali pericoli. In questo modo si mira a tenere sotto controllo la diffusione di una tecnologia potente come VASA-1, garantendo la sicurezza generale della società.
Credito immagine in primo piano: Microsoft
Source: VASA-1 di Microsoft dà vita alle foto: tutto quello che devi sapere