DeepMind di Google ha annunciato Genie 2, un modello rivoluzionario in grado di generare mondi di gioco 3D giocabili esclusivamente da istruzioni di testo. Questa tecnologia si basa sulla versione precedente, Genie 1, che creava ambienti 2D. I progressi di Genie 2 lo posizionano come uno strumento innovativo per creare esperienze diverse e interattive in tempo reale.
DeepMind di Google svela Genie 2 per mondi di gioco 3D
Genie 2 è progettato per costruire mondi virtuali coinvolgenti simulando animazioni, fisica e interazioni. Utilizzando immagini che possono essere generate da semplici istruzioni di testo, il modello consente flessibilità creativa. Ad esempio, un utente potrebbe inserire una richiesta per “un western cyberpunk” e Genie 2 produrrà un ambiente corrispondente. Questo approccio innovativo sfrutta l’intelligenza artificiale generativa per estendere i confini di ciò che può essere creato negli spazi virtuali.
Il modello opera su un processo in due fasi. Richiede innanzitutto un’immagine di riferimento, che può anche essere generata dal testo. Una volta fornito l’input visivo, Genie 2 estrapola per costruire un mondo interattivo completo. Le dimostrazioni hanno rivelato interazioni fluide tra i giocatori utilizzando i controlli tradizionali, come il layout WASD, garantendo così una navigazione intuitiva.
Nonostante questi progressi, Genie 2 deve affrontare sfide notevoli. Nello specifico, la coerenza del modello diminuisce dopo circa 20 secondi, con le simulazioni più lunghe che durano fino a un minuto. Questa incoerenza può derivare dalla sua capacità di produrre “controfattuali”, nel senso che l’IA considera diverse azioni potenziali intraprese dai giocatori, il che complica il mantenimento di una narrativa coerente.
Genie 2 brilla nella sua capacità di accogliere diverse prospettive, come la visuale in prima persona o isometrica. Incorpora anche elementi come effetti realistici dell’acqua e interazioni ambientali, esemplificati da una dimostrazione in cui un personaggio interagisce con un pallone, mostrando fisica, gravità e altre dinamiche. Tuttavia, le specifiche relative alla risoluzione del rendering e al conteggio dei poligoni rimangono riservate da Google.
Le capacità di Genie 2 vanno oltre il gioco controllato dall’utente. Il modello può anche simulare efficacemente personaggi AI che interagiscono all’interno degli ambienti generati. Google lo ha illustrato mostrando la capacità dell’intelligenza artificiale di eseguire comandi basati su istruzioni di testo all’interno del mondo generato. Tali caratteristiche suggeriscono il potenziale degli NPC guidati dall’intelligenza artificiale che possono mostrare un comportamento realistico nelle future applicazioni di gioco.
Sorgono considerazioni di sicurezza ed etiche riguardo ai dati di addestramento per Genie 2. È stato suggerito che il quadro di addestramento del modello potrebbe includere video di gioco provenienti da piattaforme come YouTube, sollevando preoccupazioni sulla proprietà intellettuale sulla somiglianza con materiale protetto da copyright. Questi problemi potrebbero portare a indagini sulle implicazioni legali dell’uso di contenuti esistenti da parte dell’intelligenza artificiale generativa.
Anche se le attuali implementazioni di Genie 2 potrebbero non offrire un’esperienza di gioco del tutto coerente a causa della loro temporalità, DeepMind immagina il modello come una risorsa per la ricerca e lo sviluppo piuttosto che come prodotti di gioco a tutti gli effetti. L’attenzione si concentra sulla prototipazione di esperienze interattive e sulla valutazione degli agenti IA in ambienti simulati.
Le specifiche del rilascio pubblico di Genie 2, delle applicazioni commerciali e delle risorse tecnologiche richieste rimangono poco chiare mentre Google naviga lentamente in queste acque.
Crediti per immagini e video in primo piano: Google DeepMind
Il post che DeepMind di Google svela Genie 2 per i mondi di gioco 3D è apparso per la prima volta su TechBriefly.
Source: DeepMind di Google svela Genie 2 per mondi di gioco 3D