Il sistema di intelligenza artificiale noto come Google Muse AI è stato presentato ufficialmente oggi. Basato sull’uso della decodifica parallela e di uno spazio latente piccolo e discreto, il nuovo modello di trasformatore da testo a immagine afferma di essere più veloce delle alternative esistenti. I creatori di Google Muse AI affermano che la loro creazione può generare fotografie a un livello di qualità paragonabile al meglio del meglio.
Noi presentiamo Musaun modello Transformer da testo a immagine che raggiunge prestazioni di generazione di immagini all’avanguardia pur essendo significativamente più efficiente rispetto ai modelli di diffusione o autoregressivi.
Il team AI di Google Muse
Che cos’è l’IA di Google Muse?
Il team afferma che Google Muse AI è un grande miglioramento rispetto ai precedenti modelli di trasformazione da testo a immagine come Imagen e DALL-E 2. Muse utilizza l’incorporamento del testo di un modello di linguaggio di grandi dimensioni per essere addestrato su un lavoro di modellazione mascherato in uno spazio token discreto (LLM ).
Muse è in grado di riconoscere segni in immagini che sono state camuffate a piacimento. Grazie all’uso di token discreti e alla riduzione dei requisiti di dimensione del campione, Muse promette di battere i modelli di diffusione dello spazio dei pixel come Imagen e DALL-E 2. Il modello genera una modifica gratuita zero-shot e senza maschera ricampionando ripetutamente i token immagine in risposta a un prompt.
Basato su MUSAi tempi di inferenza di Muse sono significativamente inferiori a quelli dei modelli concorrenti.
Modello | Risoluzione | Tempo di inferenza (↓) |
Diffusione stabile 1.4 | 512×512 | 3.7s |
Parti-3B | 256×256 | 6.4s |
Immagine | 256×256 | 9.1s |
Immagine | 1024×1024 | 13.3s |
Musa-3B | 256×256 | 0,5 sec |
Musa-3B | 512×512 | 1.3s |
A differenza di Parti e di altri modelli autoregressivi, Muse sfrutta la decodifica parallela. Per produrre immagini di alta qualità e riconoscere concetti visivi come oggetti, le loro relazioni spaziali, posizione, cardinalità e così via, un LLM che è già stato insegnato deve comprendere l’inglese a livello granulare. Non è necessario capovolgere il modello affinché Muse supporti l’inpainting, l’outpainting e l’editing senza maschera.
Funzionalità AI di Google Muse
Muse è un modello rapido e all’avanguardia per la generazione e l’alterazione di immagini dal testo e ha diverse funzioni utili, tra cui:
- Generazione di testo in immagine
- In reazione agli input testuali, l’intelligenza artificiale (AI) Muse di Google genera rapidamente immagini di alta qualità (1,3 s per una risoluzione 512×512 o 0,5 s per una risoluzione 256×256 su TPUv4).
- Editing a scatto zero e senza maschera
- Il modello AI di Google Muse ci offre un editing gratuito zero-shot e senza maschera campionando ripetutamente i token di immagine in risposta a un’istruzione testuale.
- Quando si modifica un’immagine, la modifica senza maschera consente di manipolare diversi oggetti con un semplice prompt di testo.
- Zero-shot Inpainting/Outpainting
- Muse AI di Google è gratuito e viene fornito con funzionalità di modifica basate su maschere (inpainting e outpainting). Applicando una maschera a un montaggio, diventa funzionalmente equivalente a una nuova generazione.
Dai un’occhiata ai migliori generatori di tweet AI che ti aiuteranno a twittare come Elon Musk.
Dettagli del modello AI di Google Muse
Puoi controllare il flusso di formazione di Muse AI di Google in basso:
Il team di Google utilizza due diverse reti di tokenizer VQGAN, una per fotografie di bassa qualità e una per immagini ad alta risoluzione. I trasformatori a bassa risoluzione (“base”) e ad alta risoluzione (“superres”) vengono addestrati con i token non mascherati e gli incorporamenti di testo T5 per prevedere i token mascherati.
Per informazioni più dettagliate su Google Muse AI, fare clic su qui.
Strumenti AI che abbiamo spiegato
Sebbene alcuni dicano “no alle immagini generate dall’IA”, quasi ogni giorno un nuovo strumento di intelligenza artificiale entra nelle nostre vite, come ad esempio:
- IA pronta
- Cactus AI
- OpenAI Point-E
- Uberduck AI
- QQ Dimensione diversa Me
- La macchina del tempo AI di MyHeritage
- L’intelligenza artificiale di Cicerone di Meta
- Nozione AI
- IA Meta Galattica
- RomanzoAI
- Crea un video Meta AI
- DALL-E 2
- Wombo Dream
- IA DreamBooth di Google
- Diffusione stabile
Resta sintonizzato per saperne di più!
Source: Google Muse AI: funzionalità, esempi e altro ancora