Google annunciato l’anteprima privata del suo modello di generazione video, Veo, per i clienti Google Cloud che utilizzano Vertex AI. L’annuncio consente ad aziende come Quora e Mondelez International di sfruttare questa tecnologia AI per scopi creativi e di marketing.
Veo, presentato ad aprile, può generare video ad alta definizione, inclusi clip 1080p lunghi fino a sei secondi con vari frame rate. Gli utenti possono creare video fornendo immagini insieme a suggerimenti, consentendo al modello di catturare diversi stili visivi e cinematografici. Warren Barkley, direttore senior della gestione dei prodotti presso Google Cloud, ha sottolineato che la lunga attesa per l’API era dovuta al miglioramento del modello per la preparazione aziendale.
Il modello eccelle nel generare effetti specifici come le esplosioni e comprende i concetti fisici di base. Può anche eseguire modifiche mascherate, consentendo agli utenti di modificare regioni specifiche all’interno di un video. Nonostante le sue capacità, Veo mostra incoerenze tipiche dell’attuale intelligenza artificiale generativa, come oggetti che scompaiono e comportamenti fisici non realistici, che portano a potenziali limitazioni nel suo utilizzo.
Veo e Imagen 3: Cosa offrono
Google ha introdotto Veo insieme a Imagen 3, un modello di immagine generativa progettato per produrre immagini della massima qualità da istruzioni di testo. Entrambi i modelli saranno disponibili per i clienti Vertex AI, con Imagen 3 destinato a diventare ampiamente accessibile la prossima settimana. Le aziende che hanno iniziato a utilizzare questi strumenti includono Oreo e Cadbury, enfatizzando le loro applicazioni commerciali.
Suggerimento del video qui sotto: Un cowboy solitario cavalca il suo cavallo attraverso una pianura aperta allo splendido tramonto, luce soffusa, colori caldi.
(Video: Google)
Suggerimento del video qui sotto: Una ripresa aerea di un faro che si erge su una scogliera rocciosa, il suo faro che fende le prime luci dell’alba, le onde che si infrangono contro le rocce sottostanti
(Video: Google)
Barkley ha osservato che l’intelligenza artificiale generativa sta guidando la trasformazione aziendale, con l’86% delle imprese che segnala una crescita dei ricavi. Ha affermato che Google è impegnata a far progredire la tecnologia dell’intelligenza artificiale generativa, evidente nelle ultime offerte con Veo e Imagen 3.
Per affrontare potenziali abusi, entrambi i modelli incorporeranno misure di salvaguardia per prevenire la generazione di contenuti dannosi. Inoltre, tutti gli output presenteranno filigrane digitali, incluso SynthID di Google DeepMind, che incorpora marcatori invisibili per combattere la disinformazione e l’errata attribuzione. Google sostiene di non utilizzare i dati dei clienti per addestrare i propri modelli, concentrandosi invece su set di dati disponibili pubblicamente.
Il miglioramento delle funzionalità aziendali è stata una priorità sin dall’annuncio iniziale di Veo. Il modello è stato addestrato utilizzando una vasta gamma di campioni video di alta qualità, anche se i dettagli sulle fonti di dati di addestramento specifiche rimangono non divulgati. Barkley ha riconosciuto che, sebbene alcuni dati possano includere contenuti di YouTube, questi operano in base agli accordi di Google con i creatori di contenuti.
L’approccio proattivo di Google affronta anche i rischi di proprietà intellettuale associati all’intelligenza artificiale generativa. Veo offrirà filtri a livello di prompt per bloccare contenuti violenti ed espliciti e Barkley ha indicato che i risultati di Veo verranno forniti con una politica di indennizzo per proteggere gli utenti dalle richieste di violazione del copyright.
Man mano che Veo si integra gradualmente in più prodotti Google, il modello è stato introdotto in prova tramite Google Labs a maggio e annunciato come parte di YouTube Shorts a settembre. Tuttavia, Google ha dovuto affrontare la concorrenza nello spazio dell’intelligenza artificiale generativa da parte di aziende come OpenAI e Adobe, che hanno rapidamente assicurato partnership con vari studi e agenzie creative.
Credito immagine in primo piano: Google DeepMind
Il post I nuovi strumenti AI di Google stanno cambiando per sempre la creazione di video e immagini è apparso per la prima volta su TechBriefly.