Google ha lanciato Gemini 2, un sofisticato modello di intelligenza artificiale che migliora la capacità degli utenti di interagire con la tecnologia. Questo annuncio, fatto durante un evento stampa, evidenzia le capacità di Gemini 2 nell’esecuzione di compiti, capacità di conversazione e comprensione multimodale, rappresentando un progresso significativo nella tecnologia AI.
Google lancia Gemini 2: una nuova era per gli assistenti AI
Demis Hassabis, CEO di Google DeepMind, ha osservato che Gemini 2 funziona come un assistente virtuale in grado di “pianificare ed eseguire attività sui computer di un utente e sul web”. Il modello mira ad aiutare gli utenti a gestire varie attività senza problemi, aprendo potenzialmente la strada all’intelligenza generale artificiale (AGI) imitando le funzioni cognitive simili a quelle umane. Il CEO di Google, Sundar Pichai, ha sottolineato l’impegno dell’azienda nello sviluppo di “modelli agenti” in grado di comprendere e agire nel mondo in modo più efficace, indicando gli investimenti significativi effettuati nell’ultimo anno.
Gemini 2 include funzioni “multimodali” migliorate, che consentono all’intelligenza artificiale di analizzare audio e video in modo più efficace durante conversazioni sofisticate. Dimostrando queste capacità, Gemini 2 potrebbe ridefinire il funzionamento dei personal computer, risparmiando potenzialmente tempo attraverso attività automatizzate come la prenotazione di voli e la gestione dei documenti. Tuttavia, permangono sfide relative alla capacità della tecnologia di elaborare comandi aperti senza errori, il che potrebbe portare a errori costosi.
Anche agenti IA specializzati per la codifica e la scienza dei dati fanno parte degli strumenti di Gemini 2, consentendo agli utenti di affrontare compiti di programmazione complessi che vanno oltre le capacità dei modelli precedenti. A differenza degli strumenti di intelligenza artificiale prevalenti che si concentrano sul completamento di base del codice, questi agenti possono svolgere attività complete come il controllo del codice nei repository e la facilitazione dell’analisi dei dati.
Progetto Mariner: Nuovo approccio alla navigazione web
Per mostrare le capacità di Gemini 2, Google ha introdotto Project Mariner, un’estensione sperimentale di Chrome che aiuta gli utenti nella navigazione sul web. In una recente dimostrazione, l’agente AI è stato incaricato di pianificare un pasto, mentre navigava autonomamente sul sito web di un supermercato, effettuava l’accesso e aggiungeva articoli al carrello, suggerendo anche sostituzioni quando alcuni articoli non erano disponibili. Hassabis ha descritto Mariner come un prototipo di ricerca che reinventa le interazioni degli utenti con l’intelligenza artificiale, concentrandosi sulle attività quotidiane.
Gemini è stato inizialmente lanciato nel dicembre 2023 come parte della strategia di Google per competere con ChatGPT di OpenAI, che ha ottenuto consensi per la sua utilità nelle esperienze assistite dall’intelligenza artificiale. Con l’introduzione di Gemini 2, Google posiziona ora il suo modello allo stesso livello delle offerte di OpenAI, con l’obiettivo di migliorare l’esperienza di ricerca attraverso funzionalità basate sull’intelligenza artificiale.
Google ha anche rivelato l’ultima versione di Project Astra, un’iniziativa sperimentale che consente a Gemini 2 di interpretare l’ambiente circostante un utente tramite la fotocamera dello smartphone. Durante i test, Gemini 2 ha dimostrato la sua abilità nel riconoscere le bottiglie di vino, fornendo informazioni geografiche, prezzi e caratteristiche di gusto provenienti dal web. Hassabis ha espresso il desiderio che Astra si evolva in un sistema di raccomandazione definitivo, in grado di collegare interessi in diversi domini per migliorare l’esperienza degli utenti.
L’attenzione alla memoria all’interno di Gemini 2 consente all’intelligenza artificiale di conservare informazioni sulle preferenze dell’utente, con Google che garantisce agli utenti di poter gestire i propri dati, comprese le funzionalità di eliminazione. Durante i test con Astra, l’intelligenza artificiale ha mostrato un’impressionante adattabilità mantenendo il contesto della conversazione e rispondendo alle interruzioni.
Sicurezza e affidabilità degli agenti IA
Con l’espansione delle funzionalità di Gemini 2, Google sottolinea l’importanza di garantire sicurezza e affidabilità. Sebbene gli agenti si mostrino promettenti, i rischi potenziali derivano dal modo in cui gli utenti possono interagire con i sistemi e con i dati che forniscono. Project Mariner incorpora istruzioni che richiedono la conferma dell’utente prima di eseguire azioni sensibili, proteggendo così da transazioni non autorizzate.
Google è stata proattiva nell’affrontare i problemi di sicurezza collaborando con esperti interni ed esterni per valutare i rischi associati all’utilizzo dell’intelligenza artificiale. Ciò include l’esplorazione di misure per prevenire l’uso improprio della piattaforma attraverso richieste o istruzioni dannose, proteggendo così gli utenti da potenziali minacce come frodi o attacchi di phishing.
Il rilascio di Gemini 2 da parte di Google segna un momento cruciale nel progresso dell’intelligenza artificiale, poiché l’azienda continua a monitorare le esperienze e i feedback degli utenti. Il viaggio verso l’AGI si svolge progressivamente con ogni fase di sviluppo, evidenziando la ricerca in corso che potrebbe influenzare le future iterazioni della tecnologia. Mentre continuano le indagini sulle interazioni e sulle risposte degli utenti, i prossimi passi per Gemini 2 e i suoi progetti associati sembrano essere attentamente monitorati.
Crediti immagine: Google
Il post Gemini 2.0 di Google è qui: multimodale e potente è apparso per la prima volta su TechBriefly.
Source: Gemini 2.0 di Google è qui: multimodale e potente