Google ha lanciato Gemini 3.1 Flash-Lite, il modello Gemini 3 più veloce e conveniente di sempre, al prezzo di 0,25 dollari per milione di token di input e 1,50 dollari per milione di token di output.
Il modello si rivolge a carichi di lavoro di sviluppatori ad alto volume, elaborazione dati e attività di traduzione. È disponibile in anteprima tramite l’API Gemini in Google AI Studio e Vertex AI, ma non è incluso nell’app consumer Gemini.
Rispetto a Gemini 2.5 Flash-Lite, la nuova versione è più costosa ma significativamente più potente. Generalmente supera Gemini 2.5 Flash a un prezzo inferiore.
Il modello supera i concorrenti tra cui GPT-5 mini e Claude 4.5 Haiku. Grok 4.1 Fast è più conveniente, ma Gemini 3.1 Flash-Lite è più veloce e promette fino a 363 token al secondo.
Sui benchmark multimodali, il modello ha ottenuto 1432 punti Elo nella classifica Arena.ai. Ciò lo colloca tra i modelli open-weight e le offerte commerciali di ultima generazione.
Google non ha pubblicato benchmark degli agenti per il rilascio. La società ha dichiarato che il modello è destinato ad attività ad alto volume ed elaborazione di dati, non alla gestione di flotte di agenti.
Gli sviluppatori possono utilizzare l’API per ottimizzare il tempo di ragionamento del modello per il controllo dei costi. Impostazioni di ragionamento inferiori producono meno token, il che è rilevante per i carichi di lavoro ad alto volume.
Questa è la prima versione Flash-Lite per Gemini 3.1. Google tradizionalmente lancia prima le versioni Flash più potenti o salta completamente Flash-Lite, come ha fatto con Gemini 3.
Google ha lanciato Gemini 3.1 Pro due settimane prima. L’azienda descrive Flash-Lite come pensato per carichi di lavoro di sviluppatori ad alto volume su larga scala.








