Un capitolo si chiude con l’uscita di GPT-4o mini da parte di OpenAI. Alcune IA sono diventate obsolete anche se sono state rilasciate solo di recente. Questo nuovo modello sostituirà il ChatGPT 3.5 ampiamente utilizzato e gratuito. GPT-4o mini, che è più efficiente e a basso consumo energetico rispetto al vecchio modello, si dice che sia molto più intelligente del suo predecessore. Nella transizione dal modello a cui siamo abituati a GPT-4o mini, gli utenti possono aspettarsi nuove funzionalità e GPT-4o mini è completamente gratuito.
Per comprendere appieno l’importanza di questo cambiamento, dobbiamo guardare al percorso di ChatGPT 3.5. Lanciato nel 2022, ChatGPT 3.5 è rapidamente diventato un nome familiare, affascinando gli utenti con la sua capacità di generare testo simile a quello umano, rispondere a domande e assistere in varie attività. È stato ampiamente utilizzato sia da privati che da aziende. È stato persino un potente strumento per la creazione di contenuti, la risoluzione di problemi e il recupero di informazioni generali. Negli ultimi anni, tuttavia, altre IA rilasciate gratuitamente hanno superato ChatGPT 3.5.
Cosa può fare il GPT-4o mini?
Il GPT-4o mini è dotato di una serie di miglioramenti che lo distinguono naturalmente dal suo predecessore, altrimenti sarebbe illogico. Uno dei miglioramenti più notevoli è la capacità di eseguire sia l’elaborazione di testo che di immagini. Questa nuova doppia capacità consente al modello di elaborare e comprendere informazioni da più fonti, con il potenziale risultato di un output più completo e accurato.
Le capacità del modello sono state testate con vari benchmark. Nel benchmark MMLU (Massive Multitask Language Understanding), che misura il ragionamento su un’ampia gamma di argomenti, il GPT-4o mini ha ottenuto un punteggio dell’82%. In base a questi risultati, il nuovo modello di OpenAI supera altri piccoli modelli di intelligenza artificiale sul mercato. Faremo dei benchmark nella nostra famiglia. E naturalmente, la decisione spetta a voi.
Un altro ambito in cui si dice che il GPT-4o mini eccella è il ragionamento matematico. Il modello ha ottenuto un impressionante 87% nel benchmark MGSM (Mathematics Grade School Merge). Ciò significa che il nostro nuovo amico può scrivere codice meraviglioso, risolvere problemi di logica o aiutarti con compiti complessi.
In termini di applicazioni pratiche, GPT-4o mini supporta sia testo che immagini nella sua API. Ciò significa che puoi integrare l’applicazione in altri media anziché usarla solo su un sito web. OpenAI non si ferma qui, annunciando piani per estendere le capacità del modello per includere l’elaborazione video e audio in futuro, espandendo ulteriormente i suoi potenziali casi d’uso.
Le specifiche del GPT-4o mini
Da un punto di vista tecnico, il GPT-4o mini cerca di rappresentare un equilibrio tra prestazioni ed efficienza. OpenAI non ha rivelato le dimensioni esatte del modello, ma afferma che è alla pari con altri piccoli modelli AI come Llama 3 8b, Claude Haiku e Gemini 1.5 Flash. Voglio dire, cos’altro potrebbe essere?
Uno dei vantaggi più importanti del GPT-4o mini è la sua velocità. Come sapete, nel modello ChatGPT 3.5, le risposte a volte impiegano fino a 20 secondi, ora ne impiegano fino a 10. Secondo i test iniziali, il modello ha una velocità di trasmissione media di 202 monete al secondo. Questa è più del doppio della velocità del GPT-4o e del GPT-3.5 Turbo, il che lo rende particolarmente adatto per applicazioni in cui i tempi di risposta rapidi sono cruciali.
La finestra di contesto del modello è un’altra importante caratteristica tecnica. Il GPT-4o mini può elaborare fino a 128.000 monete alla volta. Ciò equivale alla lunghezza di un libro medio. Questa ampia finestra di contesto consente al modello di mantenere coerenza e pertinenza in lunghe interazioni o quando si gestiscono documenti lunghi.
Il GPT-4o mini contiene informazioni e dati fino a ottobre 2023. Questi dati possono essere aggiornati con gli aggiornamenti. Ma per ora, potresti non ottenere risposte efficienti per un evento o uno sviluppo dopo quella data.
È troppo lungo?
- Supporta l’elaborazione di testo e immagini
- Punteggio di riferimento MMLU: 82%
- Punteggio benchmark MGSM: 87%
- L’API supporta l’input di testo e visione
- Dimensioni paragonabili ad altri piccoli modelli di intelligenza artificiale (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
- Velocità di output media: 202 token al secondo
- Finestra di contesto: 128.000 token
- Termine ultimo per la conoscenza: ottobre 2023
- Tempo di risposta fino a 10 secondi
Che ne dici del prezzo del GPT-4o mini?
I prezzi dell’API non sono ancora stati annunciati, ma OpenAI ha fissato il prezzo del modello a 15 centesimi per milione di token di input e 60 centesimi per milione di token di output per gli sviluppatori che utilizzano le sue API. Questa struttura di prezzi rende GPT-4o mini più conveniente rispetto ai suoi predecessori e OpenAI afferma che è il 60% più economico di GPT-3.5 Turbo.
Il costo ridotto di esecuzione di GPT-4o mini potrebbe avere implicazioni di vasta portata per l’accessibilità dell’IA. Rendendo disponibili funzionalità AI avanzate a un prezzo inferiore, OpenAI sta potenzialmente aprendo la porta a un’adozione più ampia della tecnologia AI in una varietà di settori e regioni.
L’efficienza e la convenienza del modello lo rendono particolarmente attraente per attività semplici e ad alto volume che richiedono ripetute chiamate al modello AI. Ciò potrebbe essere particolarmente vantaggioso per le piccole e medie imprese o per gli sviluppatori che lavorano su progetti con budget limitati.
GPT-4o mini vs altri modelli leader
Per comprendere meglio il nuovo modello, facciamo un confronto tecnico con altri modelli:
Modello | Precisione (%) | MMLU | GPQA | GOCCIOLARE | MGSM | MATEMATICA | Valutazione Umana | MMMUM | MathVista |
Mini GPT-4o | 82.0 | 40.2 | 79.7 | 87.0 | 70.2 | 87.2 | 59,4 | 56.7 | 63,8 |
Gemelli Flash | 77,9 | 38.6 | 78,4 | 75,5 | 40.9 | 71.5 | 56.1 | 58.4 | 0,0 |
Claude Haiku | 73,8 | 35.7 | 78,4 | 71.7 | 40.9 | 75,9 | 50.2 | 46.4 | 0,0 |
Motore turbo GPT-3.5 | 69,8 | 30.8 | 70.2 | 56.3 | 43.1 | 68.0 | 0,0 | 0,0 | 0,0 |
GPT-4o | 88.7 | 53.6 | 83.4 | 90,5 | 76,6 | 90.2 | 69.1 | 0,0 | 0,0 |
GPT-4 | 90.0 | 55.0 | 85.0 | 92.0 | 78.0 | 92,5 | 70,5 | 60.0 | 65.0 |
Motore turbo GPT-4 | 91.0 | 56.0 | 86.0 | 93.0 | 79.0 | 93.5 | 71.0 | 61.0 | 66.0 |
Gemelli | 85.0 | 50.0 | 80.0 | 88.0 | 72.0 | 88,5 | 65.0 | 55.0 | 60.0 |
Gemelli Avanzato | 87.0 | 52.0 | 82.0 | 90.0 | 74.0 | 90.0 | 67.0 | 57.0 | 62.0 |
- MMLU (Comprensione multitasking massiva del linguaggio): Un benchmark completo per la valutazione dei modelli linguistici in un’ampia gamma di attività in diversi domini.
- GPQA (Risposta alle domande di carattere generale): Un parametro di riferimento per testare la capacità di un modello di rispondere in modo accurato a domande di cultura generale.
- DROP (Ragionamento discreto sui paragrafi): Un benchmark di comprensione della lettura che richiede ai modelli di eseguire operazioni discrete come addizione e sottrazione sul testo.
- MGSM (matematica multi-step): Un parametro di riferimento per valutare la capacità di un modello di risolvere problemi matematici articolati in più fasi.
- MATEMATICA: Un benchmark specificamente incentrato sulla valutazione delle capacità di risoluzione dei problemi matematici dei modelli linguistici.
- Valutazione umana: Un punto di riferimento per la valutazione della generazione di codice, in cui i modelli vengono valutati in base alla loro capacità di generare codice corretto e funzionale a partire da dichiarazioni di problemi.
- MMMU (Comprensione della macchina multimodale): Un benchmark che testa la capacità di un modello di comprendere e integrare informazioni provenienti da più modalità, come testo, immagini e audio.
- MathVista: Un parametro di riferimento specifico progettato per valutare le capacità di ragionamento matematico e di risoluzione dei problemi dei modelli linguistici in varie discipline matematiche.
In definitiva, il modello “migliore” dipende dalle tue esigenze. Il GPT-4o mini offre un mix impressionante di capacità in un pacchetto più compatto, rendendolo una scelta attraente per molti utenti.
Credito immagine in evidenza: IA aperta
Source: ChatGPT 3.5 verrà sostituito da GPT-4o mini