Llama 3.1 405b di Meta AI è un successo che è riuscito a impressionare molti utenti. Il nuovo modello non è un pesce piccolo, è un pesce grosso in un bacino di modelli linguistici in continua crescita. Diamo un’occhiata all’IA che fa parlare e scrivere tutti.
Llama 3.1 405b di Meta AI è, come suggerisce il nome, un grande modello linguistico con 405 miliardi di parametri. Fa parte della serie Llama 3 di Meta, lanciata nell’aprile 2024. I primi benchmark suggeriscono che questo modello potrebbe superare i leader attuali in diversi test AI chiave.
Un cavallo di un colore diverso: specifiche Llama 3.1 405b di Meta AI
Meta AI, precedentemente nota come Facebook AI Research, è la divisione di ricerca sull’intelligenza artificiale di Meta Platforms. Hanno introdotto Llama (Large Language Model Meta AI) nel 2023 come alternativa open source ai modelli linguistici proprietari. Llama ha rapidamente guadagnato popolarità nella comunità AI. Sulla base di questo successo, Meta ha rilasciato Llama 2 nel 2023, che ha mostrato miglioramenti significativi.
Ora, con Llama 3, Meta ha spinto i confini ancora più in là, culminando nel potente modello Llama 3.1 405b di cui stiamo parlando oggi. Questa rapida progressione mostra l’impegno di Meta nel far progredire la tecnologia AI open source.
In quest’epoca in cui l’intelligenza artificiale è ovunque intorno a noi, le aziende non si fermano. In un’epoca in cui guardiamo alla vecchia grafica dei giochi e ci chiediamo quanto si possa migliorare, siamo arrivati a perdonare la nuova grafica, e lo stesso vale per l’intelligenza artificiale.
Meta AI non è da meno quando si tratta di prestazioni. Questo modello ha 405 miliardi di parametri, il che lo rende un peso massimo nell’arena dell’IA. Quindi, cosa significa questo parametro 405b?
Neigh-ver dice mai: Llama 3.1 405b di Meta AI contro i concorrenti
Meta AI’s Llama 3.1 405b sta mostrando risultati impressionanti nei primi benchmark. Supera GPT-4 in diversi test, tra cui GSM8K, Hellaswag, Boolq e varie categorie MMLU. Tuttavia, è in ritardo in aree come HumanEval e scienze sociali MMLU.
Le prestazioni del modello sono particolarmente elevate nei compiti di matematica e di codifica. Ad esempio, nel test GSM8K, Llama 3.1 405b di Meta AI ha ottenuto un punteggio di 96,8, mentre la sua controparte 70B ha ottenuto 94,8. In HumanEval, il modello 405B ha raggiunto 85,3, rispetto a 79,3 per la versione 70B.
Queste cifre si basano sul modello base. L’ottimizzazione delle istruzioni potrebbe potenzialmente migliorare ulteriormente questi risultati. Quindi possiamo dire che questi numeri rappresentano la potenza di elaborazione, più grande è il numero, meglio è (ma a volte), ma a volte i modelli vengono schiacciati dal loro carico.
Hoof It verso il futuro: Llama 3.1 405b di Meta AI e intelligenza artificiale open source
Il fatto che il modello Llama 3.1 405b di Meta AI sia un’IA open source e che per la prima volta un modello open source possa battere il miglior LLM closed source disponibile in vari benchmark, potrebbe essere un segno di ciò che verrà, anche se al momento non è ancora del tutto chiaro. Per ora, possiamo creare i nostri GPT in ChatGPT. Questa dipendenza potrebbe essere interrotta in futuro.
Llama 3.1 405b di Meta AI è un nuovo, forte player nel settore dell’intelligenza artificiale. Le sue ottime prestazioni su vari benchmark e la natura open source lo rendono un modello da tenere d’occhio. Mentre l’intelligenza artificiale continua a evolversi, Llama 3.1 405b di Meta AI può svolgere un ruolo importante nel dare forma al futuro dei modelli linguistici e della tecnologia dell’intelligenza artificiale.
Credito immagine in evidenza: Blog di Meta AI
Source: Il Llama 3.1 405b di Meta AI supera i benchmark