Meta AI: In questo post, spiegheremo cos’è il lama 2 e come usarlo. Meta ha svelato il suo più recente Llama 2 large language model (LLM), che nei test ha superato altri modelli di chat open source (incluso GPT) nella maggior parte dei benchmark, tra cui disponibilità e sicurezza.
Oltre a pubblicare tre modelli alternativi come parte della nuova versione, uno addestrato su 7 miliardi di parametri, uno su 13 miliardi e, infine, una versione da 70 miliardi, Meta AI sta anche rendendo disponibile “Llama 2 Chat”, una variante più raffinata progettato esclusivamente per casi d’uso conversazionali.
Questo è un risultato tecnologico in sé e per sé, ma la cosa più intrigante è che Meta e Microsoft hanno anche annunciato un rafforzamento della loro collaborazione, consentendo agli sviluppatori che utilizzano gli strumenti Microsoft di scegliere tra i modelli GPT di Meta e OpenAI durante la creazione di esperienze AI.
Meta AI: cos’è il lama 2?
L’architettura del trasformatore del modello di linguaggio autoregressivo Llama 2 è stata ottimizzata. L’uso commerciale e accademico in lingua inglese di Llama 2 è previsto. È disponibile in una varietà di varianti pre-addestrate e ottimizzate, nonché dimensioni dei parametri che vanno da 7 miliardi a 70 miliardi.
Secondo Meta, le versioni ottimizzate si adattano alle preferenze umane per la sicurezza e l’utilità tramite la messa a punto supervisionata (SFT) e l’apprendimento per rinforzo con feedback umano (RLHF). 2 trilioni di token di dati provenienti da fonti pubblicamente accessibili sono stati utilizzati per pre-addestrare Llama 2.
Mentre i modelli pre-addestrati possono essere modificati per una serie di attività che generano il linguaggio naturale, i modelli su misura sono progettati per una conversazione simile a un assistente. Qualunque sia il modello scelto da uno sviluppatore, la guida all’utilizzo responsabile di Meta AI può aiutare a dirigere qualsiasi ulteriore messa a punto che potrebbe essere necessaria per personalizzare e ottimizzare i modelli con le adeguate mitigazioni di sicurezza.
Come usare il lama 2?
Ci sono ottime notizie se vuoi giocare a Llama 2 di Meta AI per te stesso. Huggingface ha una versione demo facilmente disponibile. Basta attenersi a questi semplici passaggi:
- Visita questa pagina.
- Quando arrivi al sito Web, scorri verso il basso fino a visualizzare una sezione contrassegnata come “Demo”.
- C’è una finestra di chat lì. Inserisci subito un messaggio.
- Per inviare il tuo messaggio, premi invio.
Tramite SageMaker JumpStart nell’interfaccia utente di SageMaker Studio e SageMaker Python SDK, puoi accedere ai modelli di base. Discuteremo la ricerca di modelli in SageMaker Studio in questa sezione.
Un ambiente di sviluppo integrato (IDE) denominato SageMaker Studio offre un’unica interfaccia visiva basata sul Web tramite la quale è possibile accedere a strumenti creati appositamente per eseguire tutte le attività di sviluppo ML, dalla raccolta dei dati alla creazione, test e distribuzione dei modelli ML. Fare riferimento a Amazon SageMaker Studio per ulteriori informazioni su come installare e configurare SageMaker Studio.
Una volta su SageMaker Studio, fai clic su Soluzioni predefinite e automatizzate per accedere a SageMaker JumpStart, che include modelli pre-addestrati, notebook e soluzioni predefinite.
Puoi cercare soluzioni, modelli, notebook e altre risorse dalla pagina di destinazione JumpStart di SageMaker. Nel carosello Foundation Models: Text Generation, ci sono due importanti modelli Llama 2 tra cui scegliere. Aggiorna la tua versione di SageMaker Studio interrompendola e riprendendola se non riesci a vedere i modelli Llama 2. Fare riferimento a Arresto e aggiornamento delle app di Studio per ulteriori dettagli sugli aggiornamenti della versione.
Selezionando Esplora tutti i modelli di generazione del testo o digitando “lama” nella casella di ricerca, puoi anche individuare le restanti quattro varianti del modello.
Per leggere le informazioni sul modello, inclusa la licenza, i dati di addestramento utilizzati e le istruzioni per l’uso, scegli la scheda del modello. Distribuisci e Apri taccuino sono altri due pulsanti che ti aiutano a usare il modello.
È necessario riconoscere il contratto di licenza con l’utente finale e la politica di utilizzo accettabile in un popup quando si seleziona uno dei pulsanti.
Passerai alla fase successiva per utilizzare il modello dopo averlo riconosciuto.
L’esempio seguente mostra come utilizzare i modelli Llama con l’apprendimento nel contesto di pochi scatti fornendo al modello l’accesso ai dati di addestramento. Tieni presente che traiamo solo conclusioni dal modello che è stato implementato e che i pesi del modello rimangono costanti per tutto il tempo.
Input: Traduci dall’inglese al francese:
lontra marina => loutre de mer
menta piperita => menthe poivrée
peluche giraffa => giraffa peluche
formaggio =>Produzione:
fromage
cioccolato => cioccolato
macchina => voiture
criceto => criceto
birra => birra
bicicletta => biciclettatte
banana => banana
fragola => fragola
pizza => pizza
cheeseburger => cheeseburger
ananas => ananas
carota => carota
anguria => pastèque
balena => balena
melanzana => melanzana
gatto => chattare
pinguino => manchot
leone => leone
elefante => éléphant
panda => panda
tigre => tigre
salmone => salmone
scoiattolo => écureuil
canguro => canguro
tartaruga => tortura
polpo => poulpe
rana => grenouille
maiale => cochon
pesce rosso => poisson rouge
squalo tigre => requin tigre
gorilla => gorilla
dol
Meta AI
La disponibilità di Llama 2 nel IA azzurra libreria di modelli è stata rivelata da Microsoft alla sua conferenza Microsoft Inspire. Ora, i programmatori possono usarlo per creare. Inoltre, è progettato per funzionare localmente su Windows per semplificare i flussi di lavoro per gli sviluppatori di intelligenza artificiale. di AWS Amazon SageMaker L’hub Jumpstart offre anche Llama 2 e seguiranno altri fornitori.
Il lancio di un ecosistema aperto è stato anche rivelato il rapporto tra Microsoft e Meta AI per framework IA intercambiabili. Lo standard ONNX (Open Neural Network Exchange) per i modelli di deep learning è stato annunciato per la prima volta nel 2017 da Meta AI (ex Facebook), ed è allora che è iniziato lo sviluppo.
I due hanno promesso di incoraggiare lo sviluppo dell’IA aperta, in particolare garantendo a più imprese in tutto il mondo l’accesso alla tecnologia AI fondamentale.
Secondo Meta AI, i modelli Llama 2 sono stati sottoposti a un processo di red teaming, in cui i dipendenti avevano il compito di identificare i punti deboli nell’architettura di sicurezza dei modelli e garantirne la sicurezza. Inoltre, sono state utilizzate fonti esterne per creare “suggerimenti contraddittori” per aiutare nella messa a punto del modello.
Lo schema di trasparenza nel ricerca articolo i dettagli di Llama 2 delineano gli svantaggi del modello e il modo in cui Meta intende affrontarli in futuro. Gli utenti di Llama 2 sono tenuti ad aderire a un “uso accettabile” policy, che vieta l’utilizzo del modello per produrre codice dannoso, consentire il trasferimento non autorizzato di informazioni o materiali a minori o produrre contenuti che promuovano il terrorismo. Puoi accedere al elenco completo qui.
Per incoraggiare i programmatori ad adottare il modello linguistico “per risolvere problemi difficili”, Meta ha lanciato il Sfida impatto lamacon ulteriori informazioni a seguire.
Prima di partire, leggi il nostro articolo: 15 migliori idee di intelligenza artificiale per i personaggi per goderti meglio le tue conversazioni
Credito immagine in primo piano: Unsplash.
Source: Meta AI: cos’è il lama 2 e come si usa? • TechIn breve