Apple continua a lavorare a pieno ritmo sull’intelligenza artificiale. Infine, ha lanciato una nuova serie di modelli di intelligenza artificiale open source chiamati OpenELM (.
Con l’obiettivo di offrire agli utenti la potenza e le funzioni dell’intelligenza artificiale senza la necessità di server cloud, Apple afferma che la caratteristica più importante di questi modelli è che possono funzionare sul dispositivo.
Nel frattempo, di recente abbiamo condiviso con voi le dichiarazioni e i dettagli di Mark Gurman di Bloomberg su AI LLM in iOS 18. Ecco tutto ciò che sappiamo sui nuovi modelli di intelligenza artificiale.
Cos’è OpenELM?
OpenELM è composto da otto modelli. Quattro sono pre-addestrati, mentre altri possono essere personalizzati con istruzioni e input specifici. I modelli sono relativamente piccoli (da 270 milioni a 3 miliardi di parametri) e ottimizzati per funzionare sui dispositivi.
Apple utilizza una strategia di ridimensionamento basata su livelli per migliorare la precisione e l’efficienza dei modelli.
D’altro canto, l’utilizzo dei modelli OpenELM offre numerosi vantaggi:
- Elaborazione AI sul dispositivo: Con i modelli OpenELM, le funzioni AI possono essere eseguite direttamente sul dispositivo senza bisogno di server cloud. Ciò aumenta significativamente sia la privacy che la sicurezza dei dati.
- Costi inferiori: La minore dipendenza dai server cloud si traduce in risparmi sui costi.
- Tempi di risposta più rapidi: L’elaborazione dei dati sul dispositivo consente tempi di risposta più rapidi e un’esperienza utente più fluida.
- Più ricerca e sviluppo: i modelli OpenELM sono open source e consentono a ricercatori e sviluppatori di studiarli e migliorarli. Ciò accelera il progresso della tecnologia AI e lo sviluppo di applicazioni di prossima generazione.
Apple ha fatto quanto segue dichiarazione sui nuovi modelli linguistici:
La riproducibilità e la trasparenza dei modelli linguistici di grandi dimensioni sono cruciali per far avanzare la ricerca aperta, garantire l’affidabilità dei risultati e consentire indagini sui dati e sulle distorsioni dei modelli, nonché sui potenziali rischi. A tal fine, rilasciamo OpenELM, un modello di linguaggio aperto all’avanguardia. OpenELM utilizza una strategia di ridimensionamento a livello per allocare in modo efficiente i parametri all’interno di ciascun livello del modello del trasformatore, garantendo una maggiore precisione. Ad esempio, con un budget di parametri pari a circa un miliardo di parametri, OpenELM presenta un miglioramento della precisione del 2,36% rispetto a OLMo richiedendo al contempo un numero di token di pre-addestramento due volte inferiore.
Divergendosi dalle pratiche precedenti che fornivano solo pesi del modello e codice di inferenza e pre-addestramento su set di dati privati, la nostra versione include il framework completo per l’addestramento e la valutazione del modello linguistico su set di dati disponibili pubblicamente, inclusi registri di addestramento, checkpoint multipli e pre-addestramento configurazioni. Rilasciamo anche il codice per convertire i modelli nella libreria MLX per l’inferenza e la messa a punto sui dispositivi Apple. Questa versione completa mira a potenziare e rafforzare la comunità di ricerca aperta, aprendo la strada a futuri sforzi di ricerca aperta.
Inoltre, se vuoi saperne di più su OpenELM, puoi controllare questo rapporto dettagliato.
I piani di Apple includono la disponibilità dei modelli OpenELM nel sistema operativo iOS 18. Si prevede che iOS 18 includa significativi miglioramenti incentrati sull’intelligenza artificiale e esegua un modello linguistico di grandi dimensioni (LLM) sul dispositivo.
I modelli OpenELM sono considerati un passo importante per il futuro dell’intelligenza artificiale. Con i nuovi modelli, si prevede che l’intelligenza artificiale diventerà più privata, sicura e accessibile.
La mossa di Apple potrebbe essere importante per diffondere l’intelligenza artificiale e integrarla in ogni aspetto della vita quotidiana.
Credito immagine in primo piano: Keming Tan/Unsplash
Source: Apple rilascia una nuova serie di modelli AI open source chiamati OpenELM