ARM ha presentato le sue tecnologie di processore mobile di prossima generazione, con i dispositivi consumer previsti entro la fine dell’anno. L’azienda sta rivedendo il proprio marchio, gli aggiornamenti dell’architettura e ponendo maggiore enfasi sulle capacità di intelligenza artificiale e ray tracing.

ARM sta cambiando il marchio della sua linea di CPU, sostituendo i core Cortex-X e A con una nuova serie C1 (core Ultra, Performance, Pro e Nano). Anche le GPU Mali vengono rinominate, con la linea Immortalis che lascia il posto ai marchi G1-Ultra, Premium e Pro.

Tutti i nuovi core C1 sono basati sull’architettura ARMv9.3, eliminando la gamma multi-tier Cortex-X. I core C1-Ultra e Performance sostituiscono il Cortex-X925, il C1-Pro sostituisce il Cortex-A725 e il C1-Nano è un rinnovamento del Cortex-A520. Il C1-Performance è una variante più piccola del 35% del C1-Ultra, destinata ai chipset di livello medio-alto con un leggero compromesso in termini di prestazioni.

Il C1-Ultra mostra un guadagno IPC del 12% rispetto al Cortex-X925, con un aumento complessivo delle prestazioni di circa il 25% se si tiene conto di un processo a 3 nm e una velocità di clock più elevata di 4,1 GHz (rispetto ai 3,6 GHz del Cortex-X925). Offre inoltre le stesse prestazioni del suo predecessore consumando il 28% in meno di energia. Ciò è ottenuto attraverso una finestra fuori ordine più ampia (gestendo circa 2.000 istruzioni in volo rispetto alle circa 1.500 dell’X925) e un aumento del 33% della larghezza di banda della cache delle istruzioni L1.

C1-Pro si concentra sui miglioramenti front-end, con un branch predittor e un branch target buffer (BTB) più grandi, una maggiore larghezza di banda dei dati L1 e una latenza TLB L2 inferiore, contribuendo al risparmio energetico. ARM afferma che il C1-Pro offre le stesse prestazioni del Cortex-A725 con una riduzione di potenza del 26% o l’11% di prestazioni in più a parità di potenza. Il C1-Nano offre un aumento del 26% dell’efficienza energetica rispetto al Cortex-A520, con modesti miglioramenti delle prestazioni del 5-8%, poiché è destinato ad attività in background.

Un’aggiunta chiave alle nuove CPU è SME2, ​​l’ultima estensione di ARM per accelerare i carichi di lavoro di machine learning. SME2, ​​che si basa sullo SME originale con istruzioni multivettoriali, compressione del peso e reti binarie, si trova all’esterno del core come unità di esecuzione condivisa. Ciascun core della serie C1 può decodificare le istruzioni SME2 e l’unità può spegnersi quando non viene utilizzata. ARM dichiara una riduzione della latenza di 4,7 volte nel riconoscimento vocale, una codifica dei token 4,7 volte più veloce e un salto prestazionale medio di 3,7 volte su una selezione di altri carichi di lavoro rispetto allo stesso core CPU C1-Pro senza SME2.

La nuova GPU Mali G1-Ultra offre prestazioni migliori del 20% per giochi e inferenza di machine learning, il 9% in meno di energia per fotogramma e un ray tracing fino a 2 volte più veloce rispetto all’Immortalis G925 dell’anno scorso. Il ray tracing 2 volte più veloce è ottenuto tramite il supporto hardware per l’attraversamento BVH e un algoritmo a raggio singolo. L’RTU (Ray Tracing Unit) può essere alimentato quando non viene utilizzato. La GPU G1 è disponibile in diverse versioni del marchio a seconda del numero di core: 10+ core con ray-tracing è un G1-Ultra, 6-9 core è un G1-Premium e 1-5 core è un G1-Pro.

La piattaforma Lumex di ARM mira ad accelerare il time-to-market con soluzioni di piattaforma complete, inclusi progetti pronti per l’integrazione dei chip e collaborazioni più strette con fonderie come TSMC. La piattaforma FPGA Lumex Reference interna dell’azienda suggerisce una configurazione mobile di fascia alta: due core C1-Ultra da 4,1 GHz accoppiati con sei core C1-Pro da 3,5 GHz, due unità SME2, ​​una cache L3 da 16 MB, un Mali-G1 Ultra da 14 core e 16 MB di cache a livello di sistema, il tutto su 3 nm. Per i chipset di punta, ARM suggerisce di sostituire il C1-Ultra con il C1-Premium. I chipset di livello medio potrebbero presentare un singolo core Ultra o Premium abbinato a tre core Pro e quattro core Nano.

L’azienda prevede che MediaTek Dimensity 9500 sarà il primo SoC di punta a sfoggiare i nuovi core CPU C1 di ARM e la GPU G1-Ultra, con la possibilità che anche il Google Tensor G6 del prossimo anno adotti la nuova serie C1.