Nvidia Grace CPU e Nvidia H100 sono state rivelate alla Nvidia GTC 2022. Nvidia ha annunciato oggi la sua architettura GPU Hopper di nuova generazione e la GPU Hopper H100, oltre a un nuovo chip per data center che combina la GPU con una CPU ad alte prestazioni, soprannominata ” Grace CPU Superchip” (da non confondere con gli altri di Nvidia Superchip Grace).
CPU Nvidia Grace: specifiche, prezzo e data di rilascio
Il Superchip GPU Nvidia è il primo tentativo dell’azienda di utilizzare una CPU per data center specializzata. Il chip basato su Arm sarà caratterizzato da 144 core sbalorditivi e 1 terabyte al secondo di larghezza di banda di memoria, secondo le informazioni trapelate da Intel. In realtà combina due CPU Grace collegate tramite l’interconnessione NVLink di Nvidia, che è paragonabile all’architettura M1 Ultra di Apple.
La nuova CPU, che sarà alimentata dalla veloce memoria LPDDR5X, dovrebbe essere consegnata nella prima metà del 2023 e offrirà prestazioni 2 volte superiori rispetto ai server convenzionali. Nvidia prevede che il chip raggiungerà 740 punti nel benchmark SPECrate®2017_int_base, mettendolo testa a testa con i processori per data center AMD e Intel di fascia alta (anche se alcuni di questi ottengono punteggi più alti, ma al costo di prestazioni per watt inferiori ).
“È emerso un nuovo tipo di data center: fabbriche di intelligenza artificiale che elaborano e perfezionano montagne di dati per produrre intelligence. Il Grace CPU Superchip offre le massime prestazioni, larghezza di banda della memoria e piattaforme software NVIDIA in un unico chip e brillerà come la CPU dell’infrastruttura AI del mondo”.
-Jensen Huang, fondatore e CEO di Nvidia
Questo nuovo chip, per molti versi, è la naturale evoluzione del Grace Hopper Superchip e della CPU annunciata lo scorso anno. Il Superchip Grace Hopper combina una CPU e una GPU in un unico design system-on-a-chip. Questo sistema, che debutterà anche nella prima metà del 2023, includerà una GPU di memoria da 600 GB per i modelli di grandi dimensioni e Nvidia afferma che la larghezza di banda della memoria sarà 30 volte maggiore rispetto alla GPU di un server di base. Questi processori, secondo Nvidia, sono destinati all’intelligenza artificiale “su scala gigantesca” e alle applicazioni di calcolo ad alte prestazioni.
Il Grace CPU Superchip è un SoC basato su Arm v9 che può essere utilizzato per creare CPU o server autonomi con un massimo di otto GPU basate su Hopper.
L’azienda indica che sta lavorando con “clienti leader di HPC, supercomputing, hyperscale e cloud”, il che implica che questi sistemi saranno eventualmente disponibili su un provider cloud vicino a te.
Nessuna informazione sul prezzo è stata ancora condivisa.
GPU Nvidia H100: specifiche, prezzo e data di rilascio
Nvidia sta rilasciando una serie di tecnologie nuove e migliorate con Hopper, ma l’enfasi dell’architettura sui modelli di trasformatori, che sono diventati la tecnica di apprendimento automatico preferita per molte applicazioni e che alimentano modelli come GPT-3 e asBERT, potrebbe essere la più essenziale .
Il nuovo Transformer Engine del chip H100 promette di accelerare l’addestramento del modello fino a sei volte, e poiché questa nuova architettura include anche il nuovo sistema NVLink Switch di Nvidia per il collegamento di numerosi nodi, enormi cluster di server alimentati da questi chip saranno in grado di scalare per supportare reti enormi con meno spese generali.
“I modelli di intelligenza artificiale più grandi possono richiedere mesi per essere addestrati sulle piattaforme informatiche odierne. È troppo lento per le aziende. L’intelligenza artificiale, l’elaborazione ad alte prestazioni e l’analisi dei dati stanno crescendo in complessità con alcuni modelli, come quelli di grandi dimensioni, che raggiungono trilioni di parametri. L’architettura NVIDIA Hopper è costruita da zero per accelerare questi carichi di lavoro di intelligenza artificiale di prossima generazione con un’enorme potenza di elaborazione e una memoria veloce per gestire reti e set di dati in crescita”.
-Dave Salvatore
I tensor core dei clienti, che possono combinare precisione a 8 bit e mezza precisione a 16 bit secondo necessità pur rimanendo precisi, vengono utilizzati nel nuovo Motore trasformatore.
Nessuna informazione sul prezzo è stata ancora condivisa.