DeepSeek lancia il modello V4 con un contesto di un milione di parole

DeepSeek ha lanciato il suo nuovo modello di intelligenza artificiale, DeepSeek V4, sostenendo prestazioni migliorate ottimizzate per i chip prodotti a livello nazionale in Cina. Il modello presenta un contesto ultra lungo di un milione di parole, migliorando le capacità dell’agente, la conoscenza del mondo e le prestazioni di ragionamento.

DeepSeek V4 è disponibile in due versioni: DeepSeek V4-Pro e DeepSeek V4-Flash. L’azienda descrive quest’ultima come un’opzione più efficiente ed economica. Secondo DeepSeek, V4-Pro supera significativamente altri modelli open source nei benchmark della conoscenza mondiale ed è solo leggermente superato dal modello closed source di Google, Gemini-Pro-3.1.

La variante V4-Pro include una “modalità di massimo sforzo di ragionamento” progettata per far avanzare le capacità di conoscenza dei modelli open source, affermandosi come uno dei principali contendenti in quello spazio. DeepSeek in precedenza aveva causato una svendita di trilioni di dollari nel mercato azionario con il suo modello precedente, R1, che sfidava i sistemi di intelligenza artificiale come ChatGPT di OpenAI a un costo di sviluppo inferiore.

La versione R1 dello scorso anno ha portato a perdite significative per le principali aziende tecnologiche, con Nvidia che ha subito oltre 500 miliardi di dollari in un solo giorno. Il lancio ha segnato anche la prima grande competizione da parte di un’azienda cinese di intelligenza artificiale contro i colossi tecnologici statunitensi affermati. Il rilascio di DeepSeek arriva nel mezzo delle restrizioni statunitensi all’esportazione di semiconduttori verso la Cina, che colpiscono in particolare le GPU di fascia alta essenziali per lo sviluppo dell’intelligenza artificiale.

Il sistema di chip utilizzato per l’addestramento di DeepSeek V4 non è stato divulgato, ma l’azienda ha dichiarato che supporta sia i chip Nvidia che quelli Huawei. DeepSeek V4 può elaborare fino a 384.000 token, un’unità di dati fondamentale per i modelli AI. Ciò segna un miglioramento significativo rispetto al suo predecessore, V3, che gestiva solo 128.000 token.

L’aggiornamento consente il ragionamento su più documenti, consentendo all’intelligenza artificiale di comprendere interi libri e database di codici completi. L’azienda sostiene che questa capacità rappresenta un “drammatico balzo in avanti nell’efficienza computazionale” e avvia una nuova era per modelli linguistici di grandi dimensioni con contesti lunghi un milione.

DeepSeek V4-Pro supera Gemini-3.1-Pro di Google ma è ancora in ritardo rispetto al modello Claude Opus 4.6 di Anthropic. DeepSeek mira a migliorare ulteriormente l’intelligenza, la robustezza e l’usabilità del modello in varie attività e scenari.

Credito immagine in primo piano

DeepSeek lancia il modello V4 con un contesto di un milione di parole

Related Stories

OpenAI ha approvato il lancio pubblico dei modelli GPT-5.6 il 9 luglio

Meta lancia uno strumento per rilevare immagini generate dall’intelligenza artificiale con filigrana invisibile

Claude Cowork ora può eseguire attività dal tuo telefono

Apple porta controlli vocali Siri più personali nella beta 3