TechBriefly IT
  • Tech
  • Business
  • Geek
  • Science
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us
No Result
View All Result
TechBriefly IT
No Result
View All Result
Home Tech
DeepSeek scopre l'identificatore MODEL1 prima del lancio della V4

DeepSeek scopre l'identificatore MODEL1 prima del lancio della V4

byAytun Çelebi
21/01/2026
in Tech
Reading Time: 2 mins read
Share on FacebookShare on Twitter

DeepSeek, una startup cinese di intelligenza artificiale, ha rivelato un nuovo modello, “MODEL1”, nel suo repository di codice FlashMLA su GitHub, apparendo 28 volte su 114 file. La rivelazione coincide con il primo anniversario del rilascio di R1 di DeepSeek. MODEL1 rappresenta un'architettura distinta da DeepSeek-V3.2, nome in codice interno “V32”. L'analisi del codice da parte degli sviluppatori indica cambiamenti nel layout della cache dei valori-chiave, nella gestione della scarsità e nella decodifica del formato dei dati FP8. Queste alterazioni suggeriscono una ristrutturazione mirata per l’ottimizzazione della memoria e l’efficienza computazionale. La divulgazione è avvenuta tramite il repository FlashMLA di DeepSeek, che contiene il kernel di decodifica Multi-Head Latent Attention dell'azienda per le GPU Nvidia Hopper. Gli aggiornamenti al codice sorgente FlashMLA hanno aggiunto il supporto per MODEL1, inclusa la compatibilità con la prossima architettura Blackwell di Nvidia (SM100), secondo i post sulla comunità LocalLLaMA di Reddit. Le modifiche al codice mostrano che MODEL1 ritorna a una dimensione standard 512 unificata e incorpora funzionalità descritte come “Value Vector Position Awareness” e possibili implementazioni del sistema di memoria condizionale “Engram” di DeepSeek. DeepSeek prevede di rilasciare il suo modello V4 di prossima generazione intorno a metà febbraio 2026, in coincidenza con il capodanno lunare il 17 febbraio, secondo L'informazionecome citato da Reuters. Test interni condotti dai dipendenti di DeepSeek suggeriscono che V4 potrebbe sovraperformare i modelli rivali di Anthropic e OpenAI sui benchmark di codifica, in particolare con istruzioni di codice lunghe. Si prevede che il modello V4 integrerà l'architettura Engram di DeepSeek, che consente il recupero efficiente da contesti che superano un milione di token utilizzando un sistema di ricerca per fatti fondamentali. La rivelazione di MODEL1 arriva un anno dopo il debutto di DeepSeek su R1 nel gennaio 2025. Questo evento, definito “momento AI Sputnik” dal venture capitalist Marc Andreessen, ha comportato una riduzione di 593 miliardi di dollari del valore di mercato di Nvidia in un solo giorno, ITPro riportato. Secondo quanto riferito, il modello R1 di DeepSeek è costato meno di 6 milioni di dollari per l'addestramento, ma ha eguagliato o superato il modello o1 di OpenAI sui benchmark matematici e di codifica. La società ha successivamente rilasciato la V3.1 in agosto e la V3.2 a dicembre, con la V3.2 descritta come in grado di offrire prestazioni equivalenti a GPT-5 di OpenAI.


Credito immagine in primo piano

Source: DeepSeek scopre l'identificatore MODEL1 prima del lancio della V4

Related Posts

Google lancia gli esami pratici SAT gratuiti su richiesta tramite Gemini

Google lancia gli esami pratici SAT gratuiti su richiesta tramite Gemini

Snap paga milioni per risolvere la causa sulla dipendenza da adolescenti prima del processo

Snap paga milioni per risolvere la causa sulla dipendenza da adolescenti prima del processo

Il CEO di Anthropic contesta l’approvazione da parte degli Stati Uniti delle vendite di chip AI alla Cina

Il CEO di Anthropic contesta l’approvazione da parte degli Stati Uniti delle vendite di chip AI alla Cina

Netflix presenta un'importante riprogettazione dell'app mobile per combattere TikTok e YouTube

Netflix presenta un'importante riprogettazione dell'app mobile per combattere TikTok e YouTube

Google lancia gli esami pratici SAT gratuiti su richiesta tramite Gemini
Tech

Google lancia gli esami pratici SAT gratuiti su richiesta tramite Gemini

Snap paga milioni per risolvere la causa sulla dipendenza da adolescenti prima del processo
Tech

Snap paga milioni per risolvere la causa sulla dipendenza da adolescenti prima del processo

Il CEO di Anthropic contesta l’approvazione da parte degli Stati Uniti delle vendite di chip AI alla Cina
Tech

Il CEO di Anthropic contesta l’approvazione da parte degli Stati Uniti delle vendite di chip AI alla Cina

Netflix presenta un'importante riprogettazione dell'app mobile per combattere TikTok e YouTube
Tech

Netflix presenta un'importante riprogettazione dell'app mobile per combattere TikTok e YouTube

OpenAI lancia lo strumento di previsione dell'età basato sull'intelligenza artificiale per limitare ChatGPT ai minori
Tech

OpenAI lancia lo strumento di previsione dell'età basato sull'intelligenza artificiale per limitare ChatGPT ai minori

TechBriefly IT

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Modalités et Conditions
  • Politique de Confidentialité
  • Sur Tech Briefly
  • TechBriefly

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • Science
  • How to
  • about
    • Sur Tech Briefly
    • Modalités et Conditions
    • Politique de Confidentialité
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.