Secondo Whale Lab, il lancio di DeepSeek V4 e del nuovo modello Tencent Hunyuan è previsto per aprile 2026.

Questi rilasci simultanei indicano un’accelerazione nello sviluppo dell’intelligenza artificiale (AI) in Cina, con un focus sulle applicazioni pratiche piuttosto che sulle prestazioni di riferimento.

DeepSeek V4 è descritto come un modello multimodale di grandi dimensioni in grado di generare testo, immagini e video. Il modello mira a migliorare le capacità di codifica e la memoria a lungo termine, una sfida nota per i modelli linguistici di grandi dimensioni.

Rapporti precedenti, incluso uno del Financial Times, avevano suggerito una versione di marzo per DeepSeek V4. Una variante più leggera, “V4 Lite”, è apparsa sul sito web di DeepSeek il 9 marzo.

Whale Lab ha riferito che due modelli, “Healer Alpha” e “Hunter Alpha”, sono apparsi sulla piattaforma OpenRouter, il che suggerisce che potrebbero essere le prime versioni di DeepSeek V4. Hunter Alpha è descritto come un modello da trilioni di parametri con una finestra di contesto da un milione di token. Healer Alpha è pubblicizzato come un modello multimodale con ragionamento cross-modale. Nessuna entità ha ufficialmente rivendicato questi modelli.

DeepSeek ha collaborato con Huawei e Cambricon per ottimizzare V4 per i chip AI cinesi nazionali. L’azienda ha inoltre collaborato con Baidu per migliorare le sue funzionalità di ricerca AI.

Il nuovo modello Hunyuan di Tencent sarà guidato da Shunyu Yao, il capo scienziato dell’intelligenza artificiale di Tencent, entrato a far parte del gruppo nel dicembre 2025. Il modello ha circa 30 miliardi di parametri e si concentrerà sull’apprendimento nel contesto e sull’usabilità degli agenti.

Yao, laureato alla Tsinghua University, è noto per il suo lavoro su framework di agenti AI come ReAct e Tree of Thoughts. Secondo Caixin, ha sostenuto il passaggio dal benchmarking alle applicazioni basate su scenari.

Questi rilasci seguono altri lanci di modelli di intelligenza artificiale in Cina da parte di aziende tra cui Alibaba e ByteDance. La corsa del settore si sta intensificando per quanto riguarda le capacità multimodali, la memoria a lungo termine e le prestazioni degli agenti nel mondo reale.


Credito immagine in primo piano