DeepSeek ha annunciato significative riduzioni di prezzo per il suo servizio API sabato, poco dopo il rilascio del suo modello di linguaggio di grandi dimensioni V4 il 24 aprile 2023. La riduzione dei prezzi riduce le tariffe per la cache di input a un decimo delle tariffe precedenti e offre uno sconto del 75% sul modello V4-Pro fino al 5 maggio 2023.

Il prezzo di successo della cache di input del V4-Pro è sceso a 0,025 yuan (circa 0,0036 dollari) per milione di token. I prezzi standard durante il periodo promozionale sono fissati a 3 yuan per l’input e 6 yuan per l’output per milione di token. Questa strategia di prezzo mina nettamente i concorrenti, con modelli di Anthropic, OpenAI e Google che costano tra $ 12 e $ 25 per milione di token, secondo i dati di OpenRouter.

DeepSeek ha lanciato V4-Pro e V4-Flash in anteprima, segnando il primo lancio significativo del modello dell’azienda dalla sua versione V3.2 nel dicembre 2022. V4-Pro ha 1,6 trilioni di parametri e 49 miliardi di parametri attivi per passaggio di inferenza, rendendolo il più grande modello open-weight attualmente disponibile. V4-Flash presenta una configurazione più piccola con 284 miliardi di parametri.

Anche prima dei recenti tagli, i prezzi standard di V4-Pro erano di 1,74 dollari per l’input e 3,48 dollari per l’output per milione di token, ovvero circa il 98% in meno rispetto al prezzo del GPT-5.5 Pro di OpenAI. Gli ultimi sconti ampliano ulteriormente questo vantaggio competitivo.

In un contesto di aumento dei costi della potenza di calcolo nel settore dell’intelligenza artificiale, la strategia di DeepSeek si allinea con una tendenza più ampia di riduzione dei prezzi all’interno del settore. Secondo un rapporto di Gelonghui, la società ha abbracciato pienamente il concetto di “riduzione del prezzo dell’intelligenza artificiale”.

In particolare, V4 funziona su hardware Huawei Ascend invece che su chip Nvidia, il che, secondo gli osservatori, potrebbe favorire l’adozione nazionale dei sistemi di intelligenza artificiale. Wei Sun, principale analista di intelligenza artificiale presso Counterpoint Research, ha indicato che questo sviluppo consente l’implementazione di sistemi di intelligenza artificiale senza fare affidamento esclusivamente su Nvidia, accelerando potenzialmente i progressi dell’intelligenza artificiale sia nazionali che globali.

V4-Pro dimostra un’efficienza significativa, richiedendo solo il 27% della potenza di calcolo del suo predecessore, V3.2, per una finestra di contesto da un milione di token. Nonostante i suoi progressi, DeepSeek riconosce che V4 rimane indietro rispetto a modelli leader come GPT-5.4 e Gemini 3.1 Pro di circa tre-sei mesi in termini di prestazioni, come affermato nel documento tecnico dell’azienda.


Credito immagine in primo piano