Secondo i dati settimanali pubblicati il 24 febbraio 2026, i modelli linguistici di grandi dimensioni realizzati in Cina rappresentano ora il 61% del consumo totale di token su OpenRouter, la più grande piattaforma di aggregazione API LLM al mondo. I tre modelli più utilizzati sulla piattaforma sono stati tutti sviluppati da laboratori di intelligenza artificiale cinesi.
MiniMax M2.5 ha conquistato il primo posto con 2,45 trilioni di token consumati in una sola settimana, con un aumento del 197% rispetto alla settimana precedente. Kimi K2.5 di Moonshot AI è seguito con 1,21 trilioni di token, anche se il suo utilizzo è diminuito del 20% su base settimanale. GLM-5 di Zhipu AI si è classificato terzo con 780 miliardi di token dopo un aumento del 158%. DeepSeek V3.2 si è classificato al quinto posto tra tutti i modelli sulla piattaforma. Insieme, i modelli cinesi hanno rappresentato 5,3 trilioni degli 8,7 trilioni di token consumati dai primi 10 modelli della piattaforma.
L’aumento nell’utilizzo di MiniMax M2.5 è stato in parte determinato dall’accesso promozionale gratuito. Kilo Code, uno strumento di codifica basato sull’intelligenza artificiale, ha offerto il modello gratuitamente per una settimana a partire dal 12 febbraio. Cline, un altro strumento di sviluppo, ha lanciato una promozione simile.
MiniMax M2.5 ottiene un punteggio dell’80,2% su SWE-Bench Verified, posizionandosi a un punto dal Claude Opus 4.6 di Anthropic all’80,8%.
La programmazione è diventata la più grande categoria di consumo di token su OpenRouter, passando dall’11% a oltre il 50% dei token totali entro il 2025. I flussi di lavoro guidati da agenti, in cui i modelli eseguono autonomamente attività in più fasi, ora rappresentano più della metà di tutti i token di output sulla piattaforma.
Il COO di OpenRouter, Chris Clark, ha affermato che i modelli open-weight cinesi sono sproporzionatamente pesanti nei flussi di agenti gestiti dalle aziende statunitensi. Tutti e tre i modelli cinesi di punta di questa settimana sono ottimizzati per la codifica e l’automazione degli agenti.
Il costo rimane un fattore determinante. MiniMax M2.5 addebita 0,30 dollari per milione di token di input e 1,10 dollari per milione di token di output. GLM-5 ha un prezzo di 0,30 dollari per milione di token di input e 2,55 dollari per milione di token di output. In confronto, Claude Opus 4.6 costa 5 dollari per milione di token di input e 25 dollari per milione di token di output, circa 10-20 volte più costoso.
Il consumo totale settimanale di token di OpenRouter ha raggiunto circa 12,1 trilioni, un aumento di 12,7 volte rispetto a un anno fa. La piattaforma, fondata dall’ex CTO di OpenSea Alex Atallah, fornisce un gateway API unificato per oltre 400 modelli di oltre 60 fornitori.
Martin Casado, partner di Andreessen Horowitz, ha stimato che circa l’80% delle startup che utilizzano stack IA open source utilizzano modelli cinesi. Il MIT Technology Review ha riferito che l’adozione dei modelli cinesi a peso aperto sta accelerando nella Silicon Valley.







