MiniMax M2.7 corrisponde ai migliori benchmark di codifica nei test

MiniMax ha rilasciato i pesi del suo modello MiniMax M2.7 il 12 aprile 2023, in mezzo a un’ondata di rilasci a peso aperto da parte dei laboratori cinesi, che hanno avuto un impatto significativo sul panorama competitivo dell’IA.

Questa versione è in linea con una tendenza più ampia in Cina, poiché varie aziende si affrettano a svelare i loro progressi. MiniMax M2.7 è stato annunciato per la prima volta a marzo e ha ottenuto un punteggio del 56,22% sul benchmark SWE-Pro, eguagliando i risultati del GPT-5.3-Codex. Inoltre, ha raggiunto il 55,6% sul benchmark VIBE-Pro, che è quasi alla pari con Opus 4.6 per la consegna di progetti in attività web, mobili e di simulazione. Il modello ha inoltre ottenuto il punteggio ELO più alto, pari a 1.495, nella valutazione GDPval-AA tra i modelli open source.

I pesi di MiniMax M2.7 sono ora disponibili su Hugging Face e supportati sulle piattaforme NVIDIA. Tuttavia, il rilascio ha dovuto affrontare critiche a causa delle restrizioni di licenza che vietano l’uso commerciale senza previa autorizzazione scritta, che secondo alcuni membri della comunità mina la sua classificazione open source. MiniMax ha caratterizzato l’M2.7 come il primo modello a partecipare al proprio ciclo di sviluppo attraverso un processo chiamato “autoevoluzione”.

Il rilascio di MiniMax segue l’open source di Zhipu AI del suo modello GLM-5.1 il 7 aprile, che opera sotto la licenza MIT. Questo modello, contenente 754 miliardi di parametri, può eseguire attività di ingegneria in modo autonomo per un massimo di otto ore. Al contrario, Alibaba ha lanciato il suo modello API proprietario, Qwen 3.6 Plus, il 2 aprile, scatenando speculazioni sul suo impegno nelle pratiche open source. Qwen 3.6 Plus era ancora gratuito su OpenRouter dall’11 aprile, ma la sua disponibilità a lungo termine rimane incerta.

Cresce l’attesa per il modello V4 di DeepSeek, il cui lancio è previsto per la fine di aprile. Il fondatore di DeepSeek, Liang Wenfeng, ha indicato che il modello funzionerà con i chip Ascend di Huawei, sottolineando gli sforzi di autosufficienza della Cina nel settore dei semiconduttori. Si prevede che presenterà circa un trilione di parametri e utilizzerà l’architettura Mixture-of-Experts con una finestra di contesto da un milione di token. Si prevede inoltre che la V4 includa più varianti, come una modalità Vision per il supporto multimodale. Nonostante si siano verificati due ritardi, i primi stress test suggeriscono che un lancio pubblico potrebbe essere imminente.

Credito immagine in primo piano

MiniMax M2.7 corrisponde ai migliori benchmark di codifica nei test

Related Stories

Gli studenti che facevano affidamento sull’intelligenza artificiale ottenevano risultati peggiori negli esami successivi

Samsung distribuisce ChatGPT Enterprise e Codex alla forza lavoro globale

OpenAI afferma che gli errori di salute del ChatGPT gratuito sono diminuiti del 71%.

Adobe espande l’assistente AI Firefly a Premiere, Illustrator e InDesign