MiniMax ha rilasciato MMX-CLI, un’interfaccia a riga di comando basata su Node.js per la sua piattaforma AI, che consente agli sviluppatori e agli agenti AI di accedere direttamente alle capacità generative.
MMX-CLI affronta le sfide affrontate dagli agenti basati su Large Language Model (LLM), che faticano a generare media senza livelli di integrazione aggiuntivi. La nuova interfaccia consente agli utenti di invocare varie funzioni di generazione multimediale direttamente come comandi shell, eliminando la necessità di protocolli di contesto del modello.
L’interfaccia integra le funzionalità di MiniMax in sette gruppi di comandi: testo mmx, immagine mmx, video mmx, parlato mmx, musica mmx, visione mmx e ricerca mmx. Ogni comando fornisce funzionalità specifiche su misura per sviluppatori e applicazioni AI.
Il comando di testo mmx supporta la chat multigiro e si rivolge a varianti specifiche del modello MiniMax. Per impostazione predefinita utilizza MiniMax-M2.7, consentendo attività avanzate di generazione di testo. Il comando immagine mmx consente la generazione di immagini da istruzioni di testo, fornendo opzioni per le proporzioni e la coerenza del soggetto su più output. Questa funzionalità aiuta i flussi di lavoro che richiedono continuità visiva. Il comando video mmx utilizza MiniMax-Hailuo-2.3 per la generazione video, con opzioni per il polling sincrono o il tracciamento delle attività asincrone. Gli utenti possono specificare un fotogramma di apertura per la generazione del video utilizzando i flag del comando.
Il comando vocale mmx di MMX-CLI presenta oltre 30 voci di sintesi vocale. Consente agli utenti di regolare parametri come velocità, volume e tono supportando al tempo stesso la temporizzazione dei sottotitoli. L’input è limitato a 10.000 caratteri.
Con il comando mmx music, gli utenti possono generare musica da input di testo e definire vari parametri compositivi come genere e strumentazione. Sono incluse anche le opzioni per incorporare filigrane. Il comando mmx vision interpreta le immagini utilizzando un modello di linguaggio visivo, consentendo così agli utenti di informarsi sul contenuto delle immagini tramite prompt.
Il comando mmx search facilita le ricerche sul Web, restituendo risultati in formato testo o JSON. Sia la struttura di comando che l’architettura tecnica sottostante sono ottimizzate per l’usabilità in vari ambienti. MMX-CLI è sviluppato principalmente in TypeScript ed è compatibile con Node.js 18+. La sua implementazione è semplice, con gestione strutturata degli errori e supporto per il routing API a doppia regione.
MiniMax ha affermato che MMX-CLI riduce significativamente le barriere di integrazione per lo sviluppo dell’intelligenza artificiale fornendo uno strumento unificato per diverse capacità di generazione di media. Questo, combinato con la facile configurazione degli agenti AI, semplifica il processo di creazione di applicazioni intelligenti.








