OpenAI ha lanciato una nuova applicazione macOS per il suo strumento di codifica Codex, incorporando pratiche agentiche che consentono agli agenti AI di gestire le attività di codifica in modo indipendente. Questa versione segue la tendenza dello sviluppo di software ad agenti, vista in strumenti come Claude Code e Cowork, dove sciami di agenti e subagenti eseguono gran parte del lavoro di programmazione.
L’azienda ha introdotto per la prima volta Codex come interfaccia a riga di comando in aprile, seguita da un’interfaccia web un mese dopo. L’app macOS, presentata lunedì, supporta l’esecuzione di più agenti in parallelo. Integra le competenze degli agenti e i flussi di lavoro avanzati che hanno guadagnato popolarità nell’ultimo anno.
Il lancio arriva meno di due mesi dopo che OpenAI ha rilasciato GPT-5.2-Codex, descritto come il suo modello di codifica più potente. OpenAI mira a questa combinazione per attirare utenti da concorrenti come Claude Code.
Il CEO Sam Altman ha parlato delle capacità del modello durante una conferenza stampa. “Se vuoi davvero fare un lavoro sofisticato su qualcosa di complesso, 5.2 è di gran lunga il modello più forte”, ha detto. “Tuttavia, è stato più difficile da usare, quindi pensiamo che prendere quel livello di capacità del modello e inserirlo in un’interfaccia più flessibile, sarà importante.”
I benchmark di codifica presentano un quadro misto. GPT-5.2 occupa la prima posizione su TerminalBench, che valuta le prestazioni dell’intelligenza artificiale sulle attività di programmazione da riga di comando. Tuttavia, i punteggi di Gemini 3 e Claude Opus sono inferiori ma rientrano nel margine di errore del benchmark. Sul banco SWE, che mette alla prova la capacità dell’intelligenza artificiale di correggere bug software reali, i risultati non mostrano un chiaro vantaggio per GPT-5.2.
I casi d’uso agenti rimangono difficili da valutare in modo accurato. Le esperienze degli utenti con modelli all’avanguardia possono variare in modo significativo.
L’app Codex per macOS introduce diverse nuove funzionalità. Abilita le automazioni in background impostate per l’esecuzione in base a una pianificazione, con i risultati in coda per la revisione da parte dell’utente al momento della restituzione. Gli utenti possono selezionare le personalità dell’agente che vanno dal pragmatico all’empatico per adattarlo al proprio stile di lavoro.
Altman ha sottolineato la velocità di sviluppo dell’app. “Puoi usarlo da un foglio di carta pulito, nuovo di zecca, per creare un software davvero sofisticato in poche ore”, ha affermato. “Il limite massimo di ciò che si può costruire è la velocità con cui riesco a inserire nuove idee.”








