Microsoft ha lanciato “MAI-Transcribe-1”, un modello di trascrizione AI che raggiunge la precisione del parlato in testo in 25 lingue ampiamente parlate. Il modello mira a servire applicazioni come riunioni, sottotitoli e dettatura.

MAI-Transcribe-1 sarà reso disponibile su Microsoft Foundry insieme ad altri modelli, MAI-Voice-1 e MAI-Image-2. Microsoft ha affermato che questo lancio consente “i modelli MAI [di] diventare ampiamente disponibili per uso commerciale per la prima volta”, consentendo ai clienti di valutare e creare applicazioni che sfruttano l’intelligenza artificiale nella trascrizione, nella voce e nella generazione di immagini.

MAI-Voice-1 offre una generazione vocale iperrealistica che mantiene l’identità del parlante e le sfumature emotive attraverso i contenuti estesi. Include una funzionalità di suggerimento vocale in grado di sviluppare voci personalizzate del marchio da un solo minuto di audio registrato.

Nel frattempo, MAI-Image-2 è un nuovo modello di generazione di testo in immagine che eccelle nel rendering dell’illuminazione naturale, nelle tonalità della pelle precise e nel testo chiaro all’interno delle immagini. Questo modello si è classificato tra i primi tre nella classifica testo-immagine di Arena.ai.

Microsoft continua a ridurre la propria dipendenza dalla tecnologia OpenAI. L’azienda ha criticato GPT-4 per i costi elevati e i tempi di risposta lenti. Pertanto, Microsoft ha avviato lo sviluppo dei propri modelli IA interni e sta valutando modelli di terze parti per la sua funzionalità Copilot.

Mustafa Suleyman, CEO dell’intelligenza artificiale di Microsoft, ha confermato l’attenzione allo sviluppo di modelli di intelligenza artificiale “fuori frontiera”, sottolineando che non raggiungeranno la sofisticazione delle offerte di OpenAI. La recente ristrutturazione della leadership di Copilot di Microsoft ha portato alla formazione di quattro divisioni: esperienza Copilot, piattaforma Copilot, app Microsoft 365 e modelli di intelligenza artificiale. Jacob Andreou, ex dirigente di Snap, guiderà la divisione Copilot Experiences e riporterà al CEO di Microsoft Satya Nadella.

Il CEO di Salesforce, Marc Benioff, aveva precedentemente affermato che Microsoft probabilmente smetterebbe di utilizzare la tecnologia OpenAI, sottolineando le sfide affrontate da OpenAI, incluso l’abbandono del suo progetto Stargate da 500 miliardi di dollari volto a costruire data center negli Stati Uniti.


Credito immagine in primo piano