L’integrazione dell’API DALL-E è ora annunciata da OpenAI. Gli sviluppatori potranno utilizzare DALL-E direttamente nelle loro app attraverso questa nuova API.
L’accesso all’API DALL-E è ora nella versione beta pubblica
Come forse già saprai, ultimamente l’accesso a DALL-E 2 è stato reso disponibile a tutti! Tuttavia, con questo nuovo annuncio, GPT-3, Embeddings e Codex sono ora affiancati da DALL-E, un modello di linguaggio trasformatore che consente agli utenti di utilizzare prompt in linguaggio naturale per generare e modificare immagini originali.
“Più di 3 milioni di persone stanno già utilizzando DALL·E per estendere la propria creatività e accelerare i propri flussi di lavoro, generando oltre 4 milioni di immagini al giorno. Gli sviluppatori possono iniziare a costruire con questa stessa tecnologia in pochi minuti”, ha dichiarato OpenAI.
Hanno condiviso questo codice e l’immagine di output come esempio:
- L’output:
Cosa offre l’API DALL-E per gli sviluppatori?
Grazie alla versatilità di DALL-E, gli utenti possono produrre e modificare immagini uniche che vanno dal creativo al fotorealistico. DALL-E è eccellente nell’esecuzione di istruzioni in linguaggio naturale, consentendo agli utenti di specificare esattamente ciò che desiderano visualizzare. Man mano che la ricerca di OpenAI avanza, continuerà ad aggiornare l’API per riflettere gli sviluppi all’avanguardia in termini di qualità dell’immagine, latenza, scalabilità e usabilità.
Moderazione incorporata
Gli sviluppatori possono spedire con sicurezza le loro applicazioni, sapendo che le attenuazioni integrate, come i filtri per i simboli di odio e il sangue, gestiranno gli aspetti difficili della moderazione incorporando le lezioni di fiducia e sicurezza che abbiamo acquisito distribuendo DALL-E a 3 milioni di artisti e utenti a livello globale. Come parte della nostra dedizione all’implementazione responsabile in OpenAI, continueremo a mettere la fiducia e la sicurezza al primo posto in modo che gli sviluppatori possano concentrarsi sulla creazione.
App DALL-E
OpenAI ha collaborato a stretto contatto con un gruppo selezionato di primi utenti che hanno già integrato DALL-E in una gamma di app e prodotti.
Microsoft sta integrando l’API DALL-E in Designer, un nuovissimo strumento di progettazione grafica che consente agli utenti di creare inviti, immagini, cartoline digitali, post sui social media e in modo più professionale.
Inoltre, Microsoft sta integrando l’API DALL-E in Bing e Microsoft Edge con Image Creator, consentendo agli utenti di creare immagini nel caso in cui i risultati Web non forniscano ciò che stanno cercando.
Il primo sistema operativo di moda e lifestyle al mondo si chiama CALA. Dall’ideazione del prodotto fino all’abilitazione all’e-commerce e all’evasione degli ordini, CALA unisce l’intero processo di progettazione in un’unica piattaforma digitale. Gli utenti possono creare nuovi concetti di design dalle foto di riferimento inviate o dalle descrizioni linguistiche naturali utilizzando le nuove tecnologie di intelligenza artificiale di CALA basate sull’API DALL-E.
Anche una startup fotografica in rapida espansione chiamata Mixtiles utilizza l’API DALL-E. Milioni di persone possono realizzare splendide pareti fotografiche con la loro assistenza grazie al software e a un semplice processo di sospensione. Guidando le persone attraverso un processo creativo che cattura i primi ricordi, luoghi fantastici e altro, Mixtiles utilizza l’API DALL-E per generare e incorniciare opere d’arte emotivamente risonanti.
“Siamo entusiasti di vedere cosa faranno i nostri clienti con DALL·E e quali idee creative svilupperanno”, ha affermato OpenAI nella dichiarazione.
Prezzi dell’API DALL-E
La dimensione dell’immagine di output determina il prezzo per l’API DALL-E. Mentre ci sono piccoli sconti per 512 x 512 a $ 0,018/immagine e 256 x 256 a $ 0,016/immagine, 1024 x 1024 costa $ 0,02/immagine.
Lo ha detto Luke Miller, product manager di OpenAI VentureBeat che l’API ha tre funzioni. Gli utenti possono creare un’immagine, modificarne una parte e creare numerose versioni della stessa immagine.
“Puoi pensare che non sia diverso dal processo creativo, inventare idee, scegliere qualcosa e restringere e poi continuare a iterare e trovare qualcosa che si adatta alle tue esigenze e al contesto dato”, ha affermato.
Secondo Rowan Curran, un esperto di intelligenza artificiale e ML presso Forrester Research, sarà “estremamente utile” per gli sviluppatori se l’API DALL-E consente la modifica e il miglioramento delle immagini.
In passato, Curran annotava il costo associato al mantenimento di grandi modelli linguistici come uno dei loro limiti generali. Pertanto, ha affermato che l’API DALL-E “aprirebbe un’intera serie di casi d’uso, in particolare per le startup e le persone che stanno ottenendo finanziamenti iniziali”.
Documentazione API DALL-E
Gli sviluppatori possono leggere l’intera documentazione che spiega l’API DALL-E utilizzando questo collegamento. Quando DALL-E 2 ha introdotto l’outpainting, eravamo davvero entusiasti. Non vediamo l’ora di vedere gli effetti di questo nuovo salto di OpenAI.
Source: La beta pubblica dell’API DALL-E è ora annunciata da OpenAI