Viene introdotto Google MusicLM AI, un rivoluzionario sistema di intelligenza artificiale in grado di comporre brani musicali di qualsiasi genere con una descrizione testuale. Nonostante le sue impressionanti capacità, la società ha scelto di peccare per eccesso di cautela e non ha attualmente in programma di renderlo disponibile al pubblico. Sebbene i precedenti sistemi di intelligenza artificiale generativa per la musica, come Riffusion e Dance Diffusion, abbiano tentato di comporre canzoni, sono stati limitati da vincoli tecnici e dati di addestramento insufficienti, risultando in composizioni prive di complessità e alta fedeltà. Tuttavia, Google MusicLM AI rappresenta un significativo balzo in avanti e potrebbe essere il primo sistema a superare queste sfide.
whoa, questo è più grande di ChatGPT per me.
google ha quasi risolto la generazione di musica, direi. https://t.co/s9PQaJ5R6A— Keunwoo Choi (@keunwoochoi) 27 gennaio 2023
Scopri Google MusicLM AI, il primo importante strumento di text-to-music
Un recente carta accademica evidenzia lo sviluppo di MusicLM, un sistema di intelligenza artificiale addestrato su un enorme set di dati composto da 280.000 ore di musica. L’obiettivo del sistema era quello di generare canzoni con “significativa complessità” basate su descrizioni testuali, come “incantevole canzone jazz con un memorabile assolo di sassofono e un cantante solista” o “techno berlinese degli anni ’90 con bassi bassi e cassa forte”. L’output prodotto da Google MusicLM AI, sebbene non necessariamente così fantasioso o musicalmente unificato come un artista umano, possiede comunque una notevole somiglianza con la musica composta dall’uomo.
Sarebbe un eufemismo esprimere quanto sia impressionante l’output prodotto da Google MusicLM AI, in particolare data l’assenza di musicisti o strumentisti umani nel processo di creazione. Nonostante sia dotato di descrizioni a volte lunghe e complesse, MusicLM ha la straordinaria capacità di incorporare elementi intricati come riff strumentali, linee melodiche e sfumature emotive nelle sue composizioni.
Le capacità di Google MusicLM AI vanno oltre la semplice generazione di brevi frammenti musicali. Il team di ricerca di Google ha dimostrato la capacità del sistema di basarsi su melodie preesistenti, siano esse canticchiate, cantate, fischiate o suonate su uno strumento. Inoltre, MusicLM ha la capacità di prendere diverse descrizioni sequenziali e creare una narrazione melodica che dura diversi minuti, rendendola adatta alla colonna sonora di un film.
La versatilità di Google MusicLM AI si estende all’essere diretto attraverso una combinazione di immagini e didascalie, oltre a produrre audio che imita il suono di uno strumento specifico all’interno di un particolare genere. L’esperienza del “musicista” AI può anche essere regolata, consentendo al sistema di generare musica influenzata da vari luoghi, periodi di tempo o scopi specifici, come musica edificante per l’esercizio fisico.
Puoi raggiungere gli AI di Google MusicLM Pagina GitHub per ascoltare alcuni campioni!
Il compositore musicale di Google AI è davvero bravo?
Tuttavia, è importante notare che Google MusicLM AI non è privo di difetti. Alcuni degli output prodotti dal sistema possono mostrare una qualità disgiunta, un risultato naturale della procedura di formazione. La capacità del sistema di generare voci, comprese le armonie corali, è al di sotto delle aspettative. I testi generati spesso non sono comprensibili, costituiti da un inglese stentato o senza senso, e le voci sintetizzate mancano della raffinatezza di un singolo artista e invece suonano come un ibrido di varie voci.
Il nuovo modello musicale di Google MusicLM è la svolta della settimana.
Eccolo in azione.
Basta descrivere la musica e genererà la traccia: pic.twitter.com/xAhzHfGnMH
— Pete (@nonmayorpete) 27 gennaio 2023
Nonostante le sue straordinarie capacità, i ricercatori di Google riconoscono i numerosi dilemmi etici posti da un sistema come MusicLM, inclusa la probabilità di incorporare materiale protetto da copyright dai dati di formazione nelle canzoni generate. Durante la loro sperimentazione, hanno scoperto che circa l’1% della musica generata era una copia esatta delle canzoni del set di dati di addestramento. Questa elevata incidenza di duplicazioni ha portato i ricercatori a decidere di non rilasciare Google MusicLM AI nella sua forma attuale.
“Riconosciamo il rischio di potenziale appropriazione indebita di contenuti creativi associati al caso d’uso. Sottolineiamo con forza la necessità di ulteriori lavori futuri per affrontare questi rischi associati alla generazione di musica “, hanno affermato i coautori dell’articolo.
Se MusicLM o un sistema simile dovesse essere rilasciato in futuro, è probabile che sorgerebbero problemi legali significativi, indipendentemente da come il sistema è commercializzato o posizionato, sia come aiuto agli artisti o meno. Questa è una preoccupazione che è già emersa per quanto riguarda i sistemi di intelligenza artificiale più semplici. Nel 2020, l’etichetta discografica di Jay-Z ha presentato reclami per violazione del copyright contro il canale YouTube, Vocal Synthesis, per aver utilizzato l’intelligenza artificiale per creare cover delle canzoni di Jay-Z, tra cui “We Didn’t Start the Fire” di Billy Joel. Dopo aver inizialmente rimosso i video, YouTube li ha successivamente ripristinati, determinando che le richieste di rimozione erano “incomplete”. La legalità della musica generata dall’intelligenza artificiale rimane un’area grigia.
Google annuncia MusicLM: un modello per generare musica dal testo. Ecco alcune cose folli che può fare:
1. Dato l’audio di una melodia, può generare nuova musica ispirata a quella melodia personalizzata dai suggerimenti! Ecco qualcuno che canticchia bella ciao trasformato in coro a cappella, EDM, ecc. pic.twitter.com/HKDnXI1C8U
—bleedingedge.ai (@bleedingedgeai) 27 gennaio 2023
Mentre la tecnologia AI per la generazione di musica continua ad avanzare, le questioni relative alla sua legalità rimangono in prima linea. Eric Sunray, uno stagista legale presso la Music Publishers Association, ha scritto a carta bianca che sostiene che sistemi come MusicLM violano i diritti protetti dallo United States Copyright Act attraverso la creazione di “tappezzerie di audio coerente” da materiale protetto da copyright utilizzato nella loro formazione.
Queste preoccupazioni hanno trovato eco per quanto riguarda i sistemi di intelligenza artificiale in altri campi, tra cui la generazione di immagini, codice e testo, poiché i loro dati di addestramento provengono spesso dal Web senza il consenso dei creatori. La questione del fair use è stata discussa anche dopo il rilascio di Jukebox di OpenAI, con alcuni dubbi sull’uso di materiale protetto da copyright nell’addestramento dei modelli di intelligenza artificiale.
Come affermato da Andy Baio di Waxy, si ipotizza che la musica generata dai sistemi di intelligenza artificiale possa essere considerata un’opera derivata dal punto di vista dell’utente, offrendo così la protezione del copyright solo ai suoi componenti originali. La definizione di ciò che costituisce “originalità” in questo contesto rimane poco chiara, rendendo lo sfruttamento commerciale di tale musica un territorio inesplorato. Se, tuttavia, la musica generata rientra nell’ambito del fair use come la parodia o il commento, la questione diventa meno complicata. Tuttavia, Baio prevede che il sistema giudiziario dovrebbe adottare un approccio caso per caso per raggiungere un verdetto.
Mentre il panorama legale continua ad evolversi, la chiarezza sulla questione che circonda l’intelligenza artificiale che genera musica potrebbe essere imminente. Diverse cause legali in corso, tra cui una riguardante i diritti degli artisti il cui lavoro viene utilizzato nella formazione dei sistemi di intelligenza artificiale senza la loro autorizzazione o consapevolezza, avranno probabilmente un impatto sul settore. Solo il tempo rivelerà l’esito di questi procedimenti giudiziari.
Hai sentito il nuovo classificatore di testo AI di OpenAI per rilevare i testi generati dall’intelligenza artificiale?
Source: Google MusicLM AI: trasforma il testo in… musica!