OpenAI ha cancellato accidentalmente dati cruciali relativi alla sua causa sul copyright con il New York Times durante procedimenti legali in corso per denunce di violazione del copyright. L’incidente ha coinvolto dati provenienti da macchine virtuali dedicate fornite ai querelanti, che OpenAI ha riconosciuto alla corte in una recente istanza. Di conseguenza, gli avvocati del Times hanno dichiarato di aver perso una settimana di lavoro relativo al caso.
OpenAI affronta una battuta d’arresto per la perdita di dati in una causa con il New York Times
Secondo a lettera del Times‘ team legale, questa perdita di dati ha coinvolto “un’intera settimana di lavoro dei suoi esperti e avvocati” ed è stata “irrimediabilmente persa”. I querelanti stavano indagando sulle affermazioni secondo cui i modelli di OpenAI erano stati addestrati su contenuti non autorizzati. Come parte di questo processo, hanno accumulato dati in oltre 150 ore di ricerca intensiva sui set di dati di addestramento di OpenAI, cercando in particolare casi di violazione del copyright. Un rapporto da TechCrunch ha indicato che la cancellazione è avvenuta il 14 novembre, quando “i programmi e i dati dei risultati di ricerca archiviati su una delle macchine virtuali dedicate sono stati cancellati dagli ingegneri di OpenAI”.
IL afferma il nocciolo della causa che OpenAI, insieme a Microsoft, il suo partner che utilizza la tecnologia OpenAI per il suo chatbot AI Bing, ha violato il copyright del New York Times utilizzando contenuti protetti da paywall senza autorizzazione. Il Times sostiene che i modelli di OpenAI hanno prodotto repliche “quasi letterali” dei suoi articoli, argomentando per i danni. OpenAI ha costantemente confutato queste accuse, sostenendo che la sua formazione era basata su dati disponibili al pubblico, qualificabili come fair use ai sensi delle leggi sul copyright.
Un portavoce di OpenAI ha commentato che l’incidente è stato un “problema tecnico”. Allo stesso tempo, sono riusciti a recuperare con successo la maggior parte dei dati cancellati e gli elementi critici, tra cui “la struttura delle cartelle e i nomi dei file”, rimangono persi e di conseguenza inutilizzabili. Di conseguenza, gli avvocati del Times si trovano ora ad affrontare la sfida di riavviare la raccolta delle prove da zero. Nonostante le circostanze, hanno riferito di “non avere motivo di crederci [the erasure] era intenzionale”, sottolineando che OpenAI è nella posizione migliore per effettuare ricerche nei suoi set di dati. Tuttavia, hanno anche notato la riluttanza dell’azienda a rivelare dettagli sui propri dati di formazione.
A complicare ulteriormente le cose, sono emerse simili rivendicazioni sul copyright contro OpenAI. Una recente causa contro la società da parte di Raw Story e AlterNet è stata archiviata perché i querelanti non hanno potuto fornire prove sufficienti del danno correlato alle loro accuse. Al contrario, Il New York Times Secondo quanto riferito, ha investito oltre 1 milione di dollari in spese legali per portare avanti la sua causa contro OpenAI. Questo impegno finanziario illustra la sfida specifica degli editori più piccoli quando competono con aziende tecnologiche.
OpenAI, d’altra parte, ha recentemente stipulato accordi di licenza con diverse importanti società di media, consentendo l’uso dei loro contenuti per addestrare i suoi modelli di intelligenza artificiale, fornendo così compensi e crediti. I rapporti indicano che OpenAI sta pagando al gigante editoriale Dotdash Meredith almeno 16 milioni di dollari all’anno per i diritti di licenza, riflettendo la sua strategia di ricerca di partnership formali piuttosto che di contenziosi in corso.
Credito immagine: Furkan Demirkaya/Ideogramma
Il post Il problema legale del NewYork Times si aggrava poiché OpenAI elimina accidentalmente dati importanti è apparso per la prima volta su TechBriefly.