È stato introdotto un nuovo standard di licenza, Really Simple Licensing (RSL), per consentire agli editori web di definire i termini in base ai quali gli sviluppatori di sistemi di intelligenza artificiale possono utilizzare i loro contenuti. L’iniziativa mira a stabilire un quadro per le società di intelligenza artificiale per compensare gli editori per l’utilizzo dei loro dati per addestrare modelli di intelligenza artificiale.
Mercoledì, importanti organizzazioni tra cui Reddit, Yahoo, Medium, Quora e People Inc. hanno annunciato il loro supporto allo standard RSL, un protocollo di licenza di contenuto aperto. Questo standard consente agli editori di specificare come i bot dovrebbero pagare per recuperare i dati di addestramento dell’intelligenza artificiale dai loro siti, con l’obiettivo di influenzare collettivamente le società di intelligenza artificiale ad adottare il quadro.
Lo standard RSL espande il protocollo robots.txt esistente, che storicamente ha consentito agli editori di istruire i web crawler su quali parti del loro sito possono e non possono accedere. RSL migliora tutto ciò consentendo ai siti Web di includere termini di licenza e royalty all’interno del file robots.txt. Questi termini possono anche essere incorporati in libri, video e set di dati di formazione online, consentendo agli editori di chiedere un compenso per il loro utilizzo.
Dietro lo standard RSL c’è RSL Collective, un’organizzazione per i diritti recentemente costituita. È guidato da Eckart Walther, co-creatore dello standard Really Simple Syndication (RSS) ed ex CEO di CardSpring, e Doug Leeds, ex CEO di IAC Publishing e Ask.com. Walther ha dichiarato: “L’obiettivo è creare un nuovo modello di business scalabile per il web. RSL prende alcune di quelle prime idee RSS e crea un nuovo livello per l’intera Internet in cui vengono definiti i diritti di licenza e i diritti di compensazione”.
Lo standard RSL supporta vari modelli di licenza, comprese le opzioni gratuite. I proprietari dei siti possono richiedere che le società di intelligenza artificiale paghino una quota di abbonamento o una tariffa di pagamento per scansione tramite lo standard RSL, che verrebbe addebitata ogni volta che un bot AI esegue la scansione del sito web. Inoltre, è possibile implementare una tariffa pay-per-inference, consentendo ai siti di ricevere un compenso quando un modello di intelligenza artificiale fa riferimento al loro lavoro per generare una risposta. I bot che eseguono la scansione dei siti per altri scopi, come l’archiviazione o l’inclusione nei motori di ricerca, possono continuare normalmente.
Diverse società di media, tra cui Vox Media (società madre di The Verge), News Corp (proprietaria del Wall Street Journal) e The New York Times, hanno già stabilito accordi di licenza con singole società di intelligenza artificiale come OpenAI e Amazon. Il collettivo RSL mira a semplificare questo processo, consentendo a qualsiasi proprietario o creatore di siti Web di ricevere il pagamento per il proprio lavoro senza negoziare accordi separati.
Il successo di RSL dipende dall’adozione da parte dei principali attori del settore, in particolare delle aziende di intelligenza artificiale. I costruttori di modelli di intelligenza artificiale sono stati accusati di ignorare i file robots.txt dei siti e attualmente non esiste un metodo semplice per tenere traccia delle tariffe di inferenza senza la loro collaborazione. Il collettivo RSL conta sull’influenza collettiva dei principali editori web per rendere più allettante l’adozione dello standard. Leeds ha dichiarato: “Il nostro compito è uscire e convincere un grande gruppo di persone a dire che è nel tuo interesse, sia in modo efficiente, perché puoi negoziare con tutti contemporaneamente, sia legalmente, perché se non lo fai, stai violando tutti in una volta.”
A differenza dei sistemi come il “pay per crawl” di Cloudflare, lo standard RSL da solo non può impedire ai bot di visitare un sito web. Il collettivo RSL sta collaborando con Fastly, una rete di distribuzione di contenuti, per controllare l’accesso dei bot AI ai siti Web in base al fatto che abbiano accettato di concedere in licenza i contenuti. Leeds ha descritto Fastly come “il buttafuori alla porta del club, e non lasciano entrare le persone a meno che non abbiano la carta d’identità giusta. RSL sta rilasciando le carte d’identità. Quindi diciamo: ‘Ehi, hai accettato di concedere in licenza questo contenuto’, e Fastly dice: ‘Dai, fai il check-out con la tua carta d’identità.'” Gli editori che non utilizzano Fastly possono comunque chiedere alle società di intelligenza artificiale di concedere in licenza i loro contenuti, ma non saranno in grado di bloccare i crawler di intelligenza artificiale finché altri fornitori non avranno sviluppato una soluzione.
Leeds ritiene che il Collettivo RSL possa far rispettare legalmente le licenze, affermando che “tutti i partecipanti all’organizzazione collettiva per i diritti partecipano all’applicazione di qualsiasi violazione”, distribuendo così le spese legali. Ha paragonato questo sistema alle organizzazioni per i diritti digitali esistenti, come il gruppo per i diritti musicali ASCAP, che raccoglie e distribuisce i costi di licenza ai suoi membri. Mentre le licenze musicali convenzionali beneficiano di un forte precedente legale per la protezione del copyright, lo scraping non autorizzato e l’uso dei media per l’addestramento dei sistemi di intelligenza artificiale rimangono in un’area grigia dal punto di vista legale. I principali attori dell’intelligenza artificiale stanno attualmente affrontando azioni legali da parte di entità come Reddit, Getty Images e vari editori online.
Leeds e Walther hanno dichiarato: “C’è sempre stata la questione se i bot abbiano accettato termini che non vedono. RSL cambia la situazione in modo fondamentale, avvisando i crawler di quali sono i termini prima che accedano a un sito”.
Leeds spera che il sistema crei un modo intuitivo per navigare tra le licenzesing funziona per la formazione sull’intelligenza artificiale, affermando: “Quello che stiamo facendo non è reinventare le ruote o inventare le ruote: le stiamo solo portando in un luogo in cui non esistevano prima. Il motivo per cui non esistevano qui prima è perché non hanno avuto uno standard su cui poter costruire. Ecco perché RSL Standard è così importante: fornisce l’infrastruttura per creare le cose che hanno funzionato in ogni altro settore dei media che non è ancora successo.”
L’adesione di editori e creatori a RSL Collective è gratuita. Anche altri marchi importanti come O’Reilly, wikiHow e Ziff Davis (proprietario di IGN) si sono uniti all’organizzazione.








