OpenAI e Microsoft affrontano cause legali per materiale con copyright utilizzato nell’addestramento dell’intelligenza artificiale

OpenAI afferma che allenare i migliori modelli di IA attuali senza utilizzare materiali protetti da copyright è impossibile.

OpenAI riconosce che non è fattibile addestrare in modo efficace modelli AI generativi senza utilizzare contenuti protetti da copyright.

OpenAI, con il supporto del suo principale finanziatore Microsoft, è attualmente coinvolta in una serie di cause legali che li accusano di utilizzare opere protette da copyright senza autorizzazione per addestrare i loro modelli di linguaggio di grandi dimensioni (LLM). In una svolta intrigante, OpenAI ha dichiarato che sarebbe “impossibile addestrare i modelli AI di punta di oggi senza utilizzare materiali protetti da copyright”. Nelle prove scritte presentate alla Camera dei Lord per il Comitato di comunicazione e selezione digitale, OpenAI ha spiegato che la protezione del copyright ora comprende una vasta gamma di espressioni umane, tra cui post di blog, fotografie, codice software e documenti governativi. Nonostante OpenAI sostenga di rispettare le leggi sul copyright, questa rivelazione potrebbe aprire le porte a future cause legali contro i giganti tecnologici.

Le sfide affrontate da OpenAI e Microsoft ruotano attorno all’immensità dei materiali protetti da copyright e alla loro dipendenza da essi per un addestramento efficace dei modelli AI. OpenAI sostiene che addestrare i modelli AI esclusivamente su libri di dominio pubblico e disegni centenari non soddisferebbe le esigenze della società contemporanea. Sebbene il loro approccio di utilizzare materiali disponibili pubblicamente su Internet rientri nella dottrina dell’uso equo, i critici sostengono che dovrebbero compensare gli autori per il loro lavoro, considerando il sostanziale guadagno finanziario che hanno tratto da questi materiali protetti da copyright.

Potenziare i creatori ed esplorare alternative

OpenAI riconosce che c’è spazio per migliorare il supporto e l’abilitazione dei creatori. L’azienda è attivamente impegnata nello sviluppare meccanismi che consentano ai titolari dei diritti di escludersi dall’addestramento. Inoltre, OpenAI sta collaborando strettamente con gli editori per stabilire accordi reciprocamente vantaggiosi. Ad esempio, OpenAI consente agli editori di bloccare il web crawler GPTBot dall’accesso ai loro siti web, dimostrando il loro impegno nel affrontare le preoccupazioni sollevate dai creatori di contenuti.

Cause legali e risposte

Diverse cause legali sono state presentate contro OpenAI e Microsoft, sollevando accuse di utilizzo non autorizzato di materiali protetti da copyright. In risposta, OpenAI non ha affrontato direttamente queste specifiche cause legali, ma ha smentito le affermazioni del New York Times riguardo all’utilizzo dei suoi articoli di notizie pubblicati senza autorizzazione. OpenAI afferma che le trattative erano in corso per una “partner di alto valore” che avrebbe dato loro accesso alle notizie del Times. L’azienda sostiene che il Times ha manipolato intenzionalmente gli input per ottenere estratti letterali da articoli a pagamento. OpenAI ritiene che la causa intentata dal Times sia priva di merito, enfatizzando il suo desiderio di una partnership costruttiva con il giornale.

Q&A: Affrontare le preoccupazioni e la curiosità dei lettori

D: Come addestra OpenAI i suoi modelli di linguaggio di grandi dimensioni?

OpenAI addestra i suoi modelli utilizzando una grande quantità di dati che include diverse forme di espressione umana, come post di blog, fotografie, discussioni in forum e persino documenti governativi. Questi estesi dati di addestramento consentono ai modelli di comprendere e generare risposte testuali simili a quelle umane.

D: È possibile addestrare modelli AI senza utilizzare materiali protetti da copyright?

OpenAI suggerisce che sia praticamente impossibile addestrare modelli AI di punta senza utilizzare materiali protetti da copyright. L’immensità e la diversità dei contenuti protetti da copyright forniscono informazioni e contesto cruciali affinché i modelli di linguaggio sviluppino il livello desiderato di comprensione e generino risposte pertinenti.

D: OpenAI e Microsoft sono protetti legalmente dalla dottrina dell’uso equo?

OpenAI sostiene che il loro utilizzo di materiali disponibili pubblicamente su Internet per l’addestramento dell’AI rientri nei limiti dell’uso equo. Tuttavia, l’uso equo è un principio legale complesso che richiede un’analisi caso per caso. Le cause legali in corso contro OpenAI e Microsoft determineranno alla fine la legittimità dei loro casi specifici.

D: Come sta affrontando OpenAI le preoccupazioni dei creatori di contenuti?

OpenAI riconosce la necessità di supportare ed abilitare i creatori. L’azienda sta lavorando attivamente su meccanismi che consentano ai titolari dei diritti di escludere l’utilizzo dei loro contenuti per l’addestramento dei modelli AI. OpenAI sta anche dialogando con gli editori per stabilire accordi che affrontino le preoccupazioni dei creatori di contenuti continuando ad avanzare nelle tecnologie AI.

Guardando avanti: Impatto e Sviluppi Futuri

Le cause legali contro OpenAI e Microsoft segnalano un punto di svolta significativo nell’utilizzo di materiali protetti da copyright per l’addestramento dell’AI. Mentre le battaglie legali si svolgono, gli esiti avranno implicazioni di vasta portata per il futuro dello sviluppo dell’AI. Trovare un equilibrio tra i diritti dei creatori di contenuti e l’avanzamento della tecnologia dell’AI è fondamentale.

È imperativo per ricercatori, responsabili delle politiche e professionisti del settore esplorare approcci alternativi per la formazione dei modelli di intelligenza artificiale al fine di garantire un ecosistema equo e sostenibile. Ciò potrebbe implicare sforzi collaborativi per creare set di dati di formazione liberamente disponibili o stabilire modelli di reddito condivisi che compensino i creatori di contenuti per i loro contributi.

In conclusione, le cause legali contro OpenAI e Microsoft indicano l’importanza crescente della protezione del copyright nell’era dell’intelligenza artificiale. Mentre queste battaglie legali sono in corso, rappresentano un’opportunità per conversazioni e dibattiti a livello industriale sul quadro etico e legale che circonda la formazione dell’AI. Affrontando le preoccupazioni dei creatori di contenuti e lavorando per trovare soluzioni equilibrate, l’industria può continuare a prosperare nel rispetto dei diritti di coloro che generano contenuti di valore.

📢 Ti sei mai chiesto dell’intersezione tra intelligenza artificiale e diritto d’autore? Attualmente OpenAI e Microsoft si trovano di fronte a cause legali per l’uso di materiali coperti da copyright nella formazione dei loro ampi modelli linguistici. Scopri di più sulle battaglie legali e sulle implicazioni per il futuro dell’AI nel mio ultimo articolo! Non dimenticare di condividere le tue opinioni e diffondere la notizia. #AI #dirittod’autore