Il New York Times fa causa a OpenAI e Microsoft per violazione del copyright

Il New York Times intenta una causa legale contro OpenAI e Microsoft per aver presumibilmente addestrato modelli di intelligenza artificiale utilizzando materiale soggetto a copyright del Times

Il New York Times (NYT), il prestigioso giornale noto per il suo giornalismo premiato, ha intrapreso un’azione legale contro OpenAI e il suo investitore, Microsoft. Il Times sostiene che queste aziende abbiano violato le leggi sul copyright utilizzando milioni di articoli del NYT per addestrare i loro modelli AI generativi, tra cui il popolare ChatGPT di OpenAI e il Copilot di Microsoft, senza ottenere il consenso.

Nella sua causa legale, presentata presso il Tribunale distrettuale federale a Manhattan, il Times chiede che i modelli AI e i dati di addestramento contenenti il materiale non autorizzato siano distrutti. Inoltre, il Times chiede “miliardi di dollari in danni statutari ed effettivi” per l’uso illecito dei loro preziosi contenuti.

Il Times sottolinea l’importanza del giornalismo indipendente e avverte che se le organizzazioni giornalistiche non possono proteggere il loro lavoro, ci sarà una significativa perdita per la società. Nella denuncia si afferma che le azioni di OpenAI e Microsoft minano il giornalismo e ostacolano la produzione di notizie approfondite.

In risposta alla causa, un portavoce di OpenAI ha dichiarato che rispettano i diritti dei creatori di contenuti e hanno intrattenuto conversazioni produttive con il New York Times. OpenAI spera di trovare una soluzione mutuamente vantaggiosa, come hanno già fatto con altri editori.

I modelli AI generativi imparano analizzando esempi e creando nuovi contenuti, tra cui saggi, codice, e-mail e articoli. Aziende come OpenAI raccolgono enormi quantità di dati dal web, alcuni dei quali potrebbero essere soggetti a restrizioni sul copyright. Mentre i fornitori sostengono che la dottrina del fair use protegge le loro pratiche di web scraping, i detentori dei diritti d’autore, comprese le organizzazioni giornalistiche, non sono d’accordo.

Questo conflitto tra fornitori e detentori dei diritti d’autore ha portato a numerose battaglie legali. Ad esempio, l’attrice Sarah Silverman e diversi scrittori famosi hanno accusato Meta, la casa madre di OpenAI, di utilizzare il loro lavoro senza autorizzazione. Inoltre, i programmatori hanno intentato una causa contro Microsoft, OpenAI e GitHub, sostenendo che Copilot è stato sviluppato utilizzando il loro codice protetto.

La causa intentata dal New York Times rappresenta un caso importante nella continua disputa legale tra fornitori di AI generativa e detentori dei diritti d’autore. La causa mette in luce il potenziale danno causato alla reputazione del Times dai modelli AI che generano informazioni false o inventate. Nel reclamo si evidenziano casi in cui il Bing Chat di Microsoft (ora Copilot) ha fornito informazioni errate suppostamente tratte dal Times.

La causa solleva anche preoccupazioni riguardo a questi modelli AI che competono con gli editori di notizie fornendo informazioni esclusive senza richiedere una sottoscrizione. Questa pratica riduce le opportunità di guadagno, in quanto i contenuti generati dall’AI mancano di citazioni, monetizzazione e link di affiliazione utilizzati dal Times per generare commissioni.

I modelli AI generativi a volte “rigurgitano” i dati di addestramento, riproducendo essenzialmente i contenuti in maniera letterale. In un caso, OpenAI ha involontariamente permesso agli utenti di ChatGPT di aggirare i paywall e accedere a contenuti notiziari restritti.

Il New York Times accusa OpenAI e Microsoft di sfruttare il loro investimento nel giornalismo senza fornire alcuna compensazione. Il reclamo suggerisce che queste aziende stiano costruendo concorrenti degli editori di notizie, sottraendo efficacemente pubblico e danneggiando il business del Times.

Questa disputa riflette un problema più ampio che gli editori affrontano con aziende come Google. Recentemente, gli editori hanno intentato una causa contro Google, sostenendo che i suoi esperimenti AI, come il chatbot Bard e l’esperienza generativa di ricerca, deviano il traffico e i ricavi pubblicitari dagli editori attraverso pratiche anticoncorrenziali. Uno studio condotto da The Atlantic ha scoperto che i motori di ricerca basati su AI potrebbero rispondere alle domande degli utenti senza richiedere loro di cliccare sui siti degli editori, potenzialmente riducendo il traffico fino al 40%.

Anche se gli editori hanno preoccupazioni legittime, l’esito di queste cause rimane incerto. Heather Meeker, esperta di proprietà intellettuale, ha paragonato l’azione di indurre modelli AI generativi a copiare contenuti all’uso di un elaboratore di testi per tagliare e incollare. Meeker ritiene che la maggior parte di queste cause possa fallire perché alla fine è responsabilità dell’utente se intenzionalmente fa copiare contenuto protetto al modello AI.

Al posto di impegnarsi in battaglie legali, alcuni organi di stampa hanno scelto di collaborare con fornitori di AI generativa stipulando accordi di licenza. Ad esempio, l’Associated Press e Axel Springer hanno negoziato accordi con OpenAI.

Il New York Times ha cercato di raggiungere un accordo di licenza con Microsoft e OpenAI ad aprile. Purtroppo, i negoziati non hanno portato al risultato desiderato, dando luogo alla causa attuale.

Vale la pena notare che questa causa serve da campanello d’allarme, evidenziando la necessità di linee guida chiare e regolamenti riguardanti l’utilizzo di contenuti con copyright nell’addestramento di modelli AI. Bilanciare i benefici dell’AI generativa con la protezione della proprietà intellettuale presenta sfide significative e richiede la collaborazione tra fornitori, creatori e legislatori.

Content Q&A

D: Perché il New York Times sta citando in giudizio specificamente OpenAI e Microsoft? R: Il New York Times sostiene che OpenAI e Microsoft abbiano utilizzato milioni di articoli del NYT senza autorizzazione per addestrare i loro modelli AI generativi, causando un possibile danno al marchio e al ricavo del Times.

Q: Cosa sono i modelli di intelligenza artificiale generativa e come imparano? A: I modelli di intelligenza artificiale generativa imparano analizzando esempi e creando nuovi contenuti. Questi modelli, come il ChatGPT di OpenAI e il Copilot di Microsoft, possono generare saggi, codice, email e articoli emulando modelli da dati di allenamento diversi.

Q: Cosa è la dottrina del fair use e come si relaziona a questa causa legale? A: La dottrina del fair use fornisce una difesa legale che consente un uso limitato di materiale con copyright senza il permesso dell’autore. Tuttavia, la sua interpretazione varia, portando a disaccordi tra i fornitori di AI generativa e i detentori del copyright su cosa rientra nel fair use.

Q: Come regurgitano i modelli di IA generativa i dati di allenamento e perché è preoccupante? A: I modelli di IA generativa a volte producono contenuti che replicano o assomigliano molto ai loro dati di allenamento, riproducendo frasi o frasi verbatim. Questa regurgitazione può creare problemi quando porta alla diffusione di informazioni false o inaccurate.

Q: Quale impatto potrebbe avere questa causa sul business delle abbonamenti alle notizie? R: Se modelli di intelligenza artificiale come ChatGPT e Copilot generano informazioni che di solito sono accessibili solo tramite abbonamento, potrebbe minare la propositione del valore degli abbonamenti alle notizie. I clienti potrebbero invece fare affidamento su contenuti generati da AI, portando potenzialmente a una diminuzione degli abbonamenti e delle entrate per gli editori di notizie.

Q: Come stanno affrontando la questione dell’utilizzo di modelli di IA da parte di altri editori senza il permesso? R: Alcuni editori, come Associated Press e Axel Springer, hanno scelto di collaborare con fornitori di AI generativa stipulando accordi di licenza. Questo approccio consente agli editori di proteggere i loro contenuti beneficiando comunque della tecnologia AI.

In conclusione, la causa legale intentata dal New York Times contro OpenAI e Microsoft porta l’attenzione alle complesse questioni legate all’uso di materiale con copyright nell’allenamento dei modelli di intelligenza artificiale generativa. L’esito di questo caso avrà implicazioni sia per i creatori di contenuti che per i fornitori di AI, evidenziando la necessità di linee guida più chiare e di una maggiore cooperazione in questo campo in evoluzione. Mentre le battaglie legali proseguono, è essenziale trovare un equilibrio tra la promozione dell’innovazione e il rispetto della proprietà intellettuale.

🔗 Link pertinenti: – OpenAIMicrosoftThe New York TimesAssociated Press Partnership with OpenAIAccordo di licenza Axel SpringerStudio di The Atlantic sull’impatto dell’AI