La corsa agli armamenti per la rilevazione dell’IA è iniziata

The AI detection arms race has begun

Edward Tian non si considerava uno scrittore. Come studente di informatica a Princeton, aveva seguito un paio di corsi di giornalismo, dove aveva imparato le basi della redazione, e il suo atteggiamento solare e la curiosità da sperimentatore lo rendevano simpatico ai suoi insegnanti e compagni di classe. Ma descriveva il suo stile di scrittura di allora come “piuttosto brutto” – formulaico e goffo. Uno dei suoi professori di giornalismo gli disse che Tian era bravo nel “riconoscimento dei modelli”, cosa che era utile nella produzione di copie giornalistiche. Quindi Tian rimase sorpreso quando, durante il suo secondo anno, riuscì a ottenere un posto nel prestigioso seminario di scrittura di non-fiction di John McPhee.

Ogni settimana, 16 studenti si riunivano per ascoltare il leggendario scrittore del New Yorker che analizzava la sua arte. McPhee assegnava esercizi che li costringevano a pensare in modo rigoroso alle parole: descrivere un’opera d’arte moderna in campus, o ridurre la lunghezza del Discorso di Gettysburg. Utilizzando un proiettore e delle diapositive, McPhee condivideva diagrammi disegnati a mano che illustravano i diversi modi in cui strutturava i suoi saggi: una linea retta, un triangolo, una spirale. Tian ricorda che McPhee diceva di non poter insegnare ai suoi studenti come scrivere, ma almeno poteva aiutarli a trovare la loro voce unica.

Questo articolo appare nel numero di ottobre 2023. Iscriviti a ENBLE.

Fotografia: Jessica Chou

Se McPhee aveva suscitato una visione romantica del linguaggio in Tian, l’informatica offriva una prospettiva diversa: il linguaggio come statistica. Durante la pandemia, aveva preso un anno di pausa per lavorare alla BBC e fare uno stage presso Bellingcat, un progetto giornalistico open source, dove aveva scritto codice per individuare i bot di Twitter. Da matricola, aveva seguito corsi di apprendimento automatico e di elaborazione del linguaggio naturale. E nell’autunno del 2022 aveva iniziato a lavorare sulla sua tesi di laurea magistrale sulla rilevazione delle differenze tra testi generati dall’IA e testi scritti da esseri umani.

Quando ChatGPT è stato lanciato a novembre, Tian si è trovato in una posizione insolita. Mentre il mondo impazziva per questa nuova chatbot radicalmente migliorata, Tian era già familiare con la tecnologia sottostante di GPT-3. E come giornalista che aveva lavorato per sradicare le campagne di disinformazione, capiva le implicazioni dei contenuti generati dall’IA per l’industria.

Mentre era a casa a Toronto per le vacanze invernali, Tian ha iniziato a sperimentare con un nuovo programma: un detector di ChatGPT. Si è sistemato nel suo caffè preferito, sorseggiando tè al gelsomino, e ha lavorato fino a tardi a codificare nella sua camera da letto. La sua idea era semplice. Il software avrebbe analizzato un pezzo di testo valutando due fattori: “perplessità”, l’imprevedibilità della scelta delle parole; e “esplosività”, la complessità o la variazione delle frasi. La scrittura umana tende a ottenere un punteggio più alto rispetto alla scrittura dell’IA su entrambe le metriche, il che ha permesso a Tian di indovinare come un pezzo di testo fosse stato creato. Tian ha chiamato lo strumento GPTZero – il “zero” indicava la verità, un ritorno alle basi – e l’ha messo online la sera del 2 gennaio. Ha pubblicato un link su Twitter con una breve introduzione. L’obiettivo era contrastare “un aumento del plagio dell’IA”, ha scritto. “Gli insegnanti delle scuole superiori vorranno che gli studenti usino ChatGPT per scrivere i loro saggi di storia? Probabilmente no.” Poi è andato a letto.

Tian si è svegliato la mattina successiva a centinaia di retweet e risposte. C’era così tanto traffico sul server che molti utenti non riuscivano ad accedervi. “È stato totalmente pazzesco”, dice Tian. “Il mio telefono era intasato di notifiche.” Un amico lo ha congratulato per aver vinto Internet. I ragazzi su TikTok lo hanno chiamato uno spione. “Molto dell’odio iniziale era del tipo: ‘Questo ragazzo è un delatore, non ha una vita, non ha mai avuto una fidanzata'”, dice Tian con un sorriso. “Classico.” (Tian ha una fidanzata.) In pochi giorni, ha ricevuto chiamate da giornalisti di tutto il mondo, apparendo alla fine su NPR, il South China Morning Post e Anderson Cooper 360. In una settimana, il suo tweet originale aveva raggiunto oltre 7 milioni di visualizzazioni.

GPTZero era una nuova svolta nella narrazione mediatica che circondava ChatGPT, che aveva suscitato preoccupazioni diffuse nell’industria e una piaga di aperturisti generati dall’IA. (Nel 2019 i ricercatori avevano creato un detector per il testo di GPT-2, ma quello di Tian era il primo a prendere di mira ChatGPT.) Gli insegnanti ringraziavano Tian per il suo lavoro, riconoscenti di poter finalmente dimostrare le loro sospetti riguardo agli strani saggi degli studenti. L’umanità aveva trovato il suo salvatore dalla conquista dei robot?

Il programma di Tian era una sorta di colpo di partenza. La corsa era ora per creare lo strumento definitivo per la rilevazione dell’IA. In un mondo sempre più saturo di contenuti generati dall’IA, si pensava, avremo bisogno di distinguere ciò che è fatto dalla macchina da ciò che è fatto dall’uomo. GPTZero rappresentava una promessa che sarà davvero possibile distinguere l’uno dall’altro, e una convinzione che la differenza conta. Durante il suo tour mediatico, Tian – sorridente, sincero, l’incarnazione dell’alunno modello – ha approfondito questa visione rassicurante secondo cui, per quanto sofisticati diventino gli strumenti di IA generativa, saremo sempre in grado di smascherarli. C’è qualcosa di irriducibile nella scrittura umana, ha detto Tian: “Ha un elemento che non può mai essere tradotto in numeri”.

La vita su internet è sempre stata una battaglia tra falsi e rilevatori di falsi, con entrambe le parti che traggono profitto dallo scontro. I primi filtri anti-spam setacciavano le email alla ricerca di parole chiave, bloccando i messaggi con frasi come “GRATIS!” o “essere maggiorenni”, e alla fine impararono a filtrare interi stili di scrittura. Gli spammer risposero circondando le loro offerte con frammenti di linguaggio simile a quello umano tratti da vecchi libri e mescolati insieme. (Questo tipo di messaggio, chiamato “litspam”, divenne un genere a sé stante.) Con l’aumentare della popolarità dei motori di ricerca, i creatori che cercavano di aumentare il ranking delle loro pagine ricorsero al “keyword stuffing” – ripetendo la stessa parola più volte – per ottenere priorità. I motori di ricerca risposero declassando quei siti. Dopo che Google introdusse il suo algoritmo PageRank, che favoriva i siti web con molti link in entrata, gli spammer crearono interi ecosistemi di pagine di supporto reciproco.

Verso il cambio di millennio, lo strumento captcha arrivò per distinguere gli esseri umani dai bot in base alla loro capacità di interpretare immagini di testo distorto. Una volta che alcuni bot riuscirono a gestire questo, il captcha aggiunse altri metodi di rilevamento che includevano l’analisi di immagini di motociclette e treni, oltre che la rilevazione del movimento del mouse e di altri comportamenti dell’utente. (In un recente test, una versione precedente di GPT-4 ha dimostrato di sapere come assumere una persona su Taskrabbit per completare un captcha al suo posto.) Il destino di intere aziende è stato deciso dalla capacità di individuare i falsi: Elon Musk, nel tentativo di sottrarsi al suo accordo per l’acquisto di Twitter, ha citato un rilevatore di bot per sostenere la sua argomentazione secondo cui Twitter aveva falsamente rappresentato il numero di bot presenti sul suo sito.

L’IA generativa ha aumentato la posta in gioco. Mentre grandi modelli di linguaggio e generatori di testo-immagine sono stati in evoluzione costante negli ultimi dieci anni, il 2022 ha visto un’esplosione di strumenti user-friendly come ChatGPT e Dall-E. I pessimisti sostengono che potremmo presto essere sommersi da un’enorme quantità di contenuti mediatici sintetici. “Tra pochi anni, la stragrande maggioranza delle foto, dei video e dei testi che incontreremo su internet potrebbero essere generati dall’IA”, ha avvertito l’anno scorso Kevin Roose, il tecnologo del New York Times. The Atlantic immagina un prossimo “textpocalypse” mentre lottiamo per filtrare il rumore generativo. Le campagne politiche stanno sfruttando strumenti di intelligenza artificiale per creare annunci, mentre Amazon è invaso da libri scritti da ChatGPT (molti dei quali riguardano l’IA). Scorrere le recensioni dei prodotti sembra già essere il test di Turing più fastidioso del mondo. Il prossimo passo sembra chiaro: se pensavi che le email dei principi nigeriani fossero brutte, aspetta di vedere i chatbot dei principi nigeriani.

Poco dopo che Tian ha rilasciato GPTZero, è arrivata una serie di prodotti simili. OpenAI ha lanciato il suo proprio strumento di rilevamento alla fine di gennaio, mentre Turnitin, il gigante anti-plagio, ha presentato un classificatore in aprile. Tutti condividevano una metodologia di base, ma ogni modello era addestrato su diversi set di dati. (Ad esempio, Turnitin si è concentrato sulla scrittura degli studenti.) Di conseguenza, la precisione variava enormemente, dalla pretesa di OpenAI del 26% di accuratezza nel rilevamento del testo scritto dall’IA, fino alla più ottimistica affermazione di un’azienda chiamata Winston AI del 99,6%. Per rimanere avanti rispetto alla concorrenza, Tian avrebbe dovuto continuare a migliorare GPTZero, ideare il suo prossimo prodotto e nel frattempo terminare gli studi universitari.

Immediatamente, Tian ha reclutato il suo amico delle superiori Alex Cui come CTO e, nelle settimane successive, ha coinvolto un gruppo di programmatori provenienti da Princeton e dal Canada. Poi, in primavera, ha integrato un trio di programmatori dell’Uganda, che aveva conosciuto quattro anni prima mentre lavorava per una start-up che forma ingegneri in Africa. (Cittadino del mondo, Tian è nato a Tokyo e ha vissuto a Pechino fino all’età di 4 anni, quando i suoi genitori, entrambi ingegneri cinesi, hanno trasferito la famiglia in Ontario.) Insieme, il team ha iniziato a lavorare alla prossima applicazione: un’estensione di Chrome che avrebbe analizzato il testo di una pagina web e avrebbe determinato se fosse stato generato da un’intelligenza artificiale.

Un’altra minaccia per GPTZero era GPTZero. Quasi immediatamente dopo il lancio, i critici sui social media hanno iniziato a pubblicare esempi imbarazzanti dell’errore di classificazione del tool. Qualcuno ha fatto notare che riconosceva come potenzialmente scritta da un’intelligenza artificiale alcune parti della Costituzione degli Stati Uniti. La beffa ha lasciato il posto all’indignazione quando le storie degli studenti falsamente accusati di frode a causa di GPTZero hanno iniziato ad invadere Reddit. Ad un certo punto, un genitore di uno di questi studenti ha contattato Soheil Feizi, un professore di informatica presso l’Università del Maryland. “Erano davvero furiosi”, ha detto Feizi. Lo scorso autunno, prima del debutto di GPTZero, Feizi e alcuni suoi colleghi del Maryland avevano iniziato a preparare un progetto di ricerca sui problemi dei rilevatori di IA, che sospettava potessero non essere affidabili. Ora GPTZero e le sue imitazioni lo hanno portato a pensare che potessero fare più danni che benefici.

Un altro mal di testa per Tian era il numero di studenti astuti che trovavano modi per eludere il rilevatore. Una persona su Twitter ha istruito gli utenti a inserire uno spazio di larghezza zero prima di ogni “e” in un testo generato da ChatGPT. Un utente di TikTok ha scritto un programma che bypassava il rilevatore sostituendo certe lettere inglesi con corrispondenti simili in cirillico. Altri hanno iniziato a far passare il loro testo generato dall’IA attraverso QuillBot, un popolare strumento di parafrasi. Tian ha cercato di colmare queste lacune, ma le soluzioni alternative continuavano ad arrivare. Era solo questione di tempo prima che qualcuno mettesse in piedi un prodotto concorrente – un anti-rilevatore.

All’inizio di marzo, un matricola dell’Università di Stanford di nome Joseph Semrai e alcuni amici stavano guidando lungo la Pacific Coast Highway verso Los Angeles quando sono rimasti bloccati fuori dalla loro Zipcar a Ventura. Si sono recati a un vicino Starbucks e hanno atteso l’assistenza stradale. Ma mentre l’attesa si prolungava per ore, Semrai e un amico si chiedevano come recuperare il tempo perso. Semrai aveva un saggio da consegnare la settimana successiva per un corso di scrittura obbligatorio per i matricole. Era il suo tipo meno preferito di compito: un saggio formulistico destinato a mostrare il ragionamento logico. “È un processo piuttosto algoritmico”, dice Semrai.

ChatGPT era la soluzione ovvia. Ma all’epoca, le sue risposte tendevano a essere limitate a pochi paragrafi, quindi la generazione di un saggio di lunghezza intera sarebbe stato un processo multistep. Semrai voleva creare uno strumento che potesse scrivere il saggio in un’unica volta. Sapeva anche che c’era una possibilità che potesse essere rilevato da GPTZero. Con l’incoraggiamento del suo amico, Semrai ha tirato fuori il suo laptop e ha creato uno script che avrebbe scritto un saggio basato su una traccia, fatto passare il testo attraverso GPTZero, quindi ha continuato a modificare la formulazione fino a quando l’IA non era più rilevabile, utilizzando essenzialmente GPTZero contro se stesso.

Semrai ha presentato il suo programma qualche giorno dopo al Friends and Family Demo Day, una sorta di presentazione per la comunità di sviluppatori universitari di Stanford. Davanti a una stanza piena di compagni di classe, ha chiesto al pubblico un argomento per il saggio, qualcuno ha suggerito “alta cucina” in California, e l’ha digitato nella casella di input. Dopo pochi secondi, il programma ha restituito un saggio di otto paragrafi, non originale ma coerente, con le fonti citate. “Non dico che presenterò mai questo saggio”, ha detto Semrai, tra le risate. “Ma eccolo lì. Non so, risparmia tempo.” Ha chiamato lo strumento WorkNinja e lo ha messo sull’app store due mesi dopo. Con l’aiuto di una campagna promozionale che ha coinvolto l’influencer della generazione Z David Dobrik e un regalo di 10 Tesla agli utenti che si iscrivevano, ha ricevuto più di 350.000 download nella prima settimana; le iscrizioni si sono poi rallentate a qualche centinaio al giorno, secondo Semrai. (Semrai non ha voluto dire chi ha finanziato la campagna, dicendo solo che si trattava di un importante investitore angelo della Silicon Valley.)

L’aspetto ordinato e calmo di Semrai nasconde una intensità sottostante. Mentre Tian rimbalza e bolle nel mondo, Semrai appare concentrato e serio. Il diciannovenne parla con tono sicuro e pronto per i podcast di un imprenditore della Silicon Valley che vede il mondo in termini di problemi da risolvere, terminando ogni altra frase con “Giusto?” Ascoltandolo parlare di fossati difendibili e della “curva a S” della crescita sociale, è facile dimenticare che non può bere legalmente. Ma poi, occasionalmente, dirà qualcosa che rivela l’universitario ingenuo, aperto al mondo e ancora alla ricerca del suo posto in esso. Come il tempo in cui lui e un amico hanno camminato intorno al molo di Santa Monica fino alle 3 del mattino, “parlando di ciò che apprezziamo”. Semrai pensa molto a come trovare equilibrio e felicità. “Penso che, mentre sono giovane, probabilmente risieda più nell’esplorazione del derivato”, dice, “inseguendo i momenti alti e bassi”.

Crescendo a New York e poi in Florida, i suoi genitori – un padre vigile del fuoco di Yonkers e una madre casalinga cinese – gli hanno dato una grande libertà. “Mi è stato lasciato durante l’infanzia perseguire ciò che mi entusiasmava sinceramente”, ha detto. “Il modo migliore per farlo era creare cose sul computer.” Quando Semrai aveva 6 anni ha creato un plug-in per assegnare livelli di permesso per i server di Minecraft e a 7 anni ha scritto un programma che correggeva Windows 7 in modo che si potesse eseguire Windows XP su di esso. “Mi rende sinceramente felice consegnare cose alle persone”, dice.

La sua famiglia si è trasferita da Queens a Palm City quando aveva 9 anni, e Semrai ha visto la differenza tra i sistemi scolastici pubblici. La competenza informatica di base che aveva dato per scontata nelle scuole di New York era rara in Florida. Ha iniziato a scrivere programmi per aiutare a colmare le lacune nell’istruzione, una traiettoria che gli consente di dire, a 19 anni, che ha “lavorato nell’ed tech per tutta la vita”. Durante il primo anno di liceo, ha creato una piattaforma di apprendimento online che ha vinto finanziamenti per startup in una competizione locale. Prima di Covid, aveva creato un sistema di pass digitale che è diventato la base per il contact tracing ed è stato adottato da 40 distretti scolastici nel sud-est del paese.

Semrai è fondamentalmente un tecno-ottimista. Dice di credere che dovremmo accelerare lo sviluppo della tecnologia, compresa l’intelligenza artificiale generale, perché alla fine ci porterà verso una società di “post-scarcity”, una visione del mondo talvolta descritta come “accelerazionismo efficace”. (Da non confondere con l’altruismo efficace, secondo cui dovremmo prendere azioni che massimizzino gli esiti “buoni”, comunque definiti). L’argomentazione di Semrai per WorkNinja si basa sulla sua logica di accelerazione. Gli strumenti di scrittura IA sono buoni, secondo lui, non perché aiutano i ragazzi a barare, ma perché costringeranno le scuole a rivedere i loro programmi. “Se puoi seguire una formula per creare un saggio, probabilmente non è un buon compito”, dice. Immagina un futuro in cui ogni studente possa ottenere il tipo di istruzione una volta riservato agli aristocratici, attraverso tutor personalizzati di intelligenza artificiale. Quando stava imparando a programmare, Semrai dice di essersi affidato principalmente a video su YouTube e forum su internet per rispondere alle sue domande. “Sarebbe stato più facile se ci fosse stato un tutor a guidarmi”, dice. Ora che i tutor di IA sono realtà, perché ostacolarli?

Joseph Semrai, 19 anni, creatore di WorkNinja, uno strumento che genera saggi scritti da intelligenza artificiale.

Illustrazione: James Marshall; Fotografia: Charis Morgan

Di recente ho utilizzato WorkNinja per generare una serie di saggi, tra cui uno sulla teoria dell’evoluzione di Darwin. La prima versione che mi ha dato era goffa e ripetitiva, ma funzionante, esplorando le implicazioni della teoria per la biologia, la genetica e la filosofia. GPTZero l’ha individuata come molto probabilmente generata da intelligenza artificiale.

Quindi ho premuto il pulsante “Riformula” di WorkNinja. Il testo è leggermente cambiato, sostituendo alcune parole con sinonimi. Dopo tre riformulazioni, GPTZero ha finalmente dato al testo il suo marchio di umanità. (Quando ho testato lo stesso testo di nuovo qualche settimana dopo, lo strumento l’ha etichettato come una combinazione di scrittura umana e da intelligenza artificiale.) Il problema era che molte delle frasi riformulate non avevano più senso. Ad esempio, la seguente frase:

La teoria dell’evoluzione di Darwin è l’idea che le specie viventi si evolvano nel tempo a causa della loro interazione con l’ambiente.

si era trasformata in:

La teoria dell’evoluzione di Darwin è il pensiero che le specie viventi acquisiscono nel tempo a causa della loro interazione con l’ambiente circostante.

Almeno, uno studente che cerca una scorciatoia dovrebbe sistemare la propria bozza di WorkNinja prima di presentarla. Ma questo indica un vero problema: se anche questo lavoro imperfetto può eludere i rilevatori, cosa potrebbe ottenere un prodotto più solido?

A marzo, Soheil Feizi dell’Università del Maryland ha pubblicato i suoi risultati sulle prestazioni dei rilevatori di intelligenza artificiale. Ha sostenuto che i problemi di accuratezza sono inevitabili, dato il modo in cui funzionano i rilevatori di testo generati da intelligenza artificiale. Aumentando la sensibilità dello strumento per individuare più testo generato da intelligenza artificiale, non si può evitare di aumentare il numero di falsi positivi a un livello che lui considera inaccettabile. Finora, afferma, è impossibile ottenere uno senza l’altro. E man mano che la distribuzione statistica delle parole nel testo generato da intelligenza artificiale si avvicina a quella degli esseri umani, cioè diventa più convincente, afferma che i rilevatori diventeranno sempre meno accurati. Ha anche scoperto che la parafrasi confonde i rilevatori di intelligenza artificiale, rendendo i loro giudizi “quasi casuali”. “Non penso che il futuro sia brillante per questi rilevatori”, dice Feizi.

Feizi afferma che nemmeno il “watermarking” aiuta. Con questo approccio, uno strumento generativo di intelligenza artificiale come ChatGPT regola in modo proattivo i pesi statistici di determinate parole “token” intercambiabili, ad esempio utilizzando “start” al posto di “begin”, o “pick” al posto di “choose”, in un modo che sarebbe impercettibile per il lettore ma facilmente individuabile da un algoritmo. Qualsiasi testo in cui compaiono tali parole con una determinata frequenza potrebbe essere contrassegnato come generato da uno strumento specifico. Ma Feizi sostiene che con abbastanza parafrasi, un watermark “può essere cancellato”.

Nel frattempo, afferma, i rilevatori stanno danneggiando gli studenti. Supponiamo che uno strumento di rilevazione abbia un tasso di falsi positivi del 1 percento – un’assunzione ottimistica. Ciò significa che in una classe di 100 studenti, nel corso di 10 saggi da fare a casa, ci saranno in media 10 studenti accusati ingiustamente di aver copiato. (Feizi afferma che un tasso di uno su 1.000 sarebbe accettabile). “È ridicolo pensare anche solo di utilizzare tali strumenti per controllare l’uso dei modelli di intelligenza artificiale”, dice.

Tian afferma che lo scopo di GPTZero non è quello di individuare i copioni, ma finora è indiscutibilmente stato il suo caso d’uso principale. (I risultati di rilevamento di GPTZero ora vengono forniti con un avviso: “Questi risultati non dovrebbero essere utilizzati per punire gli studenti”). Per quanto riguarda l’accuratezza, Tian afferma che il livello attuale di GPTZero è del 96 percento quando addestrato sul suo set di dati più recente. Altri rilevatori vantano cifre più alte, ma Tian afferma che queste affermazioni sono un campanello d’allarme, poiché significa che stanno “sovradattando” i loro dati di addestramento per adattarsi ai punti di forza dei loro strumenti. “Devi mettere l’intelligenza artificiale e l’essere umano sullo stesso piano”, dice.

Sorprendentemente, le immagini, i video e gli snippet audio generati da intelligenza artificiale sono molto più facili da individuare, almeno per ora, rispetto al testo sintetico. Reality Defender, una startup sostenuta da Y Combinator, è stata lanciata nel 2018 con un focus sulla rilevazione di immagini e video falsi e si è poi estesa all’audio e al testo. Intel ha rilasciato uno strumento chiamato FakeCatcher, che individua i video deepfake analizzando i modelli di flusso sanguigno facciale visibili solo alla telecamera. Un’azienda chiamata Pindrop utilizza la “biometria” vocale per individuare l’audio contraffatto e autenticare i chiamanti al posto delle domande di sicurezza.

Il richiamo irresistibile dell’IA dice: Non deve essere così. E quando si considera il miliardo di persone che sono fuori dal club d’elite dei sofferenti-scrittori, si inizia a pensare: Forse non dovrebbe essere così.

Il testo generato dall’IA è più difficile da rilevare perché ha relativamente pochi punti dati da analizzare, il che significa meno opportunità per l’output dell’IA di deviare dalla norma umana. Confronta questo con FakeCatcher di Intel. Ilke Demir, una ricercatrice per Intel che ha anche lavorato su film Pixar, afferma che sarebbe estremamente difficile creare un set di dati abbastanza grande e dettagliato da permettere ai deepfaker di simulare le firme del flusso sanguigno per ingannare il rilevatore. Quando le ho chiesto se una cosa del genere potesse eventualmente essere creata, ha detto che il suo team prevede sviluppi futuri nella tecnologia deepfake al fine di restare al passo con loro.

Ben Colman, CEO di Reality Defender, dice che gli strumenti di rilevamento della sua azienda sono inviolabili anche perché sono privati. (Finora, i clienti dell’azienda sono stati principalmente governi e grandi corporazioni.) Con strumenti disponibili pubblicamente come GPTZero, chiunque può far passare un pezzo di testo attraverso il rilevatore e poi modificarlo finché non supera l’esame. Reality Defender, al contrario, controlla ogni persona e istituzione che utilizza lo strumento, dice Colman. Sorvegliano anche un utilizzo sospetto, quindi se un account particolare dovesse eseguire test sulla stessa immagine più e più volte con l’obiettivo di eludere il rilevamento, il loro sistema lo segnalerà.

In ogni caso, proprio come i cacciatori di spam, le spie, i produttori di vaccini, i baratori di scacchi, i progettisti di armi e l’intera industria della sicurezza informatica, i rilevatori di IA in tutti i media dovranno adattarsi costantemente alle nuove tecniche di elusione. Presumendo, ovviamente, che la differenza tra umano e macchina abbia ancora importanza.

Più tempo passavo a parlare con Tian e Semrai e i loro compagni di classe, più mi chiedevo: Amano scrivere davvero uno di questi giovani? “Sì, molto!” ha detto Tian, sorridendo ancora di più del solito quando gli ho chiesto lo scorso maggio nel campus di Princeton. “È come un puzzle.” Gli piace capire come le parole si adattano insieme e poi organizzare le idee in modo che fluiscano. “Penso che sia divertente da fare.” Gli piace anche il processo di intervista, perché gli dà “una finestra sulla vita delle persone, oltre a uno specchio su come vivi la tua.”

Al liceo, Tian dice che scrivere sembrava un compito. Accredita a McPhee di aver accresciuto il suo amore e ampliato i suoi gusti. A giugno, mi ha detto entusiasta che aveva appena preso una copia usata de La vita di scrittura di Annie Dillard.

Semrai ha trovato simili gli incarichi di scrittura al liceo noiosi e meccanicistici, più incentrati sulla sintesi delle informazioni che sulla creazione di qualcosa di nuovo. “Avrei preferito compiti in formato aperto che avrebbero suscitato la creatività,” dice. Ma ha messo quelle abilità di sintesi al lavoro. Il secondo anno, ha scritto un libro di istruzioni di 800 pagine chiamato Build for Anything, destinato “a portare qualcuno a conoscere un po’ di tutto” sullo sviluppo web. (Ha auto-pubblicato il libro su Amazon nel 2022 e ha venduto qualche centinaio di copie.) Semrai ha detto che è il tipo di prosa in cui ChatGPT eccelle ora. “Non penso che il libro rientri nella categoria della scrittura significativa,” dice.

Dopo quasi 20 anni di digitare parole per denaro, posso dire per esperienza che scrivere fa schifo. Chiedi a qualsiasi scrittore professionista e ti dirà che è il peggio e che non diventa più facile con l’esercizio. Posso attestare che l’entusiasmo e la curiosità necessari per scandagliare continuamente il mondo, scovare fatti e spremere il loro significato possono essere difficili da mantenere. E questo senza considerare lo stato dell’industria: tariffe in diminuzione, riduzione del numero di pagine e accorciamento dell’attenzione (dei lettori e la mia). Continuo a farlo perché, per il meglio o per il peggio, è ora quello che sono. Lo faccio non per piacere ma perché mi sembra significativo, almeno per me.

Alcuni scrittori romanticizzano la lotta. McPhee una volta descrisse di aver passato due settimane sdraiato su un tavolo da picnic, cercando di decidere come iniziare un articolo. “Il pezzo sarebbe poi consistito di circa cinquemila frasi, ma per quelle due settimane non sono riuscito a scriverne nemmeno una,” scrisse. Un’altra volta, a 22 anni, si legò alla sua sedia da scrittura con una cintura di accappatoio. Secondo Thomas Mann, “Uno scrittore è qualcuno per cui scrivere è più difficile che per altre persone.” “Cerchi, ti spezzi il cuore, la schiena, il cervello e poi – solo allora – ti viene dato,” scrive Annie Dillard in La vita di scrittura. Offre questa riflessione dopo un lungo paragone tra la scrittura e la lotta con un coccodrillo.

L’implicazione è che più forte è la pressione, più dolce è il succo – che c’è virtù nel fissare la pagina vuota, domarla, costringerla a cedere alla prosa. Così avvengono le scoperte più grandi, ci diciamo. L’agonia ne vale la pena, perché è così che nascono le idee.

Il richiamo irresistibile dell’IA dice: Non deve essere così. E quando si considera che miliardi di persone sono al di fuori dell’élite dei sofferenti-scrittori, si comincia a pensare: Forse non dovrebbe essere così.

May Habib ha trascorso la sua prima infanzia in Libano prima di trasferirsi in Canada, dove ha imparato l’inglese come seconda lingua. “Ho pensato che fosse piuttosto ingiusto che così tanto beneficio sarebbe stato concesso a qualcuno bravo nella lettura e nella scrittura”, dice. Nel 2020, ha fondato Writer, una delle diverse piattaforme ibride che mirano non a sostituire la scrittura umana, ma ad aiutare le persone – e, più precisamente, i marchi – a collaborare meglio con l’IA.

Habib afferma di credere nel valore dello sguardo fisso sulla pagina bianca. Ti aiuta a considerare e scartare idee e ti costringe a organizzare i tuoi pensieri. “Ci sono così tanti vantaggi nel percorrere il percorso tortuoso, nel volerti uccidere guardando il cursore”, dice. “Ma questo deve essere bilanciato con la velocità dei millisecondi”.

Lo scopo di Writer non è di scrivere per te, dice, ma piuttosto di rendere la tua scrittura più veloce, più efficace e più coerente. Questo potrebbe significare suggerire modifiche alla prosa e alla struttura, o evidenziare ciò che è stato scritto sull’argomento e offrire controargomenti. L’obiettivo, afferma, è aiutare gli utenti a concentrarsi meno sulla meccanica del livello delle frasi e più sulle idee che cercano di comunicare. Idealmente, questo processo produce un testo che è tanto “umano” quanto se la persona lo avesse scritto interamente da sé. “Se il rilevatore può identificarlo come scrittura AI, allora hai usato gli strumenti in modo errato”, dice.

L’idea bianco-nero che la scrittura sia generata dall’uomo o dall’IA sta già svanendo, afferma Ethan Mollick, professore alla Wharton School dell’Università della Pennsylvania. Invece, stiamo entrando in un’era di quella che lui chiama “scrittura centauro”. Certamente, chiedere a ChatGPT di produrre un saggio sulla storia dell’Impero mongolo produce risultati prevedibilmente “da AI”, dice. Ma “inizia a scrivere: ‘I dettagli nel paragrafo tre non sono del tutto corretti – aggiungi queste informazioni e rendi il tono più simile a quello del New Yorker'”, dice. “Allora diventa più un lavoro ibrido e una scrittura di migliore qualità”.

Mollick, che insegna imprenditorialità a Wharton, non solo permette ai suoi studenti di usare strumenti di intelligenza artificiale, ma lo richiede. “Ora il mio programma dice che devi fare almeno una cosa impossibile”, dice. Se uno studente non sa programmare, forse scrive un programma funzionante. Se non ha mai fatto lavoro di progettazione, potrebbe mettere insieme un prototipo visivo. “Ogni carta che consegni deve essere criticata da almeno quattro famosi imprenditori che simuli”, dice.

Secondo Mollick, gli studenti devono ancora padroneggiare la loro area di studio per ottenere buoni risultati. L’obiettivo è farli pensare criticamente e creativamente: “Non mi importa quale strumento usino per farlo, purché usino gli strumenti in modo sofisticato e usino la loro mente”.

Mollick ammette che ChatGPT non è bravo come i migliori scrittori umani. Ma può dare una mano a tutti gli altri. “Se eri uno scrittore di quarta categoria, ora sei al 60-70 percentile”, dice. Libera anche certi tipi di pensatori dalla tirannia del processo di scrittura. “Equipariamo la capacità di scrivere all’intelligenza, ma non è sempre vero”, dice. “Anzi, direi che spesso non è vero”.

Edward Tian, 23 anni, creatore di GPTZero, uno strumento che rileva la scrittura generata dall’IA.

Illustrazione: James Marshall; Fotografia: Lauryn Hill

In una giornata senza nuvole di maggio, io e Tian abbiamo passeggiato per il campus di Princeton; grandi tende bianche di riunione sembravano essere atterrate come astronavi sui prati curati. Su mia richiesta, Tian ha invitato alcuni compagni di classe a unirsi a noi per pranzo in un ristorante Szechuan fuori dal campus e parlare di AI.

Mentre alcune scuole si affrettavano a vietare ChatGPT e i CEO delle aziende tecnologiche firmavano lettere di avvertimento sul destino alimentato dall’IA, gli studenti erano notevolmente rilassati riguardo a un futuro assistito dalla macchina. (Princeton ha lasciato ai professori il compito di stabilire le proprie regole di base.) Uno di loro aveva recentemente usato ChatGPT per scrivere la sezione dei ringraziamenti della sua tesi. Altri, incluso Tian, si affidavano ad esso per completare parti di script durante la programmazione. Lydia You, una laureanda in informatica che ha intenzione di lavorare nel giornalismo, aveva chiesto a ChatGPT di scrivere una poesia sulla perdita di cose nello stile di Elizabeth Bishop – un tentativo di ricreare la sua famosa poesia “One Art”. (“L’arte di perdere non è difficile da padroneggiare”). Il risultato era “molto simile” alla poesia originale, ha detto You, e ha scoperto che il chatbot faceva un lavoro ancora migliore nell’analizzare l’originale e nel descrivere ciò che lo rendeva così emozionante. “Abbiamo visto molto panico su quasi tutto nella nostra vita”, ha detto You, citando TikTok, Twitter e Internet stessa. “Sento che le persone della nostra generazione sono come, possiamo capire da soli come usare questo”.

Sophie Amiton, una studentessa senior che studia ingegneria meccanica e aerospaziale, intervenne: “Inoltre, penso che la nostra generazione sia più pigra in molti modi”, disse, mentre Tu annuivi in accordo. “Vedo molte più persone che non vogliono lavori tradizionali ora, non vogliono lavorare dalle nove alle cinque”.

“Sono disillusi”, Tu disse. “Molti lavori sono fogli di calcolo”.

“Penso che ciò sia emerso a causa di Covid”, continuò Amiton. “Le persone hanno rivalutato qual è il vero scopo del lavoro e se è possibile utilizzare ChatGPT per rendere la vita più facile e quindi avere una migliore qualità della vita o un equilibrio tra vita e lavoro, allora perché non utilizzare la scorciatoia?”

Liz, una neo-laureata di Princeton che preferiva non utilizzare il suo cognome, mi ha inviato un saggio che aveva scritto con l’aiuto di ChatGPT per una classe di politica globale. Invece di chiedergli semplicemente di rispondere alla domanda del saggio, ha inserito un’outline con punti dettagliati, quindi l’ha fatto scrivere il saggio basandosi sui suoi appunti. Dopo un’ampia discussione – dicendogli di riscrivere e riorganizzare, aggiungere sfumature qui e contesto là – alla fine ha ottenuto un saggio che si sentiva a suo agio a consegnare. Ha preso un A.

Ho copiato e incollato il suo saggio in GPTZero. Il verdetto: “Il tuo testo è probabilmente stato scritto interamente da un essere umano”.

All’inizio di maggio, poche settimane prima che Tian e i suoi compagni di classe indossassero le loro toghe di laurea nere, il team di GPTZero ha rilasciato il plug-in Chrome che stavano sviluppando e l’ha chiamato Origin. Origin è ancora rudimentale: devi selezionare il testo di una pagina web tu stesso e la sua precisione non è perfetta. Ma Tian spera che un giorno lo strumento scansionerà automaticamente ogni sito web che guardi, evidenziando i contenuti generati dall’IA, dal testo alle immagini al video, così come qualsiasi cosa “tossica” o dubbia dal punto di vista dei fatti. Descrive Origin come un “parabrezza” per l’autostrada dell’informazione, che devia il materiale inutile o dannoso e ci permette di vedere chiaramente la strada.

Tian era incessantemente ottimista riguardo all’azienda; si sentiva anche fortunato ad essere laureato in un lavoro che voleva davvero. Molti dei suoi amici avevano iniziato a frequentare Princeton con l’intenzione di diventare imprenditori, ma la stretta nel settore tecnologico aveva cambiato i loro piani.

“Abbiamo visto molta paura per quasi tutto nella nostra vita. Sento che le persone della nostra generazione sono come, possiamo capire da soli come usare questo”.

Come una matricola che ha ancora tre anni da trascorrere a Stanford, Semrai si è avvicinato all’estate con un’atteggiamento più spensierato. In un pomeriggio caldo di giovedì di giugno, sul tetto del Pier 17 vicino a Wall Street, Semrai, indossando una camicia verde a fantasia e Nike bianche, mi ha parlato con entusiasmo del futuro, o almeno delle prossime settimane. La sua estate stava ancora prendendo forma. (“Sto rapidamente testando la mia tesi”.) Ma per ora era a New York, ospite di amici mentre lavorava su un paio di progetti basati sull’IA. La notte precedente aveva dormito in uno spazio di coworking a SoHo. Ora si trovava nella sezione VIP all’ombra di un evento organizzato da Techstars New York City, un acceleratore di startup, mentre centinaia di partecipanti sudati si aggiravano sotto il sole accecante.

Vicino, il sindaco di New York City Eric Adams si trovava sul palco indossando occhiali da aviatore e un completo, elogiando le glorie della programmazione. “Sono un tecnico”, disse Adams, prima di incoraggiare gli ospiti a cercare collaboratori diversi e utilizzare il “codice sorgente” per risolvere problemi sociali come il cancro e la violenza armata. Poi esortò i single nella folla a trovare un “ragazzino o una fidanzata e a frequentarli”.

Semrai stava adottando un approccio di “vediamo cosa funziona” nella costruzione. Oltre a WorkNinja, stava sviluppando una piattaforma per chatbot basati su celebrità reali e addestrati con un’enorme quantità di dati su di loro, con i quali i fan potevano interagire. Stava anche creando un prototipo di un braccialetto che registra tutto ciò che diciamo e facciamo – Semrai lo chiama una “memoria perfetta” – e offre consigli in tempo reale per facilitare le conversazioni. (Un gruppo di compagni di classe a Stanford ha recentemente creato un prodotto correlato chiamato RizzGPT, un occhiale che aiuta il suo indossatore a flirtare.)

Si aspettava che l’estate desse vita a un’esplosione di app basate sull’IA, mentre giovani programmatori si mescolano e si incroceranno. (Eric Adams approverebbe.) “Penso che verranno create una serie di startup e tra cinque anni saremo in grado di tracciare connessioni tra le persone: l’inizio di un ecosistema”, ha detto.

All’estate, Tian aveva un team di 12 dipendenti e aveva raccolto 3,5 milioni di dollari da alcuni VC, tra cui Jack Altman (fratello del CEO di OpenAI Sam Altman) e Emad Mostaque di Stability AI. Ma nel corso delle nostre conversazioni, ho notato che il suo modo di presentare GPTZero/Origin stava leggermente cambiando. Ora, diceva, la rilevazione dell’IA sarebbe solo una parte dello strumento per dimostrare l’umanità. Altrettanto importante sarebbe l’attenzione alla provenienza o alle “credenziali dei contenuti”. L’idea è quella di allegare un tag crittografico a un pezzo di contenuto che ne verifica la creazione da parte di un essere umano, come determinato dal suo processo di creazione – una sorta di captcha per i file digitali. Adobe Photoshop già allega un tag alle foto che utilizzano il suo nuovo strumento di generazione AI, Firefly. Chiunque guardi un’immagine può fare clic destro su di essa e vedere chi l’ha creata, dove e come. Tian dice di voler fare lo stesso per il testo e che sta discutendo con la Content Authenticity Initiative – un consorzio dedicato a creare uno standard di provenienza per i media – nonché con Microsoft per lavorare insieme.

Si potrebbe interpretare il suo enfasi sulla provenienza come un tacito riconoscimento che la sola rilevazione non basta. (OpenAI ha chiuso il suo classificatore di testo a luglio “a causa della sua bassa percentuale di precisione.”) Inoltre, anticipa un possibile cambiamento di paradigma nel modo in cui ci rapportiamo ai media digitali. Tutto l’impegno della rilevazione suggerisce che gli esseri umani lasciano una firma inequivocabile in un pezzo di testo – qualcosa di percettibile – allo stesso modo in cui un rilevatore di bugie presuppone che la disonestà lasci una traccia oggettiva. La provenienza si basa su qualcosa di simile a un’etichetta “Made in America”. Se non fosse per l’etichetta, non sapremmo la differenza. È una distinzione sottile ma significativa: la scrittura umana potrebbe non essere migliore, o più creativa, o anche più originale. Ma sarà umana, cosa che avrà importanza per altri esseri umani.

A giugno, il team di Tian ha compiuto un altro passo verso la praticità. Mi ha detto che stavano costruendo una nuova piattaforma di scrittura chiamata HumanPrint, che avrebbe aiutato gli utenti a migliorare il loro testo scritto da AI e consentire loro di condividere “prove di autenticità”. Non generando testo, però. Piuttosto, utilizzerebbe la tecnologia di GPTZero per evidenziare le sezioni di testo che non erano sufficientemente umane e sollecitare l’utente a riscriverlo con le proprie parole – una sorta di inversione degli attuali assistenti di scrittura AI. “Quindi gli insegnanti possono specificare, OK, forse più del 50 percento dell’articolo dovrebbe ancora essere scritto con le tue parole”, ha detto. Quando ho chiesto se questa fosse una svolta per l’azienda, Tian ha sostenuto che era “un’estensione naturale della rilevazione”. “È sempre stata una visione di essere lo standard d’oro dell’uso responsabile dell’IA”, ha detto Tian, “e questo è ancora presente”. Tuttavia, l’implicazione è chiara: non c’è modo di fermare la scrittura dell’IA; l’unica opzione è lavorare con essa.

Quando Tian stava testando per la prima volta GPTZero, ha esaminato un saggio del 2015 del New Yorker di McPhee chiamato “Frame of Reference”. In esso, McPhee riflette sulle gioie e sui rischi di fare riferimenti culturali nella propria scrittura. “Menziona Beyoncé e tutti sanno chi è. Menziona Veronica Lake e potresti anche essere nel Quetico-Superior”, scrive in modo scherzoso. Elenca una serie di aggettivi che ha usato per descrivere i baffi, tra cui “sincero”, “senza fronzoli”, “giroscopico”, “ingenuo”, “analgesico”, “lenitivo”, “odobene” e “tetragrammatonico”. Conclude con un aneddoto sulla battaglia con un redattore per includere un riferimento a un termine britannico oscuro usato dai turisti dell’alta classe in India durante il Raj. (Ha vinto lui.) È un classico McPhee: preciso come un bisturi, generoso seppur un po’ compiaciuto, gioiosamente discorsivo, indulgente fino a quando non arriva al punto giusto. GPTZero ha determinato che l’articolo era “il più umano su tutti i parametri”, ha detto Tian. Ho chiamato McPhee per chiedergli cosa pensasse che significasse che la sua scrittura fosse particolarmente umana.

“Non ho davvero un’idea molto buona”, mi ha detto McPhee al telefono. “Ma se dovessi indovinare, è che i miei pezzi raggiungono la scienza, l’agricoltura, l’aviazione o qualunque sia l’argomento, attraverso le persone. C’è sempre una figura centrale da cui imparo”. Infatti, McPhee scrive attraverso gli occhi degli esperti. Il lettore si allontana non solo con una conoscenza esoterica sulla geologia o la fisica delle particelle o le arance, ma con un senso della persona che studia l’argomento, così come McPhee che studia la persona.

McPhee, ora 92 anni, ha detto di non essere preoccupato che l’IA sostituisca gli scrittori umani. “Sono estremamente scettico e non mi preoccupo affatto”, ha detto. “Non penso che ci sia un Mark Twain dell’intelligenza artificiale”.

Ma, ho chiesto, cosa succederebbe se tra anni qualcuno progettasse un McPheeBot3000 addestrato sulla scrittura di McPhee e poi gli chiedesse di produrre un libro su un argomento nuovo? Potrebbe non essere in grado di attraversare ruscelli con attivisti ambientali o fare pesca a mosca con ittiologi, ma non potrebbe catturare la voce, lo stile e il punto di vista di McPhee? Tian ha sostenuto che le macchine possono solo imitare, mentre McPhee non si ripete mai: “Quello che è unico in McPhee è che lui pensa a cose che McPhee di ieri non avrebbe pensato”.

Ho chiesto a McPhee del McPheeBot3000 ipotetico. (O, se Semrai ha la sua strada, non così ipotetico.) “Se questa cosa succede mai, in un futuro in cui non ci sono più io”, ha detto, “spero che le mie figlie si presentino con un avvocato”.


Questo articolo appare nel numero di ottobre 2023. Iscriviti ora.

Fateci sapere cosa ne pensate di questo articolo. Inviate una lettera al direttore a mail@ENBLE.com.