I lavoratori minorenni stanno addestrando l’IA.

I lavoratori minori si stanno addestrando nell'utilizzo dell'IA.

Come la maggior parte dei ragazzi della sua età, Hassan, 15 anni, passava molto tempo online. Prima della pandemia, gli piaceva giocare a calcio con i ragazzi del posto nella sua città natale di Burewala nella regione del Punjab, in Pakistan. Ma i lockdown Covid lo hanno reso un po’ un recluso, attaccato al suo telefono cellulare. “Uscivo dalla mia stanza solo quando dovevo mangiare qualcosa”, dice Hassan, ora 18enne, che ha chiesto di essere identificato con uno pseudonimo perché aveva paura di azioni legali. Ma a differenza della maggior parte degli adolescenti, non stava facendo scroll su TikTok o giocando. Dalla sua camera da letto d’infanzia, lo studente delle scuole superiori stava lavorando nella catena di fornitura globale dell’intelligenza artificiale, caricando e etichettando dati per addestrare algoritmi per alcune delle più grandi aziende di IA al mondo.

I dati grezzi utilizzati per addestrare gli algoritmi di apprendimento automatico sono prima etichettati dagli esseri umani e la verifica umana è anche necessaria per valutarne l’accuratezza. Questa etichettatura dei dati va dalla semplice – identificare immagini di lampioni per strada, ad esempio, o confrontare prodotti di e-commerce simili – a quella profondamente complessa, come la moderazione dei contenuti, dove i lavoratori classificano i contenuti dannosi all’interno dei dati raccolti da ogni angolo di internet. Questi compiti vengono spesso esternalizzati a lavoratori occasionali, tramite piattaforme di crowdsourcing online come Toloka, che è stata dove Hassan ha iniziato la sua carriera.

Un amico lo ha indirizzato al sito, che prometteva lavoro in qualsiasi momento, da qualsiasi parte. Ha scoperto che un’ora di lavoro gli avrebbe fatto guadagnare circa 1-2 dollari, dice, più del salario minimo nazionale, che all’epoca era di circa 0,26 dollari. Sua madre è una casalinga e suo padre è un operaio meccanico. “Puoi dire che faccio parte di una famiglia povera”, dice. Quando è scoppiata la pandemia, aveva bisogno di lavoro più che mai. Rinchiuso in casa, online e inquieto, ha fatto qualche ricerca e ha scoperto che Toloka era solo la punta dell’iceberg.

“L’IA viene presentata come una scatola magica che può fare tutto”, dice Saiph Savage, direttore del Civic AI Lab della Northeastern University. “Le persone semplicemente non sanno che ci sono lavoratori umani dietro le quinte”.

Almeno alcuni di questi lavoratori umani sono bambini. Le piattaforme richiedono che i lavoratori siano maggiorenni, ma Hassan ha semplicemente inserito i dettagli di un parente e ha usato un metodo di pagamento corrispondente per eludere i controlli, e non era l’unico a farlo. ENBLE ha parlato con altri tre lavoratori in Pakistan e in Kenya che hanno detto di essersi uniti alle piattaforme quando erano ancora minorenni e ha trovato prove che questa pratica è diffusa.

“Quando ero ancora a scuola, molti adolescenti discutevano dei lavori online e di come si univano usando l’ID dei propri genitori”, dice un lavoratore che si è unito ad Appen a 16 anni in Kenya, che ha chiesto di rimanere anonimo. Dopo la scuola, lui e i suoi amici si collegavano per completare compiti di annotazione fino a tarda notte, spesso per otto ore o più.

Appen ha preferito non rilasciare un commento attribuibile.

“Se sospettiamo che un utente abbia violato l’Accordo dell’Utente, Toloka effettuerà un controllo dell’identità e richiederà un documento di identità fotografico e una foto dell’utente che tiene in mano il documento di identità”, afferma Geo Dzhikaev, responsabile delle operazioni di Toloka.

Spuinto da una corsa globale verso l’IA, l’industria globale di etichettatura e raccolta dati dovrebbe raggiungere oltre 17,1 miliardi di dollari entro il 2030, secondo Grand View Research, una società di ricerca e consulenza di mercato. Piattaforme di crowdsourcing come Toloka, Appen, Clickworker, Teemwork.AI e OneForma collegano milioni di lavoratori occasionali remoti del sud del mondo a società tecnologiche con sede nella Silicon Valley. Le piattaforme pubblicano micro-compiti per i loro clienti tecnologici, tra cui Amazon, Microsoft Azure, Salesforce, Google, Nvidia, Boeing e Adobe. Molte piattaforme collaborano anche con la piattaforma di servizi dati stessa di Microsoft, il Sistema Universale di Rilevanza Umana (UHRS).

Questi lavoratori sono prevalentemente in Africa orientale, Venezuela, Pakistan, India e Filippine, anche se ci sono persino lavoratori nei campi profughi che etichettano, valutano e generano dati. Ai lavoratori viene pagato per compito, con una remunerazione che varia da un centesimo a qualche dollaro, anche se l’estremità superiore è considerata una rarità, dicono i lavoratori. “La natura del lavoro spesso sembra una forma di servitù digitale, ma è necessaria per guadagnarsi da vivere”, dice Hassan, che ora lavora anche per Clickworker e Appen.

A volte, ai lavoratori viene chiesto di caricare audio, immagini e video, che contribuiscono ai set di dati utilizzati per addestrare l’IA. I lavoratori di solito non sanno esattamente come le loro contribuzioni verranno elaborate, ma queste possono essere piuttosto personali: nella scheda dei lavori dei lavoratori di Clickworker, un compito afferma: “Mostraci il tuo bambino/bambina! Aiuta ad insegnare all’IA scattando 5 foto del tuo bambino/bambina!” per €2 ($ 2,15). Il prossimo dice: “Fai partecipare il tuo minore (età compresa tra 13 e 17 anni) a un interessante progetto di selfie!”

Alcuni compiti coinvolgono la moderazione dei contenuti: aiutare l’intelligenza artificiale a distinguere tra contenuti innocenti e contenuti che contengono violenza, discorsi d’odio o immagini per adulti. Hassan ha condiviso registrazioni dello schermo dei compiti disponibili il giorno in cui ha parlato con ENBLE. Un compito UHRS gli chiedeva di identificare “fuck”, “c**t”, “dick” e “bitch” in un testo. Per Toloka, gli sono state mostrate pagine su pagine di corpi parzialmente nudi, incluse immagini sessualizzate, annunci di lingerie, una scultura esposta e persino un corpo nudo da un dipinto in stile rinascimentale. Il compito? Distinguere tra contenuti per adulti e innocenti, per aiutare l’algoritmo a distinguere tra torso sensazionale e torso permesso.

Hassan ricorda di aver moderato contenuti da minorenne su UHRS che, dice lui, continua ad influire sulla sua salute mentale. Dice che i contenuti erano espliciti: resoconti di casi di stupro, tratti da articoli che citavano rapporti giudiziari; discorsi d’odio tratti da post dei social media; descrizioni di omicidi tratte da articoli; immagini sessualizzate di minori; immagini nude di donne adulte; video per adulti di donne e ragazze tratti da YouTube e TikTok.

Molti dei lavoratori remoti in Pakistan sono minorenni, dice Hassan. Ha condotto un sondaggio su 96 intervistati su una chat di gruppo su Telegram con quasi 10.000 lavoratori UHRS, per conto di ENBLE. Circa un quinto ha dichiarato di essere minorenne.

Awais, 20 anni, di Lahore, che ha parlato a condizione che il suo nome non sia pubblicato, ha iniziato a lavorare per UHRS tramite Clickworker a 16 anni, dopo aver promesso alla sua ragazza una vacanza di compleanno ai laghi turchesi e alle montagne innevate della regione settentrionale del Pakistan. I suoi genitori non potevano aiutarlo con i soldi, quindi si è rivolto al lavoro dati, usando la carta di identità di un amico. “Era facile”, dice.

Lavorava sul sito tutti i giorni, completando principalmente il compito “Generic Scenario Testing Extension” di Microsoft. Questo coinvolgeva testare l’accuratezza della homepage e del motore di ricerca. In altre parole, selezionando “offerte auto” sulla homepage di MSN, comparivano foto di auto? Cercando “gatto” su Bing, mostrava immagini di felini? Guadagnava da $1 a $3 al giorno, ma ha trovato il lavoro sia monotono che infuriante. A volte si trovava a lavorare 10 ore per $1, perché doveva fare una formazione non retribuita per accedere a determinati compiti. Anche quando superava la formazione, poteva non esserci alcun compito da completare; o se superava il limite di tempo, sospendevano il suo account, dice. Poi, come per magia, è stato bandito dal suo compito più redditizio, qualcosa che accade regolarmente ai lavoratori. Le sospensioni possono avvenire per una serie di motivi, come fornire risposte errate, rispondere troppo velocemente o dare risposte che deviano dal modello medio degli altri lavoratori. Aveva guadagnato $70 in totale. Era quasi abbastanza per portare la sua fidanzata delle scuole superiori in vacanza, quindi Awais ha deciso di disconnettersi per sempre.

Clickworker non ha risposto alle richieste di commento. Microsoft ha rifiutato di commentare.

“In alcuni casi, una volta che un utente completa la formazione, la quota di risposte per quel progetto è stata già raggiunta e il compito non è più disponibile”, ha dichiarato Dzhikaev. “Tuttavia, se diventano disponibili altri compiti simili, saranno in grado di partecipare senza ulteriori formazioni”.

I ricercatori dicono di aver trovato prove di lavoratori minorenni nell’industria dell’intelligenza artificiale anche in altre parti del mondo. Julian Posada, professore assistente di Studi Americani presso l’Università di Yale, che studia il lavoro umano e la produzione di dati nell’industria dell’intelligenza artificiale, afferma di aver incontrato lavoratori in Venezuela che sono entrati nelle piattaforme da minorenni.

Omettere i controlli sull’età può essere abbastanza semplice. Le piattaforme più permissive, come Clickworker e Toloka, chiedono semplicemente ai lavoratori di dichiarare di avere più di 18 anni; le piattaforme più sicure, come Remotasks, utilizzano la tecnologia di riconoscimento facciale per confrontare i lavoratori con la loro carta d’identità fotografica. Ma anche questo può essere fallace, dice Posada, citando un lavoratore che dice di aver semplicemente avvicinato il telefono al volto della nonna per superare i controlli. La condivisione di un singolo account tra membri della famiglia è un altro modo in cui i minorenni accedono al lavoro, dice Posada. Ha scoperto che in alcune case venezuelane, quando i genitori cucinano o fanno commissioni, i bambini si collegano per completare i compiti. Dice che una famiglia di sei persone che ha incontrato, con bambini di soli 13 anni, affermavano tutti di condividere un unico account. Gestivano la casa come una fabbrica, dice Posada, in modo che due membri della famiglia fossero al computer a lavorare sui dati in qualsiasi momento. “Le loro schiene facevano male perché erano stati seduti per così tanto tempo. Così facevano una pausa e poi i ragazzi continuavano”, dice.

Le distanze fisiche tra i lavoratori che addestrano l’intelligenza artificiale e i giganti tecnologici all’altra estremità della catena di fornitura, “la deterritorializzazione di Internet”, come la chiama Posada, creano una situazione in cui intere forze lavoro sono essenzialmente invisibili, regolate da un diverso insieme di regole o da nessuna.

La mancanza di controllo dei lavoratori può addirittura impedire ai clienti di sapere se i lavoratori mantengono il loro reddito. Un utente di Clickworker in India, che ha chiesto di rimanere anonimo per evitare di essere bandito dal sito, ha detto a ENBLE di “impiegare” 17 lavoratori UHRS in un ufficio, fornendo loro un computer, un cellulare e una connessione internet, in cambio di metà del loro reddito. Mentre i suoi lavoratori hanno un’età compresa tra i 18 e i 20 anni, a causa della mancanza di requisiti di certificazione dell’età di Clickworker, lui sa che ci sono teenager che utilizzano la piattaforma.

Nelle parti più oscure dell’industria del crowdsourcing, l’uso di lavoratori minori è palese.

I servizi di risoluzione di Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart), in cui le piattaforme di crowdsourcing pagano gli esseri umani per risolvere i captcha, sono una parte meno compresa nell’ecosistema dell’IA. I captcha sono progettati per distinguere un bot da un essere umano – l’esempio più noto è il reCaptcha di Google, che chiede agli utenti di identificare oggetti in immagini per accedere a un sito web. Il vero scopo dei servizi che pagano le persone per risolverli rimane un mistero per gli accademici, dice Posada. “Ma quello che posso confermare è che molte aziende, inclusa la reCaptcha di Google, utilizzano questi servizi per addestrare modelli di intelligenza artificiale”, dice. “Quindi, questi lavoratori contribuiscono indirettamente ai progressi dell’IA”.

Google non ha risposto a una richiesta di commento in tempo per la pubblicazione.

Ci sono almeno 152 servizi attivi, per lo più con sede in Cina, con più di mezzo milione di persone che lavorano nel mercato sotterraneo del reCaptcha, secondo uno studio del 2019 condotto da ricercatori dell’Università di Zhejiang a Hangzhou.

“Lavoro stabile per tutti. Ovunque”, dichiara un servizio, Kolotibablo, sul suo sito web. L’azienda ha un sito promozionale dedicato alla presentazione delle testimonianze dei propri lavoratori, che include immagini di bambini di tutto il mondo. In una, un sorridente bambino indonesiano mostra la sua torta di compleanno dell’11° anniversario alla telecamera. “Sono molto felice di poter aumentare i miei risparmi per il futuro”, scrive un altro, non più grande di 7 o 8 anni. Una ragazza di 14 anni in un lungo vestito di Hello Kitty condivide una foto della sua postazione di lavoro: un laptop su una scrivania rosa a tema Barbie.

Non tutti i lavoratori intervistati da ENBLE si sentivano frustrati dalle piattaforme. A 17 anni, la maggior parte degli amici di Younis Hamdeen faceva il cameriere. Ma il giovane pakistano ha scelto di aderire a UHRS tramite Appen, utilizzando la piattaforma per tre o quattro ore al giorno, insieme alla scuola superiore, guadagnando fino a 100 dollari al mese. Il compito più redditizio che ha svolto è stato comparare i prodotti elencati su Amazon. “Amo lavorare per questa piattaforma”, dice Hamdeen, ora 18enne, perché viene pagato in dollari statunitensi – cosa rara in Pakistan – e quindi beneficia di tassi di cambio favorevoli.

Ma il fatto che il compenso per questo lavoro sia incredibilmente basso rispetto agli stipendi dei dipendenti interni delle aziende tecnologiche, e che i vantaggi del lavoro scorrono in una sola direzione – dal sud globale al nord globale – porta a paralleli scomodi. “Dobbiamo considerare il tipo di colonialismo che viene promosso con questo tipo di lavoro”, dice il Civic AI Lab’s Savage.

Hassan è stato recentemente ammesso a un programma di laurea in tecnologia laboratoriale medica. Le app rimangono la sua unica fonte di reddito, lavorando da 8:00 alle 18:00, seguita dalle 2:00 alle 6:00. Tuttavia, i suoi guadagni sono scesi a soli 100 dollari al mese, poiché la domanda di compiti ha superato l’offerta, con l’adesione di più lavoratori dalla pandemia.

Si lamenta del fatto che i compiti UHRS possono pagare anche solo 1 centesimo. Anche nei lavori più remunerati, come occasionali compiti sui social media su Appen, la quantità di tempo che deve trascorrere facendo ricerche non pagate significa che deve lavorare cinque o sei ore per completare un’ora di lavoro in tempo reale, tutto per guadagnare 2 dollari, dice.

“È schiavitù digitale”, dice Hassan.