La nuova iniziativa di ricerca mira a costruire un grande modello di intelligenza artificiale linguistica per il sudest asiatico

La nuova iniziativa di ricerca mira a creare un vasto modello di intelligenza artificiale linguistica per il sud-est asiatico

Mappamondo del Sudest asiatico

È in corso una nuova iniziativa di ricerca per costruire un ampio modello di lingua (LLM) che meglio risponda alle caratteristiche demografiche delle nazioni del sudest asiatico.

Chiamato Programma nazionale LLM multimodale, l’iniziativa è guidata da Singapore al fine di sviluppare un modello di lingua artificiale (AI) ampio che supporti la diversa mescolanza di cultura e lingua della regione.

Inoltre: L’etica dell’IA generativa: come possiamo sfruttare questa potente tecnologia

Tre agenzie governative — Infocomm Media Development Authority (IMDA), AI Singapore (AISG) e l’Agenzia per la scienza, la tecnologia e la ricerca (A*STAR) — si sono unite per lanciare il programma di ricerca, con fondi del valore di 70 milioni di dollari di Singapore (52,48 milioni di dollari) provenienti dalla National Research Foundation.

“Con l’evoluzione rapida della tecnologia, c’è la necessità strategica di sviluppare capacità sovrane in LLM”, hanno dichiarato le agenzie in una dichiarazione congiunta. “Singapore e le culture, i valori e le norme locali e regionali della regione differiscono da quelli dei paesi occidentali, da cui originano la maggior parte dei grandi modelli di lingua”.

Hanno sottolineato l’importanza dello sviluppo di LLM multimodali e localizzati per il sudest asiatico, compreso Singapore, che comprendano il contesto e i valori legati alle diverse culture e lingue della regione. Queste variabilità possono comprendere, ad esempio, il passaggio da una lingua all’altra nella popolazione multilingue di Singapore.

Inoltre: Una questione spinosa: chi possiede codice, immagini e narrazioni generate da IA?

La ricerca sfrutterà le risorse di calcolo ad alte prestazioni del National Supercomputing Centre di Singapore e cercherà di sviluppare le capacità di ricerca e ingegneria del paese in LLM multimodali.

“Questo sforzo nazionale sottolinea l’impegno di Singapore nell’essere un centro globale dell’IA”, ha dichiarato Ong Chen Hui, vice direttore esecutivo di IMDA del gruppo biztech. “La lingua è un fattore essenziale per la collaborazione. Investendo nel talento e negli ampi modelli di IA per le lingue regionali, vogliamo favorire la collaborazione industriale tra i confini e guidare la prossima ondata di innovazione dell’IA nel sudest asiatico”.

L’iniziativa si baserà sugli sforzi attuali di SEA-LION (Southeast Asian Languages in One Network) di AISG, che è un LLM open-source che l’agenzia governativa ha dichiarato essere progettato per essere più piccolo, flessibile e veloce rispetto ai LLM presenti sul mercato oggi. Attualmente SEA-LION funziona con due modelli di base: un modello a tre miliardi di parametri e un modello a sette miliardi di parametri.

Illustrando la rilevanza del modello open-source, AISG ha dichiarato: “I LLM esistenti mostrano forti pregiudizi in termini di valori culturali, convinzioni politiche e atteggiamenti sociali. Questo è dovuto ai dati di addestramento, specialmente quelli ripescati da Internet, che spesso hanno origini eccessivamente WEIRD. WEIRD si riferisce a società occidentali, istruite, industrializzate, ricche e democratiche. Le persone di origine non-WEIRD sono meno propense ad essere istruite, a utilizzare Internet e ad avere facilmente accessibile il loro contributo”.

Inoltre: 7 suggerimenti avanzati per la scrittura di prompt ChatGPT che devi conoscere

SEA-LION mira a creare LLM (Linguistic Language Models) che rappresentino meglio le popolazioni “non-WEIRD” (Western, Educated, Industrialized, Rich, Democratic). I suoi dati di formazione includono 981 miliardi di token linguistici, che AISG definisce come frammenti di parole creati scomponendo il testo durante il processo di tokenizzazione. Questi frammenti includono 623 miliardi di token in inglese, 128 miliardi di token dell’Asia sudorientale e 91 miliardi di token in cinese.

Gli sforzi per costruire LLM localizzati fanno parte dell’ultima strategia di intelligenza artificiale di Singapore, che mira a diventare un centro globale di sviluppo per soluzioni di intelligenza artificiale entro il 2030. Questi sforzi includono piani per triplicare il numero di professionisti dell’intelligenza artificiale nel paese a 15.000 nei prossimi tre-cinque anni e fornire un ecosistema che supporti la governance, test e benchmark, insieme alle linee guida sull’etica e la sicurezza dell’IA.

Osservando che il mondo sta entrando in una terra inesplorata con i recenti sviluppi dell’intelligenza artificiale, il Vice Primo Ministro di Singapore, Lawrence Wong, ha dichiarato al lancio della strategia nazionale sull’IA: “Finora, l’IA è stata principalmente basata sul riconoscimento dei pattern. Ma in futuro avremo sistemi di intelligenza artificiale con capacità operative e transazionali. Avremo macchine con abilità cognitive simili a quelle umane e capacità di autoconsapevolezza e decisionali indipendenti.”

Con il potenziale di cambiare significativamente la vita umana e influenzare le società, lo sviluppo e l’adozione responsabili dell’IA dovrebbero essere guidati in modo più deliberato, ha affermato Wong.