Singapore guida l’iniziativa per lo sviluppo di un modello di linguaggio multimodale per l’Asia sudorientale

Singapore investe 52 milioni di dollari nello sviluppo di un modello linguistico unico diverso dalle nazioni occidentali

Progetto di ricerca per la costruzione di un grande modello di intelligenza artificiale per il linguaggio dell’Asia sudorientale

🌐 Globo dell'Asia Sudorientale 🌐

Un nuovo progetto di ricerca è in corso per costruire un grande modello di linguaggio (LLM) che si adatti meglio alla demografia delle nazioni dell’Asia sudorientale.

Presentazione del National Multimodal LLM Programme

Chiamato National Multimodal LLM Programme, questa entusiasmante iniziativa è guidata da Singapore e mira a sviluppare un grande modello di linguaggio per l’intelligenza artificiale (AI) che supporti la diversità culturale e linguistica della regione. 🇸🇬

Tre agenzie governative – Infocomm Media Development Authority (IMDA), AI Singapore (AISG) e l’Agenzia per la Scienza, la Tecnologia e la Ricerca (A*STAR) – hanno collaborato per lanciare il programma di ricerca, con un finanziamento di SG$70 milioni ($52.48 milioni) dalla National Research Foundation.

Perché l’Asia sudorientale ha bisogno di modelli di linguaggio localizzati

“Con l’evoluzione rapida della tecnologia, c’è una necessità strategica di sviluppare capacità sovrane in LLM”, hanno dichiarato le agenzie in un comunicato congiunto. “Singapore e le culture, i valori e le norme locali e regionali della regione sono diverse da quelle dei paesi occidentali, dove originano la maggior parte dei grandi modelli di linguaggio”.

Per comprendere veramente il contesto e i valori legati alle diverse culture e lingue della regione, è fondamentale sviluppare modelli di linguaggio multimodali e localizzati per l’Asia sudorientale. Questo include affrontare le sfide del passaggio di contesto tra le lingue nella popolazione multilingue di Singapore.

Sviluppo delle capacità di ricerca e ingegneria

L’iniziativa di ricerca sfrutterà le risorse di calcolo ad alte prestazioni del Singapore National Supercomputing Centre e si concentrerà sullo sviluppo delle capacità di ricerca e ingegneria del LLM multimodale del paese. L’impegno di Singapore a diventare un centro globale per l’AI è evidente, con Ong Chen Hui, vicepresidente esecutivo del gruppo biztech di IMDA, che afferma: “Il linguaggio è un elemento essenziale per la collaborazione. Investendo in talenti e grandi modelli di linguaggio per le lingue regionali, vogliamo favorire la collaborazione industriale tra confini e guidare la prossima ondata di innovazione legata all’AI in Asia sudorientale”.

SEA-LION: un passo verso una maggiore localizzazione

L’iniziativa si baserà sugli sforzi attuali del progetto Southeast Asian Languages in One Network (SEA-LION) di AISG, un LLM open-source progettato per essere più piccolo, flessibile e veloce rispetto ai LLM presenti sul mercato oggi. SEA-LION opera su due modelli di base: un modello a tre miliardi di parametri e un modello a sette miliardi di parametri.

Creando LLM che rappresentino meglio le popolazioni “non-WEIRD” (non occidentali, istruite, industrializzate, ricche, democratiche), SEA-LION mira a contrastare i pregiudizi presenti nei modelli esistenti. Con i suoi dati di allenamento composti da 981 miliardi di token linguistici, SEA-LION ha il potenziale per colmare il divario e fornire una rappresentazione più accurata delle lingue e delle culture dell’Asia sudorientale.

L’ambiziosa strategia di Singapore sull’AI

Gli sforzi per costruire LLM localizzati sono in linea con la strategia sull’AI di Singapore, che mira a stabilire il paese come un centro di sviluppo globale per soluzioni di intelligenza artificiale entro il 2030. Questa strategia completa comprende piani per triplicare il numero di professionisti dell’AI nel paese a 15.000 nei prossimi tre-cinque anni, insieme a iniziative incentrate sulla governance, test, benchmarking e linee guida sull’etica e la sicurezza dell’AI.

Il vice primo ministro di Singapore, Lawrence Wong, ha sottolineato l’importanza dello sviluppo e dell’adozione responsabili dell’AI nel suo discorso al lancio della strategia nazionale sull’AI. Mentre l’AI progredisce, ha evidenziato la possibilità di macchine con capacità cognitive simili a quelle umane, consapevoli di sé e di decisioni indipendenti. Pertanto, è cruciale guidare lo sviluppo e l’adozione dell’AI in modo deliberato.

Domande e risposte: cosa vogliono sapere gli altri lettori?

Domanda: Cosa è un grande modello di linguaggio (LLM)? Risposta: Un grande modello di linguaggio è un sistema di intelligenza artificiale in grado di generare testo simile a quello umano, rispondere a domande e comprendere il contesto del linguaggio. Utilizza una enorme quantità di dati per imparare e riprodurre i modelli di linguaggio simili a quelli umani.

Domanda: Come mostrano le attuali modelli di linguaggio dei pregiudizi? Risposta: Gli attuali modelli di linguaggio spesso mostrano dei pregiudizi a causa dei dati di allenamento che utilizzano, che spesso provengono dal web. Questi dati tendono ad avere un’origine occidentale, istruita, industrializzata, ricca e democratica (WEIRD), creando pregiudizi nei valori culturali, nelle convinzioni politiche e nelle attitudini sociali. Le persone di origine non-WEIRD sono meno rappresentate in questi modelli.

D: Quali sono i vantaggi della costruzione di modelli di linguaggio localizzati? R: La costruzione di modelli di linguaggio localizzati consente una migliore comprensione delle sfumature, del contesto culturale e dei valori specifici di una determinata regione. Affrontando i pregiudizi e le limitazioni dei modelli esistenti, i modelli localizzati forniscono rappresentazioni più accurate e consentono progressi nelle applicazioni di intelligenza artificiale per le lingue regionali.

D: In che modo SEA-LION contribuisce alla localizzazione linguistica? R: SEA-LION è un LLM open source appositamente progettato per rappresentare popolazioni non-WEIRD. Sfruttando i suoi dati di addestramento, che includono token linguistici del sudest asiatico e delle regioni di lingua cinese, SEA-LION mira a fornire un modello di linguaggio più inclusivo e completo per le culture del sud-est asiatico.

D: Quali sono le implicazioni a lungo termine della strategia di Singapore sull’IA? R: La strategia sull’IA di Singapore mira a posizionare il paese come leader mondiale nello sviluppo di intelligenza artificiale. Promuovendo la collaborazione industriale, aumentando il numero di professionisti dell’IA e concentrandosi sulla governance e sull’etica, Singapore mira a stimolare l’innovazione, la crescita economica e il progresso sociale nel campo dell’IA.

In conclusione

Il programma nazionale di LLM multimodale guidato da Singapore dimostra un impegno nello sviluppo di modelli di linguaggio dell’IA che rappresentino meglio le culture e le lingue del sud-est asiatico. Affrontando i pregiudizi, i contesti specifici della lingua e i valori locali, questi modelli localizzati apriranno la strada a progressi nelle applicazioni di IA e favoriranno l’innovazione nella regione. L’ambiziosa strategia di Singapore sull’IA posiziona il paese come leader mondiale nello sviluppo di IA, enfatizzando l’importanza di un’adozione responsabile dell’IA e la necessità di abbracciare il potere trasformativo dell’IA.


Riferimenti:
1. TomTom e Microsoft lanciano un assistente di guida AI 2. L’etica dell’IA generativa: come possiamo sfruttare questa potente tecnologia 3. DALL·E 3: come ChatGPT può leggere e modificare immagini, vieni a vedere 4. Una questione spinosa: chi possiede il codice, le immagini e le narrazioni generate dall’IA? 5. Il proprietario di CBS Paramount National Amusements dichiara di essere stato hackerato 6. OpenAI rilascia la patch per la fuga di dati di ChatGPT: problema completamente risolto 7. 7 suggerimenti avanzati per la scrittura di prompt di ChatGPT che devi conoscere


Ti è piaciuto questo articolo affascinante? Condividi i tuoi pensieri nei commenti qui sotto e non dimenticare di diffondere la voce condividendo questo articolo sui tuoi social media preferiti! 🚀😄