Open Source vs. Closed Source La battaglia dell’IA scatenata

I ricercatori hanno scoperto che il Llama 2 ha ottenuto solo leggermente migliori risultati rispetto a un'ipotesi casuale in un esame medico, mentre il GPT-4 ha quasi raggiunto un punteggio sufficiente.

Modelli AI generativi open source sono ancora indietro rispetto a GPT-4

Fonte immagine: MixImages – tech

Uno dei dibattiti più accesi nel mondo dell’intelligenza artificiale generativa (AI) riguarda la rivalità in corso tra modelli open source e closed source. Entrambi hanno i loro sostenitori e detrattori, ma quale approccio offre maggiori promesse per fornire soluzioni AI preziose? Tuffiamoci nel mondo emozionante e spietato dell’AI e scopriamolo!

Clash di titani: modelli di linguaggio open source e closed source

Nel campo open source, abbiamo una miriade di grandi modelli di linguaggio (LLM) costantemente prodotti da una vibrante comunità di contributori. Il leader del branco è l’impressionante Llama 2, un modello open source che ha attirato notevole attenzione.

Rappresentando il campo closed source ci sono i formidabili contendenti: GPT-4 di OpenAI e il modello di linguaggio della startup Anthropic, conosciuto come Claude 2.

🔗 Link pertinente: Walmart presenta l’IA generativa al CES

La chiave della vittoria: performance in specifici domini

Per determinare quale approccio regni sovrano, scrutiamo attentamente le loro performance in specifici domini. Prendiamo ad esempio il complesso dominio della nefrologia, la scienza dei reni. In uno studio recente condotto da scienziati delle università Pepperdine, California a Los Angeles e UC Riverside (pubblicato in NEJM AI), i modelli open source si sono impantanati, mentre GPT-4 ha mostrato la sua abilità.

🔗 Link pertinente: Le aziende hanno bisogno di una governance dell’IA

“A confronto con GPT-4 e Claude 2, i modelli open source si sono comportati male in termini di risposte corrette totali e qualità delle spiegazioni”, ha scritto l’autore principale Sean Wu e i suoi colleghi.

🔗 Link pertinente: I migliori chatbot di intelligenza artificiale

GPT-4 si è davvero distinto, ottenendo un punteggio del 73,3%, quasi alla pari con il voto di passaggio per una persona che risponde a domande di nefrologia a scelta multipla.

Risultati della battaglia: i modelli open source faticano a tenere il passo

Purtroppo, i modelli open source, compreso Llama 2, hanno avuto difficoltà nel fornire risposte accurate. Hanno ottenuto punteggi non migliori di una scelta casuale. Tuttavia, Llama 2 è riuscito a superare leggermente i suoi omologhi open source, ottenendo un punteggio del 30,6%.

🔗 Link pertinente: Cinque modi per utilizzare l’IA in modo responsabile

Fattori sottostanti: i dati medici proprietari prendono il centro della scena

Vi sono molti motivi che contribuiscono alle scarse performance dei modelli open source. In particolare, Anthropic e OpenAI hanno integrato dati medici proprietari nei loro processi di formazione, conferendo loro un chiaro vantaggio.

🔗 Link pertinente: MedPerf punta a velocizzare l’IA medica preservando i dati privati

L’autore principale, Sean Wu, e il suo team hanno osservato che “dati di alta qualità per la formazione di LLM nel campo medico spesso risiedono in materiali non pubblici”. Questi dati, costituiti da fonti curate e sottoposte a revisione paritaria come libri di testo e articoli, rimangono inaccessibili alla comunità open source. L’accesso a tali dati di formazione medica esclusivi probabilmente sarà un fattore significativo nel determinare il miglioramento dei modelli open source in futuro.

🔗 Link pertinente: Aggiornamento: Google Pixel Phones

Spazio per il Miglioramento: Un Lungo Cammino da Percorrere

Anche se le performance di GPT-4 sono state lodevoli, è importante ricordare che ha comunque fallito nel raggiungere un voto umano sufficiente. Tutti i modelli di linguaggio, indipendentemente dalla loro apertura, hanno ancora molta strada da fare. Ma non temete, ci sono iniziative all’orizzonte che potrebbero livellare il campo di gioco.

Addestramento Federato: Un Futuro più Intelligente

Uno sforzo trasformativo che sta guadagnando slancio è l’addestramento federato, dove i modelli di linguaggio vengono addestrati su dati privati e poi contribuiscono con le loro conoscenze ad uno sforzo aggregato nel cloud pubblico. Questo approccio mira a colmare il divario tra i dati medici confidenziali e lo sforzo collettivo per rafforzare i modelli open-source. Un’iniziativa degna di nota in questo ambito è MedPerf, avviata dal consorzio industriale ML Commons.

🔗 Link Pertinente: L’enorme Sforzo di Apple nell’AI

Sfruttare il Potere della Collaborazione

Un’altra strada promettente è la possibile distillazione dei modelli commerciali in programmi open-source. Ereditando competenze mediche specifiche dai loro modelli di riferimento, questi programmi open-source possono produrre output migliorati. MedPaLM, il LLM di Google DeepMind specializzato nel rispondere alle domande mediche, ne è un esempio notevole.

🔗 Link Pertinente: Corsi di Immagini AI su Udemy

Quando Mondi Collidono: Potenziare gli Output per un Impatto Massimo

Anche senza una formazione medica specifica, i modelli di linguaggio possono ottenere risultati migliori utilizzando la “generazione potenziata da recuperazione”. Questo approccio permette ai LLM di cercare input esterni durante la generazione dei loro output, amplificando le capacità delle reti neurali.

Il Vantaggio dell’Apertura: Creatività Collaborativa

In definitiva, la natura aperta dei modelli come Llama 2 offre infinite opportunità per diversi attori di contribuire e migliorare. A differenza dei modelli a codice chiuso come GPT-4 e Claude 2, il destino dei modelli open-source rimane veramente democratico.

Preparatevi per una battaglia reale nell’intelligenza artificiale, in cui l’innovazione, la creatività e la collaborazione apriranno la strada ad eccellenti modelli di linguaggio!

🎉 Continuiamo le discussioni! Condividete le vostre opinioni sul dibattito tra codice aperto e codice chiuso nei commenti qui sotto. E non dimenticate di diffondere il messaggio condividendo questo articolo sui social media! 📢

Elenco delle Referenze:

  1. Walmart Debutta con l’IA Generativa al CES
  2. La Necessità di Governance dell’IA per le Aziende
  3. I Migliori Chatbot basati su IA
  4. Cinque Modi per Utilizzare in Modo Responsabile l’IA
  5. MedPerf Cerca di Accelerare l’AI Medica Mantenendo i Dati Privati
  6. Aggiornamento: Telefoni Google Pixel
  7. L’enorme Sforzo di Apple nell’AI
  8. Corsi di Immagini AI su Udemy