I NotebookLM di Google punta ad essere l’assistente di scrittura definitivo

I NotebookLM di Google l'assistente di scrittura definitivo.

Steven Johnson ha scritto 13 libri, su argomenti che vanno da un epidemia di colera a Londra al valore dei videogiochi. È stato un presentatore televisivo e un ospite di podcast. È un relatore principale che non deve definirsi tale nel suo profilo LinkedIn. E da oltre un anno è un dipendente a tempo pieno di Google, uno status che è evidente quando mi fa entrare negli uffici di Chelsea di questo gigante delle ricerche a New York per mostrarmi ciò che il suo team ha creato.

Testo normale

ISCRIVITI per Testo normale

Si chiama NotebookLM, e il modo più semplice per pensarci è come un collaboratore di intelligenza artificiale con accesso a tutti i tuoi materiali che si siede sulla tua spalla metaforica per guidarti nel tuo progetto. NotebookLM è stato lanciato in anteprima per un gruppo selezionato all’inizio di quest’anno ma ora è disponibile a tutti come “esperimento”: è il modo a basso rischio di Google per vedere come l’app si comporta e come ci comportiamo noi con l’app.

Johnson è arrivato a Google attraverso una passione di una vita per il software come “un partner di pensiero dinamico”, uno strumento per velocizzare e migliorare il processo creativo. Quando era all’università, si è appassionato a HyperCard, il software di Apple che suddivideva la conoscenza in blocchi e consentiva di navigare nello spazio delle informazioni attraverso collegamenti. Ha anticipato la navigazione web prima che esistesse la rete. “Ho combattuto strenuamente per trasformare HyperCard in quell’attrezzo dei sogni, ma non era ancora pronto,” ha detto. Alla fine è diventato un appassionato di Scrivener, un elaboratore di testi combinato con un organizzatore di progetti popolare tra gli autori di libri. (Anche io sono un fan.)

Quando Johnson ha avuto accesso al generatore di testo GPT-3 di OpenAI nel 2021, ha riconosciuto che l’IA poteva elevare una nuova generazione di strumenti di pensiero. Oh, aspetta, ha detto a se stesso, questa cosa che è stata sempre nella parte posteriore della mia mente ora sarà possibile. Scenari impensabili anche solo un anno prima erano improvvisamente sul tavolo. Johnson ancora non sapeva che Google non solo aveva modelli di linguaggio simili, ma stava già lavorando a un progetto molto in linea con il suo pensiero. Nel maggio 2022, un piccolo team nella divisione sperimentale di Google Labs ha inviato una e-mail a freddo a Johnson. Hanno organizzato un incontro tramite Starline, un progetto di Google Labs che consente incontri dal vivo sorprendentemente intimi. “Sostanzialmente ho avuto una conversazione con un ologramma che ha detto, ‘Sai, questa cosa che hai cercato per tutta la vita? Possiamo finalmente costruirla,'” dice Johnson. È diventato un consulente a tempo parziale per il piccolo team, condividendo inizialmente il flusso di lavoro di uno scrittore professionista. “Ecco quattro o cinque ingegneri, ecco un vero autore, guardiamolo semplicemente,” riassume il processo Josh Woodward, responsabile di Google Labs. Alla fine Johnson si è coinvolto nello sviluppo del prodotto stesso ed è stato assorbito al punto di accettare un impiego a tempo pieno. Il suo titolo presso Google Labs è direttore editoriale.

NotebookLM, originariamente chiamato Project Tailwind, inizia creando un set di dati del materiale di origine, che si trascina nel tool da Google Docs o dalla clipboard. Dopo che l’app ha digerito tutto, è possibile porre domande a NotebookLM sul materiale, grazie alla tecnologia del grande modello di linguaggio di Google, in parte alimentato dall’aggiornamento appena rilasciato Gemini. Le risposte riflettono non solo ciò che c’è nel materiale di origine, ma anche la comprensione generale più ampia del mondo che Gemini possiede. Un elemento critico è che ogni risposta alle domande viene fornita con un set di citazioni che riportano esattamente da dove proviene l’informazione, in modo che gli utenti possano verificare l’accuratezza dell’output.

Google non è l’unico che sta immaginando prodotti che consentano alle persone di creare set di dati personalizzati da esplorare con LLMs. Al OpenAI’s developer day dello scorso mese, l’azienda ha presentato mini-GPT personalizzati che possono essere adattati a un compito specifico. Woodward riconosce una “similitudine centrale”. Ma sostiene che NotebookLM si concentra di più sull’ottimizzazione del flusso di lavoro e mira a fornire una precisione superiore nei suoi output. Inoltre, sostiene che i prodotti OpenAI hanno una personalità più accentuata, mentre NotebookLM è progettato senza tali pretese.

Ho giocato con NotebookLM per alcune settimane. La parte più irritante del processo di scrittura per me è sempre stata quella di dover costantemente abbandonare il mio manoscritto per trovare le informazioni esatte di cui ho bisogno in una trascrizione o documento a cui voglio fare riferimento o citare. Mentre scrivevo questo saggio, quando volevo ricordarmi il titolo ufficiale di Johnson, NotebookLM mi ha subito fornito la risposta quando l’ho chiesto. Ma questa è solo una delle sue utilità più prosaiche. Le funzioni più profonde si presentano sotto forma di analisi che può fornire sul materiale di origine, non solo i fatti, ma anche l’immagine generale che dipingono. Appena inserisci le fonti, sembra che NotebookLM arrivi alle proprie opinioni su ciò che è importante sul tema e può suggerirti domande a cui rispondere e temi da esplorare. E anche se Woodward sostiene che NotebookLM non ha una personalità, gli piace sicuramente parlare. Anche una semplice domanda come il titolo di Johnson è stata seguita da una lista di quattro punti elencati.

Dato che le mie fonti erano tre membri di Google e un post sul blog aziendale, gli output di NotebookLM riflettevano, non sorprendentemente, ciò che Google vuole far pensare al mondo di NotebookLM. Quando ho fatto domande su questo materiale di origine, ho dovuto costantemente ricordare all’app che non stavo scrivendo dal punto di vista di Google. Quando ho chiesto a NotebookLM di descriversi nel modo più semplice possibile, sperando che potesse aiutarmi a formulare una breve descrizione nel primo paragrafo di questo saggio, ha risposto con i suoi adorati punti elencati. Gli ho chiesto di ridurlo a una sola frase che non sembrasse una descrizione pubblicitaria. Ecco cosa è venuto fuori: “NotebookLM è uno strumento sperimentale di appunti alimentato dall’IA che ti aiuta a imparare più velocemente leggendo e comprendendo i tuoi documenti, generando riassunti, rispondendo alle tue domande e persino aiutandoti a fare del brainstorming su nuove idee”. È un riassunto impressionante che è stato supportato da 10 citazioni, ma non rifletteva il punto di vista più importante: il mio. È giusto così, perché spetta a me fornirlo. Sono anche contento che NotebookLM non abbia cercato di impressionare con un (patetico) tentativo di linguaggio alla moda, perché anche quello è compito mio.

Ma ecco la mia preoccupazione. Gli utenti di NotebookLM, che semplicemente vogliono fare un buon lavoro in modo rapido, potrebbero non prendersi il tempo per fare quel duro lavoro di pensiero. Potrebbero non preoccuparsi neanche di analizzare attentamente i materiali di ricerca stessi. Perché dedicare tempo quando il tuo amico AI ha esaminato il materiale molto più attentamente di te ed ha già raggiunto alcune interessanti conclusioni? Johnson non sembra preoccuparsi di ciò come me. Innanzitutto, sottolinea che gli utenti non sono obbligati a intrattenere un dialogo concettuale con l’app: possono usarla felicemente per trovare quel passaggio in cui viene identificato il titolo di qualcuno e simili. Ma chiaramente ritiene che sia un enorme vantaggio impegnarsi in tale dialogo. È entusiasta che NotebookLM offra suggerimenti su temi da approfondire. E puoi persino utilizzare una modalità in cui NotebookLM critica il tuo lavoro e sostiene il lato opposto. “Se sono sinceramente interessato a ottenere un punto di vista unico, NotebookLM dovrebbe essere in grado di aiutarmi a raggiungerlo con meno problemi”, dice, “e forse anche a trovare un punto di vista più interessante”. Ciò mi fa chiedere: di chi sarebbe ora quel punto di vista?

Mentre usiamo sempre più strumenti AI, in modo sempre più intensivo, questa domanda è fondamentale. Dopo aver trascorso l’intero anno 2023 scrivendo e riflettendo sull’IA, posso ora sintetizzare la mia preoccupazione principale, in modo più succinto di quanto NotebookLM possa fare. Il nostro futuro sarà caratterizzato da una tensione tra copilota (l’IA come collaboratore) e pilota automatico (gli esseri umani come assistenti dell’IA). Quest’ultimo è più efficiente e meno costoso dal punto di vista dell’economia del lavoro in senso stretto, ma ci sono tutta una serie di problemi.

Sottolineare ciò non è assolutamente un attacco a NotebookLM. Sto solo esercitando il mio mestiere di commentatore in un modo che i nostri attuali modelli di IA non possono eguagliare (almeno per ora). Nel frattempo, lavorando con il suo team di Google Labs, Steven Johnson ha raggiunto lo standard d’oro per i prodotti tecnologici, creando lo strumento che desidera di più utilizzare. Ora può passare le sue giornate a Google costruendone di nuovi – e forse, affrontando la maledizione di ottenere quello che hai chiesto.

La passione di Steven Johnson per gli strumenti di supporto al pensiero è iniziata con il software HyperCard di Apple, che ha avuto un’enorme influenza. Nel mio articolo nella rivista Macworld del febbraio 1988, ho riflettuto su HyperCard personalmente, cercando di valutare le potenzialità di questo affascinante programma e l’idea di navigare attraverso un mare di informazioni del mondo – necessariamente attraverso un obiettivo pre-internet. In quel periodo ero scettico che un progetto del genere potesse essere finanziato e non mi aspettavo che si sarebbe trattato di un’iniziativa dal basso, accelerata alla fine da Google, un’azienda il cui scopo era rendere accessibili universalmente le informazioni del mondo. Ma avevo ragione a prevedere le implicazioni del copyright con cui ci stiamo confrontando ora nell’era di ChatGPT.

C’è una lunga fila di seguaci di questa visione, che inizia nel 1945 con Vannevar Bush e prosegue con Ted Nelson, che ha coniato il termine “ipermedia”. Il presidente di Apple, Sculley, scrive della sua convinzione che HyperCard e i suoi discendenti ci libereranno dalle “limitazioni del formato lineare di un libro”: collegare le informazioni “nel modo in cui si pensa” in molti casi eluderà la noiosa convenzione di inizio, metà e fine. La nostra narrativa potrebbe cominciare a somigliare a romanzi come “Rayuela”, scritto dallo scrittore sudamericano Julio Cortázar. Il premio Nobel sosteneva che i 155 capitoli del suo libro potessero essere letti in diverse sequenze. Nel mondo dell’ipermedia, i libri di saggistica non verrebbero letti dall’inizio alla fine, ma sarebbero mescolati in una sorta di Banca Mondiale dell’Informazione, ogni passaggio collegato in milioni di modi ad altre informazioni pertinenti. Per citare Sculley, l’utilizzo di questo modello “consente all’utente di richiamare qualsiasi informazione di cui ha bisogno, nella dose che richiede”.

Questo mi sembra uno scenario improbabile, almeno in proporzione a quanto alcuni commentatori hanno previsto. Un’enorme sfida si frappone tra noi e il realizzare il sogno dell’ipermedia: tutte le conoscenze del mondo devono essere inserite come dati e messe online.

Anche i problemi di copyright e fair use devono essere affrontati, il che comporta un numero quasi infinito di ore di lavoro di avvocati. In un mondo in cui troppe persone sono affamate e senza casa, il nostro programma spaziale è fermo, le aziende sono agili ed efficienti, e ogni centesimo disponibile viene utilizzato per strumenti di distruzione, è difficile immaginare che questo progetto multimiliardario possa mai prendere il via.

Senza dubbio, i modi veloci per accedere alle informazioni – ciò che potrebbe un giorno essere conosciuto come la tradizione di HyperCard – cambieranno il modo in cui facciamo ricerca e acquisiamo conoscenze. Ma i cambiamenti nel futuro prossimo avverranno su una scala molto più modesta. Nel frattempo, non lasciamo che il discorso sulle superstrade delle informazioni offuschi la nostra visione di ciò che abbiamo di fronte: un programma fantastico chiamato HyperCard. È qui adesso, è reale, e abbiamo tutti un compito davanti a noi: capire come sfruttarlo al massimo.

Poiché questo sarà l’ultimo Plaintext dell’anno e anche perché voi lettori state facendo un pessimo lavoro nel riempire la mia casella di posta con domande, me ne farò una da solo. Di cosa scriverai nel 2024? Beh, l’IA, ovviamente. Voglio scrivere sugli sviluppi che fanno avanzare la tecnologia e sulla corsa potenzialmente pericolosa per lanciare prodotti per restare un passo avanti alla concorrenza. Nei miei 40 anni di esperienza nel campo tecnologico, questo è il periodo più eccitante che ricordi e anche il momento in cui un commento formatissato è più critico.

Spero anche di avere una serie di conversazioni approfondite per la nostra serie The Big Interview, in cui alcune delle persone fondamentali nel campo dell’IA e di altri settori sveleranno chi sono e faranno le domande che desiderate di più farvi rispondere.

In una delle interviste di quest’anno, Satya Nadella si è riferito all’intelligenza artificiale generale, o AGI, come a una potenziale “ultima invenzione”. Perdonatemi il mio pregiudizio, ma non posso accettarlo. Anche se l’IA sembra superare ciò che gli esseri umani possono fare in ogni campo, compresi quelli creativi, per definizione non può mai fornire una cosa che sostiene tutti noi e che è indispensabile in tutto ciò che produciamo e creiamo. E quella cosa è una connessione umana. Sì, sono emozionato dall’IA. Ma mi aspetto anche che molto tempo dopo la mia scomparsa le persone in carne e ossa continuino a stupire e ispirare i loro simili con ciò che creano e raggiungono.

Auguri di buone vacanze e ci vediamo a gennaio.

Puoi inviare domande a mail@ENBLE.com. Scrivi ASK LEVY nella riga dell’oggetto.

L’esito più deprimente dei negoziati sul clima COP28 finora è il numero record di delegati legati alle compagnie petrolifere e del gas.

NotebookLM sarà alimentato in parte da Google’s Gemini LLM, introdotto questa settimana. Fa parte di una grande corsa verso il chatbot definitivo.

Ecco Demis Hassabis, il capo umano di Google DeepMind, che spiega cosa significa Gemini.

Alla festa di compleanno del 30º anniversario di ENBLE, ho convocato la prima riunione del “Club degli ottimisti dell’IA”. Alla fine abbiamo parlato non solo del potenziale dell’IA, ma anche dei suoi pericoli.

L’ex spia responsabile del successo televisivo The Americans ha un nuovo spettacolo ancora più surreale in lavorazione.

Non perdere le future edizioni riservate ai soli abbonati di questa rubrica. Iscriviti a ENBLE (sconto del 50% per i lettori di Plaintext) oggi.