Spotify utilizza l’intelligenza artificiale per tradurre le voci originali dei podcaster in lingue aggiuntive

Spotify usa l'IA per tradurre le voci originali dei podcaster in altre lingue.

Questa settimana Spotify ha annunciato una funzionalità di traduzione basata sull’IA per i podcaster che potrebbe conferirgli un vantaggio rispetto alla piattaforma di podcast di Apple. La traduzione vocale per i podcast utilizza l’intelligenza artificiale per tradurre i podcast in altre lingue utilizzando la voce originale del podcaster.

Sebbene Spotify abbia sviluppato lo strumento, sta utilizzando la più recente tecnologia di generazione vocale di OpenAI. Questo sistema apprende la voce e lo stile del locutore originale, traducendo poi il podcast in un’altra lingua. Spotify afferma che questo sistema offrirà un’esperienza di ascolto “più autentica”, più naturale e personale rispetto al doppiaggio standard. I podcast tradotti in questo modo manterranno le caratteristiche distintive della voce del locutore.

Spotify sta testando Voice Translation al momento e sta collaborando con podcaster come Dax Shepard, Monica Padman, Bill Simmons, Steven Bartlett e Lex Fridman per creare traduzioni vocali basate sull’IA in lingue come lo spagnolo, il francese e il tedesco sia per gli episodi esistenti che per i futuri episodi di podcast.

Gli episodi tradotti vocalmente sono disponibili in tutto il mondo per gli utenti Premium e Free. Un primo gruppo di episodi tradotti in spagnolo è già disponibile, mentre quelli in francese e tedesco saranno disponibili “nei prossimi giorni e settimane”. Secondo Spotify, il programma pilota fornirà “importanti informazioni” per future espansioni e iterazioni.

Anche se Apple al momento non dispone di uno strumento concorrente per la piattaforma dei Podcast, sta sperimentando con la tecnologia vocale basata sull’IA. In iOS 17, Apple ha aggiunto una funzione di Voce Personale che consente di utilizzare l’IA per creare una replica della propria voce. Al momento, si tratta di una funzionalità di accessibilità progettata da Apple per coloro che rischiano di perdere la capacità di parlare, ma è plausibile che Apple possa utilizzare la replicazione vocale anche in altri ambiti in futuro.