La nuova trascrizione AI e l’espansione serverless di Amazon

La nuova trascrizione AI e l'espansione serverless di Amazon le ultime innovazioni tecnologiche

Amazon Web Services (AWS) ha recentemente annunciato importanti espansioni di Amazon Transcribe, il suo servizio di riconoscimento vocale automatico basato su cloud, che consente la trascrizione in oltre 100 lingue. Le nuove funzionalità sfruttano modelli generativi di intelligenza artificiale (AI) che sono stati addestrati su milioni di ore di dati vocali – secondo un articolo sul blog di Amazon.

In precedenza, Amazon Transcribe supportava 79 lingue con tassi di precisione del 20-50%. I nuovi algoritmi di auto-apprendimento che alimentano il servizio di trascrizione possono ora riconoscere modelli di discorso unici e accenti in una vasta gamma di lingue. Ciò impedisce la sovrarappresentazione di particolari lingue nei dati di addestramento, garantendo che l’accuratezza sia costante indipendentemente da quanto una lingua sia diffusa.

L’automazione della trascrizione dell’AI amplierà la possibilità per grandi popolazioni di avere parole nella propria lingua.

Questi avanzamenti nell’IA ampliano significativamente l’accessibilità della trascrizione automatica, che in precedenza era disponibile solo per lingue comuni come l’inglese e lo spagnolo. I clienti di AWS possono ora sfruttare il servizio in tutto il mondo, creando applicazioni che richiedono capacità di conversione del parlato in testo.

Funzionalità come la punteggiatura automatica, il vocabolario personalizzato, l’identificazione della lingua e il filtraggio dei contenuti offrono un’usabilità aggiuntiva per tradurre registrazioni audio e video. Le trascrizioni sono in grado di comprendere il parlato anche in ambienti rumorosi, rendendo la tecnologia adatta per riassumere le interazioni dei call center.

La piattaforma di analisi delle chiamate di AWS già utilizza Amazon Transcribe per generare riassunti automatizzati delle trascrizioni delle chiamate tra agenti e clienti. Ciò riduce lo sforzo manuale necessario per interpretare le chiamate ed estrarre informazioni significative. Gli esperti del settore ritengono che, man mano che l’accuratezza del riconoscimento vocale migliora, l’integrazione di tali servizi di intelligenza artificiale si accelererà in diverse applicazioni aziendali.

Amazon Transcribe rimane un importante attore nella trascrizione cloud.

Nonostante Amazon Transcribe rimanga un attore significativo nello spazio della trascrizione cloud, affronta una crescente concorrenza da aziende come Otter.ai, che offre le proprie funzionalità di riassunto basate su intelligenza artificiale. C’è anche un interesse crescente per il riconoscimento vocale da parte di importanti attori tecnologici come Meta, che sta sviluppando un modello di traduzione in grado di riconoscere quasi 100 lingue.

OpenAI ha anche lanciato il proprio software di trascrizione open source, chiamato Whisper. Il software è ancora vicino allo stato dell’arte delle prestazioni di trascrizione e può essere eseguito localmente su hardware per consumatori. L’azienda lo ha presentato insieme a un servizio di trascrizione on-demand nel settembre 2022.

Crediti immagine in evidenza: Elias Tigiser;