di CHIARA VENUTO

Ascoltare i podcast di tutto il mondo in qualsiasi lingua e con la voce originale. È la promessa di Spotify, il colosso svedese di streaming on-demand, che attraverso l’intelligenza artificiale clonerà e tradurrà la voce degli autori dei programmi pubblicati sulla piattaforma.

Un’idea che – in modo facile e indolore – fa avverare il sogno di chiunque abbia studiato una lingua straniera: essere in grado di parlarla come un nativo, senza accento e senza sforzo. E che rende più semplice l’accesso alle informazioni contenute nei podcast, oggi usati da molti giornalisti e apprezzati dal pubblico. In Italia, ad esempio, Radio 24 punta a pubblicare 620 nuovi podcast al mese.

“esperienza autentica”

“Corrispondendo alla voce del creatore, ‘Voice Translation’ offre agli ascoltatori di tutto il mondo il potere di scoprire nuovi podcaster”. Sono le parole di Ziad Sultan, vicepresidente del reparto “Personalizzazione” di Spotify. Per l’azienda quella creata attraverso l’IA è “un’esperienza di ascolto più autentica che suona più personale e naturale rispetto al doppiaggio tradizionale”.

Spotify si affiderà allo strumento di trascrizione e traduzione audio Whisper, opera di OpenAI (l’impresa fondatrice di ChatGPT). Per quanto riguarda la “clonazione” della voce, è stata annunciata come una tecnologia per l’accessibilità in grado di creare “un audio simile a quello di un umano partendo da un testo e da pochi secondi” di registrazione del parlato. 

mimare il tono

L’amministratore delegato di OpenAI, Sam Altman, già in passato aveva parlato della pericolosità dell’intelligenza artificiale. Negli ultimi tempi si è persino paragonato a Robert Oppenheimer, il padre della bomba atomica, la cui storia ha ispirato il film di Christopher Nolan arrivato quest’anno nelle sale di tutto il mondo. Ed è proprio per ragioni di sicurezza che la tecnologia di copiatura della voce sarà diffusa in maniera limitata. “Queste capacità presentano anche nuovi rischi – si legge nel comunicato stampa di OpenAI – come la possibilità che persone malintenzionate impersonino personaggi pubblici o commettano frodi”.

Non è una novità: già da tempo esistono intelligenze artificiali in grado di “clonare” la voce delle persone. La diffusione di una IA talmente sviluppata da tradurre un intero podcast mimando persino il tono e il ritmo del parlante originario, però, potrebbe portare i rischi a nuovi livelli. Nel frattempo, preoccupa traduttori e doppiatori, le professioni più colpite da questo cambiamento.

versioni in spagnolo

Ci vorrà del tempo prima che la funzione di traduzione venga implementata su larga scala. Al momento sono disponibili le versioni in spagnolo di tre episodi originariamente in inglese: sono puntate dei podcast dell’informatico Lex Fridman, dell’attore Dax Shepard e dell’imprenditore Steven Bartlett. Ciascuna di esse contiene un’intervista, e perciò per ciascuno anche un’altra voce (oltre a quella dell’autore) è stata tradotta.

Nei prossimi giorni saranno pubblicate sulla pagina dedicata di Spotify anche le versioni in francese e tedesco. Per il momento non si parla ancora della traduzione in italiano. L’azienda non ha precisato in che misura intende rendere disponibile lo strumento, ma si sa già che altri podcast famosi saranno tradotti. Tra questi, anche quello del giornalista sportivo e critico culturale americano Bill Simmons.

LASCIA UN COMMENTO