Arriva VALL-E: la voce artificiale che riproduce quella umana
Sarà capitato a tutti di sentire, almeno una volta, la voce di una sintesi vocale, ovvero di quei programmi capaci di riconoscere un testo scritto e di vocalizarlo. Sono le voci dei centralini automatici, quelle che gestiscono le file alle casse del supermercato, che annunciano treni e aerei in arrivo e in partenza.
Rispetto al passato sono stati fatti passi da gigante nel tentare di rendere il più possibile queste voci sintetiche simili a quella umana: ora è infatti possibile scegliere tono, inflessione, velocità e tutta una serie di opzioni che permettono di avere un risultato il più possibile fedele alla realtà.
Tuttavia, la differenza tra queste voci e quelle reali è rimasta evidente: impossibile riprodurre le sfumature, il colore, la profondità e l’espressività di una voce umana. Fino a oggi.
Una rivoluzione tecnologica
Si chiama VALL-E ed è il nuovo modello di intelligenza artificiale applicata alle sintesi vocali sviluppata da Microsoft. Dopo l’ascolto di un campionamento di soli 3 secondi, VALL-E è in grado di riprodurre fedelmente la voce umana ascoltata, imitandone tutte le caratteristiche che la rendono unica.
Non solo: il programma è in grado di simulare anche l’ambiente acustico in cui si svolge la conversazione, ad esempio una telefonata o una conferenza.
I possibili impieghi
I ricercatori hanno ipotizzato un impiego nel campo delle sintesi vocali ad alta qualità, come nel caso degli editing audio o la creazione di contenuti vocali a partire da un testo.
Poiché questo tipo di Ia (intelligenza artificiale) si presta a usi impropri, gli sviluppatori assicurano che saranno costruiti modelli di rilevamento per comprendere se una clip audio è stata realizzata da VALL-E al fine di evitare la manipolazione di discorsi, l’impersonificazione di un parlante e lo spoofing (pratiche di cyber criminalità che consistono nello spacciarsi per una fonte affidabile ai fini di truffare ed estorcere denaro e informazioni).
Insomma, il futuro non sembra poi così lontano.
Roberta Gatto