comunicaZIONI
Skype lancia la traduzione simultanea con la voce di chi parla
Il servizio è Truvoice: la funzione sfrutta l’intelligenza artificiale per tradurre, in altre lingue, le chiamate vocali tra utenti
Skype ha lanciato TruVoice, una funzione che sfrutta l’intelligenza artificiale per tradurre, in altre lingue, le chiamate vocali tra utenti. La novità è che, a differenza di alcuni software odierni, la sintesi vocale non è robotica ma utilizza un timbro vicino a quello di chi parla, per rendere la comunicazione più naturale, anche quando a parlarsi sono persone di nazionalità differenti. Microsoft definisce TruVoice «un enorme passo avanti per Skype, poiché consente a persone che parlano lingue diverse di comunicare facilmente». Al momento le uniche lingue supportate sono inglese, spagnolo, francese, tedesco e cinese. In futuro ne saranno aggiunte delle altre. Skype era già in grado di rilevare automaticamente lingue diverse e avviare la traduzione del testo e audio ma usando appunto un sistema robotizzato, che permetteva di raggiungere lo scopo della comprensione con poca enfasi rispetto all’audio. Con TruVoice si fa un passo ulteriore verso l’abbattimento delle barriere linguistiche tra gli utenti. La funzionalità, una volta disponibile, sarà visibile anche attraverso le app mobili di Skype, seguendo il meno «altro» e poi «traduci» nel riquadro basso della finestra della chiamata in corso. Microsoft ha spiegato come funziona il campionamento dell’intelligenza artificiale, che «mima» il parlato dell’utente senza registrare e conservare l’audio delle parole. «Skype usa l’Intelligenza Artificiale per rilevare automaticamente le lingue parlate durante una videochiamata e tradurle in tempo reale. Questo viene fatto utilizzando una combinazione di tecnologia di riconoscimento vocale ed elaborazione del linguaggio naturale, che sono in grado di comprendere e interpretare le parole pronunciate e tradurle nella lingua desiderata. Inoltre, se si attiva l’uso della voce naturale, utilizzeremo l’intelligenza artificiale per campionare le parole e ottimizzare la traduzione in modo che suoni uguale, rendendo la conversazione più umana».