Amazon открыл доступ к новому синтезатору речи на основе сервиса AWS Text-To-Speech Polly. Он делает компьютерный голос более живым и эмоциональным. Например, один из искусственных голосов говорит с интонацией ведущего новостей. Послушайте, это впечатляет.

И всё благодаря искусственному интеллекту, который взял минимально различимые звуки языка (фонемы), описал диапазон и оттенки звучания каждой фонемы (спектрограммы), а потом конвертировал их в аудиосигнал.

Искусственного диктора, созданного Amazon, уже используют, например, The Globe and Mail и Encyclopedia Britannica. Теперь подключить его к своему продукту может кто угодно. Но говорит он пока только по-английски.

В январе «живой» голос добавили в экосистему Amazon Alexa. Голосовой помощник сможет определять настроение человека и учитывать его в своих ответах.


Поделитесь в соцсетях: