Google создала программу, точно имитирующую человеческий голос
Tacotron 2 предназначена для преобразования текста в речь. Она состоит сразу из двух нейросетей глубокого обучения. Первая преобразует текст в спектрограмму, а вторая — алгоритм под названием WaveNet — озвучивает её, генерируя соответствующие звуковые элементы.


Компания Google наконец смогла решить проблему всех систем синтеза человеческой речи, в которых голос зачастую звучал уж слишком искусственно. Новая программа Tacotron 2 умеет настолько точно имитировать реальную человеческую речь, что синтезируемые звуки вовсе невозможно отличить от настоящего голоса. Она состоит сразу из двух нейросетей глубокого обучения.
Первая преобразует текст в спектрограмму, а вторая — алгоритм под названием WaveNet — озвучивает её, генерируя соответствующие звуковые элементы. Tacotron 2 справляется с произношением самых трудных слов и названий, а также умеет изменять интонацию в зависимости от встречающихся в тексте знаков препинания. Пока программа находится ещё на раннем этапе, но в будущем данную технологию планируется внедрить в такие сервисы компании, как Google Assistant и Google Переводчик.
Читайте также:
Yahoo и Mozilla судятся из-за Google
Google запатентовала ноутбук с мотором
Источник: Google
Фото: pixabay.com