В основе технологии — «ансамбль из нейронных сетей», позволяющий скопировать любой голос и произнести им что угодно. Чтобы синтезировать голос, нейросети должны проанализировать несколько часов аудиозаписей обладателя голоса и оцифрованный текст, который он зачитывает.
Создатели Vera Voice считают, что разработку можно использовать, чтобы поздравлять людей голосами знаменитостей, озвучивать книги, сериалы и рекламу, а также применять в «умных колонках».
Источник: Meduza.io