С помощью нейросетей можно воссоздать голос любого человека

Киевский стартап Respeecher работает над технологией, которая способна скопировать звучание голоса любого человека.

Сейчас команда проходит обучение в акселераторе Techstars и получила финансирование от него в размере $120 000 в обмен на долю в компании.

«Наш продукт позволяет одному человеку говорить голосом другого без использования текста (speech-to-speech). Например, я смогу говорить голосом Барака Обамы. Для этого алгоритму передают мою фразу и на выходе через пару минут получаем ту же фразу, сказанную голосом Обамы, с моими интонациями и эмоциональным наполнением», — объясняет идеи продукта сооснователь компании.

Сооснователи Александр Сердюк и Дмитрий Белевцов впервые создали прототип проекта, еще участвуя в хакатоне, организованном Grammarly. Но качество программы в тот момент было неидеальным.

Сейчас в команде шестеро человек, они работают в киевском офисе Respeecher. Трое сооснователей (в том числе, Дмитрий) находятся на обучении в акселераторе в Филадельфии.

«Подготовка данных и обучение нейросетей требует небольшой сервисной части, поэтому сейчас мы работаем с клиентами на проектной основе. Сейчас так работаем, к примеру, с голливудской студией», — говорит Дмитрий.

Для кого?

Сейчас продукт дорос до стадии коммерческого использования: компания заключили контракты с несколькими медиа и киностудиями. Продукт Respeecher им интересен. С его помощью можно, к примеру, заставить любую историческую персону произносить любой текст его же голосом. Главное ограничение продукта сейчас: его нельзя использовать в реалтайме, но команда над этим работает.

Поделиться в: