Интересно обо всех и обо всем (maxxbay) wrote,
Интересно обо всех и обо всем
maxxbay

Category:

Нейросеть научили копировать голос при синтезе текста в речь





Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
Оригинал взят у bamymih в Нейросеть научили копировать голос при синтезе текста в речь

Subscribe
Buy for 40 tokens
Мне в очередной раз удалось вывести на чистую воду ещё одного проходимца. Сергей взял кредит, чтобы построить себе дом-мечту и оказался у разбитого корыта. Так что думайте головой, прежде чем... Вот вам реальная история, которая получила очень интересный сюжетный поворот. Сергей скопил…
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments