Интересно обо всех и обо всем (maxxbay) wrote,
Интересно обо всех и обо всем
maxxbay

Category:

Нейросеть научили копировать голос при синтезе текста в речь





Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.

Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
Оригинал взят у bamymih в Нейросеть научили копировать голос при синтезе текста в речь

Subscribe
promo maxxbay october 30, 2013 17:02 52
Buy for 30 tokens
- А вы тоже включаете ногой компьютер? - А вы тоже в детстве с горки зимой на пакетах или линолеуме катались? - А у вас в детстве тоже были варежки на резинке? - А у вас дома тоже есть пакет с пакетами? - А вы тоже облизываете этикетку от йогурта? - А у вас тоже от шапки лоб чешется? - А вы…
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments