Как стать автором
Обновить

Комментарии 4

В Bark еще можно генерировать/клонировать голоса. Очень легко сделать голос по своему вкусу вместо стандартного встроенного.

Плюс, существует фреймворк Bark Infinity с автоматической нарезкой длинного текста и другими плюшками.

Мне не хватало только возможности стримить аудио с низкой задержкой (барк хоть и работает быстрее, чем в реальном времени, но приходится ждать пока будет готов кусок в 11-13 секунд). Поэтому переключился на Coqui TTSv2, там стриминг из коробки работает.

Спасибо!

Может есть ещё рекомендации по клонированию голоса + переводу на другой язык? Очень интересно подобное решение (видел платные сервисы только, хотя глубокий ресерч ещё не производил).

Ничего локально запускаемого, чтобы было на уровне HeyGen не знаю.

Такая же беда с генерацией музыки.

Ну значит подождём ещё полгодика)

Рано или поздно что-нибудь достойное окажется в опенсорсе.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий