войти зарегистрироваться

Google ChromeСинтез речи в Chrome

Google внедрил в браузер интерфейсы Text-to-Speech API, так что теперь любое приложение или расширение Chrome способно читать текст вслух. Синтез речи из расширения осуществляется элементарной командой

chrome.tts.speak('Hello, world!');

(предварительно требуется добавить tts в список разрешений для данного расширения).

С помощью модуля chrome.ttsEngine можно прикрутить к браузеру свой собственный движок синтеза речи, например, для русского языка.

РазработкаТребуется небольшое бета-тестирование от уникальных специалистов

Уважаемые хабражители,
Мы уверены, что среди вас есть хотя бы по одному человеку, который знает некоторые не очень распространенные языки.

Дело в том, что мы добавили к нашему сервису Text-to-Speech движки для нескольких новых языков. Они пока доступны только для Википедии, в режиме бета-теста.

Просьба простая — выберите на странице в списке слева язык, который Вы знаете, и послушайте хотя бы одну статью Википедии на карте.

Qt SoftwareQtSpeech, доступ к text-to-speech

Хочу представить небольшой но удобный модуль для кросс-платформенного использования TTS(text-to-speech). На данный момент поддерживаются основные платформы:
* Windows, используя SAPI,
* Unixes, используя Festival проект,
* MacOSX, используя SpeechSynthesis

Так как для Windows и Mac используются родныe API то все голосовые движки установленные в систему будут автоматически вам доступны. Для Unix всё не так радужно, нет какой-то общей системы, апи, поэтому был просто выбран проект Festival который даёт неплохое качество для английского языка и лицензию LGPL. На Mac вы всегда можете расчитывать на отличный голос Alex.

Использование библиотеки очень простое — итак ваше приложение наконец скажет «Hello World!».

Персональные блоги Wikistream — всемирный аудио-путеводитель на основе статей Wikipedia

image
Мы выпустили в свет аудио-гид, который основан на Википедии.

В Wikipedia примерно миллион статей имеют координатную привязку к определенным точкам на планете. 172 тысячи из них — на английском языке. На русском — 17 тысяч. Мы преобразовали все это богатство в разумный аудио-гид.
Он доступен вам, если у вас есть смартфон с GPS и Java или iPhone 3G. Вы платите только за интернет трафик.

В этом топике хочу рассказать о некоторых проблемах, с которыми мы сталкивались в процессе реализации проекта.

Персональные блоги TTS — Text To Speech

В силу служебной необходимости разбирался с рынком промышленных движков по преобразованию текста в речь.
Рынок не сказать, что бы огромен, но достаточно стар.
В России собственные разработки представлены в Центре Речевых Технологий (они же ЦРТ).
Среди популярных Nuance (TTS Milena). Бюджетный проект 09 (комерческий проект 099) реализован на базе Nuance. Интегратором выступила компания Logictel , которая на самом деле это Сател.
В России данный продукт представляют Open Communication, Voxcom и многие другие.

Ещё один менее качественный продукт от компании ScanSoft (TTS Katerina), признаться так себе.

Другой продукт представлен компанией Loquendo (TTS Olga). В России на данный момент по моим сведения пока никто не представляет. Если ошибаюсь, буду приятно удивлён.

С наладкой TTS всё относительно просто. Разработчик должен оперировать с фонемами конкретного языка. А уже потом происходит нормализация, когда произнесение отдельных слов докручивают до идеала. Для это существуют Speech API, VoiceXML, SML и т.п.

Персональные блоги Используем Text To Speech от Google

Набираем в браузере:
translate.google.com/translate_tts?tl=en&q=some short english text

или пишем скрипт google-tts.sh:
#!/bin/sh
text=`echo $@|tr ' ' '+'`
file=`echo $@|tr ' ' '-'`.mp3
wget -U Opera "http://translate.google.com/translate_tts?tl=en&q=$text" -O "$file"

использовать так: ./google-tts.sh some short english text

Linux для всехСинтез русской речи в Linux

Прочитал статью про SAPI и Powershell (Учим PowerShell разговаривать), и мне стало интересно как же с синтезом русскоязычной речи в родной для меня операционке, Linux'e. Как выяснилось все далеко не так радужно, да и качество синтеза далеко до голоса Алены, но все же.

Персональные блоги Голосовой движок Acapela Alyona


В июле этого года, компания Acapela, разработчики популярного русскоязычного голосового модуля Николай, выпустили новый русский, женский голосовой движок, который получил название Алёна. Работает с частотой 22 кГц. По качеству синтезируемой речи Алёна намного опережает Николая, тембр голоса и интонация, по мнению пользователей приятней, чем у движка Катерина от ScanSoft RealSpeak.

ПодкастыСлушать сайты в любое время и в любом месте

С ростом популярности интернет-СМИ, блогов и тематических сообществ объем генерируемого контента увеличивается в геометрической прогрессии. Уже сейчас многие пользователи физически не успевают обрабатывать свою подписку, то и дело нажимая на «красную кнопку», удаляющую все непрочитанные статьи возрастом более 48 часов. Признаться, для меня, как очень активного — как в онлайне, так и в офлайне человека, полностью прочитанные каналы — в буквальном смысле непозволительная роскошь.

Обладатели мобильных устройств с RSS-ридером могут читать статьи, находясь вдалеке от стационарного компьютера или ноутбука. Но сложнее, если вы сидите за рулем автомобиля, занимаетесь спортом или просто находитесь в пешей прогулке. С экрана в эти моменты читать текст неудобно, хотя это время можно было бы также использовать для получения информации.

Вполне логичным, на мой взгляд, здесь является решение получать материалы своей подписки в формате аудио: преобразовывать текст в речь, загружать файлы в КПК, плеер или мобильный телефон и слушать статьи почти в любое время и в любом месте.

Персональные блоги Пишем скрипт под линукс, прочитывающий свежие статьи с хабра в мп3 файл.

Многие из нас хотели бы еще немного сэкономить свое время. Одна из технологий, позволяющих сделать это — tts (text to speech): Когда компьютер читает вслух какой-либо текст. Согласитесь, как приятно было бы прослушать все свежие статьи с хабра, пока вы готовите еду, убираете квартиру, одеваетесь или завязываете шнурки т.е. в те моменты когда ваши глаза и руки заняты, а мозг и уши почти свободны.
Недавно я написал скрипт, позволяющий перевести в мп3 все свежие статьи с хабра для того чтобы можно было их прослушать. Немного изменив его вы сможете получать статьи и с других сайтов, вместо записи в мп3 можно будет проговорить статьи на компьютере немедленно, также в скрипте реализован достаточно простой способ работы с rss через консоль linux.