Слушать сайты в любое время и в любом месте

С ростом популярности интернет-СМИ, блогов и тематических сообществ объем генерируемого контента увеличивается в геометрической прогрессии. Уже сейчас многие пользователи физически не успевают обрабатывать свою подписку, то и дело нажимая на «красную кнопку», удаляющую все непрочитанные статьи возрастом более 48 часов. Признаться, для меня, как очень активного — как в онлайне, так и в офлайне человека, полностью прочитанные каналы — в буквальном смысле непозволительная роскошь.

Обладатели мобильных устройств с RSS-ридером могут читать статьи, находясь вдалеке от стационарного компьютера или ноутбука. Но сложнее, если вы сидите за рулем автомобиля, занимаетесь спортом или просто находитесь в пешей прогулке. С экрана в эти моменты читать текст неудобно, хотя это время можно было бы также использовать для получения информации.

Вполне логичным, на мой взгляд, здесь является решение получать материалы своей подписки в формате аудио: преобразовывать текст в речь, загружать файлы в КПК, плеер или мобильный телефон и слушать статьи почти в любое время и в любом месте.


Системы TTS (Text-to-Speech), которые синтезируют текст в речь, существуют достаточно давно: еще в 1961 году на компьютере IBM 704 впервые была «искусственным» образом воссоздана человеческая речь. С тех времен, конечно, изменилось многое: компьютеры научились синтезировать голос более реалистично, а на технологии TTS было создано множество программных продуктов.
Среди них: для английской речи — TextAloud, SpeakOut, SAM, для русской — Digit, Sakrament Talker, Govorilka и многие другие. На основе TTS-движков созданы самые различные утилиты: читалки сообщений в IM, переводчики, приложения для мобильных устройств, тулбары и плагины для браузеров, при помощи которых можно озвучивать любую веб-страницу.

В последнее время в интернете появилось несколько веб-сервисов, позволяющих ловко преобразовывать текстовый RSS-поток в набор аудиозаписей, которые можно и загружать, и прослушивать прямо на сайте. Все они используют различные TTS-движки и работают в основном с английским языком. Это Odiogo, Expressivo, Talkr, TalkingNews, Dixero, PimpMyNews, Vozme, ReadTheWords, Feed2Podcast, BlogBard.



Из приведенных сервисов можно отдельно отметить Odiogo, который не только переводит статьи в аудио на приемлемом уровне, но и позволяет очень удобно управлять своими потоками и аудиозаписями. С его помощью, отправив адрес любого англоязычного RSS-потока, вы сможете получить аудио через обычные веб-страницы, «облегченные» веб-страницы для мобильных устройств или через отдельный RSS-поток. По словам разработчиков, в будущем планируется расширить набор языков, и будем надеяться, что среди них окажется русский.

Что касается качества, то стоит отметить, что если синтезаторы английской речи заметно продвинулись и сейчас выдают более-менее реалистичный голос, то с русскоязычными TTS-движками всё несколько хуже. Один из самых продвинутых среди них — Digalo, пока генерирует весьма унылое бормотание: не каждый сможет постоянно прослушивать такие аудиозаписи, прощая компьютеру проглоченные звуки, неправильные ударения и монотонный «роботоподобный» голос.

Поэтому самым активным русскоязычным пользователям придется довольствоваться результатами работы несовершенных синтезаторов либо искать другие способы решения проблемы, одним из которых может явиться озвучивание статей живыми людьми.

Возможно, это звучит несколько неожиданно, но в условиях отсутствия качественного TTS-движка для русского языка, нашу проблему на достойном уровне смогут решить только живые голоса живых людей. Сейчас в Интернете представлено множество агентств, предлагающих услуги профессиональных дикторов, которые могут начитать любые текстовые материалы под заказ. Но, к сожалению, эти услуги больше ориентированы на создание промо-роликов, и их стоимость за минуту записи составляет в среднем 20 долларов.

В марте в рунете был анонсирован сервис Dubbee, который предложит своим пользователям перевести RSS-подписку в формат аудио, причем все статьи будут озвучиваться людьми. При этом происходить это будет довольно быстро и по приемлемой цене (аудиозаписи старше двух дней будут распространяться свободно). Судя по всему, такое решение хоть и будет платным, но однозначно решит проблему качественного и своевременного преобразования статей подписки в аудио. Сам сервис пока находится в разработке, но уже сейчас на странице Dubbee Intro можно послушать некоторые статьи в аудио (в том числе с Хабра).

Таким образом, если для материалов на английском языке есть множество специализированных веб-сервисов, читающих текст на достойном уровне, то для русскоязычных каналов в данный момент готового удобного решения для получения статей в формате аудио не существует. И чтобы как-то решить проблему обработки своей RSS-подписки вдалеке от компьютера, отечественным пользователям остается ждать появления сервисов с поддержкой русского языка, использующих либо технологию TTS, либо голоса профессиональных дикторов. И если в первом случае проблема — в наличии качественного TTS-движка, то во втором — в платности всех новых аудиозаписей.

Отсюда
+22
6 апреля 2008, 20:54
18
hightower 9,5

комментарии (32)

+1
Frodo #
слушать текст который читается синтезированным голосм - та еще пытка. ИМХО скоро у каждого уважающего себя сайта будут в команде дикторы которые будут озвучивать новости, ибо еще не скоро компы смогут читать текст так же качественно как люди.
0
Taar #
проблема в том, что для нормальной записи нужен не простой микрофон.. нужно фактически спец помещение, где отсутствуют лишние звуки... это для нормальной записи конечно :) кустарным способом можно записывать, но вот качество и фон будет мега хреновыми...

имхо либо вскоре появятся команды аутсорсеров, которые будут переводить рсс-текст сайтов определенной тематики, либо сами порталы будут надиктовывать текст.
0
hightower #
Ну вот как раз Dubbee, видимо, и будет такой командой аутсорсеров :)
Только неясно - будут ли люди готовы платить за такие "нормальные записи"
+1
viraltrends #
Вы лукавите! ;) все немного проще, посмотре на рпод же ! мы же не джазз на хайтек аппаратуре слушать собрались?)
+1
Ashina #
Мне жаль свои уши, я лучше музу послушаю.
0
Dr_Gnoiseberg #
Не нравятся мне все эти TTS-движки. Вы голос Майкрософт Сэма слышали? :) Конечно, есть спич-синты и получше, но не настолько, чтобы позволять им читать рсс ленты.
+1
hollander #
Отказался от RSS-ридера, все что всплывает в памяти или кажется актуальным из списка адресов - просматриваю.

Количество информации увеличивается и становится невозможной бесконечная интернет-медитация.

Хотелось бы узнать, сколько % хабраЛюдей занимается спортом и каким. Можно ли сделать такой опрос? И сколько люди проводят времени за компьютером?
Мы же люди, с биологическим телом и душой, а не роботы просто с мозгом.
–1
aleks_raiden #
уточним - пока еще люди, но уверенно движемся к матрице. вот вы почему не занимаетесь, а здесь пишете комментарии? так вы не только тратите свое время, которое можно употребить на еще один сет жима лежа, но и время других людей, которые, читая эти комментарии и отвечая, также тратят время, пропустим очередной сет приседаний :)
–2
hollander #
бред
–2
aleks_raiden #
да, спасибо, забыл слово - вам получилось охарактеризовать одним словом свой пост, и выразить доходчиво, для любой доярки, то, что я расписывал в ответе на три строки :)
–4
hollander #
так, не пиз#еть!!! )
0
Arseny #
Есть еще одна проблема. Как известно, при написании одной и той же новости в газету или на радио журналист руководствуется разными принципами в силу специфики того или иного средства массовой коммуникации. Если банально начитывать даже самые хорошие материалы с классных сайтов, то аудиозапись будет гораздо менее интересна, эффективна и т.п. Таким образом я склонен думать, что в этой схеме понадобится еще одно звено - рерайтер, который будет обрабатывать тексты.
0
Taar #
а как же быть с картинками в рассылках? :) будет описывать словами? :)
0
hightower #
Действительно такая проблема существует. Кроме картинок есть ведь еще куча типов информации, которые в аудио либо сложно, либо вообще не перевести - диаграммы, таблицы, куски кода и т. д. И если при озвучивании эти элементы игнорировать, то смысл может потеряться. Поэтому как вариант решения можно привлекать рерайтеров. Они могли бы не только редактировать текст, но и комментировать и описывать эти виды контента. А материалы, где в тех же картинках или видео заложен основной смысл и озвучивать его бесполезно - не трогать вообще :)
0
diamant #
ну радиоведущие как-то же справляются :)
0
posthuman #
На мой взгляд, если на прочтение время нет, то и на прослушку нехватит :(
Да и на сайтах как хабр, где основная суть ссылки и коменты подобное реализовать довольно сложно.
0
hightower #
Тогда, может, озвучивать и комментарии? Хотя бы те, что с рейтингом.
И вообще - давать возможность людям оставлять свои аудиокомментарии. Через интернет или мобильный телефон - позвонил, сказал код и начитал текст...
0
posthuman #
А смайлы и другую атрибутику инет общения как передавать?

Аудиокоментарии вообщем интересно) Особенно к подкастам. Но и тут некоторая загвоздка, если ты уже закачал подкаст, то новые коменты упустишь, если не закачал, то откаментить не получится. хотя.. утро вечера мудренее, может после массового брайншторминга вырисуется идейка.
0
hightower #
Не думаю, что здесь это всё нужно. Получать статьи в аудио - это в первую очередь, решает проблему своевременного получения новостей. Так, что абсолютно не важно, где и что ты делаешь при этом. Если трудно прочитать текст, его можно послушать.
А если хочется посмотреть аватары, профайлы, ссылки и т.п. - то милости просим на сайт.
Что касается аудиокомментариев, то на них всегда можно подписаться - также, как и на сами статьи. Вопрос только в том, так ли это необходимо. Когда у меня мало времени, я читаю статью и читаю комментарии с рейтингом выше 3. Не вижу проблемы реализовать это в аудио.
0
byakuya #
Помимо хабра, существует огромное количество информационных ресурсов, пользователи которых хотели бы получать свежие новости на определенную тематику в кратчайшие сроки. Речь идет как раз о самой новости, а не о комментариях, которых не некоторых порталах вообще нету.
Возможность прослушивать новости позволяет пользователю быть в курсе дел 24/7, не находясь при этом рядом с ПК, подключенным к интернету.
К примеру, если человек постоянно находится за рулем авто - он получает аудиозаписи на свой мобильный и спокойно их прослушивает во время вождения.
0
diamant #
В марте в рунете был анонсирован сервис Dubbee, который предложит своим пользователям перевести RSS-подписку в формат аудио, причем все статьи будут озвучиваться людьми.

Круг замкнулся :)

В детстве я смотрел новости по ТВ, затем читал расшифровки/тексты новостей на сайтах ТВ-компаний, а теперь вот, когда я читаю чисто онлайновые новостные сайты и блоги, изначально текстовые новости будут начитывать дикторы :)
0
Taar #
кроме того потом все эволюционирует в Блутус очки, которые будут транслировать подкаст :)
0
feed #
"неправильные ударения и монотонный «роботоподобный» голос.."
при наличии нормальных словарей и Катькиного движка, голос вполне себе ничего...
0
proxy #
Первый раз я столкнулся с программой синтезатором речи в 1998 году - это была "Говорящая мышь". Качество синтезируемой речи было низким и программой почти не пользовался. Недавно решил посмотреть что же изменилось за прошедшие 10 лет в этой области. И был приятно удивлен. С голосовым движком Elan TTS Russian Nicolai программы речевого синтеза выдают понятную и удобоваримую речь. Первые 20-30 минут не совсем комфортно, а потом быстро привыкаешь(мозг сам достраивает эмоциональную составляющую читаемого текста). Более того привыкнув актерская начитка начинает раздражать.
0
feed #
попробуй RealSpeak Katerina
0
proxy #
Пробовал, но Nicolai ИМХО разборчивей звучит. Много перепробовал и движков и программ. Из программ остановился на "Балаболка" www.cross-plus-a.com/rus/balabolka.html - удобное чтение буфера обмена, приятный интерфейс, запись в mp3.
НЛО прилетело и опубликовало эту надпись здесь
0
hightower #
Здесь речь идет о прослушивании не подкастов, а любых RSS-лент.
Существование подкаст-сервисов для мобильников ни для кого не секрет. Через телефон сегодня можно не только прослушивать, но и записывать подкасты. Например, Gabcast неплохо с этим справляется.
НЛО прилетело и опубликовало эту надпись здесь
0
anvaka #
Здорово!

Просто потрясающе! У себя на блогспоте я озвучил идею Podcast Service, а через десять дней Dubbee анонсировал свой выход :)! Мне определенно не хватает этого сервиса. Искренне желаю парням успеха!
0
Nata111 #
Я пробовала, больше часа не могу выдержать ни Катерину, ни Николая, прослушивание синтетической речи требует огромного напряжения и очень утомляет. В дорогу лучше запасаться подкастами и аудиокнигами.
0
ice9 #
Совершенно согласен с вами. Вслушиваться в голос того, кому наплевать на то, что он читает, не получается. Точнее, через некоторое время тебе уже наплевать на то, что ты слушаешь :)
Уж лучше фоновую музыку поставить.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.