<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
<channel>
	<title>Хабрахабр:  Метки / распознавание речи</title>
	<link>http://habrahabr.ru/rss/tag/распознавание речи/</link>
	<description><![CDATA[]]></description>
	<language>ru</language>
	<managingEditor>editor@habrahabr.ru</managingEditor>
	<generator>habrahabr.ru</generator>
	<pubDate>Sun, 12 Feb 2012 01:51:05 GMT</pubDate>
	<lastBuildDate></lastBuildDate>
	<image>
		<link>http://habrahabr.ru/</link>
		<url>http://habrahabr.ru/i/logo.gif</url>
		<title>Хабрахабр</title>
	</image>
	
			
		<item>		
			<title><![CDATA[DIY или Сделай Сам / Умный дом с web-интерфейсом на perlxstut]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/DIY/137726/</guid>
			<link>http://habrahabr.ru/blogs/DIY/137726/</link>			
			<description><![CDATA[В какой-то момент стало очень лениво отрывать свою пятую точку, чтобы перед сном выключить свет в комнате. И решил это дело автоматизировать. В итоге был изобретён свой велосипед для удалённого управления силовой нагрузкой – программно-аппаратный комплекс, обладающий следующими особенностями:<br/>
 <div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/DIY/137726/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Mon, 06 Feb 2012 20:24:27 GMT</pubDate>
			<author>tzirulnicov</author>
			<category>умный дом</category><category>распознавание речи</category><category>perl</category><category>php</category><category>pic</category><category>pickit2</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Алгоритмы / Динамическое программирование в алгоритмах распознавания речи]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/algorithm/135087/</guid>
			<link>http://habrahabr.ru/blogs/algorithm/135087/</link>			
			<description><![CDATA[В системах распознавания речи, содержащих слова, распознавание требует сравнения между входным словом и различными словами в словаре. Эффективное решение проблемы лежит в динамических алгоритмах сравнения, целью которого является введение временных масштабов двух слов в оптимальное соответствие. Алгоритмы такого типа являются динамическими алгоритмами трансформации временной шкалы. В данной статье представлено два варианта реализации алгоритма предназначенные для распознавания отдельных слов.<br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/algorithm/135087/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Wed, 21 Dec 2011 22:20:31 GMT</pubDate>
			<author>rgen3</author>
			<category>динамическое программирование</category><category>распознавание речи</category><category>распознание отдельных слов</category>
		</item>
		
		
		
		
		
		
		
		
	
		
			
		<item>		
			<title><![CDATA[Алгоритмы / [Из песочницы] Скрытые Марковские модели в распознавании речи]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/algorithm/134954/</guid>
			<link>http://habrahabr.ru/blogs/algorithm/134954/</link>			
			<description><![CDATA[Самое быстрое и эффективное взаимодействие между людьми происходит посредством устной речи. С помощью речи могут быть переданы различные чувства и эмоции, а главное — полезная информация. Необходимость создания компьютерных интерфейсов звукового ввода-вывода не вызывает сомнений, поскольку их эффективность основана на практически неограниченных возможностях формулировки в самых различных областях человеческой деятельности. <br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/algorithm/134954/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Tue, 20 Dec 2011 11:48:31 GMT</pubDate>
			<author>rgen3</author>
			<category>Лингвистика</category><category>скрытые Марковские модели</category><category>распознавание речи</category>
		</item>
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Разработка под Apple iOS / Распознавание и синтез речи в любое приложение под iOS за час]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/macosxdev/134825/</guid>
			<link>http://habrahabr.ru/blogs/macosxdev/134825/</link>			
			<description><![CDATA[<b>Вводная часть:</b><br/>
<br/>
Сам инструментарий называется NDEV. Чтоб получить необходимый код (его мало) и документацию (её много), надо зарегиться на сайте в «программе сотрудничества». Сайт:<br/>
<br/>
<a href="http://dragonmobile.nuancemobiledeveloper.com/public/index.php">dragonmobile.nuancemobiledeveloper.com/public/index.php</a><br/>
<br/>
Это весь «геморрой», если клиентов вашего приложения менее полумиллиона и они пользуются сервисами менее 20 раз в день. Сразу после регистрации вы получите членство «Silver», которое позволит вам бесплатно пользоваться данными сервисами.<br/>
Разработчикам предлагается пошаговая инструкция по внедрению в свое приложение на iOS сервисов распознавания и синтеза речи:<br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/macosxdev/134825/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Sun, 18 Dec 2011 18:43:48 GMT</pubDate>
			<author>Someonesolitude</author>
			<category>iOS</category><category>Разработка</category><category>мобильные приложения</category><category>разработчик</category><category>разработчики</category><category>программа</category><category>NDEV</category><category>речевые сервисы</category><category>Nuance</category><category>внедрение</category><category>имплементация</category><category>синтез речи</category><category>распознавание речи</category><category>речевые технологии</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[iPhone / Протокол коммуникации Siri взломан]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/iphone/132622/</guid>
			<link>http://habrahabr.ru/blogs/iphone/132622/</link>			
			<description><![CDATA[Разработчикам мобильных приложений из компании Applidium <a href="http://applidium.com/en/news/cracking_siri/">удалось разобраться</a> в протоколе коммуникации, который использует программа Siri, так что теперь этот движок распознавания речи теоретически можно запускать на любом устройстве, в том числе Android, если вы знаете, где добыть идентификатор iPhone 4S, и компания Apple не внесёт его в «чёрный список».<br/>
<br/>
Ключевым элементом Siri является то, как программа общается с сервером (Siri работает только при наличии доступа в интернет). Трафик идёт по протоколу TCP, порт 443, на сервер 17.174.4.4. Если вы попробуете связаться с сервером <a href="https://17.174.4.4/">https://17.174.4.4/</a> с десктопа, то увидите, что он предъявляет сертификат на имя <i>guzzoni.apple.com</i> (<a href="http://www.ai.sri.com/~guzzoni/">Дидье Гуззони</a> из компании SRI — один из создателей этой технологии).<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/iphone/132622/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Tue, 15 Nov 2011 08:05:31 GMT</pubDate>
			<author>alizar</author>
			<category>Applidium</category><category>Siri</category><category>распознавание речи</category><category>iPhone 4S</category><category>https</category><category>GUID</category><category>zlib</category><category>CFPropertyList</category>
		</item>
		
		
		
		
		
		
		
		
	
		
		
		
			
		<item>		
			<title><![CDATA[Искусственный интеллект / [Перевод] История развития систем распознавания речи: как мы пришли к Siri]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/artificial_intelligence/131945/</guid>
			<link>http://habrahabr.ru/blogs/artificial_intelligence/131945/</link>
			<description><![CDATA[Оглядываясь назад, мы видим, что развитие технологии распознавания речи похоже на наблюдения процесса взросления у ребенка — прогрессируя от определения отдельных слов, затем все больших словарей и наконец до быстрых ответов на вопросы, как это делает Siri.<br/>
<br/>
Слушая Siri с ее слегка элегантным чувством юмора, мы восхищаемся тем, как далеко продвинулись за эти годы в отрасли распознавания речи. Давайте взглянем в прошлые десятилетия, которые позволили человеку управлять девайсами, используя только голос. <br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/artificial_intelligence/131945/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Sat, 05 Nov 2011 10:26:52 GMT</pubDate>
			<author>karazyabko</author>
			<category>ИИ</category><category>распознавание речи</category><category>google voice search</category><category>siri</category><category>iphone</category>
		</item>
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Искусственный интеллект / Правила общения с системами распознавания речи]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/artificial_intelligence/130918/</guid>
			<link>http://habrahabr.ru/blogs/artificial_intelligence/130918/</link>			
			<description><![CDATA[С ростом интереса к системам распознавания речи (Siri, Google Voice Search и т.д.) — несколько простых правил общения с роботами на материале советского кинематографа и мультипликации… <br/>
<br/>
<iframe width="560" height="349" src="http://www.youtube.com/embed/2KEdUa6WLDw" frameborder="0" allowfullscreen></iframe>]]></description>
			
			<pubDate>Fri, 21 Oct 2011 12:27:37 GMT</pubDate>
			<author>GeorgeR</author>
			<category>распознавание речи</category><category>правила общения с роботами</category><category>siri</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[IP-телефония / FreeSWITCH + mod_unimrcp + VoiceNavigator. Синтез и распознавание русской речи во FreeSWITCH]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/voip/129811/</guid>
			<link>http://habrahabr.ru/blogs/voip/129811/</link>			
			<description><![CDATA[<img src="http://habrastorage.org/storage1/d4048c23/cf914a43/54dba5c2/817e0185.png" alt="VoiceNavigator"/> <img src="http://wiki.freeswitch.ru/download/attachments/131074/global.logo?version=1&amp;modificationDate=1299144154773" alt="FreeSWITCH"/> <img src="http://code.google.com/p/unimrcp/logo?cct=1304109601" alt="UniMRCP"/><br/>
<br/>
В продолжение <a href="http://habrahabr.ru/blogs/voip/124946/">серии статей</a> об интеграции Asterisk и VoiceNavigator опишу интеграцию <a href="http://speechpro.ru/product/recognition/platform/vn">VoiceNavigator</a> с <a href="http://www.freeswitch.org">FreeSWITCH</a>.<br/>
<br/>
На Хабре имеется несколько статей и упоминаний об FS, но с популярностью Asterisk он не сравнится))<br/>
<br/>
FreeSWITCH, являясь продолжением и развитием идей заложенных в Asterisk, имеет действительно модульную архитектуру, где весь основной функционал, на сколько это возможно, вынесен в отдельные модули. Это позволяет обеспечить большую гибкость создаваемых решений, масштабируемых от софтфона до софтсвича. FreeSWITCH может быть использован в качестве коммутатора, АТС, медиа-шлюза или медиа-сервера для приложений IVR, использующих XML-файлы для управления алгоритмом обработки звонка.<br/>
<br/>
Для FreeSWITCH в отличие от Asterisk нет необходимости отдельно компилировать UniMRCP. Поддержка UniMRCP уже добавлена и работает «из коробки» в виде модуля asr_tts/mod_unimrcp.<br/>
<br/>
Ниже описывается установка FreeSWITCH, подключение к нему VoiceNavigator и создание тестового голосового приложения.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/voip/129811/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Wed, 12 Oct 2011 09:14:00 GMT</pubDate>
			<author>mulai</author>
			<category>ip-телефония</category><category>freeswitch</category><category>синтез речи</category><category>распознавание речи</category><category>call-центры</category><category>системы голосового самообслуживания</category><category>VoiceNavigator</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Железо / «Умный дом» собственными руками. Часть 3. Синтез и распознавание голоса с помощью Google]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hardware/129936/</guid>
			<link>http://habrahabr.ru/blogs/hardware/129936/</link>			
			<description><![CDATA[В <a href="http://habrahabr.ru/blogs/hardware/129799/">прошлой статье</a> мы смогли добиться получения изображения с наших веб-камер в виде снимков раз в секунду. Теперь пришла пора взяться за обещанное — распознавание и синтез голоса.<br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hardware/129936/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Fri, 07 Oct 2011 13:00:36 GMT</pubDate>
			<author>Neuronix</author>
			<category>google chrome</category><category>умный дом</category><category>синтез речи</category><category>распознавание речи</category><category>perl</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Блог компании Самый Нужный ТЕЛЕФОН / Apple — доедает яблоко?]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/company/88005554448/blog/129802/</guid>
			<link>http://habrahabr.ru/company/88005554448/blog/129802/</link>			
			<description><![CDATA[<img src="http://habrastorage.org/storage1/3488f7c9/311074e6/a72bfc37/0c690454.jpg"/> <br/>
<br/>
Привет, Хабравчане!<br/>
Пару мыслей в слух о презентации нового iPhone 4S.<br/>
<br/>
Ждали iPhone 5, получили 4S.<br/>
А стоило ли вообще ждать чего-то принципиально нового от Аpple?<br/>
<br/>
В продукции Apple последнего времени всегда не хватает какой-то мелочи, и она обязательно появляется в новой версии с анонсом чуть ли ни как самая главная «фича». История с отсутствием usb в iPad, увеличение мощности процов и разрешения камеры, добавление встроенного распознавание речи в новом iPhone 4S, история про <a href="http://www.3dnews.ru/news/apple-zapatentovala-paryashchiy-tachskrin">«парящий» touchscreen</a> не нашедшая своего продолжения в новом iPhone. <br/>
Стоит признать, у Аpple по-прежнему гениальный маркетинг, но есть ли у Apple новые прорывные технологии как в своё время был «multitouchscreen»? <br/>
Возможно, не так всё плохо и новые технологии есть: наличие в iPhone 4S распознавания речи на движке Nuance может быть первыми шагами к новому интерфейсу взаимодействия с телефоном, к голосовому интерфейсу.<br/>
В предыдущей версии iPhonе с распознаванием речи справлялся сторонний продукт Google Voice Search, заточенный под поиск в интернете. Новый движок Nuance обладает всем необходимым для реализации полноценного интерфейса управления гаджетом.<br/>
<br/>
Сможет ли новый движок от Nuance стать принципиально новым интерфейсом ввода для iPhone?<br/>
Голосовое управление в телефоне, в играх и других приложениях (голосовые смс, голосовые e-mail) есть в этом будущее?<br/>
<br/>
Будем ли мы разговаривать <b>С</b> телефоном или так и будем тыкать его пальцами?<br/>
<br/>
Интересны ваши впечатления от нового гаджета Apple…]]></description>
			
			<pubDate>Wed, 05 Oct 2011 08:51:54 GMT</pubDate>
			<author>88005554448</author>
			<category>iphone</category><category>iphone 4s</category><category>самый нужный телефон</category><category>распознавание речи</category><category>nuance</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[IP-телефония / Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 4]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/voip/128898/</guid>
			<link>http://habrahabr.ru/blogs/voip/128898/</link>			
			<description><![CDATA[<img src="http://habrastorage.org/storage1/d4048c23/cf914a43/54dba5c2/817e0185.png" alt="VoiceNavigator"/> <img src="http://www.asterisk.org/themes/newAsterisk/images/logo.jpg" alt="Asterisk"/> <img src="http://code.google.com/p/unimrcp/logo?cct=1304109601" alt="UniMRCP"/> <br/>
<br/>
<a href="http://habrahabr.ru/blogs/voip/124946/">Часть 1</a><br/>
<a href="http://habrahabr.ru/blogs/voip/125147/">Часть 2</a><br/>
<a href="http://habrahabr.ru/blogs/voip/125512/">Часть 3</a><br/>
<br/>
В четвертой части, как и было обещано, рассмотрим ограничения и недостатки <a href="http://www.asterisk.org">Asterisk</a> как голосовой платформы и особенности его взаимодействия с <a href="http://speechpro.ru/product/recognition/platform/vn">VoiceNavigator</a>. <br/>
Голосовая платформа – это программно-аппаратный комплекс с функциями синтеза и распознавания речи, позволяющий создавать решения, направленные на оптимизацию работы контакт-центра, усовершенствование работы с клиентами и построение систем голосового самообслуживания.<br/>
<br/>
Asterisk голосовой платформой в чистом виде не является, т.к. работа с серверами синтеза и распознавания не является его основной задачей и реализуется посредством <a href="http://code.google.com/p/unimrcp/">UniMRCP</a>. Поэтому часть недостатков и ограничений связана именно с реализацией работы в UniMRCP.<br/>
<br/>
Среди больших и известных голосовых платформ, использующихся в колл-центрах для построения СГС, стоит отметить Avaya Voice Portal, Genesys Voice Platform, Siemens OpenScape CCVP, Cisco Unified CCX, Voxeo, Voxpilot.<br/>
Информации в Рунете очень не много, как и специалистов по данным продуктам с соответствующим уровнем компетенции. Используются в больших колл-центрах, стоимость соответствующая, и доступна она только для больших компаний.<br/>
Если будет интерес к какой-то из платформ, готов написать о них отдельно.<br/>
<br/>
Два основных недостатка, существующие в Asterisk+UniMRCP — это отсутствие поддержки VoiceXML и неработающий barge-in для синтеза речи.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/voip/128898/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Wed, 28 Sep 2011 09:23:01 GMT</pubDate>
			<author>mulai</author>
			<category>ip-телефония</category><category>asterisk</category><category>синтез речи</category><category>распознавание речи</category><category>call-центры</category><category>системы голосового самообслуживания</category><category>VoiceNavigator</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Алгоритмы / Microsoft Research объявило о прорыве в распознавании речи]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/algorithm/127332/</guid>
			<link>http://habrahabr.ru/blogs/algorithm/127332/</link>			
			<description><![CDATA[<h4>Коротко и на русском</h4><br/>
О новой технологии, над которой в MR работаю уже довольно долго, было объявлено на Interspeech 2011, проходящей сейчас во Флоренции.<br/>
С помощью гибридной контекстно-зависимой глубокой нейронной сети (Hybrid Context-Dependent Deep Neural Networks for Large Vocabulary Speech Recognition — CD-DNN-HMM) и Джорджа Дала (George Dahl) из Университета Торонто команде MR удалось улучшить качество и скорость распознавания речи до «почти человеческих» показателей. За счет сходства структур этой нейронной сети с 3D команда добилась значительного прироста скорости при использовании вычислений на GPU.<br/>
<br/>
[ <a href="http://research.microsoft.com/en-us/news/features/speechrecognition-082911.aspx">Оригинальная новость</a> ]]]></description>
			
			<pubDate>Tue, 30 Aug 2011 07:34:23 GMT</pubDate>
			<author>safright</author>
			<category>распознавание речи</category><category>Microsoft Researc</category><category>Interspeech</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[IP-телефония / Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 3]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/voip/125512/</guid>
			<link>http://habrahabr.ru/blogs/voip/125512/</link>			
			<description><![CDATA[<a href="http://habrahabr.ru/blogs/voip/124946/">Часть 1</a><br/>
<a href="http://habrahabr.ru/blogs/voip/125147/">Часть 2</a><br/>
<a href="http://habrahabr.ru/blogs/voip/128898/">Часть 4</a><br/>
<br/>
В <a href="http://habrahabr.ru/blogs/voip/125147/">предыдущей статье</a> было рассказано о тегах синтеза и о построении грамматик распознавания. <br/>
В этой части мне хотелось бы показать построение конкретного голосового приложения в Asterisk. Чтобы не придумывать голосовое меню для магазина «Рога и копыта», решил поступить проще и найти на Хабре ранее реализованный пример, на котором можно наглядно показать преимущества использования синтеза и распознавания. <br/>
<br/>
На Хабре нашелся вот <a href="http://habrahabr.ru/blogs/voip/70771/">этот пост</a>, который когда-то довольно активно обсуждался. Автор предлагает прослушивать прогноз погоды по телефону, используя множество предзаписанных файлов и <a href="http://informer.gismeteo.ru/getcode/xml.php?id=27612">xml-информеры</a> с сайта Gismeteo. Мне хотелось бы усовершенствовать данное приложение и показать, как синтез и распознавание облегчают жизнь при построении IVR и получении динамической информации.<br/>
<br/>
Приложение будет запрашивать город, погоду в котором хотелось бы узнать, затем спрашивать время (сегодня днем, завтра вечером и т.д.) и сообщать необходимую информацию.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/voip/125512/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Wed, 03 Aug 2011 10:51:08 GMT</pubDate>
			<author>mulai</author>
			<category>ip-телефония</category><category>asterisk</category><category>синтез речи</category><category>распознавание речи</category><category>call-центры</category><category>системы голосового самообслуживания</category><category>VoiceNavigator</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[IP-телефония / Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 2]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/voip/125147/</guid>
			<link>http://habrahabr.ru/blogs/voip/125147/</link>			
			<description><![CDATA[<a href="http://habrahabr.ru/blogs/voip/124946/">Часть 1</a><br/>
<a href="http://habrahabr.ru/blogs/voip/125512/">Часть 3</a><br/>
<a href="http://habrahabr.ru/blogs/voip/128898/">Часть 4</a><br/>
<br/>
В <a href="http://habrahabr.ru/blogs/voip/124946/">предыдущей статье</a> была описана общая схема работы, установлен UniMRCP, Asterisk подключен к VoiceNavigator и создано простое голосовое приложение. <br/>
Остановимся подробнее на возможностях синтеза и распознавания. Первая часть статьи будет посвящена языку разметки SSML, вторая — построению грамматик.<br/>
<br/>
<h4>Использование языка разметки SSML</h4><br/>
Управление синтезом речи на лингвистическом и акустическом уровне, происходит с помощью управляющих тегов в формате SSML.<br/>
С помощью тегов можно определить произношение, управлять интонацией, скоростью и громкостью звучания и т.д.<br/>
Опишу только наиболее используемые теги.<br/>
Подробную информацию по всем тегам можно получит в описании <a href="http://www.w3.org/TR/speech-synthesis/">стандарта </a>.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/voip/125147/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Thu, 28 Jul 2011 14:12:12 GMT</pubDate>
			<author>mulai</author>
			<category>ip-телефония</category><category>asterisk</category><category>синтез речи</category><category>распознавание речи</category><category>call-центры</category><category>системы голосового самообслуживания</category><category>VoiceNavigator</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[IP-телефония / Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 1]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/voip/124946/</guid>
			<link>http://habrahabr.ru/blogs/voip/124946/</link>			
			<description><![CDATA[<a href="http://habrahabr.ru/blogs/voip/125147/">Часть 2</a><br/>
<a href="http://habrahabr.ru/blogs/voip/125512/">Часть 3</a><br/>
<a href="http://habrahabr.ru/blogs/voip/128898/">Часть 4</a><br/>
<br/>
Учитывая, возросший интерес сообщества к Asterisk решил внести и свою лепту и рассказать о построении голосовых меню с использованием синтеза и распознавания речи. <br/>
<br/>
Статья рассчитана на специалистов, имеющих опыт работы с построением IVR в Asterisk и имеющих представление о системах голосового самообслуживания.<br/>
<br/>
СГС (системы голосового самообслуживания) значительно расширяют возможности по созданию голосовых приложений и позволяют пользователю получать информацию и заказывать услуги самостоятельно, без участия оператора. Это может быть маршрутизация вызовов, запрос и выдача информации по расписанию авиарейсов, состояние банковского счета, заказ такси, запись на прием к врачу и пр.<br/>
Распознавание позволяет отказаться от линейных меню, создаваемых с помощью DTMF, разговаривать с системой человеческим языком и легко создавать меню с множественным выбором. <br/>
Синтез значительно упрощает работу с динамически меняющейся информацией и большими объемами текстовых данных.<br/>
<br/>
<img src="http://habrastorage.org/storage1/7a617621/c3ff8633/f774661d/03e1b759.gif"/><br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/voip/124946/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Tue, 26 Jul 2011 09:50:40 GMT</pubDate>
			<author>mulai</author>
			<category>ip-телефония</category><category>asterisk</category><category>синтез речи</category><category>распознавание речи</category><category>call-центры</category><category>системы голосового самообслуживания</category><category>VoiceNavigator</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Блог компании Самый Нужный ТЕЛЕФОН / Робот Милена исполняет желания в Twitter]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/company/88005554448/blog/124129/</guid>
			<link>http://habrahabr.ru/company/88005554448/blog/124129/</link>			
			<description><![CDATA[Привет, Хабр! <br/>
<br/>
У нас для вас очередная радостная новость. Голосовой сервис заказа услуг и товаров «Самый нужный телефон» обзавелся собственным ботом. Одно сообщение роботу Милене — и желание осуществится.<br/>
<br/>
<img src="http://habrastorage.org/storage1/6fce4831/1c82951a/0b43b2d3/1ff113fe.jpg"/><br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/company/88005554448/blog/124129/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Thu, 14 Jul 2011 07:41:32 GMT</pubDate>
			<author>88005554448</author>
			<category>интернет</category><category>стартап</category><category>программирование</category><category>дружба</category><category>распознавание речи</category><category>синтез речи</category><category>поиск услуг</category><category>самый нужный телефон</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Блог компании Speereo Software / Распознавание речи на собственном сайте: тестовый стенд распознавания Speereo]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/company/speereo/blog/120023/</guid>
			<link>http://habrahabr.ru/company/speereo/blog/120023/</link>			
			<description><![CDATA[Здравствуйте хабравчане! Мы рады появиться на Хабре и надеемся, что мы здесь надолго и будем полезны как Вам, так и для себя извлечем пользу.<br/>
<br/>
Итак, с трепетом к первому посту!<br/>
<br/>
<h5>Проблема</h5><br/>
Часто на веб-сайтах пользователям приходится заполнять формы запросов. Это могут быть названия железнодорожных станций или аэропортов в сервисе заказа билетов, названия улиц в поиске на карте, названия товаров или групп товаров в интернет-магазине, наконец, обычный поиск по сайту или форуму.<br/>
Во всех этих случаях происходит выбор из некоторого, заранее известного списка или индексированного набора слов/фраз.<br/>
Особенно неудобно вводить такие текстовые запросы, когда поиск осуществляется со смартфона. Иногда делать это настолько неудобно, что мы отказываемся от использования сервиса, решаем «сделаю попозже» и забываем.<br/>
<br/>
<h5>Решение</h5><br/>
Мы предлагаем альтернативное решение подобных проблем с помощью собственного «облачного» распознавания слитной речи, внедренного в Ваш сайт.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/company/speereo/blog/120023/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Thu, 26 May 2011 09:47:56 GMT</pubDate>
			<author>olegych76</author>
			<category>распознавание речи</category><category>речь</category><category>голосовые команды</category><category>распознавание</category><category>голос</category><category>speereo</category><category>speereo software</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Google / О взаимопонимании Google и Microsoft]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/google/117971/</guid>
			<link>http://habrahabr.ru/blogs/google/117971/</link>			
			<description><![CDATA[<img src="http://habrastorage.org/storage/d0699e1d/c83b5de4/83171c53/a5aa18d8.jpg"/><br/>
Нет, этот пост не будет очередной уткой на тему всяких юридических споров, новостей в духе «главный босс одной компании обозвал другую» и домыслов о заговоре. Речь пойдет о движках распознавании речи и генерации речи из текста, предоставляемых компаниями Google и Microsoft, их внутренней совместимости и взаимной дружбе. <br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/google/117971/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Fri, 22 Apr 2011 10:15:47 GMT</pubDate>
			<author>tangro</author>
			<category>распознавание речи</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Google / Используем Google Voice Search в своем приложении .NET]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/google/117234/</guid>
			<link>http://habrahabr.ru/blogs/google/117234/</link>			
			<description><![CDATA[<a title="Картинка для привлечения внимания" href="http://lh3.ggpht.com/_c5BiwoKJTCo/SdgIf2wL8DI/AAAAAAAAASE/VIMg82wqScU/165571_thumb%5B4%5D.jpg?imgmax=800"><img src="http://lh3.ggpht.com/_c5BiwoKJTCo/SdgIf2wL8DI/AAAAAAAAASE/VIMg82wqScU/165571_thumb%5B4%5D.jpg?imgmax=800"/></a><br/>
<br/>
Функция распознавания речи с некоторого времени <a href="http://habrahabr.ru/blogs/google_chrome/103158/"> доступна </a> в браузере Google Chrome. Посмотреть как это выглядит можно, например, <a href="http://slides.html5rocks.com/#speech-input">здесь</a>. <br/>
<br/>
Так как исходный Chromium открыт, возникает закономерное желание подсмотреть, можно ли использовать технологию в <s> своих корыстных</s> целях наступления мира на земле.<br/>
<br/>
Как это часто бывает, все уже сделано за нас в этой <a href="http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/"> статье</a>. Все оказывается очень просто, необходимо сделать POST запрос на адрес <a href="https://www.google.com/speech-api/v1/recognize">www.google.com/speech-api/v1/recognize</a> со звуковыми данными в формате <a href="http://flac.sourceforge.net/">FLAC </a> или <a href="http://www.speex.org/">Speex</a>. Реализуем демонстрацию распознавания <a href="http://www.sonicspot.com/guide/wavefiles.html">WAVE</a>-файлов с помощью C#.<br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/google/117234/#habracut">Читать далее</a> </div>]]></description>
			
			<pubDate>Mon, 11 Apr 2011 14:30:34 GMT</pubDate>
			<author>Yakhnev</author>
			<category>speech recognition</category><category>распознавание речи</category><category>google</category><category>google voice search</category><category>google chrome</category><category>chromium</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[IP-телефония / Распознавание фраз в зашифрованном VoIP-потоке]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/voip/115582/</guid>
			<link>http://habrahabr.ru/blogs/voip/115582/</link>			
			<description><![CDATA[Группа исследователей из Массачусетского технологического института, Google, университета Северной Каролины и университета Джона Хопкинса опубликовали окончательную версию <a href="http://portal.acm.org/citation.cfm?doid=1880022.1880029">доклада</a> с описанием метода распознавания ключевых фраз в зашифрованном VoIP-потоке с переменным битрейтом. Они заявляют, что средняя точность распознавания составляет 50%, а для некоторых фраз — до 90%.<br/>
<br/>
Распознавание возможно благодаря анализу битрейта зашифрованного потока, в котором разные звуки кодируются с разным битрейтом. Например, гласные кодируются с большим битрейтом, а свистящие и шипящие представляют собой шум, для которого достаточно минимального битрейта. <br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/voip/115582/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Wed, 16 Mar 2011 12:00:24 GMT</pubDate>
			<author>alizar</author>
			<category>VoIP</category><category>VBR</category><category>переменный битрейт</category><category>распознавание речи</category><category>кодирование звуков</category>
		</item>
		
		
		
		
		
		
		
		
	
	
	
	
	
	
	
	

	
</channel>
</rss>

