Pull to refresh

yandex-speech — wrapper к речевым технологиям Яндекса

Reading time 1 min
Views 15K
Ознакомившись с обзором движков для распознавания речи, заметил там API от Яндекса. И на выходных написал небольшую обертку для Node.js для распознавания речи с целью поиска мата в своих телефонных разговорах. По мотивам топика на Хабре.

Список нецензурных слов выкладывать не буду, а сам npm устанавливается командой.
npm install yandex-speech


Исходники и примеры использования:
github: www.github.com/antirek/yandex-speech

Немного деталей:

Ключ API активировали в течение трех часов. В запросе так и написал: «нужен тестовый ключ, запросов будет 10-20 штук в день». Ключ, указанный в примерах, блокирован. Запросите, пожалуйста, свой: developer.tech.yandex.ru

В документации написан пример, подобный запросу curl типа
curl -v -4 -H "Content-Type: audio/x-mpeg-3" -d "@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Оказалось, что можно и так отправить:
curl -v -4 -F "Content-Type=audio/x-mpeg-3" -F "audio=@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Добавил проверку размера отправляемого аудиофайла, не более 1Мб, т.к. сервис ругается на файлы большего размера.

Также добавил враппер для генерации аудиофайла по тексту. Неофициальное API по мотивам комментария на Хабре. Чтобы и text2speech, и speech2text в одном флаконе.

Надеюсь, что кому-то еще пригодится в хозяйстве. Вопросы, пожелания, критика по коду?
Tags:
Hubs:
+21
Comments 6
Comments Comments 6

Articles