Поисковые машины и технологии

индекс
99,35

Индексирование звука появилось на страничке Google Labs

На страничке перспективных разработок Google Labs появился новый проект: GAudi (Google Audio Indexing). Это технология распознавания и индексирования англоязычной речи, которая извлекается из мультимедийных файлов, в том числе из видео.

Последнюю разработку Google де-факто начали тестировать два месяца назад на небольшом количестве видеороликов с портала YouTube: см. новость «На YouTube появился полнотекстовый поиск по видео». Но это был своеобразный «чёрный ящик»: мы просто могли посмотреть, как работает новая фича, но не знали, что реально за ней стоит. Теперь же опубликован отдельный интерфейс для поиска по видеороликам (в этот индекс в будущем можно подгрузить любой видеоконтент из интернета), а также FAQ с информацией.

Из FAQ’а мы узнали, что движок распознавания речи создан с нуля специальной рабочей группой из сотрудников Google. Хотя в этой области идут изыскания уже десятки лет силами множества компаний, но GAudi — это полностью самостоятельная разработка Google.

В данный момент поддерживается только английский язык и система, конечно же, делает много ошибок. Например, в этом видеоролике слово «Czechoslovakia» неправильно распознано как «tech also but there», а слово «free» распознано как «forty», и подобных ошибок довольно много.

На странице проекта сообщается, что движку распознавания речи будут постепенно «скармливать» не только предвыборные ролики, но и другие тематические каналы YouTube, а в перспективе, наверное, он должен индексировать видеоконтент и с других сайтов.

+7
17 сентября 2008, 13:19
2

комментарии (6)

НЛО прилетело и опубликовало эту надпись здесь
+1
Gumoza #
у меня была дипломная работа по методам распознования речи с помощью фракталов… круто было — никто из преподов ничего не понимал ни во фракталах ни в распознавании речи, прога делала вид, что работала, я красиво выступал :) — оценка 5.

Если серьезно — думаю у Гугля получится.
0
pulpiteer #
Вас завтра к 9 утра просили зайти к Нине Владимировне.
0
Ganagin #
Слово «подсосать» сомнительно звучит, может заменить его на «подключить», «загрузить»?
0
alizar #
Пожалуй, да. Исправил.
0
clops #
это было вчера — используйте поиск

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.