войти зарегистрироваться

Поисковые машины и технологииИндексирование звука появилось на страничке Google Labs

На страничке перспективных разработок Google Labs появился новый проект: GAudi (Google Audio Indexing). Это технология распознавания и индексирования англоязычной речи, которая извлекается из мультимедийных файлов, в том числе из видео.

Последнюю разработку Google де-факто начали тестировать два месяца назад на небольшом количестве видеороликов с портала YouTube: см. новость «На YouTube появился полнотекстовый поиск по видео». Но это был своеобразный «чёрный ящик»: мы просто могли посмотреть, как работает новая фича, но не знали, что реально за ней стоит. Теперь же опубликован отдельный интерфейс для поиска по видеороликам (в этот индекс в будущем можно подгрузить любой видеоконтент из интернета), а также FAQ с информацией.

Из FAQ’а мы узнали, что движок распознавания речи создан с нуля специальной рабочей группой из сотрудников Google. Хотя в этой области идут изыскания уже десятки лет силами множества компаний, но GAudi — это полностью самостоятельная разработка Google.

В данный момент поддерживается только английский язык и система, конечно же, делает много ошибок. Например, в этом видеоролике слово «Czechoslovakia» неправильно распознано как «tech also but there», а слово «free» распознано как «forty», и подобных ошибок довольно много.

GoogleИндексация Аудио

Гугл в тёмных подвалах своих лабораторий запустил новую фишку: отныне они в состоянии распознавать речь (правда пока только на английском), что делает возможным поиск по ключевым словам в видео-файлах youtube. Новый проект носит кодовое название «GAudi», и оценить его в действии можно уже сейчас.