Pull to refresh
0
Content AI
Решения для интеллектуальной обработки информации

Как научить Windows Search искать информацию в картинках

Reading time2 min
Views7.2K

Некоторое время назад мы уже писали об одном из вариантов использования ABBYY Recognition Server, сегодня расскажем вам ещё об одном. Все знают виляющую хвостом собаку, которая появляется в Windows XP при нажатии F3. За ней скрывается удобная поисковая служба Windows Search, позволяющая находить затерявшиеся на компьютере файлы по названиям, а иногда и по содержимому. Поиск по содержимому в Windows по умолчанию поддержан только для файлов текстовых форматов.

Недавно мы выпустили новый продукт ABBYY Recognition Server IFilter – специальное дополнение к Windows Search, которое помогает этому поисковому сервису индексировать файлы графических форматов – TIFF, JPEG, PDF и др., хранящиеся на компьютере, чтобы потом можно было легко находить их с помощью полнотекстового поиска. Для извлечения текста из документов-изображений задействуется ABBYY Recognition Server, установленный в корпоративной сети.



Работает эта система так:

На рабочие компьютеры сотрудников устанавливается IFilter – маленькое лёгкое приложение, которое умеет передавать изображения на удаленный ABBYY Recognition Server и получать оттуда в ответ распознанный текст. Windows Search можно настроить на индексирование определенных папок и почтовых ящиков на компьютере. Все текстовые документы и письма из выбранных папок Windows Search индексирует сам, а все изображения, найденные в этих папках и вложениях в письма, передает через IFilter в Recognition Server для распознавания. Распознанный текст возвращается обратно на компьютер и добавляется в индекс – изображение становится доступно для полнотекстового поиска.

image

Сам IFilter потребляет минимум системных ресурсов – все ресурсоемкие процессы происходят на сервере в корпоративной сети. Копии изображений хранятся на сервере только во время распознавания, после распознавания они с сервера удаляются.

Ну и приятный бонус – IFilter умеет автоматически отсеивать фотографии (чтобы не мучить сервер распознаванием красот Египта и Турции).

Update по просьбам читателей: приложение работает под Windows 7, Vista, XP :)

Вера Серова
Аналитик по технологическим продуктам
Tags:
Hubs:
+13
Comments28

Articles

Information

Website
www.contentai.ru
Registered
Founded
Employees
101–200 employees
Location
Россия