хабраиндекс
0,00

TAPe-технология — новое слово в распознавании изображений

Приветствую, уважаемые Хабражители!

Позвольте представить вашему вниманию блог компании Comexp, а также технологию TAPe, которая позволяет очень быстро распознавать изображения даже в условиях сильных помех.

Интересно? Прошу под кат

Зачем это нужно?


Как известно, существуют некие стандартные методы обработки изображений, позволяющие справиться с достаточно узким классом технических задач. Средства, используемые для анализа изображений, могут работать только в условиях минимальных помех. Если помехи становятся значительными, то надежность распознавания картинки резко снижается. При этом существенно возрастает время ее обработки, что сводит на нет все задачи по обнаружению объекта или слежения за ним. Еще бы, объект давно уже исчез, а система только через полчаса сообщила, что она его опознала!

Классическая технология обработки изображения предполагает три основных этапа:
  1. Первичная обработка
  2. Выделение классификационных признаков
  3. Классификация изображения.


До разработки TAPe-технологии первые два этапа не имели теоретического решения при условии наличия организованных помех. Именно этим объясняется отсутствие в настоящее время алгоритмов надежного распознавания человека по его фотографии, или телевизионных изображений в системах контроля различных правоохранительных органов.

Может, это фикция, и создать подобный механизм невозможно? Однако здесь, как всегда, нам бросает вызов сама природа, в очередной раз демонстрируя свое совершенство. Зрительный анализатор человека столь совершенен, что мы можем распознавать какой-то предмет не только в сложных погодных условиях, но и тогда, когда большая часть этого предмета от нас скрыта. Если для нас опознать, например, стакан по одной его кромке не представляется сложным, то для машины — это непосильная задача! В то время как машина работает с огромным числом несвязных чисел, человек обладает целостным восприятием, распознавая объект большими фрагментами по малому числу признаков.

Однако решение данной проблемы все же было найдено. Компания Comexp изобрела и запатентовала такую технологию, которая позволяет распознать объект даже при условии загораживания значительной его части. Эта технология получила название TAPe (англ. Theory of Active Perception — теория активного восприятия).

Этапы технологии состоят в следующем:


  1. Составление исходного описания. Одномоментная обработка всего изображения в целом. Отсутствие на этом этапе процедуры свертки позволяет избежать зависимости от возможных помех (шума). Возникающие помехи становятся частью изображения, что может быть использовано в пользу рассматриваемого объекта: в некоторых случаях это помогает получить его информативные элементы; все существующие картинки тождественно отображаются на определенное множество картинок, которые затем могут быть обработаны в реальном времени при помощи стандартных вычислительных машин. Например, если речь идет об обработке изображения на поле размером 1024х1024 с уровнями градаций яркости 256, то мощность многообразия изображений (все множество изображений) — это космическое число, составляющее 2561048576. При обработке мощность множества полутоновых изображений существенно уменьшается и может быть представлена небольшим количеством признаков, несущих информацию о наиболее значимых структурных элементах изображения.
  2. Анализ изображения. Обработка результатов первого этапа, пространственное дифференцирование, которое позволяет выявить композитные и структурные связи между всеми структурными частями изображения.
  3. Создание образа изображения. Подготавливаются специальные изобразительные описания, отражающие остовы и интегральные кривые структурных связей элементов изображения.
  4. Принятие решений. Составленное изобразительное описание сравнивается с эталоном, имеющимся в базе. Если эталон отсутствует, то происходит формирование нового эталона.


Отсутствие свертки позволило распознавать рассматриваемый объект значительно эффективнее, чем это происходило у пирамидальных зрительных машин, основанных на свертке. Для примера, пирамидальные зрительные машины эффективнее матричных машин в 106 раз!

Посмотреть в действии



Посмотреть на технологию в действии можно на нашем сайте в разделе «Протестируй», там представлены различные видеофрагменты, которые в реальном времени ищутся по записям недельных эфиров нескольких телеканалов по разным регионам. Список телеканалов и регионов для тестирования мы изменяем каждую неделю, актуальный список всегда отображается в разделе «Протестируй». Хочу отметить, что для уменьшения нагрузки на базу данных мы включили на сайте кэширование, поэтому отчет для каждого фрагмента формируется в первый раз после его добавления.

Также вы можете загрузить свой видеофрагмент (потребуется регистрация в два шага) и увидеть насколько быстро будет произведен поиск по базе. Если у вас под рукой нет никаких видеороликов из эфира, то мы подготовили список актуальных рекламных роликов и заставок для тестирования.

Рекламные ролики:


Заставки телепередач и сериалов:


Хотелось бы узнать мнение хабражителей по поводу нашей технологии. Сейчас мы развиваем направление мониторинга телеэфира, как приоритетное в использовании технологии TAPe, но параллельно разрабатываем API для сторонних разработчиков. Есть ли какие-то идеи на этот счет, пожелания, предложения? Буду рад узнать ваше мнение по данному вопросу.
Спасибо за внимание.
+6
11 октября 2010, 09:43
20

комментарии (14)

+11
halkfild #
намного интереснее было бы почитать о технической составляющей проекта.
Более подробно о используемых методах и характеристиках аппаратной части
+8
catdog #
Это рекламный ресурс, он уже давно для этого не предназначен.
–8
Iliapan #
Как это не предназначен? Либо вы забыли тэг irony, либо то, что вы говорите — бред.
+3
Lisio #
Тэги в браузере не отображаются, попробуйте его найти в исходном коде страницы :)
+4
catdog #
Why so srs?
+1
ComexpTeam #
> Более подробно о используемых методах
В мониторинге телеэфира мы используем технологию TAPe для получение фингерпринта видео. Особенностью данного подхода является высокая устойчивость к помехам (шумы, кропы, яркость и т.п.) даже в аналоговом тв-вещании.
+4
Orion #
:) это не «подробно о используемых методах», это для чего используете. Чуть-чуть разные понятия )
+1
maloi_alex #
Более подробная информация видимо предназначена для тех, кто решил копнуть глубже.

0
alexxxst #
Эта статья предлагается к удалению. :)
+2
intelligenceAgent #
Имеются ли научные статьи по теме? Сравнения с аналогичными методами на доступных базах?
0
ComexpTeam #
Статьи были. Давно. Сейчас уж и не найти. Отсутствие современных статей связано с коммерческой тайной ( и получением патента в том числе).

Что Вы понимаете под «аналогичными методами на доступных базах»? Мы еще не встречали открытых ресурсов, которые представляют контрольные данные для сравнения с другими методами. Если подскажете, то будет очень благодарны и обязательно поделимся результатами.
0
arkady #
В статье нет ничего, кроме пиара. Поддерживаю первый комментарий
0
ComexpTeam #
Пиар — не самоцель. Для продвижения наших услуг есть специализированные ресурсы. Здесь мы бы хотели акцентировать внимание Хабражителей на последнем абзаце этой статьи: оценка работы странички «Протестируй» на нашем сайте, интересные идеи по новым способам применения нашей технологии, пожелания-предложения к разрабатываемому API.

Мы пока не готовы обсуждать тонкости технологии TAPe. Как например компания TinEye не готова обсуждать тонкости своей технологии обработки изображений. Но мы бы хотели создать подобный сервис для поиска видео.
+2
Svetloyar #
Настало время на базе вашей технологии сделать автоматическую резалку рекламы для телевизоров.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.