войти зарегистрироваться

Обработка изображенийViola Jones на собственной шкуре, часть 1. Настройка проекта под OpenCV

Привет, друзья мои! Дорогие Хабраюзеры и Хабрачитатели, предлагаю Вам окунуться в дебри разработки программы распознавания эмоций по материалам предыдущих моих статей.

АлгоритмыUpgrade Viola Jones

В моём предыдущем топике я старался показать, как метод Viola Jones работает, с помощью каких технологий и внутренних алгоритмов. В данном посте, дабы не прерывать цепочку, будет также много теории, будет показано за счет чего можно улучшить и до того прекрасный метод. Если здесь описать еще и программную реализацию, то будет огромное полотно, которое читать будет очень неудобно, и смотреться это никак не будет — решено разбить объем информации на два отдельных поста. Ниже — теория, мало картинок, но много полезного.

АлгоритмыМетод Виолы-Джонса (Viola-Jones) как основа для распознавания лиц

Хотя метод был разработан и представлен в 2001 году Полом Виолой и Майклом Джонсом [1, 2], он до сих пор на момент написания моего поста является основополагающим для поиска объектов на изображении в реальном времени [2]. По следам топика хабраюзера Indalo о данном методе, я попытался сам написать программу, которая распознает эмоцию на моём лице, но, к сожалению, не увидел на Хабре недостающей теории и описания работы некоторых алгоритмов, кроме указания их названий. Я решил собрать всё воедино, в одном месте. Сразу скажу, что свою программу успешно написал по данным алгоритмам. Как получилось рассказать о них ниже, решать Вам, уважаемые Хабрачитатели!

GoogleGoogle купил компанию, специализирующуюся на технологии распознавании объектов на фото



Похоже на то, что корпорация Google собирается вплотную заняться технологией распознавания лиц на фото. Для того, чтобы ускорить данный процесс, корпорация купила компанию PittPatt, которая как раз и занимается разработкой соответствующих технологий. PittPatt занимается не только распознаванием лиц на фотографиях, но и распознаванием фотографий вообще, с последующей разметкой (тегированием) распознанных объектов.

FacebookFacebook пробует узнать пользователей на фотографиях

image
Facebook глобально, но тихо, выкатила относительно новый сервис, который позволяет пользователям автоматизированно отмечать других пользователей на загруженных фотографиях. «Относительно» — потому как сама возможность, утверждает BBC, была доступна в Америке с декабря 2010 года, а общедоступна стала только сейчас.

Обработка изображенийКонтурный анализ

Cтатья описывает теоретические основы контурного анализа и аспекты его практического применения для распознавания изображений.
Первая часть статьи содержит основные определения и теоремы контурного анализа. Я постарался выделить главные моменты, которые позволяют достаточно быстро понять суть контурного анализа, и начать его применение на практике. Также, я добавил кое-что от себя. В основном это касается некоторых аспектов теории, которые недостаточно ясно изложены в теоретических трудах, а также вопросы оптимизации алгоритмов контурного анализа. Этому посвящена вторая часть статьи. Там же приводятся результаты работы алгоритмов, описаны проблемы и недостатки данного метода.

Блог компании ComexpМеханизм работы технологии распознавания изображений TAPe

Здравствуйте, уважаемые Хабравчане.

Спасибо всем, кто оставлял комментарии к нашему прошлому посту. Сегодня мы постараемся более подробно рассказать о TAPe-технологии, разработанной нашей компанией, в чем её суть и особенности. А также расскажем немного о способах распознавания изображений.

Всем интересующимся распознаванием изображений прошу под кат.

Искусственный интеллектЭффект коартикуляции речи и его преодоление при распознавании. Пособие для нейроспецназа из песочницы

Что такое коартикуляция



Жуткий зверь по имени «аллофон»


Произнося слова и составляющие их звуки, мы никогда не задумываемся о том, что физически они из себя представляют. Сколько из говорящих на разных языках разумных земных существ пытались записать свою речь и исследовать её на графиках, спектрограммах? Понять и изучить её особенности, выделить закономерности и вообще, узнать о речи больше? Думаю, совсем немногие — в процентном отношении.

Мы просто пользуемся! Причём пользуемся неосознанно.

Мы интуитивно делим речь на звуки, которые записываем буквами, и нам кажется, что звук «а» — это всегда «а», а в слово «мама» есть два абсолютно одинаковых звука «а».

А вот и нет!!! Проведите эксперимент: запишите слово «мама», а потом, с помощью средств обработки аудиозаписи поменяйте слоги местами…

РобототехникаРепортаж с московской демонстрации VisLab Intercontinental Autonomous Challenge или итальянские автоматические чудо-машинки в действии

Тема электротранспорта уже перестала быть новой для IT-сообщества. Хотя электромобиль на российских дорогах увидеть пока в диковинку, но некоторые хабралюди уже собирают электровелосипеды своими руками. Этот репортаж об электромобилях, но главная изюминка вовсе не в этом. Дело в том, что итальянская фирма VisLab некоторое время назад начала воплощать в жизнь грандиозное мероприятие — трансконтинентальный автопробег на автоматически управляемых электромобилях, способных передвигаться почти без участия человека и совсем без использования традиционного топлива. С 17 по 19 августа итальянская делегация находилась в Москве, 18 августа проводилась демонстрация рядом с гостиницей «Космос», а вчера, 19 августа — демонстрация для московского представительства фирмы Topcon Positioning Systems, которая является партнёром пробега и поставляла для него своё навигационное оборудование. На эту демонстрацию мне и посчастливилось попасть.Audi RSQ

Искусственный интеллектПрименение нейросетей в распознавании изображений

Про нейронные сети, как один из инструментов решения трудноформализуемых задач уже было сказано достаточно много. И здесь, на хабре, было показано, как эти сети применять для распознавания изображений, применительно к задаче взлома капчи. Однако, типов нейросетей существует довольно много. И так ли хороша классическая полносвязная нейронная сеть (ПНС) для задачи распознавания (классификации) изображений?