Pull to refresh

Библиотека компьютерного зрения CCV 0.6 с новым классификатором изображений

Reading time 1 min
Views 20K


Для свободной кроссплатформенной библиотеки компьютерного зрения CCV разработан новый классификатор изображений, обученный в свёрточной нейроной сети. Впервые классификатор такого уровня и модели (детектор лиц, детектор автомобилей, детектор пешеходов) выпущены под свободной лицензией.

Один из разработчиков CCV, китайский программист Лю Лю (Liu Liu) пишет, что за последние полтора года произошёл настоящий прорыв в алгоритмах глубокого обучения, а особенно — в области классификации изображений на основе свёрточных нейронных сетей. «Для библиотеки, рассчитанной на работу в самых современных реализациях, было бы обидно не реализовать грамотный классификатор изображений после более года прорывных исследований, опубликованных на эту тему», — говорит он. Тем более, что среди свободных библиотек есть совсем немного реализаций такого классификатора: Caffe, OverFeat и cuda-convnet, да к тому же все они под научными лицензиями. Разумеется, ситуацию нужно было исправлять.

В результате, Лю Лю потратил пять месяцев — и всё-таки сделал классификатор достойного качества ccv_convnet.c, который включён в комплект новой версии CCV 0.6.

Классификатор обучали на наборе данных ILSVRC 2010 из 1000 классов, он демонстрирует вероятность ошибки top-1 36,83% и вероятность ошибки top-5 16,25%, что близко к проприетарным классификаторам высшего класса (лучший в мире классификатор Clarifai показал на наборе ILSVRC 2013 вероятность ошибки top-5 11,19%).

Классифактор и сопутствующие модели опубликованы под международной лицензией Creative Commons Attribution 4.0.

Испытать классификатор в работе можно на сайте DoComputersDream.org и через RESTful-интерфейс.
Tags:
Hubs:
+28
Comments 13
Comments Comments 13

Articles