Формализуя активность клеток мозга мухи, задействованных в зрительных процессах, ученые нашли новый способ извлечения траекторий движения из необработанных визуальных данных.
Хотя они и построили систему, исследователи не совсем понимают, как она работает. Однако, несмотря на таинственность полученных формул, они могли бы быть использованы для программирования систем видения боевых миниатюрных беспилотных летательных аппаратов, поисково-спасательных роботов, систем автомобильной навигации и других систем, где вычислительная мощность в большом почете.
«Мы можем создать систему, которая отлично работает, вдохновляясь природой, без полного понимания того, как взаимодействуют элементы этой системы. Это нелинейная система, сказал Дэвид O'Кэрролл, вычислительный нейрофизиолог, изучающий зрение насекомых в австралийском университете Аделаиды. „Количество вычислений достаточно мало. Мы можем получить результат с помощью в десятки тысяч раз меньшего количества вычислений с плавающей точкой, чем используя традиционные способы “.
Наиболее известным из них является метод
Лукас-Канада , который рассчитывает сдвиги — вверх-вниз, из стороны в сторону — путем сравнения, кадр за кадром, как меняется каждый пиксел в области визуального наблюдения. Он используется для управления во многих экспериментальных беспилотных аппаратах, но такой брутфорс требует огромной вычислительной мощности, что делает этот метод нецелесообразным в небольших системах.
Для того, чтобы сделать возможным производство небольших летающих роботов, исследователи хотели бы найти более простой способ обработки движения. И тогда ученые обратили внимание на мух, которые используют относительно небольшое количество нейронов для маневрирования с необычайной ловкостью. И на протяжении более десяти лет, O'Кэрролл и других исследователи тщательно изучали оптические схемы полета мух, измеряя их по-клеточную активность и превращая результат эволюции в набор вычислительных принципов.
В документе, опубликованном в пятницу в Общественной библиотеке Научной Вычислительной Биологии O'Керрол и его коллега Рассел Бринкворт рассказывают о результатах применения этого метода на практике.
»Ноутбуки используют как минимум десятки ватт электроэнергии. Осуществить то, что мы разработали можно с чипами, которые потребляют лишь десятые мВт ", сказал O'Керрол.
Алгоритм исследователей состоит из серии пяти формул, через которые пропускаются данные с камер. Каждое формула представляет собой приемы, которыми пользуются мухи для обработки изменения уровней яркости, контрастности и движения, и их параметры постоянно изменяются в зависимости от того, что подается на ввод. В отличие от метода Лукаса-Канада, алгоритм не возвращает покадровое сравнение каждого пикселя, однако подчеркивает, крупномасштабные изменения. В этом смысле он похож на системы сжатия видео, которые игнорируют однотонные области.
Для тестирования алгоритма, O'Керролл и Бринкворт проанализировали несколько анимированных изображений высокого разрешения с помощью программ вроде тех, что могут быть запущенны в роботе. Когда они сравнили результаты с входными данными, они обнаружили, что он работал в различных условиях естественного освещения, которые обычно вводили в заблуждение обычные детекторы движения.
«Это удивительная работа, сказал Шон Гумберт аэрокосмический инженер из Мериледнского Университета, который строит миниатюрных автономных летающего роботов, некоторые из которых работают на
ранних версиях алгоритма O'Кэрролла. Для размещения традиционных систем навигации устройство должно быть способно к переноске достаточно большой полезной нагрузки. Но полезная нагрузка маленьких летающих роботов совсем маленькая — всего лишь пара Tic-Tac-ов. Ты никогда не засунешь несколько двухъядерников в пару Tic-tac-ов. Алгоритмы, которые используют насекомые очень просты по сравнению с вещами мы проектируем, и еще проще для небольших транспортных стредств ».
Интересно, что алгоритм не работает так же хорошо, если какая-нибудь одна операция пропущена. Сумма больше, чем целое, и О'Керролл и Бринкворт не знают почему. Поскольку параметры находятся в постоянной обратной связи, он производит каскад нелинейных уравнений, в которых трудно разобраться в ретроспективе, и почти невозможно предсказать.
«Мы вдохновились зрением насекомых, и построили модель, которая пригодна для реального использования, но при этом, мы построили систему почти такую же сложную, как само насекомое», сказал O'Керролл. «Это одна из самых увлекательных вещей. Это не обязательно приведет нас к полному пониманию того, как эта система работает, но возможно приблизит к пониманию того, как сама природа смогла сделать это правильно.»
Исследователи получили свой алгоритм из нейронных схем, относящихся к поперечному обзору, но O'Керролл считает, что похожие формулы вероятно, могут использоваться при расчете других оптических потоков, таких, которые производится для перемещения вперед и назад в трехмерном пространстве.
комментарии (53)
Может прикручу систему зрения своему боту(которого уже делаю и пишу статью)
Я бы кстати картинку перевел, а заодно можно статью в тематический блог перенести, кармы тебе хватает. :)
Интересно, что алгоритм не работает так же хорошо, если какая-нибудь одна операция пропущена. Сумма больше, чем целое, и О'Керролл и Бринкворт не знают почему. Поскольку параметры находятся в постоянной обратной связи, он производит каскад нелинейных уравнений, в которых трудно разобраться в ретроспективе, и почти невозможно предсказать.
Долго втыкал (хотя может время уже позднее так влияет :)… Сумма больше целого? Керрол производит каскад нелинейных уравнений??
Да, в ближайшие несколько дней переведу.
«Интересно, что только объединение всех пяти функций дает отличный результат, любая импровизация его ухудшает. Целое больше, чем сумма его частей.»
И опять сразу боевых. Ну б…ь не живётся людям мирно и всё тут.
Долго мы ещё будем изучать и создавать чтоб разрушать?
Всегда.
Единство и борьба противоположностей.
В мире баланс созидания/разрушения.
Что бы что то создать нужно что то разрушить (на запчасти).
Разрушаем постоянно.
Разрушаем ядра урана для добычи энергии.
Разрушаем глюкозу для энергии тела.
Разрушаем рудные тела для добычи металлов.
Разрушаем вирусы и бактерии для выживания себя.
Я не так выразился.
Я о том, что мы часто создаём что‐нибудь чтобы разрушать.
А так, конечно, новый дом не построишь пока старый не сломаешь на этом месте.
Эта фраза очень настораживает
С другой — статья, по сути дела, об искуственных нейронных сетях, только не тех, которые 50 лет назад придумали и сейчас там все формализовано, а о новой попытке взять от природы, а там разобраться. В ИНС тоже очень много творчества, и никто вам никогда не объяснит, почему данная нейросеть работает, а вот эта похожая — нет. Там все делается пробами и ошибками. Ну не все, есть некоторые соображения, но многое.
И никого это не настораживает, все работает.
Или другой пример: представьте, вы — глава фирмы или государства. Вы ей можете управлять, даже прекрасно управлять, но нет никакой возможности разобраться, почему Вася Пупкин не вышел на работу. Вы просто берете статистику, как часто Васи Пупкины так делают, и управляете =) Здесь тоже самое.
Кто такой «Корреляционный ЭМО»?)
Да, вот, только на текущем этапе эволюции нашему виду всё это не нужно.
Вдруг завтра затопит всё вокруг и срочно нужно будет отращивать ласты и жабры?
Читал в начале года книжечку «Исскуственный интеллект»в которой основной упор делался просто на попытку объяснить необьяснимое — работу коры головного мозга и универсальность ее строения — так все на уровне «слухов и домыслов»… Но в целом позитивное впечатление и очень граммотная теория. Жаль автора не могу вспомнить, книжка в офисе, позже отпишу реквииты.
Например знаете колючки, растение. По их типу у нас есть застежки на зимних куртках или обуви.
Да и в общем много других.
Эволюция не способна объяснить возникновение алгоритмов, которые работают и имеют смысл только в том случае, если все пять компонентов на месте и все они выполняются в строго заданной последовательности. Сам Дарвин об этом говорил.
Ещё раз, холиварить не хочу, просто всегда этому поражался.
Спасибо за перевод, побольше бы таких статей на Хабре.
В статье написано только о том, что выкидывание любой части ухудшает результат, а не делает его бесполезным. Так что эволюция скорее всего изобретала части последовательно.
В статье же объясняется, что сложность не в отсутствии логики, а в непомерной её сложности:
С чего бы это? С теорией искусственных нейронных сетей вы не знакомы, получается? Из обученной НС в некоторых случаях возможно извлечь информацию, пригодную для построения понятного алгоритма. А в некоторых — нет. То есть алгоритм есть (как минимум алгоритм работы нейросети), а вот _как_ он работает — не понятно. Ну, кучка нелинейных диффуравнений…
>Сам Дарвин об этом говорил.
:) Цитату приведите. Креационисты часто утверждают, что «Дарвин это говорил», религиозные фанатики, что Энштейн был верующим, а прочие мракобесы, что вода имеет память :). Но никаких разумных доказательств ни те ни другие, ни третьи не приводят.
Пишите и переводите еще, пожалуйста!
Похожая задачка, но чуть более масштабная — разобраться в функционировании мозга (тоже нейросеть, но нейронов несколько больше). Там мы можем работать в очень крупном масштабе (мозг — черный ящик, исследуем внешние проявления поведения), можем — в чуть меньшем (разделяем мозг на подсистемы=отделы и изучаем реакцию каждой подсистемы на специфические воздействия => получим больше информации), а в совсем мелком не можем — получим такую прорву информации, что для ее обработки не хватит никаких ресурсов. Еще можно моделировать систему с нуля и смотреть, как можно получить похожие свойства. И лишь потом можно как-то сводить все это воедино.