войти зарегистрироваться

Мухи, математика… Роботы?

image

Формализуя активность клеток мозга мухи, задействованных в зрительных процессах, ученые нашли новый способ извлечения траекторий движения из необработанных визуальных данных.


Хотя они и построили систему, исследователи не совсем понимают, как она работает. Однако, несмотря на таинственность полученных формул, они могли бы быть использованы для программирования систем видения боевых миниатюрных беспилотных летательных аппаратов, поисково-спасательных роботов, систем автомобильной навигации и других систем, где вычислительная мощность в большом почете.

«Мы можем создать систему, которая отлично работает, вдохновляясь природой, без полного понимания того, как взаимодействуют элементы этой системы. Это нелинейная система, сказал Дэвид O'Кэрролл, вычислительный нейрофизиолог, изучающий зрение насекомых в австралийском университете Аделаиды. „Количество вычислений достаточно мало. Мы можем получить результат с помощью в десятки тысяч раз меньшего количества вычислений с плавающей точкой, чем используя традиционные способы “.

Наиболее известным из них является метод Лукас-Канада , который рассчитывает сдвиги — вверх-вниз, из стороны в сторону — путем сравнения, кадр за кадром, как меняется каждый пиксел в области визуального наблюдения. Он используется для управления во многих экспериментальных беспилотных аппаратах, но такой брутфорс требует огромной вычислительной мощности, что делает этот метод нецелесообразным в небольших системах.

Для того, чтобы сделать возможным производство небольших летающих роботов, исследователи хотели бы найти более простой способ обработки движения. И тогда ученые обратили внимание на мух, которые используют относительно небольшое количество нейронов для маневрирования с необычайной ловкостью. И на протяжении более десяти лет, O'Кэрролл и других исследователи тщательно изучали оптические схемы полета мух, измеряя их по-клеточную активность и превращая результат эволюции в набор вычислительных принципов.

В документе, опубликованном в пятницу в Общественной библиотеке Научной Вычислительной Биологии O'Керрол и его коллега Рассел Бринкворт рассказывают о результатах применения этого метода на практике.

»Ноутбуки используют как минимум десятки ватт электроэнергии. Осуществить то, что мы разработали можно с чипами, которые потребляют лишь десятые мВт ", сказал O'Керрол.

image

Алгоритм исследователей состоит из серии пяти формул, через которые пропускаются данные с камер. Каждое формула представляет собой приемы, которыми пользуются мухи для обработки изменения уровней яркости, контрастности и движения, и их параметры постоянно изменяются в зависимости от того, что подается на ввод. В отличие от метода Лукаса-Канада, алгоритм не возвращает покадровое сравнение каждого пикселя, однако подчеркивает, крупномасштабные изменения. В этом смысле он похож на системы сжатия видео, которые игнорируют однотонные области.

Для тестирования алгоритма, O'Керролл и Бринкворт проанализировали несколько анимированных изображений высокого разрешения с помощью программ вроде тех, что могут быть запущенны в роботе. Когда они сравнили результаты с входными данными, они обнаружили, что он работал в различных условиях естественного освещения, которые обычно вводили в заблуждение обычные детекторы движения.

«Это удивительная работа, сказал Шон Гумберт аэрокосмический инженер из Мериледнского Университета, который строит миниатюрных автономных летающего роботов, некоторые из которых работают на ранних версиях алгоритма O'Кэрролла. Для размещения традиционных систем навигации устройство должно быть способно к переноске достаточно большой полезной нагрузки. Но полезная нагрузка маленьких летающих роботов совсем маленькая — всего лишь пара Tic-Tac-ов. Ты никогда не засунешь несколько двухъядерников в пару Tic-tac-ов. Алгоритмы, которые используют насекомые очень просты по сравнению с вещами мы проектируем, и еще проще для небольших транспортных стредств ».

Интересно, что алгоритм не работает так же хорошо, если какая-нибудь одна операция пропущена. Сумма больше, чем целое, и О'Керролл и Бринкворт не знают почему. Поскольку параметры находятся в постоянной обратной связи, он производит каскад нелинейных уравнений, в которых трудно разобраться в ретроспективе, и почти невозможно предсказать.

«Мы вдохновились зрением насекомых, и построили модель, которая пригодна для реального использования, но при этом, мы построили систему почти такую же сложную, как само насекомое», сказал O'Керролл. «Это одна из самых увлекательных вещей. Это не обязательно приведет нас к полному пониманию того, как эта система работает, но возможно приблизит к пониманию того, как сама природа смогла сделать это правильно.»

Исследователи получили свой алгоритм из нейронных схем, относящихся к поперечному обзору, но O'Керролл считает, что похожие формулы вероятно, могут использоваться при расчете других оптических потоков, таких, которые производится для перемещения вперед и назад в трехмерном пространстве.

комментарии (53)

  • Большую картинку, пожалуйста.
    • Сменила картинку на большую.
  • Очень интересно! Успехов!
    • Мне статья в Wired показалась несколько общей, обтекаемой. Если действительно очень Интересно, могу взяться за перевод исходной статьи из PLoS Computational Biology. Там формулы, графики и прочие симпатичные вещи.
      • Интересно. :)
      • Очень интересно почитать формулы и посмотреть графики, надеюсь вы возьмётесь за это!
      • Это действительно очень интересно!
      • Выходи за меня!
      • ОЧЕНЬ ИНТЕРЕСНО!!!
        Может прикручу систему зрения своему боту(которого уже делаю и пишу статью)
      • а готовой либы нет? %-)
      • Да, а то эта статья похожа на «торсионные поля» по стилистике.
  • Прекрасный перевод. Сразу же оправдала инвайт, побольше таких переводов на Хабр.
    Я бы кстати картинку перевел, а заодно можно статью в тематический блог перенести, кармы тебе хватает. :)
    • Перенесла в ИИ. Картинку перевожу, но, боюсь, в отрыве от оригинального текста в PLoS она будет смотреться не очень понятно.
    • Ну насчет перевода — можно было бы улучшить… В этот абзац:

      Интересно, что алгоритм не работает так же хорошо, если какая-нибудь одна операция пропущена. Сумма больше, чем целое, и О'Керролл и Бринкворт не знают почему. Поскольку параметры находятся в постоянной обратной связи, он производит каскад нелинейных уравнений, в которых трудно разобраться в ретроспективе, и почти невозможно предсказать.

      Долго втыкал (хотя может время уже позднее так влияет :)… Сумма больше целого? Керрол производит каскад нелинейных уравнений??
      • Я думаю имелся ввиду алгоритм… Даешь статью из PLoS'а :)
      • Возможно, имелось ввиду:

        «Интересно, что только объединение всех пяти функций дает отличный результат, любая импровизация его ухудшает. Целое больше, чем сумма его частей.»
  • >…они могли бы быть использованы для программирования систем видения боевых миниатюрных беспилотных летательных аппаратов, поисково-спасательных роботов…

    И опять сразу боевых. Ну б…ь не живётся людям мирно и всё тут.

    Долго мы ещё будем изучать и создавать чтоб разрушать?
    • >Долго мы ещё будем изучать и создавать чтоб разрушать?

      Всегда.

      Единство и борьба противоположностей.

      В мире баланс созидания/разрушения.

      Что бы что то создать нужно что то разрушить (на запчасти).

      • Дык мы ж не разрушаем чтобы создать что‐то новое. Мы создаём чтобы что‐нибудь разрушить — это же идиотизм.
        • >Дык мы ж не разрушаем чтобы создать что‐то новое.

          Разрушаем постоянно.

          Разрушаем ядра урана для добычи энергии.
          Разрушаем глюкозу для энергии тела.
          Разрушаем рудные тела для добычи металлов.
          Разрушаем вирусы и бактерии для выживания себя.

          • Да это понятно.

            Я не так выразился.
            Я о том, что мы часто создаём что‐нибудь чтобы разрушать.
            А так, конечно, новый дом не построишь пока старый не сломаешь на этом месте.
    • Творческий процесс по Фрейду это вытеснение. Мы вытесняем из подсознания дикие и разрушительные инстинкты, преобразуются их в полезную созидательную работу. В результате, Творческая Личность избавившись от всего дикого изобретает что нибудь полезное ( пулемет...)
  • Мы можем создать систему, которая отлично работает, без полного понимания того, как взаимодействуют элементы этой системы


    Эта фраза очень настораживает
    • с одной стороны, настораживает.

      С другой — статья, по сути дела, об искуственных нейронных сетях, только не тех, которые 50 лет назад придумали и сейчас там все формализовано, а о новой попытке взять от природы, а там разобраться. В ИНС тоже очень много творчества, и никто вам никогда не объяснит, почему данная нейросеть работает, а вот эта похожая — нет. Там все делается пробами и ошибками. Ну не все, есть некоторые соображения, но многое.

      И никого это не настораживает, все работает.

      Или другой пример: представьте, вы — глава фирмы или государства. Вы ей можете управлять, даже прекрасно управлять, но нет никакой возможности разобраться, почему Вася Пупкин не вышел на работу. Вы просто берете статистику, как часто Васи Пупкины так делают, и управляете =) Здесь тоже самое.
    • «Скайнет» так и построят — «мы не совсем понимаем, как это работает…»
      • Очень может быть, что по-другому и нельзя построить ИИ.
  • Да, кстати, в тексте не нашел.
    Кто такой «Корреляционный ЭМО»?)
  • Будьте уверенны, мы ждем продолжения! ;)
  • О, спасибо огромное за перевод! Не зря кстати, они на мух такое внимание заострили. Как никак 100 кадров в секунду против 25 человечешких
    • Да уж. Со ста кадрами в секунду мозг бы запарился все эти объемы анализировать. Он и так кучу мелочей семантически связывает «нужно или не нужно»… ;-)
      • Уж приспособился бы как-нибудь. И глаза бы сами отросли по-совершеннее.
        Да, вот, только на текущем этапе эволюции нашему виду всё это не нужно.
        Вдруг завтра затопит всё вокруг и срочно нужно будет отращивать ласты и жабры?
  • Да уж… сколько еще самых «очевидных» с точки зрения природы вещей нам предстоит разобрать и понять, чтобы ефективно использовать.

    Читал в начале года книжечку «Исскуственный интеллект»в которой основной упор делался просто на попытку объяснить необьяснимое — работу коры головного мозга и универсальность ее строения — так все на уровне «слухов и домыслов»… Но в целом позитивное впечатление и очень граммотная теория. Жаль автора не могу вспомнить, книжка в офисе, позже отпишу реквииты.
  • Видимо вы очень торопились. Кучи ошибок + в некоторых местах явно промтовский перевод, который очень сложно читать.
  • Есть вещи которые придумываются людьми и достаточно часто мы ими пользуемся, а это всего лишь копии каких-то природных вещей, растений или животных.
    Например знаете колючки, растение. По их типу у нас есть застежки на зимних куртках или обуви.
    Да и в общем много других.
  • Ну я этого в упор не понимаю. Не хочу развивать холивара или ещё чего, но как, сталкиваясь с подобным можно говорить об эволюции и безликой «природе», когда открываемые алгоритмы просто кричат о замысле и Разуме?! Если даже учёные сами до конца никак не могут понять как оно работает, когда алгоритмы уже ясны, но как они работают — не ясно!

    Эволюция не способна объяснить возникновение алгоритмов, которые работают и имеют смысл только в том случае, если все пять компонентов на месте и все они выполняются в строго заданной последовательности. Сам Дарвин об этом говорил.

    Ещё раз, холиварить не хочу, просто всегда этому поражался.

    Спасибо за перевод, побольше бы таких статей на Хабре.
    • Вообще-то непонятность строения — это как раз и есть косвенное свидетельство эволюции. Если бы алгоритм был придуман в результате разумных соображений, они бы его сразу же поняли.

      В статье написано только о том, что выкидывание любой части ухудшает результат, а не делает его бесполезным. Так что эволюция скорее всего изобретала части последовательно.
      • Да, вы правы про ухудшение результата. Хотя интересно было бы узнать подробнее.
        Если бы алгоритм был придуман в результате разумных соображений, они бы его сразу же поняли.
        Ну это если считать, что интеллект, ответственный за появление мух не превосходит наш. А если превосходит, то логика может быть настолько витиеватой, что нам как раз будет сложно понять, а может быть даже невозможно, как невозможно нам до конца понять что такое температура в сто миллионов градусов по цельсию.

        В статье же объясняется, что сложность не в отсутствии логики, а в непомерной её сложности:
        Поскольку параметры находятся в постоянной обратной связи, он производит каскад нелинейных уравнений, в которых трудно разобраться в ретроспективе, и почти невозможно предсказать.
    • >Эволюция не способна объяснить возникновение алгоритмов, которые…
      С чего бы это? С теорией искусственных нейронных сетей вы не знакомы, получается? Из обученной НС в некоторых случаях возможно извлечь информацию, пригодную для построения понятного алгоритма. А в некоторых — нет. То есть алгоритм есть (как минимум алгоритм работы нейросети), а вот _как_ он работает — не понятно. Ну, кучка нелинейных диффуравнений…
      >Сам Дарвин об этом говорил.
      :) Цитату приведите. Креационисты часто утверждают, что «Дарвин это говорил», религиозные фанатики, что Энштейн был верующим, а прочие мракобесы, что вода имеет память :). Но никаких разумных доказательств ни те ни другие, ни третьи не приводят.
      • Насчёт цитаты — я говорил о «неснижаемой сложности» о которой Дарвин говорил следующее:
        Если можно было бы показать, что существует какой-либо сложный орган, который не возможно было образовать путём многочисленных, последовательных, небольших видоизменений, моя теория, безусловно, разрушилась бы.
        А насчёт остального — я уже сказал, что холиварить не собираюсь, так как по личному опыту знаю, что это бесполезно. Я лишь высказал свою позицию. Вы — свою. Давайте разойдёмся на этом.
  • Я уже вижу их миниатюрных летающих роботов, которые тупо долбятся в моё окно!
    • Не бойтесь, это просто комары!
  • Алгоритм распознания может быть и прост, скорее всего, что это так. Но в Фазеточной области мухи тысячи «глаз». А на схеме я вижу только два входа. ( то есть у робота должно быль две пачки камер по тысячи штук, хотя и примитивных)
    • Мда… на чьей-то роже уже недовольство.
    • господин минусующий проблему которую он в упор не видит, подобен мухе с маху влетающей лбом в стекло.
  • Большое человеческое спасибо! :)
    Пишите и переводите еще, пожалуйста!
  • Это дурдом… Но это очень завораживает! Чем-то похоже на алзхимию. Что-то сделали, оно работает(!) как — пока не поняли. :) Романтика
    • Ну, типичная сложная система — на поведение сильно влияет взаимодействие компонентов, история взаимодействий, обратные связи между ними и т.п., поэтому разобраться, как оно работает изнутри, провести реверс-инжиниринг — очень сложно.
      Похожая задачка, но чуть более масштабная — разобраться в функционировании мозга (тоже нейросеть, но нейронов несколько больше). Там мы можем работать в очень крупном масштабе (мозг — черный ящик, исследуем внешние проявления поведения), можем — в чуть меньшем (разделяем мозг на подсистемы=отделы и изучаем реакцию каждой подсистемы на специфические воздействия => получим больше информации), а в совсем мелком не можем — получим такую прорву информации, что для ее обработки не хватит никаких ресурсов. Еще можно моделировать систему с нуля и смотреть, как можно получить похожие свойства. И лишь потом можно как-то сводить все это воедино.

  • Очень интересно!
  • спасибо, автор
Только авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста.