Творческая машина

Знаете ли вы, что зубную щетку «Oral-B CrossAction» с перекрещивающимися щетинками придумала нейронная сеть.
В этой статье я постараюсь рассказать некоторые подробности, касающиеся творчества искусственного интеллекта.

Нейронные сети все больше изучаются человеком, и такой вопрос как возможность творчества нейронной сети не остался без ответа.
Физик Steve Thaler, наблюдая за работой нейронной сети, заметил, что если добавлять определенный уровень «шума» в связи между нейронами сети, машина начинает выдавать новые образы, основанные на образах, загруженных в неё раннее.

В принципе ничего удивительного в этом нет, так как нейронная сеть может обобщать, находить общие свойства у загруженных объектов и хранить их образы, соответственно если добавлять определенный элемент случайности в синапсы, то сеть будет выдавать новые образы. Но она будет выдавать много абсолютно бессмысленных результатов, поэтому нужна еще одна нейронная сеть, которая занимается оценкой выдаваемых образов первой сети и уже на её выходах появляются более «осмысленные» результаты.
Так же результат зависит от уровня шума, чем он выше, тем больше выдаваемые образы не похоже на загружаемые.

image

Так же Стив понял, что нужно отключать входы нейронной сети, как например отключается сенсорное восприятие человека во время сна, что приводит к виденью очень причудливых образов.

То, что в итоге получилось он назвал «Creativity Machines». В последствии Стив основал компанию Imagination Engines INC, которая занимается разработкой творческих и самообучающихся нейронных сетей.

Далее он проводил разнообразные эксперименты, загружая образы разных видов:
Загружал изображения лиц людей и на выходе получал новые, более красивые лица.

image
image

После загрузки 12 схематичных изображений человека в разных позах, получился своеобразный танец человечка, в котором правильно расположен центр тяжести и все движения суставов естественны, причем ни одна поза в нем не повторяет загруженные образцы.

image

Загружал мелодии, и машина, “наблюдая» за выражением лица учителя и понимая, нравится ли ему выдаваемая ею музыка сочиняла неплохие композиции.
Рекомендую послушать:
narod.ru/disk/19714500000/Holy%20Cow%20Sample.mp3.html
narod.ru/disk/19714494000/Dueling%20Ideologies%20Sample.mp3.html
narod.ru/disk/19714504000/Mechanical%20Tribe%20Sample.mp3.html
Стив выпустил целый альбом из 14 композиций, назвав его «Song of neyrons».

Я думаю понятно, что сеть может фантазировать только на основе ранее загруженных в неё данных, и все это лишь эксперименты, но думаю в будущем появиться возможность загружать информацию сразу нескольких типов, например воспоминания или пережитые эмоции, вместе со словарем и образцами творчества человека, и на выходе получать новые стихотворения или картины.

Интересы Тайлера распространились и на сферу финансового прогнозирования (я думаю прогнозирование это тоже своеобразный творческий процесс), в результате чего была создана сеть, способная прогнозировать поведение финансового рынка не только по фондовым индексам, но и «понимать» последние новости и переводить их в численные данные.

Его компания Imagination Engines INC довольно плотно занимается робототехникой. Её роботы способны к творческому мышлению, что позволяет им обучаться без какого-либо вмешательства извне. Например, в одном из экспериментов был создан робот, который сам, без участия человека или заложенной программы научился использовать свои конечности. Пример самообучения одного из таких «творческих» роботов вы можете увидеть установив screensaver (http://www.imagination-engines.com/downloads/botscrnsaver.exe), в котором эмулируется робот, самообучающийся передвижению на местности, управлению сервоприводами, и изобретающий новые движения для огибания препятствий. У меня этот робот сначала очень плохо передвигался, но за 6 часов научился довольно неплохо двигаться по коридорам.

image

Сейчас компания получает заказы на разработку роботов, в том числе и от военных ведомств.

У Imagination Engines INC достаточно много патентов в разных областях, благодаря своей творческой машине.
Что касается зубной щетки, о которой я говорил в начале статьи, то её сеть придумала после загрузки в неё множества изображений обычных щеток и описания их действий.

Планы у Стива грандиозные. Объединить человеческое сознание и сознание искусственной нейронной сети, и таким образом добиться бессмертия человека.
Так же он работает над моделью «Всемирного мозга», в котором объединятся все его разработки. Этот мозг будет функционировать так же, как функционирует сеть распределенных вычислений BOINC, и с помощью неё планируется систематизировать накопленную человечеством информацию и получать «новые знания».

Для тех, кого интересует более подробная информация — офсайт Imagination Engines INC:
www.imagination-engines.com/
+107
14 апреля 2010, 16:49
70

комментарии (54)

НЛО прилетело и опубликовало эту надпись здесь
+1
biokimelito #
Спасибо, перенёс.
0
krol44 #
патенты правят миром :)
+2
ilawyer #
С каждым днём всё страшнее жить. Скоро будем жить на планете Железяка :)
+5
Silenttouch #
УПЧК и хайвмайд одного поля ягоды, однако.
НЛО прилетело и опубликовало эту надпись здесь
+1
andrew_b #
Эх, я опоздал!
0
Swart #
О боги! Всё это время я жил в обмане и лжи!
–3
farmaceft #
страшно жить сегодня.
+1
Crankoman #
мултивак в студию
0
chupvl #
Есть старый, добрый спор в когнитивных науках и психологии о том: может ли мозг и/или сознание порождать действительно новую сущность, или нового, как такового нет — а все суть комбинация ранее увиденного?

К примеру, является ли галлюцинация проекцией ранее увиденных образов, или это исключительно синтетическое порождение нашего сознания?
0
biokimelito #
В человеческом мозге тоже присутствуют такие помехи, а информации загруженной в нём огромное количество.
Но думаю рано еще с уверенностью говорить о многих вещах, так как мы очень многого о себе еще не знаем.
0
blaster999 #
>К примеру, является ли галлюцинация проекцией ранее увиденных образов, или это исключительно синтетическое порождение нашего сознания?

Смотря какая. Например, LSD обычно дает галюцинации, состоящие из ранее увиденного, но при этом элементы многократно повторяются, образуя запутанные системы. С другой стороны, цветные вспышки и пятна, которые видны при закрытых глазах и меняются под действием звуков (привет визуализации в плеерах!), которые тоже являются эффектом LSD слишком абстрактны, чтобы быть проекцией ранее увиденного.
0
lh1 #
Считается, что фосфены — это результат сенсорного голода, когда мозг работает на полную мощность, но при этом не получает никаких данных на вход, в нашем случае, с сетчатки. Просто так он остановиться не может, поэтому запускает скринсейвер). Аналогично фосфенам, возникают слуховые галлюцинации в сурдокамере, кто-то слышит музыку, кто-то неразборчивое бормотание.
Поэтому я склонен считать, что подобные галлюцинации — это в какой-то мере результат нашего взаимодействия с миром, его познания через органы чувств. Это подтверждается тем, что слепые от рождения фосфенов не видят.
+17
andrew_b #
Тема серьезная, но я теперь понял, кто придумал упячку.
+2
FlaSH14 #
Об этом ещё 6 лет назад писали на Мембране
+3
biokimelito #
Тайлер уже давно ведет свою деятельность, поэтому не удивительно, что о нём пишут.
0
ForeverLive #
Про музыку как-то слабо верится если честно. Где доказательство того что это не сделано в секвенсоре за пару минут неизвестно кем?
0
helions8 #
Скорее всего изначально был некий набор семплов, а машина их комбинировала. Я предполагаю, что где-то так.
0
Delfino #
хотелось бы послушать оригнальные треки или семплы. музыка вполне — хочу послешать робо-альбом
0
biokimelito #
0
rg_software #
По-моему, тут немного «в огороде бузина, а в Киеве дядька».
«Развлекать» нейросеть помехами конечно весело, наверняка можно получить разные прикольные результаты. А самообучение робота или бессмертие человека (ага, вот сейчас раз — и загрузили мозг в компьютер по usb — сначала разъём к черепу прикрутите) — совсем другого рода задачи.
+1
MikhailEdoshin #
С философской точки зрения разрушение знания — необходимый шаг в получении нового знания. Поэтому добавление помех здесь очень к месту. Собственно, и мутации нейросетей ни что иное, как разрушение имеющихся алгоритмов в поисках лучших.
0
dime #
>Знаете ли вы, что зубную щетку «Oral-B CrossAction» с перекрещивающимися щетинками придумала нейронная сеть.
Интересно, какой именно критерий при этом оптимизировался? Глядя на современные щётки, наверняка оптимизация была по максимуму объёма предстоящих продаж… Подавляющее большинство современных щёток имеет слишком большую (длинную) чистящую головку, вопреки очевидному :(.
Запарился уже искать каждый раз короткоголовые щётки.
Крайний раз пришлось купить длинную и выдрать пинцетом ряд пучков щетинок :). А вы говорите — нейронная сеть :).
–1
edelweard #
Извините, не смог пройти мимо, глаз режет:
www.gramota.ru/spravka/buro/search_answer/?s=%EA%F0%E0%E9%ED%E8%E9
+5
dime #
А, это распространённое среди пилотов и парашютистов суеверие :). О том, что не стоит говорить «последний полёт», поскольку последний полёт — это известно что :). Многие переносят это и на остальную речь. Грешен, каюсь :).
0
alcanoid #
В последнее время не покидает ощущение, что у нас каждый второй, судя по разговорной речи, — пилот или парашютист!
+1
Mordraug #
Не только у пилотов и парашютистов, много у кого это суеверие в ходу, я о нём узнал от скалолазов, например.
0
edelweard #
Кстати, если по существу, то у ультразвуковых щёток (которые намного дороже обычных) головка как раз небольшая. Да и стоматологи действительно рекомендуют головки малого или среднего размера. Непонятно, откуда вообще взялись большие.
0
DpyuD #
Люди ленивые — большой головкой почистится быстрее
0
StrangeAttractor #
> Крайний раз пришлось купить длинную и выдрать пинцетом ряд пучков щетинок :)

Зачем?
0
dime #
Чтобы сделать головку короткой, очевидно. Длинной орудовать неудобно и плохо вычищает.
0
Levsha100 #
То есть наше сознание, полет мысли это просто рандом- оптимистично =)
0
OpenMinded #
Откуда такой вывод? Рандомом для нашего сознания является сама поступающая информация. Если ее оцифровать, то получится довольно «толстый» поток, в котором выявленные повторяющиеся последовательности наверняка будут случайны, как будут случайны последовательности цифр в числе pi.

Смоделировать систему, способную обрабатывать такой поток данных в реальном времени довольно трудно, поэтому все случайности вносятся искусственно. Это довольно разумное решение.
+1
Levsha100 #
>>Откуда такой вывод?
Ибо нет ничего идеального, наш мозг не исключение.
Эволюция. Эволюция тому доказательство. Постоянные мутацие сделали нас именно такими.
Да и вообще все что мы видим- случайность, маленькая точка в бесконечности…
Мы- случайность.
Я пошел спать.
0
Levsha100 #
Квантовая физика сделала из Физики науку о вычислении вероятностей, ибо мы не можем обработать то множество частиц, которые она нам открыла. Мы считаем округленные значения. В микромире мы наблюдаем за хаосом, хотя на самом деле все это подчиняется строгим физическим законам.
К чему это я?
К тому, что случайности как таковой не существует, ею мы называем то, что не можем(или не хотим) уследить.
0
MaximKat #

Вот такая странная антена была создана с помощью генетических алгоритмов для НАСА в 2006 году
0
ldv290384e #
Будущее рядом. Сразу вспомнилось огромное количество иллюстраций к космической фантастике. Инопланетные корабли с придчудливыми формами различных приборов, да и корпуса в целом… если ЭТО действительно эффективная антена, то художники не ошибались.
0
Levsha100 #
Может она и эффективная, но не практичная, имхо.
+2
ldv290384e #
А опыт с фотографиями навеял воспоминания о фантастическом рассказе где инопланетные медицинские нанороботы восстановили мальчика-землянина не подозревая, что противогаз не является частью тела. И по этому шаблону стали восстанавливать и других людей… Это я к тому, что очки всего на двух исходных образах, а в итоге так или иначе проявляются на всех. При том ни как предмет, а больше похоже на рисунок на коже. =)))
0
StrangeAttractor #
Жесть :-) А ведь действительно…
+2
tolikblik #
А скажите, как рассказ называется?
0
mwizard #
Не знаю насчет рассказа, но то, что описал ldv290384e уж очень похоже на «Пустого Ребенка», эпизод телесериала «Доктор Кто».
+4
mechmind #
Написано мало по теме. Как я могу понять, Стив плотно занялся обратной связью между слоями нейросети — по сути, каждый из слоев должен качественно повышать уровень абстракции относительно входного сигнала. Допустим, распознаем графические образы — фигуры. Тогда первый слой раздвелит все пространство на полуплоскости, второй даст выпуклый многоугольник, третий уже произвольный многоугольник, на следующем «узнает» несколько многоугольников, в том числе и вложенных итд. И на выходе мы получим сигнал, который можем понимать как то, что сеть «увидела» на изображении. Если мы возьмем произвольный сигнал и пустим его в обратном направлении, то можем получить какую-то фигуру на входе.
Теперь перед нами встает задача подбора такого сигнала, чтобы при обратном прогоне что-либо заслуживающее внимания. Можно провести аналогию с восстановлением фотографии — вам в руки попала очень старая фотография с моря, почти выцветшая и с оторванным куском и вам нужно во что бы то ни стало вернуть ей прежний вид. И в шестикратном разрешении. Можно наложить 100500 фильтров и вообще ничего не добиться, но скорее всего вы будете пробовать и смотреть как лучше, тонко настраивая несколько инструментов редактора. Так же и наша программа будет изучать нейросеть, пытаясь давать ей на вход такой сигнал, чтобы выход нейросети был как можно более «чище» (что означает что она распознала данный ей образ однозначно). Простейший способ — поставить вторую нейросеть, соединив её вход с выходом первой, а её выход — с выходом первой. Немного экспериментов и можно получить эффект с лицами.
Дальше — сложнее, танцующий человечек требует некоторой памяти от программы и способность строить движения с учетом инерции. Не так очевидно, как может показаться. К сожалению, в статье ничего про это не сказано.
Что касается философского аспекта, то имхо «неуправляемая вычислительная мощь» нашего мозга постоянно занята самоэволюцией — параллельно перебираются множество комбинаций паттернов из распознанного окружающего мира, пытаясь дать сознанию то, что оно хочет. Когда у неё получается, вы получаете неожиданные идеи, а может шутки, или может быть интуитивное предчувствие, а может и вдохновение. Как и остальной мозг, это [полу]бессознательная часть тренируется со временем, и в осознанном возрасте очень выручает сознательную часть, а её мощность в качестве «генератора образов» и инертность дают творческий стиль, если можно так сказать. Теоретически, мы можем создать программу, которая будет делать то же самое — получать сигналы с сенсоров, иметь доступ к физической памяти нейросети и возможность использовать её. Но технически, это потребует огромных даже по меркам современных gpgpu и кластеров мощностей, что откладывает реализацию. Лет на 5.
На вопрос «сможет ли машина творить?» скажу — возможно. Но не нам. Мириады факторов влияют на человека, хотя бы невербально — на моделирование организма полностью, этого огромного саморегулирующегося «механизма», в котором живет мозг, на можель этой системы уйдет ещё столько же ресурсов, а она всегда будет неполна ввиду несовершенства приборов. Роботы не будут копией человека — не научатся дышать, не будут слушать стук своего сердца, их «эмоции» будут чужды людям. Но, они смогут обмениваться информацией между собой, и я надеюсь, что увижу визуализацию рободискотеки.
+1
Biga #
Извините, не убедительно.
На фотографиях отчётливо видно, что у лиц чужие носы и губы. Зачем?
На результирующей фотографии контуры множатся и расплываются, и чёрт его знает, как наше восприятие это интерпретирует, может именно из-за этого и получаются «новые» «красивые» лица.

Пепяка-денс тоже не особо удивляет. Не вижу в интерполяции введённых данных никакого творчества.

Автоматическая подстройка сети к управлению конечностями — обычное дело, и никогда творчеством не называлась.

Я не говорю, что всё это бесполезно, просто не ново, и на творчество не тянет.
+1
biokimelito #
Я думаю там загружалась не одна сотня изображений, а эти даны в качестве примера образцов.

И это всего один из множества видов искусственного интеллекта, поэтому все это могло уже где-то быть, только получалось оно другим путём.
+1
MAXH0 #
Самое забавное, что тупо усредненные фотографии выбираются людьми как более красивые. Глаз ориентируется на стандарт. Возьмите выборку из 1000 фото, усредните, подравняйте симметрию (для этого половину фото можно зеркально отразить) вы получите фото которое большинство выберут за эталон. Для этого не нужна нейросеть.
0
stab #
Дядьке просто нужно бабло, он же не скажет, что мои сети умеют делать, например, интерполяцию введённых данных, звучит как-то приземлённо, а так картинки показал и нормально, чё-то там вертится на них, потенциальным заказчикам нравится — Ишкушственной Интоллект!

Патенты, патенты, патенты и публикации уровня: берём два крутых яйца, огурец и самообучающаюся нейронную сеть™, всё это тщательно встряхиваем в закрытой кастрюле, обязательно говорим «трах-тибидох!», иначе фокус не получится, открываем кастрюлю, если мы всё сделали правильно, нейронная сеть из примитивных продуктов питания может создать образ хуя — вот, смотрите, получилось, видите, это хуй!

Короче говоря, всё это обычные нехитрые пр-махинации, совершаемые с целью добычи заказчиков и их бабла. Специалистов по нейронным сетям всё больше с каждым днём, надо как-то вертеться.
0
derid #
А между прочим нехорошие производители зубных щеток oral-b crossaction power больше не продают к ним насадок :-(
–1
ppiskun #
Друзья, я видимо пропустил какой-то отрезок времени. Вроде еще вчера ИИ был абсолютно невозможен. А сейчас, какие то нейронные сети придумывают вещи лучше человеа. Вопрос хабра людям: почему об этом не гремит весь мир и что такое нейронные сети?
P.S. Боюсь, мне скоро придется забыть все языки программирования и изучать программирование нейроных сетей
+2
etz #
«А сейчас, какие то нейронные сети»
Вы действительно очень много пропустили. Изучите, в интернете масса материалов.
+1
ppiskun #
Вы правы. Поизучал, ощущение, что я проспал лет 15
+1
Guria #
Впечатляет. Вот только жаль, что они не написали нейросеть для создания своего сайта. Может мне конечно уже пора спать, но мне читать это месиво текста неприятно.
0
biokimelito #
Да, я тоже думаю что это было бы лучшей для них рекламой в наше время.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.