Pull to refresh

Comments 17

Отличные эксперименты.

Недавно тоже получил доступ и смотрел куда в геймдеве можно прикрутить DALL-E.

По моим выводам, он неплохо справляется с pixel art и нетребовательными к качеству концептами: https://tiendil.org/using-dall-e-for-gamedev/

А как получить к нему доступ? Хочу сравнить с Midjourney (кстати он на основе DALL-E сделан или Imagen, не понятно, - не пишут, с текстом у него проблемы как у DALL-E, но лица рисует судя по найденым в интернете картинкам как DALL-E 2, или лучше).

Там у них где-то можно свой email оставить. Когда доходит очередь, приходит письмо с приглашением на регистрацию.

Поначалу возможности нейросетей не особо впечатляли, но Dall-e и Midjourney заставили меня немного пересмотреть свои взгляды

и это они пока генерируют 2D!

(и то - что Stable Diffusion что Dall-e и Midjourney - уже мигают красными флажками "мы разрешаем вам их использовать только вот так!")

А когда будет генерация 3D - тогда будет вообще "весело"

Боюсь, что этот праздник жизни продлится очень недолго. На нейронки накинут удавку ещё быстрее, чем её сейчас затягивают вокруг Интернет-свобод.
С одной стороны их придушат копирасты, которые добьются того, чтобы любое использование таких нейронок приравнивалось к пиратству (потребовав от разработчиков нейронок доказать патентную чистоту каждой из 12 млн картинок обучающей выборки). А с другой — упоротые моралфаги, которых аж корёжит от мысли, что любой человек теперь может по щелчку пальцев сгенерировать себе тонны порнухи или чего-нибудь расистско-нетолерантного.

это всё до первой утечки весов моделей.

А потом - можно будет только требовать от издателей (книжек, музыки, кино, видео, игр и т.д.) обязательного упоминания, что их продукция "без гмо" полностью состоит из изображения настоящих людей/сделанные настоящими людьми.

Ну или на каждый компьютер придется устанавливать "слежку за пользователями" - чем они нагружают свои видеокарты - игрушками или нейронками (и что-то я сомневаюсь в успехе такой затеи). Или сделать так, чтобы у частных лиц не было вычислительных устройств "большой мощности" (что - еще более невозможно, учитывая игровые видеокарты)

У Midjourney параметров не хватает целиком человека в "памяти" удерживать. Он вообще человека считает одинаковым, что спереди, что ссзади. Просто на 180° голову поворачивает, потом из лопаток делает грудь, и какое-то время нужно чтоб хребет с пуза убрать (это если фигура без одежды). Ну и теряет по ходу руки, ноги, и т.д. Чем больше объектов требуется на картинке, тем больше частей этих объектов искажается.
Т.е. 175 миллиардов параметров не достаточно для всего-всего. Нужно хотяб-ы на порядок их кол-во поднять(или больше?). А вот в 3D ... не всякий человек в состоянии в 3D больше нескольких милисикунд картинку удерживать. А уж в уме с ней работать, это ещё сложнее. И детально люди вообще не могут сцену держать в голове. Т.е. чтоб до человеческого уровня поднять уровень детализации это примерно +3 порядка. Так? Хотя у людей куча другого в голове. Может быть 2 порядка достаточно..

А вот в 3D ... не всякий человек в состоянии в 3D больше нескольких милисикунд картинку удерживать

Что вы под этим подразумеваете? И как была получена статистика?

Вы сколько милисикунд без перерыва можете крутить в уме сцену из 3-х простых объектов сразу: пирамида, цилиндр, сфера. Просто в произвольном порядке расположеных. Без извращений, просто вращая "камеру вокруг сцены"? Мне например нужно закрыть глаза и сконцентрироваться, что-бы хотя-бы около секунды это в голове держать, и не отвлечься. Т.е. прерывисто эту сцену можно себе представлять бесконечно долго. Крутить вокруг камеру без перерыва, - не очень долго. Добавлять деталей, - сцена ломается и прерывается. И это невероятно скучно. А работать с этим ... С добавлением каждой детали, типа: цвет, орбита, ещё объект, ещё действие. Вы попробуйте. Расскажите про свои ощущения. АИ в этом плане даст нам фору благодаря тому, что физически память DRAM, а перестройка параметров, - чистая помеха в подобной мозгодробилке.

Детально как на яву, представить себе сцену, также скорее всего никто не может. Детали будут всё время переписываться. Даже профессиональный художник, рисующий картину прямо сейчас, каждую секунду образ этой картины переписывает.

Мне например нужно закрыть глаза и сконцентрироваться, что-бы хотя-бы около секунды это в голове держать, и не отвлечься.

просто вы не "вращатель фигур"

не расстраивайтесь, у таких людей есть свои другие преимущества

Нет. Головоломка по ссылке простая, и отношения к данной теме не имеет. Дело в прерывистости, кол-ве объектов, и действий. Т.е. это проблема сложности, в первую очередь. Чем больше объектов и действий проводимых над ними, тем сложнее удерживать картинку в голове, не прерываясь и не переписывая её, и не концентрируясь на отдельных деталях. Если вы утверждаете, что можете в голове держать непрерывно сцену с 3-мя объектами, и проводить сценой действие длительностью более 1-й секунды, не прерываясь и не концентрируясь в процессе на конкретной детали сцены, то вы просто врёте.

вы просто врёте

какое смелое и безапелляционное заявление.

на самом деле всё давно уже протестировано, заучено, попробовано и доказано - этот процесс называется контролируемыми сновидениями. Увлекался им в 90-е будучи студентом, на развал СССР пришлось много всего про мистику, астрологию, кашпирово-чумачею и прочее. Собственно суть вот в чем - тренировать себя таким образом, чтобы когда ты засыпаешь, то ты мог совершать поступки, контролируемые, во сне. Думаю это в целом для многих сложно, но это как езда на велосипеде - один раз научитесь, потом легко вернуться.

Я научился, я не принимал никогда наркотики поэтому не могу сравнивать состояния эйфории, но этот процесс затягивает.

Выглядит это так: ложитесь удобно, чтобы контакт тела с постелью был минимально раздражающим, начинаете представлять себе сцену, я чаще всего представлял дорогу грунтовую с деревьями по бокам. И словно парю по дороге, постепенно добавляю детали - дома, машины, людей. На этой стадии сейчас я начинаю засыпать и более ничего не происходит. Но раньше я пытался сохранить границу сна не проваливаясь в него глубоко, можно сказать что это дремота. Чем дальше вы продвигаетесь в тренировках тем интерактивнее вы будете себя вести. Нет, я не достигал такого что во сну хожу как на яву, взаимодействую с объектами и людьми. Думаю этого можно добиться, но всё же нужно на это тратить силы и время - такой сон не приносит отдыха.

Собственно сцена вполне стабильна, не разваливается, детали не рваные, всё отчетливо видно словно глазами, но не реальными а глазами во все. Это чувство вам например знакомо когда вы просыпаетесь и четко помните что сейчас "видели", хотя это был сон.

У меня почему-то все изображения были или с желтым или с зеленым (и то и другое легкое и светлое по тону) оттенком, четкое и цветное никогда не получалось.

Так что не делайте заявления только на обывательском опыте тех, кто эти проблемы не изучал и не обходил. Чтобы научиться парить над дорогой у меня ушло 2-3 ночи (засыпаешь в процессе), но всё хорошо запоминается и потом это повторять проще. Как я уже сказал, сейчас я этим пользуюсь чтобы засыпать, меня не особо отвлекает свет, звуки (у нас ТВ в спальне и жена может смотреть что ей хочется).

Оспидя ... Ему про Фому, он про ерёму. У вас тип памяти, не подходит для того чтобы удерживать внимание на некой умозрительной сцене непрерывно, это процесс не чтения, а перезаписи, а при перезаписи и "перечтении" всё время возникают искажения. Вместо изотерики, просто включите мозг, и прочтите о том как память человека работает. Уровень хабра скатился до вот этого ...

Себе не врите. Вы физически не можете удерживать сцену котнроллируемо больше секунды, или не переключать внимание внутри сцены. Всегда будет некий фокус, и всё лишнее будет "как-бы" в сцене, но на самом деле его там не будет. Будет референс на воспоминание о том, что оно там быть должно. Сколько бы вы не тренировались, мозг будет искать возможность оптимизации и экономии, и будет минимизоровать затраты.

Автор, а где ты номер телефона другой страны взял для регистрации? Есть какой-то доступный способ, если нет знакомых в других странах?

Статья переводная, скорее всего у автора свой телефон "другой страны":)

Но у нас тоже есть сервисы, где можно арендовать номер нужной страны.

Он имел в виду, что в недалёком прошлом было множество белых пятна, а недалёкое будущее будет переполнено крайне правдоподобной хренью. Мы посмеялись над этим, но здесь есть над чем подумать

Ну вы и шутники конечно. Чуть живот не надорвал от этой шутки

Sign up to leave a comment.