Pull to refresh

Comments 533

Программисты изнасиловали фотографа(с).жпг

Фотографии как таковых в обученнй сетке нет. Насколько я понимаю, за просмотр этих изображений роялти не полагаются. Так что иск от компании облснованный, а фотографу стоит хоть немного разобраться в теме, прежде чем угрожать, требовать и жаловаться. Глупость наказуема.

Фотографии как таковых в обученнй сетке нет.

Поясните, пожалуйста. Если Вы имеете в виду, что в выборке находится какой-то производный материал от фото (фото, преобразованное в формат, пригодный для обучения сетки – нужного размера, с нужным набором цветов, в нужном формате закодированный, не знаю, что ещё там может быть), то это всё равно фото, просто прошедшее предварительную обработку. Или Вы имеете в виду что-то другое?

Я не знаком подробно с механизмом обучения таких сетей, так что мне правда интересно. Я полагал, что в каком-то виде фотографии при обучении используются.

Они как Яндекс хранят только ссылки на изображение и потом продают коллекцию ссылок. Это как если бы вы историю своего браузера Продали или ссылки из избранного

Ну как бы тот же Рутрекер тоже не хранит у себя объекты авторского права, но его почему все равно заблокировали. В чем разница?

Ну так там за уши притянули распространение пиратского контента. А тут Вася выложил в общий доступ фотки для бесплатного просмотра, кто-то адреса фоток собрал. Продал коллекцию общедоступных адресов.

Теперь Вася не доволен, что адрес его общедоступной фотки продали. Это как если я адрес музея кому-то скажу, потом меня засудят за пиратство контента

Просмотр людьми и использование в программном мега-продукте - разные юридические категории. Тем более, что мега-продукт нацелен на извлечения прибыли, а просмотр разрешен ради рекламы способностей фотографа.

Одно дело, когда новые технологии честно вытесняют старые, другое, кода большой бизнес пользуется мелким как бесплатными мартышками.

И тут нельзя сказать что в нейронке не хранится само фото если оно использовалось для изготовления самой сети.

Возьмем мысленный эксперимент: есть два талантливых художника. Одному волей случая повезло стать известным, второму нет. У первого за дорого покупают картины в определенном стиле, второй ничего не может продать.

И вот, неудачьник решает стать подражателем первого, рисует картины в его стилистике (но не копирует) и начинает зарабатывать.

Кто будет прав, если первый подаст в суд второго и потребует возместить недополученную прибыль?

Просмотр людьми и использование в программном мега-продукте - разные юридические категории. Тем более, что мега-продукт нацелен на извлечения прибыли, а просмотр разрешен ради рекламы способностей фотографа.

Ну значит удалить фотографа из всех поисковых систем. Ибо хранят ссылки? Хранят. Просматривает (и индексирует) их робот? Робот. Корпорации владеющие поисковыми системами являются мега-корпорациями? Да. Делают это ради получения прибыли (в отличии от некоммерческой laion) ?- делают. Вывод? Нафиг из выдачи ссылки на фото (а из поиска по картинкам - и сами фото в виде кэшированных превью). Пусть через сарафанное радио ищут.

Ибо хранят ссылки?

На это он вроде согласен. И на просмотр человеком согласен. А на именно "использование в коммерческих целях" не согласен. Напишите код. Его просмотрит нейросеть, а вам потом денег не даст. Патамушта она сама код написала, а вы тут ни при чём.

На это он вроде согласен. И на просмотр человеком согласен. А на именно "использование в коммерческих целях" не согласен.

Претензии у него к LAION. Laion учит на датасете? Нет. Laion просто аггрегирует ссылки. И выгладывает их (а не фото) на некоммерческой основе для всех (в отличии от гугла, который делает это на коммерческой основе, монетизируя рекламой). А кто по ним уже пройдет и посмотрит — от них не зависит.


Это как предъявлять претензии к гуглу за то, что кто-то учит сеть на результатах запроса к google image search.


Напишите код. Его просмотрит нейросеть, а вам потом денег не даст. Патамушта она сама код написала, а вы тут ни при чём.

Напишите код, залейте его в публичный гитхаб-реп, который виден всем, под лицезией не запрещающий его просмотр, изучение и формирование определенных выводов по результату изучения. Кто-то пройдет и посмотрит, освоит на примере вашего кода какие-то годные ООП-практики (не заучивая сам код и сам код никак напрямую и косвенно не используя) и потом пойдет писать свой код на работе (т.е за деньги), используя освоенные практики. И вам, внезапно, не заплатит. Есть в этом что-нибудь странное? Вроде нет. А нейронки именно так и делают.

 Laion учит на датасете? Нет. 

У Вас видимо пруфы есть на это.

Напишите код, залейте его в публичный гитхаб-реп, который виден всем

И в котором есть условия использования, с которыми Вы согласились на его использование другими. А можете показать условия репозитория фотографа? Что там написано? Посмотрел-понравилось-купил? Или посмотрел-поматросил-бросил?

У Вас видимо пруфы есть на это.

Зайдите на их сайт, посмотрите их проекты. У них нет ни одной генеративной text2image модели. Они не этим занимаются. С таким же успехом у меня нет пруфов, что яндекс и гугл не учат генеративные модели на своей выдаче.


И в котором есть условия использования, с которыми Вы согласились на его использование другими.

Могу показать вам 1000 и 1 реп без каких-либо условий и лицензий (т.е по-умолчанию условия площадки). Художник свои работы на публичный доступ тоже на площадках выкладывает. И я очень глубоко сомневаюсь что в их условиях сказано, что смотреть на изображения имеет право только белковый интеллект/человек и что выводы из просмотренного может делать только белковый интеллект/человек. Они запрещают копирование и переиспользование, но ничем из этого обучающаяся модель не занимается. Она буквально "смотрит и делает выводы", меняя лишь коэфициенты своих весов, причем заранее созданных при инициализации модели, еще до увиденной первой картинки. Она даже новых весов внутри себя она не создает, в отличии от человека, новые нейронные связи формируюещего (т.е по сути куда больше выносящего из увиденного).

Если Вы посмотрели чужой чертеж велосипеда (который разрешено смотреть, но не более) и сделали на его основе велосипед (велосипед же не чертеж), то Вы полагаете что Вы не должны занести автору чертежа? Просто исходя уже из того, что сам чертеж Вы не копировали?

Вы будете шокированы, однако —

Авторские права не распространяются на идеи, концепции, принципы, методы, процессы, системы, способы, решения технических, организационных или иных задач, открытия, факты, языки программирования, геологическую информацию о недрах.

Гражданский кодекс РФ, статья 1259, пункт 5 (полный текст в википедии).

Чертеж велосипеда - это не "способ решения технической задачи", данный пункт тут вообще неприменим.

Полагаю, что комментатор выше хотел сказать, что чертеж в данном случае не является объектом авторского права. Для интеллектуальной собственности существует патентое право и регулируется оно иначе.

Объектами авторских прав являются произведения науки, литературы и искусства независимо от достоинств и назначения произведения, а также от способа его выражения:

...

произведения архитектуры, градостроительства и садово-паркового искусства, в том числе в виде проектов, чертежей, изображений и макетов;

Это из цитируемой автором ГК 1259. В этом плане чертеж полагаю вполне может быть объектом авторского права, как и изображенное на нем изделие, если оно существует в единственном экземпляре и несет в себе какую-то новизну. Вот ситуацией когда дальше по чертежу что-то более-менее массово создается, безусловно занимается уже патентное а не авторское право. Но исходный комментарий на который была опубликована цитата из ГК вообще говоря и не ограничивался авторским правом.

А чертёж в изложенном случае никто не копировал. При строительстве велосипеда никакой копии чертежа не было.

Комментатор хотел сказать, что речь вообще не про чертёж. Чертёж никак не был использован при делании велосипеда. Велосипед был сделан на базе идеи, концепции, принципа, созданного в уме посмотревшего человека.


Ваш комментарий я тоже поддерживаю, он стал хорошим дополнением. Однако я не обратился в эту сторону, потому что 1 велосипед не нарушает патентного права, ведь его не продают.

Посмотрел-понравилось-купил

Посмотрел-не понравилось-не купил )

Так Stable Diffusion опенс сорс проект, за него денег не берут, если конечно ты на своём железе его используешь.

Ну в США пытались судить журналиста, который просто посмотрел код WWW-странички в браузере, и увидел там что-то типа списка паролей (именно в коде скрипта, а не на сервере), о чем и написал статью - типа взлом программы и обучение взлому.

Там были номера соцстрахования в США

Правильно-ли я вас понимаю, что вы считаете, что автор и собственник объекта, охраняемого авторским правом, не может сам определять как ему распоряжаться этим объектом?
И какая-то организация имеет больше прав в определении порядка использования его творений, чем он?

Напишите код, залейте его в публичный гитхаб-реп, который виден всем, под лицезией не запрещающий его просмотр, изучение и формирование определенных выводов по результату изучения.

Из-за этого вы не потеряете свой доход и свою работу.

Если подписывает своим именем - не засудить... Иначе бы Пикассо всех кубистов засудил бы. Более того, даже вы можете нарисовать квадрат и покрасить его в черный цвет. Но без подписи Казимира Малевича вряд ли продадите :)

Возьмем мысленный эксперимент:

Корректнее такой эксперимент: препод в художественном вузе дает своим студентам адрес сайта, чтобы они ознакомились с образцами современного искусства и написали по результатам курсовую. Вопрос: имеет ли право художник, чьи работы представлены на сайте, требовать от кого-либо денег? Работы его, на них не просто смотрят, а используют в учебном процессе. Препод получает зарплату за преподство, студенты - обрастают знаниями, повышают свою стоимость как наемных сотрудников, конкуренция тому же художнику подрастает...

Обучать студентов и загружать фотки в нейронку не одно и тоже.

Студенты совершенствуется и потом создает свое искусство не только на увиденном но и на своем жизненном опыте и на опыте препода.

А нейронка просто перетасовывает загруженные фотки. Причем, загружаются не всякий мусор а по возможности лучшие работы.

UFO just landed and posted this here

Ну уж точно с верхних полок а не с нижних :)

Нет, там все подряд. Из-за этого часто в моделях проблемы и вылезают. И поэтому плодятся дообученные модели которые на отборных сетах обучаются.

А вы уверенны что знаете как тренируют нейронные сети?
"загружать фотки в нейронку " Вот это словосочетание меня заставляет сомневаться в вашем понимании процесса.

Чем плохо такое упрощение? Суть сказанного от этого не меняется.

Студенты при просмотре тоже в мозг фотки загружают. И рисуют не из жизненного опыта, а перетасовывая загруженные фотки и изображения реального мира, загруженные из зрительного аппарата. И творят не своё искусство, а коллаж из увиденного ранее по жизни. Слепой вам ничего подобного не нарисует — не из чего коллаж делать.


Норм упрощение.

Ну вообще в живописи таки есть понятие "плагиата" и на Западе оно вполне себе ведет к судебным разбирательствам. Тут довольно тонкая грань и ее вполне можно провести по линии "сколько своих собственных сил вложил автор в работу".

Да. В текущей ситуации предлагаю судить нейронку (точнее, её авторов) за каждый случай плагиата. Плагиат доказывается так: 1) изображение присутствовало в обучающей выборке (сеть видела фотку) и 2) результат сети очень похож на это изображение.

В таком случае, это задача авторов сети организовать обучение и архитектуру сети так, чтобы сеть не могла более-менее точно воспроизвести ни одно изображение из обучающей выборки.

Это гораздо более конструктивно, чем судиться с разработчиками нейронки за нарушение авторских прав — существование изображения в «памяти» нейронки сложно доказать, кроме как через случаи плагиата.

И вот когда их завалят жалобами за плагиат, тогда пусть и работают над математкой и методами обучения и семплирования данных. Пример уже есть: разработчики ChatGPT, насколько я понял, подсуетились и напрямую запретили своей сети цитировать тексты из обучающей выборки.

Я не думаю что от того что нейросетку научат лучше перемешивать произведения разных авторов смысл происходящего принципиально изменится.

Я рассуждаю так: написать по памяти свою версию картины - приемлемо. Сфотографировать картину и продавать фотографию как самостоятельное произведение - нет. Разница в том что нарисовать свою картину сложно и требует определенных затрат усилий и наличия навыков у автора, а сфотографировать - просто. По сути мы переложили всю сложность по созданию нового произведения на создателей фотоаппарата и автора исходной картины. Работа с нейросеткой мне видится похожей на работу с очень навороченным и сложным, но все же техническим приспособлением по перемешиванию чужих изображений, схожим по объему вклада чего-то нового в творчество.

Работа с нейросеткой мне видится похожей на работу с очень навороченным и сложным, но все же техническим приспособлением по перемешиванию чужих изображений, схожим по объему вклада чего-то нового в творчество.

Тогда фотография — не искусство. Причем любая. Это просто работа с навороченным и сложным техническим приспособлением. Задал настройки, ракурс, свет, нажал кнопку — и дальше оно само запечатлело реальный (не созданный автором) уже существовавший объект, само его фильтром байера свело и в RAW/JPG сохранило. Творческой деятельности не больше чем с нейронкой, в основном тупо технические навыки.


А если таки установка ракурса/настроек/света для получения хорошего результата — это искусство, то и установка гиперпараметров, настроек, модулей, обучение и использование подключаемых эмбедингков/лор/гиперсетей и, самое главное, составление корректного позитивного и негативного промта с корректной развесовкой — тоже искусство.


Без всего этого сеть сделает "бррр" и выдаст мешанину инсульто-подобной трехголово-восьмирукой фигни покрытой пальцами, на каких бы шедеврах она не училась.

Тогда фотография — не искусство. Причем любая. Это просто работа с навороченным и сложным техническим приспособлением.

Да, в некоторых странах есть такой подход. Там делят фотографии на творческие и не-творческие.

Увы, в России любое действие фотографа заведомо признаётся творческим. И даже если совсем другой человек настроил камеру и выбрал кадр — права принадлежат именно фотографу, который нажал на кнопку.

Сфотографировать картину и продавать фотографию как самостоятельное произведение - нет.

Рынок книжек с репродукциями немного не согласен. Продается, разумеется, именно как репродукция, а не 'я сам нарисовал'.

Так репродукции нельзя создавать без разрешения правообладателя.

2) результат сети очень похож на это изображение.

Причем критично чтобы он буквально был похож (т.е изображал тот же объект в ± том же ракурсе и т.д). Т.к если похож стиль, но нарисовано то чего исходный автор ни разу не рисовал — то это уже не плагиат (а стиль авторским правом не охраняется, только конкретные изображения).

2) результат сети очень похож на это изображение.

При таком подходе осудят всех пользователей нейронки, потому что российский суд может.

Кажется тут не плагиат доказывается, а создание производного произведения.
Давайте вы выложите в сеть свой мегагениальный рассказ, кто-то переведет его и еще несколько рассказов с АвторТудей и выпустит сборник на китайском, который станет бестселлером.
Вы имеете право потребовать денег/убрать рассказ из сборника?
Ну или мульт по рассказу снимут. Тоже ведь будет совсем не похоже.

Вы имеете право потребовать денег/убрать рассказ из сборника?

Ну вообще-то да, в описанной ситуации - полное право. С мультом сложнее, будет зависеть от того насколько близко он следует первоисточнику, но как правило это тоже запрещено.

Давайте вы выложите в сеть свой мегагениальный рассказ, кто-то переведет его и еще несколько рассказов с АвторТудей и выпустит сборник на китайском, который станет бестселлером.

Именно так и работает свободное программное обеспечение и свободный контент, именно на таком неограниченном коммерческом использовании построено всемирное движение Open Source, которое широко развивают участники Хабра.

Переводить чужую работу на другие языки (форк), компилировать сборники (сборки), снимать мульты и писать статьи на Хабр — считается нормальным.

 считается нормальным.

... только при условии что это явно разрешил автор

Опенсорс "работает" на специально и тщательно составленных опенсорс-лицензиях. Без них любого опенсорсника или того кто воспользовался опенсорсной библиотекой можно было бы засудить на большие суммы.
Для художников тоже есть такие лицензии — и по идее только такие работы и можно бесплатно и без спроса использовать в обучающих выборках.

Спасибо! Я хотел подчеркнуть именно то, что вы написали. Я хотел подчеркнуть, что опенсорс-лицензии — это обычное, нормальное, общепринятое поведение современных авторов.

Просмотр людьми и использование в программном мега-продукте - разные юридические категории. Тем более, что мега-продукт нацелен на извлечения прибыли, а просмотр разрешен ради рекламы способностей фотографа.

Фотограф в гугл не жаловался, что он проиндексировал его фотки?

Работа гугла в интересах фотографа, работа нейронки - против.

Ну то есть так и запишем — "если с какой-то фигни получаю выгоду я — это хорошая фигня, а если выгоду получает дядя — то это плохая фигня".

Да, люди, они такие, не то что роботы. :)

Ну как бы да, хорошо-плохо это субъективные оценки.

Гуглим например про суд Perfect 10 к гуглу. Вот эти фотографы решили в суде доказать что гугл не в их интересах работает

Просмотр людьми и использование в программном мега-продукте - разные юридические категории. Тем более, что мега-продукт нацелен на извлечения прибыли, а просмотр разрешен ради рекламы способностей фотографа.

Но человек тоже может быть нацелен на получение прибыли и для этого долго изучать фотографии других людей для приобретения опыта. Нужно ли штрафовать таких людей после начала продаж своих фото?

Тем более, что мега-продукт нацелен на извлечения прибыли, а просмотр разрешен ради рекламы способностей фотографа.

Не соглашусь.

После рождения фотограф вообще ничего не мог, не знал, не умел. У него не было способностей, не было знаний. Но во время своего развития в целях извлечения прибыли он много раз просматривал изображения других фотографов, которые размещали свои изображения для рекламы собственных способностей. Фотограф же вместо покупки услуг других фотографов - использовал их коммерческие изображения для обучения собственной нейронной сети с целью впоследствии самостоятельно оказывать коммерческие услуги. Он никому не заплатил денег за просмотр чужих работ, но когда кто-то другой стал просматривать его работы - начал требовать заплатить ему денег за факт просмотра.

Тут вполне имеет право на жизнь такая логика. Просто у "обычного человека" и у "огромной нейросети" отличается скорость мышления. То, на что обычный человек может потратить год - нейросеть может сделать за час, используя при этом в сотни тысяч раз больше ресурсов, чем доступно человеку.

Рутрекер, хотя бы, хранит метаданные (в виде torrent-файла). А тут вообще тупо ссылка.

Причём ссылка, созданная самим же автором.

А ссылка не метаданные?

Нет, это просто адрес. А по адресу может быть все что угодно.

это просто адрес. А по адресу может быть все что угодно.

Кстати, об NFT-токенах...

А причем тут они? Речь шла о ссылках. В них в общем случае никаких метаданных не содержится. Пока не перейдешь, не узнаешь, что там. Может вообще 404

Я и не говорил, что это принципиально невозможно. Я говорил, что обычная ссылка в общем случае метаданных не содержит. Вот вы мне ссылку привели. Пока я по ней не перейду, я не узнаю что там. Может html-документ, может картинка, может видео и пр.

Да, содержит. И параметры можно передавать какие угодно. И что? Я могу дать вам ссылку на несуществующий сервер/документ, но узнаете об этом вы только тогда, когда попробуете посетить этот адрес. Или параметров может быть целая куча, только вот сервер их никак не обрабатывает.

А причем тут они? Речь шла о ссылках.

А они тут и при том, что "NFT-токен" это не что иное, как ссылка (по которой лежит картинка, которую "продали"). И многие из этих ссылок уже протухли.

NFT-токен это НЕ ссылка. Это уникальный слепок (хэш+цифровая подпись) с некоторого объекта.
Может конечно содержать в себе как дополнение еще и ссылку на объект, и чаще всего даже содержат, но это только как частный случай. Один из нескольких возможных. Или может вместо ссылки содержать непосредственно САМ объект (а не ссылку на него) непосредственно внутри(составную часть) NFT-токена, как другой частный случай. Обычно когда объект небольшой по объему.
Или не содержать вообще ничего из этого, как NFT на объекты материального мира, на которые URL на поставишь в принципе.

Это же очевидно. Он не Яндекс :-)

Если приводить аналогию, то это (список, который нашел фотограф) - "список прочитанного материала". В самой нейронке и продукте не должно быть работ фотографа. Вообще. Даже ссылок. Есть полученный опыт (коэффициенты). Так что, я не думаю, что можно сгенерировать изображение оч.близкое к исходному даже если стараться. А вот сам список ссылок - лишь библиография. Их хранят для указания источника обучения. Это частое требование лицензий типа Creative Commons и тд, плюс часть научных требований (для возможности повторить эксперемент).

Как вы сами указали ниже, речь про обучение, а не использование самих фото. Тут, наверное, может быть нюанс с цитированием - если где-то захардкодили какие-то куски "исходных изображений" (такое бывает во всяких фильтрах - как подставные фотки луны в сматрфонах). В этом вопросе эксперт вы. Прочитав книгу и сделав реферат/рецензию, я не нарушаю авторские права, если его опубликовал и даже продал. Но если там есть большие куски исходной книги как цитаты, то может и прилететь. Однако ничего такого в статье и претензиях фотографа не указано.

Так что, я не думаю, что можно сгенерировать изображение оч.близкое к исходному даже если стараться.

Если стараться, то, увы, можно. Уже неоднократно показывали это.

Быстрый поиск дал примеры с "цитированием". То есть не точная копия, но много из "оригинала". Когда мы говорим об известных вещах, то это неудивительно. Попросите знакомого нарисовать "Черный квадрат" и, скорее всего, любой нарисует близко к оригиналу. Дать запрос "Мона Лиза в стиле Леонардо Да Винчи " и ожидать получить что-то совершенно другое, было бы странным. Однако фотограф не показал "копию" своих работ от нейронки и жалуется совсем на другое.

Здесь близкая аналогия - геральдика: по описанию можно восстановить геральдически верный герб, который не будет визуально похож на "оригинал", но тем не менее по такому гербу будет сразу понятно, чей он.

Мы же здесь, вроде как за второе слово из аббревиатуры "ИИ" выступаем, ведь так? Злые дяди бизнюки (Stable Diffusion) привели в детский садик (LAION) картинки изучать. Интеллектушка "посмотрел" по ссылкам, "поучился", взял да и "нарисовал" свои творения под впечатлением от "увиденного" и "запрошенного". Дяди бизнюки стали их продавать, а злые авторы исходных картинок хотят заставить Интеллекушку свои картинки "развидеть". Как-то так? Что-то здесь похожее на пасту из тюбика и фарш из мясорубки.

Как-то так? Что-то здесь похожее на пасту из тюбика и фарш из мясорубки.

Это с человеком такой фокус не пройдет. А решит суд, что настройки продукта, созданные с использованием конкретных картинок более использовать нельзя - придётся продукт настроить заново с нуля, но уже без упомянутых картинок.

UFO just landed and posted this here

Почему втихую? Совершенно в открытую выиграет компания Дисней и подобные ей по образу мыслей. Которые таким образом запретят рисовать руками и тренировать рисующие хоть что-то похожее на то, что в их интеллектуальной собственности есть. Т.е. приблизительно все.

А почему вы оцениваете ситуацию с точки зрения того, кто выиграет? Поскольку речь здесь о правовом вопросе, основной критерий - увеличивается или уменьшается соблюдение прав людей, которые вкладывают собственные усилия в творчество (фотографию или изобразительное искусство).

Позволю себе иллюстрацию. Например, в Испании есть закон, который ради "общественного блага" охраняет тех, кто без разрешения владельца вселяется в дома, где никто не живёт. Правда собственника при этом попираются, права халявщиков - охраняются. Мотивация при этом - тоже "а вам что, жалко" и "вы всё равно это жилье не используете". Впрочем, вопрос о том, на сколько демотивированы оказываются люди, желающие купить, например, курортную недвижимость (и принести местной экономике свои деньги), оказывается за бортом.

Потому что любые права — это не какие-то фундаментальные вещи, данные нам свыше, а результат общественных компромиссов. И хороши они ровно настолько, насколько работают на долгосрочные интересы всего общества в целом.
При этом запросто может сложиться ситуация, когда люди, ослеплённые сиюминутными выгодами, могут попросту не замечать, что дальнейшее следование тем же курсом в долгосрочной перспективе ведёт к проигрышу, который полностью перекрывает все эти краткосрочные выгоды.
Те же корпорации, если обязать их обучать нейронки только на лицензионно чистых датасетах, спокойно утрутся. Им не так уж сложно увеличить патентный отдел, чтоб собирать только картинки под свободными лицензиями, и купить со скидкой единомоментный доступ к нескольким крупным фотостокам.
Зато вот опенсорсные нейронки такая инициатива убьёт сразу, и придётся вам за нейронками ходить только и исключительно к крупным корпорациям на тех условиях, которые они вам выставят (как там например с доступом к ChatGPT из России? Всё ещё не очень?)

Вы делаете фундаментальную ошибку - идея о том, что права и свободы "даны свыше" (как в случае с концепцией god-given rights) или являются естественными и неотъемлемыми (в более современной интерпретации) - не просто существует, а является фундаментом для многих правовых систем.

В свою очередь, результатом общественных компромиссов являются законы, регламентирующие использование прав и свобод. И да, люди весьма часто поддерживают те или иные законы, не имея представления о том, какие же реальные последствия они принесут.

В ситуации с ML-системами, энтузиасты этой технологии очень любят апеллировать к неудержимости прогресса и прочим весьма расплывчатым категориям, забывая и игнорируя то, что они считают неважным (например, проблему эрозии права) и используя самую разную манипулятивную риторику для того, чтобы дискредитировать оппонентов (вместо опровержения их тезисов), выступающих всего-навсего за более трезвый взгляд, а не за "тотальные запреты".

Использование подобной риторики никогда не является признаком наличия надежных аргументов в пользу той или иной позиции, скорее - наоборот.

UFO just landed and posted this here

> авторы исходных картинок хотят заставить Интеллекушку свои картинки "развидеть".

не "Интеллектушку", а "детский садик".

Как раз к Интеллектушке у него претензий нет - то ли уже успешно подоил их, то ли боится.

Литрес напоминает, который прославился выпиливая с Гугло-маркета и Эппл-маркета все читалки, в которых не умели качать из его магазин или умели качать с любых других источников.

Вообще, проблема в этой ситуации сводится к тому, какова возможная трактовка термина "использование". Потому что создание продукта, "поведение" которого определяется его "настройками", полученными из изображений, вполне можно, при определенных условиях, трактовать как "использование". Потому что этот продукт оперирует не фактической информацией, а имеет своей целью имитацию художественной составляющей изображений.

а не использование самих фото.

Хорошо. Докажите, что без его фоток сеть работала бы также, как сейчас. Переобучите сеть на основе ссылок, но чтоб по ссылкам фото не было.

Какая сеть? У него претензии НЕ к какой-то нейросети и даже НЕ к разработчикам подобных нейросетей.
А к каталогу ссылок на им же собственноручно размещенные в открытом доступе фотографии.

А за что столько минусов?

Фотограф предъявил претензии к бесплатному каталогу ссылок. Это как Яндекс, только без поиска.

Нет, там как у нас в мозгу - вам показали фотографию, и у вас что-то в мозгу изменилось, нейроны перестроились. И дальше вы можете эти знания использовать в жизни. Но сказать что у вас в голове теперь лежит эта фотография - нельзя.

Очень даже можно, вот представьте, вы никогда не видели горы, вас просят нарисовать эти самые горы, что вы нарисуете? Правильно ничего, т.к. вы понятия не имеете, что же это за горы такие.

А теперь покажем вам подборку фотографий гор, после этого попросим опять нарисовать горы, и тут вы уже сможете нарисовать те самые горы, причем они очень сильно будут похожи на те горы, что вы видели на фотографиях.

Так все же лежат ли в голове те самые фотографии?

Вы нарисуете горы, но не сделаете копию той фотографии, которую вам показали. Это практически невозможно, а что-то "очень похожее" объектом авторского права не является. Так-то горы все друг на друга похожи, и даже больше: точка с красивым обзором, как правило, известна, и что-ж теперь, нельзя оттуда сфотографировать, потому что нечто похожее уже сфотографировали и загрузили в сеть?

Ну так и пусть эта нейросеть идёт и смотри эти горы сама. Зачем она смотрит на чьи-то фотки?

А чего это вы вдруг решили запрещать?

Речь идет о запрете, а о бесплатном использовании результатов труда человека для извлечения прибыли.
Это примерно как устроится волонтером в общественную организацию, а потом выяснить, что она никакая не общественная, а коммерческая и кто-то получает вполне себе осязаемый доход от вашей бесплатной работы.
Давно вы где-то работали бесплатно?

Он предъявлял претензии как раз к некоммерческой организации, никакой прибыли из этого не извлекающей — все что они делают предоставляется бесплатно всем желающим (живет организация на энтузиазме участников и добровольных пожертвованиях/донатах/грантах идущих на покрытие необходимых расходов типа аренды серверов).

We are a non-profit organization with members from all over the world, aiming to make large-scale machine learning models, datasets and related code available to the general public.
OUR BELIEF

We believe that machine learning research and its applications have the potential to have huge positive impacts on our world and therefore should be democratized.

OUR PRINCIPAL GOALS

Releasing open datasets, code and machine learning models. We want to teach the basics of large-scale ML research and data management. By making models, datasets and code reusable without the need to train from scratch all the time, we want to promote an efficient use of energy and computing ressources to face the challenges of climate change.
FUNDING

Funded by donations and public research grants, our aim is to open all cornerstone results from such an important field as large-scale machine learning to all interested communities.

laion.ai/about

Да не вопрос. Но смотреть она может только на JPG файлы, полученные через камеру и записанные на носитель, ибо это генеративная сеть, а не робот общего назначения, способный прийти самостоятельно к горам. Считайте что инвалид. Но таки да, авторы модели могут ей нафоткать сами и скормить.


Вот только давайте догда вы при выборе курорта или страны для переезда будете не чужие фото/видео/обзоры нужного места смотреть и читать, а сами поедете смотреть своими глазами. Ибо зачем вы на чьи-то фотки интересущего объекта смотрите для получения информации? Свои сделайте.

Принципиальная разница здесь в том, что в первом случае фотографии используются для извлечения прибыли на постоянной основе, а во втором - для личного разового использования.
Ну вот поставьте себя на место фотографа - вы потратили деньги на обучение, оборудование, вы придумали идею для съемок, подобрали место, поехали туда, понесли затраты, потратили время, сделали съемки. Вы не против поделиться с обществом, чтобы оно видело ту красоту, которую видели вы, но это ваш хлеб. Если кто-то хочет извлекать прибыль из этого или посредством этого - наверно нормально ожидать получить какую-то оплату за свои опыт, знания и время. Правда?

А представьте, что я посмотрел на его прекрасные фотки, почерпнул оттуда идеи для себя и сам теперь делаю подобные, отнимая у него хлеб. Мне роялти платить или фотоаппарат выкинуть? Тогда тот, кто придумал фотографировать человека в прыжке с подогнутыми ногами, был бы богаче Маска

Если нейросети что-то нарвится - пусть идет и фотографирует в том же стиле. Это ей никто не запрещает.
А если чуть более серьезно, то сама нейросеть ничего создавать не может. Она может мимикрировать под какую-то генерализованную версию изображений, которую ей скормили во время обучения. Иными словами она взяла 100 тысяч или миллионов существующих фотографий, как-то их усреднила и при последующей генерации использует какие-то паттерны из тех фотографий, которые она видела.
Здесь поднимается вопрос не про богатство как у Маска. А про то, что многие AI старта (тот же chat gpt) использует открытые источники, которые были открыты для личного использования.
Ну например, у вас есть земельный участок. Отстутвие забора дает право прохода через него.
Вас не было год, вы возращаетесь и видите, что из соседнего карьера проложили через него дорогу и каждый день десятками ездят грузовики. Почему через ваш участок? потому что другая дорогая будет на 3 км длиннее.
Пример не совсем из виртуальной (IT) сферы, но простота копирования и распростарения данных почему-то многими воспринимается что создание этой информации было бесплатным. Увы, нет

Вас не было год, вы возращаетесь и видите, что из соседнего карьера проложили через него дорогу и каждый день десятками ездят грузовики.

возможно это будет для вас сюрпризом, но
https://cyberleninka.ru/article/n/pravo-neobhodimoy-dorogi-cherez-sosedniy-uchastok-ogranichenie-prava-sobstvennosti-v-interesah-soseda-ili-servitut/viewer

Но есть нюанс:

- если кто-кто скупил всю землю вокруг карьера, принадлежащего другому лицу, то владелец карьера может получить сервитут на дорогу к своему карьеру.
- однако, если место для дороги осталось, просто кто-то хочет сэкономить 3км на строительстве оной - то это "уже другое".

Применительно к обучению нейросети опять же "несколько другая ситуация" - т.к. "обучение нейросети" является новым видом использования объектов авторского права и, соответственно, новый "конфликт интересов": одни хотят приравнять это к ранее существовавшим, другие хотят сказать, что "это уже другое".

Институт сервитута мне знаком. В моем примере он не применим. В нем идёт речь про получение дохода путем экономии за, по сути, чужой счёт.

Ровно то, о чем эта статья

Вы неверно понимаете, как работает нейронная сеть при генерации картинок. Она фигачит случайный шум, из которого детектор выбирает хоть что-то похожее на нужный объект. В ней больше собственного творчества, чем у большинства художников и темболее фотографов.

Именно поэтому бывают артифакты по три руки с 7 пальцами.

>В ней больше собственного творчества

Согласно вашему же описанию творчества - в результате работы нейросети ни капли творчества, а сугубо производство.

а описание творчества - это "то что сделано человеком"

или какие-то более формальные критерии ?

Да, более формальные. За ними можете пройти, например, на википедию - или на более тематические ресурсы. Как минимум, в эти критерии входит влияние художника на произведение, ЕМНИП. По описанию комментатора выше, результат работы нейронной сети - коллаж с развесовками, задаваемыми авторами сети. Собственного влияния сети на результат нет.

Описание творчества прямо задано в решении Верховного суда РФ, и вот каким образом:

Творческий характер создания произведения не зависит от того, создано произведение автором собственноручно или с использованием технических средств. Вместе с тем результаты, созданные с помощью технических средств в отсутствие творческого характера деятельности человека (например, фото- и видеосъемка работающей в автоматическом режиме камерой видеонаблюдения, применяемой для фиксации административных правонарушений), объектами авторского права не являются.

Как видите, если есть автор — значит, есть творчество. (Постановление Пленума Верховного Суда Российской Федерации от 23 апреля 2019 года.)

Я достаточно неплохо понимаю, как работают нейросети в целом, хотя с генеративными дела не имел. Но не думаю что там что-то принципиально другое.
Нейросети извлекают различные паттерны, которые, как я подозреваю, используются уже в процессе генерации. И без исходных изображения паттерны не могут быть получены. Если взять 100 тысяч чужих изображения и как-то их усреднить - можно ли утверждать что создали что-то новое? или все же каждый раз, когда вы обрабатывали каждую их этих 100 тысяч фотографий, преобразовывая ее в некую дельту и сохраняя эту дельту в своей модели, вы 100 тысяч (помноженное на количество эпох) раз нарушили право авторское право?

Ну и что, что понесли затраты? Это так не работает. После затрат надо еще результаты кому-то продать. А если вы выставили их бесплатно в сеть - то с кого вы, собственно, будете требовать деньги?

А если вы выставили их бесплатно в сеть - то с кого вы, собственно, будете требовать деньги?

С тех, кто их использует ;)

От того, что где-то что-то доступно бесплатно для просмотра - это еще не значит, что оно находится в общественном достоянии и т.о. с ним можно делать (почти) что угодно.

А вот можно ли использовать их для обучения нейросетей - вопрос достаточно новый и явно не урегулированный законодательно.

Нейросеть эти фотографии просто просмотрела и ничего с ними не делала.

Нейросеть - не человек, а потому с т.з. действующего законодательства сама использовать произведения не может в принципе, она не правосубъектна. Их использует лицо (физическое, то есть человек, или юридическое, за которым, впрочем, тоже скрывается человек), владеющее и/или пользующееся нейросетью.

Верно, что лицо, используя обученную нейросеть, не использует чужие произведения.

Но именно некое лицо использует произведения для обучения нейросети. И вот к этому использованию вопросы уже вполне уместны и одновременно не урегулированы ничем, кроме договоров.

Хорошо, попробую поставить. Итак, я посвятил значительную часть своей жизни обучению, чтобы написать этот комментарий, и я рад поделиться им с миром, чтобы передать часть своего опыта и позволить другим оценить всю красоту и мощь моего воображения. Однако, я хотел бы уточнить, можно ли ожидать от вас вознаграждения, соответствующего моим усилиям, которые я затратил на обучение и совершенствование своих навыков.

Я ничего не писал про авторские права, а только про хранится или нет)
Естественно производное произведение не является нарушением авторского права)

Вы нарисуете горы, но не сделаете копию той фотографии, которую вам показали. Это практически невозможно, а что-то "очень похожее" объектом авторского права не является.

Если я буду продавать майки с Микки-Маусом, то Дисней обвинит меня в нарушении авторских прав, даже если персонажа на майке я нарисую своей собственной рукой, и он не будет полностью совпадать ни с одним прежде существовавшим рисунком.

Хм. Допустим меня кто-то пропросил запомнить фразу "Мужик перемахнул через ограду". А через какое-то время, меня спросили - помню ли я фразу, и я сказал - Конечно! "Мужчина перепрыгнул через забор". Что хранится у меня в голове при этом? Можно ли сказать что у меня лежит оригинальное предложение?

Механизм памяти намного менее прямолинеен чем кажется. Когда вы что-то вспоминаете, ваш мозг не обращается к какому-то участку мозга и не проигрывает что там записано. Скорее когда вы пытаетесь что-то вспомнить ваш мозг очень приблизительно генерирует то, что могло произойти и скармливает вам и вы уверены что вы именно это и видели. И вот это воспроизведение зависит от кучи причин. От вашего текущего состояния - если вы счастливы сейчас, то вы можете вспоминать вещи в более позитивном ключе. И наоборот.

Или например вы можете быть свидетелем какого события (были на концерте роллинг стоунз), а потом просто узнать какой-то факт об этом событии (Королева Англии была на этом концерте) и ваш мозг может инкорпорировать этот факт в ваше воспоминание (Я был на концерте роллингов и видел там Королеву Англии!)

Более того - сам факт вот этой вот генерации, работает как learning reinforcement . Т.е. если вы были свидетелем какого-то события, но какие-то детали вы не помните, ( был он в красной или желтой рубашке? Хмм, не помню. Вроде в красной.) И вот если вас попросить рассказать об этом раз, другой, третий - через какое-то время вы будете точно помнить что он был в красной рубашке и даже смутно помнить узор.

Собственно мой посыл в том что если я прожил всю жизнь в тундре и не видел гор, и вы мне покажете фото Фудзиямы, я могу быть уверен что я прекрасно ее запомнил. А в реальности мой мозг может помнить только - "Штука похожая на юрту"

Скорее когда вы пытаетесь что-то вспомнить ваш мозг очень приблизительно генерирует то, что могло произойти и скармливает вам и вы уверены что вы именно это и видели

Всё уже украдено до Вас.

Тут отдельный вопрос - а почему я должен смотреть именно вашу подборку фотографий гор? Вы сами не хотите заплатить за это эксклюзивное право показывать именно ваши фотографии?

Я ведь просто хотел посмотреть фотографии гор. Без каких-то ограничений. Если это не просто фото, а какая-то услуга с ограничениями - наверное, нужно сначала получить согласие клиента на получение этой услуги. Иначе просто все, кто увидел этот коммент, заплатите мне деньги за его просмотр. И отдельно, гугл за то, что закешировал его.
В данном случае, имхо, применимы общественные лицензии, вроде gpl. Если фотографии были выпущены под этими лицензиями - это одно. Если автор хочет постфактум получить бабло за то, что его фото кто-то использовал - имхо, нужно было заранее накладывть ограничение на использование этого фото.

В данном случае, речь не только о получении информации о том, как горы выглядят вообще, а ещё и об имитации художественной манеры (сразу множества) фотографов или художников, для чего продукт и настраивался (обучался) на реальных изображениях.

Это как различные варианты написания кода, когда вы прочли множество статей на хабре, а потом пишите за деньги уже код со своим стилем и идеями, но безусловно базируетесь на полученных ранее данных из открытых источников. Надо бы вам всему сообществу хабра денег заплатить и побольше.

Это плохая аналогия, потому что, во-первых, стиль написания кода выявить - сложнее, чем в визуальном искусстве. Во-вторых, в программировании важен функционал кода, а не имитация чьей-то манеры. В-третьих, алгоритмы вполне поддаются патентованию. В-четвертых, нейросеть - не человек, это продукт с настройками.

В который раз повторюсь, что аналогии ничего не доказывают, а даже для иллюстрации их следует хоть пытаться сделать корректными.

о-вторых, в программировании важен функционал кода, а не имитация чьей-то манеры.

Именно по-этому наверно вместо нечитаемого (но обладающего нужным функционалом) спагетти-кода примудано ООП, паттерны проектирования и прочие веселые шаблоны, по сути являющиеся иммитацией конкретного стиля, кем-то когда-то придумаенного.


стиль написания кода выявить — сложнее, чем в визуальном искусстве.

Ничуть. Лингивстический анализ для текстовой информации имеется, и характерные для человека вещи выявить может и в коде.


В-четвертых, нейросеть — не человек, это продукт с настройками.

Мозг человека — нейросеть с настройками. Модели нейросети — не продукт с настройками. Есть алгоритм их обучения и их применения — это код, с настройками. Но сами модели — черный ящик, и что творится внутри него понятно весьма смутно (хоть и понятнее мозга, ибо тут хотя бы архитектуру мы сами проектируем)

То, что слово "стиль" применяется и к художественным произведениям, и к программированию, не делает эти два понятия одним и тем же. Художественный стиль в написании кода отсутствует, кроме отдельных весьма специфических ситуаций. Вы же притягиваете снова аналогию за уши.

Мозг человека может быть сколько угодно нейросетью с настройками, только в существующей правовой системе человек и продукт занимают очень разные позиции. Если вам нравится считать, что между ними нет разницы - вам никто не запрещает, но поскольку есть множество ситуаций, где закон обращается с человеком и продуктом по-разному (например, у человека есть права, а у продукта - нет), вам придется с этим мириться.

Так в данном случае закон-то как раз не на стороне фотографа… Вот только его защитники апеллируют как раз не к закону, а к морали и справедливости, пытаясь доказать, что вынесенное законным судом решение несправедливо и должно быть пересмотрено.

в существующей правовой системе человек и продукт занимают очень разные позиции.

Fine. Веса нейронной сети — продукт. Вот только этот продукт — это не живое создание, тут нет свободы воли. Веса сами ничего не плагиатят, не генерируют и не рисуют. И авторы весов тоже.
И даже нейросеть (код, ПО), для которой эти веса лишь составной компонент, тоже ничего не генерирует, не ресует и не нарушает.


Генерируют люди. Сеть лишь инструмент. Как люди (якобы) делают плагиат чужих работ с использованием иснтрумента "Stable Diffusion", так могут делать и с помощью инструмента "Photoshop" и даже с помощью связки инструментов "Windows" + "Chrome".


Вы конечно можете сказать что авторы SD что-то нарушают когда позволяют модели смотреть на картинки (выложенные для свободного простмотра без органичений по чисто белковым формам интеллекта)…
НО! Вот вам вопрос. Если на картинку буду смотреть я (человек), а потом под впечатлением от картинки менять руками веса в модели (модель картинку не будет видеть — я введу коэффициенты исключительно руководствуясь своими белковыми впечатлениями от просмотра) — будет ли нарушение? Я ж просто посмотрел и "вдохновился", а потом пошел творить что-то новое, как и другие художники. А если вместо меня это сделает 1.5 млрд китайцев и столько же индусов (ну чтобы скорость правки коэффициентов в весах осмысленной сделать немного) — будут ли нарушения? И какие, если это просто живые люди пришли смотреть на картинку, выложенную для живых людей, а потом на основе собственного жизненного опыта коэффициенты весов правят?


P.S. А ведь такой проект даже был, где у GAN'а в качестве дискриминатора выступали люди и онлайн меню оценки прикручено было. И вполне ничего так NSFW пиксельарт-дама вырисовывалась...

Я ведь просто хотел посмотреть фотографии гор. 

Так смотрите. Никто вам это не запрещает. Но ваша нейросеть - просто инструмент для зарабатывания бабок. Не наделяйте её человеческим. Не наделяйте её человеческими правами. Бабки просто отдайте за использование чужого "труда".

Никого это сейчас не интересует и ящик пандоры открыт. Но я не соглашусь с Вашей позиции. Представим есть дизайнер, он посмотрел однажды, мельком Ваши и не только фотографии гор в интернете на пиратском сайте, и в для очередного заказчика нарисовал горы. Интересен юридический момент, не уверен что были похожие прецеденты.

Но ваша нейросеть — просто инструмент для зарабатывания бабок.
Бабки просто отдайте за использование чужого "труда".

Коммерческий художник, обучившийся на трудах и работах других художников и фотографов — просто инструмент для зарабатывания бабок. Пусть тоже отдаст бабки всем, чьими работами он вдохновлялся при обучении, чьи работы использовал как референсы, на чьих персонажей фан-арты на патреоне рисовал и т.д и т.п. Ибо этого художника от нейронки радикально отличает только белковый носитель вместо кремниевого.


Разрешить рисовать только слепым или запертым в одиночной камере с рождения и чужих работ точно не видевшим. Чтобы точно на чужом не обучались и чужой труд в своих работах не использовали.

Автор это ограничение накладывает сейчас. Просит перестать показывать фотки следующим клиентам. А ему в ответ - мы будем показывать ваши фотки кому хотим, ведь вы их выложили в интернет. Наверное, кроме согласия клиента на представление услуги, нужно ещё и согласие автора взять, как вы считаете?

Его фотки нейронка ни кому не показывает. Агригатор ссылок, только адрес бесплатно раздаёт, где можно посмотреть на общедоступные фотографии.

Кто что в какой момент нарушил?

Клиент - это компания, которая обучает нейросеть. Автор не хочет, что бы обучающие нейросеть использовали его фотографии. По-моему, простое требование. В ответ ему говорят - хотим и используем, а кто что нарушил?

Кто конкретно и в какой момент нарушил, пусть решает суд. Может вообще через когда-нибудь отменят копирайт, что бы любые фотки мог использовать кто угодно. Пострадают авторы, правда, зато разбираться легко.

Но само его требование понятно - не используйте мои фотки для нейросетей. Не прикрывайтесь "а я только то, а это не я, а он" и т.п. Просто не используйте, т.к. они мои. По-моему, требование простое и понятное.

Ну, так фотограф решил провернуть фарш назад, внезапно спохватился запрещать.

Почему вы так решили? Вы думаете, если я выложил фото, это автоматически даёт пожизненное разрешение всем его использовать, которое нельзя отозвать?

Обратите внимание, он не просил "разучить нейросети". Он просил убрать из обучающего набора. То есть попросил не использовать в будущем (!). Пользуясь вашей аналогией, он попросил перестать делать фарш.

А её в обучающем наборе никто не держит. Нейронка сходила по адресу, посмотрела и дальше пошла, даже к себе не сохранила.

А фотограф претензии вообще к каталогу ссылок выдвинул.

И что откуда удалять? Из каталога ссылок?

Нейронка не "ходит по адресу". Я понимаю, что вы крайне далеки от обучения сетей, но если кратко, обучающий набор всегда лежит локально.

Но даже если вообразить ваш невозможный вариант, что за каждой картинкой обучающий код идёт по http/https, то в чем непонятность требования не ходить за его картинками? Ладно бы вы сказали "меня не волнует, хочу и использую, мне всё равно, кто рисовал эти картинки". Но нет, вы упираете на то, что после использования их не сохраняют. Но это, по большому счету, не так важно. Просьба была именно не использовать.

И что откуда удалять? Из каталога ссылок?

Этот каталог нередактируемый, что ли? Из него удалить нельзя? В чем суть вашего вопроса?

Просьба пришла после использования и удаления.

Это как с персональными данными, их можно обрабатывать, а хранить очень жёсткие требования. И требовать удалить результаты обработки не получится.

Просьба пришла после использования

Это было последнее использование? Больше использовать никогда не будут? Тогда вы правы, автор картинок опоздал.

Либо, более вероятно, вы зациклились на прошлом, а просят не использовать в будущем. И вы отказываетесь это принимать.

Про каталог, существует некоммерческий каталог общедоступных ссылок, с чего вдруг владелец каталога должен что-то оттуда удалять? Что он нарушил?

то в чем непонятность требования не ходить за его картинками?

В том что он требует "не ходить" не у Stability.AI/OpenAI/Google которые ходят и смотрят, а у каталога ссылок, который никуда ни за чем не ходит и ничего не учит.

Возможный вариант — непонятность в том, что собственно где запрос пароля (или вообще 403 сразу) при обращении по этому адресу? Судя по описанию LAION'а — это сразу решит проблему (не решит с уже скачанным да — но это не требует)

Нет, не лежат. Я посмотрел 800 снимков гор, начал рисовать. Какой из снимков я повторяю? Я рисую свои.
Аналогично - я переписываю книгу когда пишу сочинение, если в тексте сочинения попадаются такие же буквы как в книге? Именно не диктант, пересказ или изложение, а сочинение.
Пользуясь Вашей логикой можно обвинить Толстого в плагиате Аксакова, а что слова одинаковые, буквы тоже.

Горы - слишком распространены. А вот представим себе что-то более специфичное, Красную Площадь, например, с Храмом Васи́лия Блаже́нного, уже такого в датасете будет не очень много и по такому же специфичному промпту, будут выдавать компиляции из этого небольшого числа снимков - больше данные взять просто неоткуда. Но можно предположить, что фото для датасета взяты из Википедии, куда отдают с соответствующей лицензией снимки. Но данный фотограф, я так понял, не давал такого права. А ещё интереснее что думают люди, чьи лица оказались в датасете и потом по узкоспецифичным запросам могу появляться возможно в достаточно узнаваемом виде (из-за ограниченного числа снимков в датасете по такому запрсоу) где угодно, включая порно. Я замечал, что по узким запросам выдаются достаточно похожие лица. Вполне возможно, что они похожи именно на оригинал из датасета.

Или вот ещё пример специфичного контента - песчаный червь из "Дюны" по запросам "Shai Hulud" или "sandworm". В ограниченном срезе датасета видно, что таких изображений совсем немного и они ещё и повторяются многократно. Художника определить очень легко. Если они не давали согласия на использование изображений для обучения нейросетей, то их возмущение можно понять. Кто-то будет зарабатывать деньги на их работах по сути.

Или вот ещё пример специфичного контента — песчаный червь из «Дюны» по запросам «Shai Hulud» или «sandworm». В ограниченном срезе датасета видно, что таких изображений совсем немного и они ещё и повторяются многократно. Художника определить очень легко. Если они не давали согласия на использование изображений для обучения нейросетей, то их возмущение можно понять. Кто-то будет зарабатывать деньги на их работах по сути.
Плохой пример. Планету Земля тоже особо оригинально не нарисуешь. Что теперь, все должны денег первому нарисовавшему?
Это как широко известная в узких кругах жалоба художников на то, что по запросу «bloodborne» неиросеть рисует мужика с двумя топорами, вид сзади.
НУ ТАК ПОТОМУ ЧТО ВЫ САМИ ЭТО БЕЗ КОНЦА И РИСУЕТЕ!

При чём тут Земля? Для неё полно спутниковых фото и разных изображений. Изображение выдуманных существ является творческим продуктом автора и его использование в коммерческих целях без согласия автора явно нарушает законодательство.

А при чем здесь спутниковые фото? Мы же про рисунки. Вроде.
Изображение выдуманных существ является творческим продуктом автора
Некоторые вещи нельзя изобразить не-стандартно. Ну то есть да, червя можно превратить в гусеницу, и лишить зубов, но резонный вопрос: а при чем тут Shai Hulud?
Изображение выдуманных существ является творческим продуктом автора

Запретить всех кто рисует фан-арт. И даже тех кто рисует исключительно по текстовому описанию — ведь сущетсво то принадлежит автору. А художники с фан-артом на этом зарабатывают популярность и внимание публики, которое затем монетизируют. Недопустимо!

Продажа фанарта - нелегальна!

Потому и нейросети не должны брать деньги.

Согласен. Однако SD открыта и бесплатна, MJ формально продает гпу-часы железа (но учитывая недоступность модели - можно считать что продает всё же нейронку) и лишь ClosedAI максимально коммерческой была с самого начала и в явном виде продает конкретно генерации, но почему-то к ним претензий было меньше всего :)

UFO just landed and posted this here

"Фотограф" сделал кадр и опубликовал его. Некто "Программист" официально получил к этому кадру доступ (купил, или в виде превью или как-то ещё - не так важно, важно что ничего не нарушая) и вычислил из его содержимого, например, хэш-сумму, далее используя это число по своему усмотрению. Как мне кажется, тут "программист" ничего не должен "фотографу".

Аналогия не совсем корректная, но очень близкая по духу алгоритмам настройки нейросетей.

Вот именно. Технически Stable Diffusion — это всего лишь мощный фильтр-шумоподавитель. Суть идеи в том, что исходные изображения зашумляются в несколько этапов:
image
после чего идёт подбор коэффициентов громадного фильтра так, чтобы он каждый раз снижал зашумление на одну ступеньку (давил часть шума).
Тогда, скормив такому настроенному фильтру чистый гауссов шум вместо картинки, примерно за 50 итераций шумоподавления на выходе внезапно получаем рандомную картинку — это собственно и есть процесс генерации.
Причём процесс настройки такого супер-фильтра напоминает детскую игру "горячо-холодно": меняем коэффициенты и смотрим, стал результат лучше или хуже. Если лучше — меняем ещё дальше в ту же сторону. Хуже — пробуем менять по-другому. Настройка идёт автоматически с огромной скоростью (триллионы итераций).

Ну так технически JPG-файл - тоже набор математических операций над исходным растром - дискретное фурье-преобразование, амплитуды там, вот-это-все. Однако авторское право на них вполне себе распространяется. Тут вопрос реально к регулятору - где и как в общем случае провести границу fair usage-a.

На мой вкус критерий прост - если можно каким-то промптом заставить нейросеть выдать картинку, неотличимую от оригинала для большинства людей-зрителей - значит копирайтненько. Если нельзя - ну сорян, непрокатило.

Так эти преобразованные файлы в нейронку не включаются ни в каком виде — они используются только для её настройки.
Если вы возьмёте с полсотни фотографий и откалибруете по ним ваш монитор, чтобы на нём картинки отображались с наилучшей цветопередачей, разве вы должны после этого платить каждому автору каждой фотографии? Даже если потом продаёте этот калибровочный профиль.

Эхем, нейроны сетки, если ее обучить неправильно - ну, например, кормить только одной картинкой сами по себе не будут отображать картинку. Но и нарисовать кроме нее ничего не смогут. И да, если в копирайт вообще верить - это таки его нарушение. IMHO, конечно. И если вам показывать с детства одну и ту же картинку, и вы ее по памяти один-в-один воспроизведете - это таки опять же нарушение, если судить по, скажем так, духу законодательства об авторском праве, с буквой могут быть разночтения и чудеса в разных юрисдикциях.

Так что (imho, опять же) - или крестик или трусы - если признавать авторское право в принципе - где-то проводить границу надо. И граница вида "применил какую-то математику - значит уже не копирайт" - сомнительна. В отличие от границы вида "применил необратимую математику", которая таки кажется разумной.

Или, как вариант, можно вообще отказаться от авторского права как концепции и не забивать этим всем себе голову вовсе.

Эхем, нейроны сетки, если ее обучить неправильно — ну, например, кормить только одной картинкой сами по себе не будут отображать картинку. Но и нарисовать кроме нее ничего не смогут.

На самом деле не совсем так — современные GAN'ы, обученные с нуля на одной-единственной картинке, очень даже неплохо её творчески переосмысливают (хотя, понятно, придумать какие-то совершенно новые объекты, отсутствующие в оригинале, не могут).


Пример

Если вас каким-то промтом под дулом пистолета можно заставить нарисовать картинку, похожую на копирайтную. То всё, копирайтенько? 🙂

Если на Photoshop подать нужное последовательность данных, то он может выдать картинку неотличимую от копирайтной. Например файл загрузить

Под дулом пистолета - это другой кодекс, уголовный - по нему ответит тот кто с пистолетом :)

Даже без дула пистолета если вы только из промта руками восстановите изображение (сделаете копию картины или игры), копирайт не будет работать. Clean-room design эта идея обычно называется. Проблема в том, что нужно сохранить убедительные доказательства для суда, и что в случае нейронок этими доказательствами будут алгоритмы и веса, которые никакому суду показывать никто точно не собирается.

P.S. Если в фотошопе рисовать копирайтными цветами, он их [заменит на чёрный]
(https://hardwaresfera.com/en/noticias/software/colores-pantone-photoshop/).

если можно каким-то промптом

Вы напишете программу, которая берёт файл, удаляет из него каждый второй байт и сохраняет оставшееся в новый файл. Я беру чужую картинку в JPG, удваиваю каждый байт и сохраняю в файл. Открываться он не будет. Мы берём этот файл, скармливаем в вашу программу, получаем на выходе чужую картинку! Получается, ваша программа нарушает права?

В случае нейросети, алгоритм гораздо сложнее, чем удалять каждый второй байт - но суть не меняется.

Нет. Нейросеть вообще никак не обрабатывает и не запоминает изображения, они служат для её настройки.

это всего лишь мощный фильтр-шумоподавитель

Напомнило

— Как вы делаете корабли в бутылках?
— Берём бутылку. Насыпаем в неё щепки, опилки, нитки, наливаем клей и трясём. Обычно получается всякая фигня, но иногда — корабли.

Получается,что я увидев фото среди гугл картинок и позже воспроизведя часть своих воспоминаний в цифровом формате с фото, должен роялти некому фотографу, за то что увидел фото?

Вам привет от композиторов-песенников. Выкатывают друг другу иски за три ноты. На эту тему игра есть "угадай мелодию".

Да, сам недавно на подобную новость натыкался и был немного удивлен, поскольку песни совсем, как по мне, непохожи.

У тысяч бездарностей внезапно появился сильный конкурент и они теперь стараются его задавить любой ценой, натягивая копирастные законы на Глобус и бесятся от бессилия 😁

Я так понимаю автор - палка палка огуречик уже вытирает слезы хрустящими купюрами?

А если вы ещё и деньги получайте за свое творчество, то вы должны заплатить каждому в мире автору любого материала с которым когда либо ознакомились. Забавная логика тут у многих )

обучение это получение коэффициентов, вытащить их из миллиардов цифр эти миллиардные доли процентов - задача скорее невозможная чем возможная.

Если я возьму чужую фотографию, помещу её в редактор и велю сжать до размера 2*2 пикселя, я получу 4 квадратика забавных цветов. Вопрос: сколько прав автор оригинальной фотографии имеет на эти 4 квадратика?

Это будет производной работой, нужно получить согласие правообладателя. Если бы цвета этих квадратиков вы бы придумали сами, без обработки исходной чужой фотографии, то это было бы полностью вашими квадратиками - даже если цвета случайно полностью совпадут.

В таком случае подавляющее большинство современных художников является злостными нарушителями авторских прав. Потому что они вовсю пользуются рефами, а то и "пипеткой" орудуют, нагло извлекая десяток-другой пикселей рефа, чтобы добавить их цвета в составляемую палитру.

UFO just landed and posted this here

Очевидно, что если появится человек мастер-плагиатор, которому достаточно посмотреть на фотографии, чтобы делать подобное - то такому мастеру не будут показывать фотографии. А задним числом будут обижаться на того, кто таки показал мастеру фото.

ВСЕ люди без исключения именно так и обучаются. Повторять части известных работ - это вообще часть обучающего процесса во многих художественных школах.

Да, но продавать подобные повторения равно как и выдавать их за свои работы запрещено, это плагиат.

А 2*2 = 4.
Только какое отношение это имеет к данному обсуждению?
Сеть обвиняют не в том, что она выдает чужие картинки за свои. Её обвиняют в том, что она учится рисовать на чужих картинках.

Сеть обвиняют именно в том что она может повторять части известных работ в своих произведениях. Вы верно заметили что это нормально для обучения, я возразил что использовать то что получилось от своего имени нельзя.

В более широком контексте большинство художников конечно так или иначе опираются на работы предшественников. Но они так же вкладывают в творчество что-то свое. Если мы убираем этот "самостоятельный" компонент то получаем художника который копирует картину известного художника сидя перед ней и стараясь убрать все отличия или фотографа который фотографирует картину и объявляет полученное фото уже своим собственным. Оба варианта как нетрудно заметить порицаются а второй просто запрещен. Я считаю вполне оправданным проведение параллелей между созданием "своей фотографии" и "картины нарисованной нейросетью": в обоих случаях использование технического приспособления сводит свой собственный вклад в создание произведения к минимуму.

Ну так вы просто не понимаете как работают нейросети. Также как и те, кто эти иски подает.

Прекрасно понимаю, а вам бы не мешало свои утверждения аргументировать. Не так давно было исследование на котором нейросетку сумели заставить воспроизвести практически дословно ряд изображений использовавшихся при обучении. Разумеется обычно это не так заметно, но принцип работы нейросети состоит именно в запоминании и усреднении фрагментов изображений. Хотя в получившейся "смеси" исходные данные для человека уже неразличимы, они там все равно есть.

Человеческого художника при известном желании можно заставить так же практически воспроизвести те изображения, на которых он обучался. Тут вопрос про 'вкладывают в творчество что-то свое'. Ну пускай у сетки не творчество, это без разницы. Но вкладывает она таки порядком много. Особенно если используемый генератор случайных чисел - аппаратный и не предсказуемый.

Тут по сути вопрос чем считать нейросеть - автором или изощренным техническим приспособлением. Если приравнять сетку к авторам то да, аргументы про обучение имеют смысл. Но на мой взгляд нейросетка это все-таки техническое приспособление. Сенсор в фотоаппарате тоже много шума в изображение фотографируемой картины вносит но сути происходящего это не меняет.

Сеть обвиняют именно в том что она может повторять части известных работ в своих произведениях.

Может — не значит делает. Иначе будет как анекдоте про "за изнасилование тоже сажайте — ведь аппарато то имеется".


Человек, насмотревшись чужих работ — тоже может повторять их части в своих произведениях. Будем штрафовать и осуждать его за принципиальную возможность?


Более того — сама модель ничего этого не может, она не живая. Могут люди, если умышленно захотят сделать плагиат. И вот тех, кто с помощью SD/MJ/Dalle воспроизводит чужие работы, и надо осуждать. А не ПО, через которое они это делают. Иначе тогда и Adobe надо судить за то, что они не блокируют возможность рисовать другими людьми плагат через ФШ. Пусть остлеживают и заменяют такие картины на черный квадрат при сохраненнии.


Но они так же вкладывают в творчество что-то свое. Если мы убираем этот "самостоятельный" компонент то получаем художника который копирует картину известного художника сидя перед ней и стараясь убрать все отличия

Я вам готов дать денег, если вы возьмете любую ванильную модель SD, опишите ей любую из имеющихся в обучающей выборке картин и сможете через генерацию добиться результата, который любым актуальным софтом для поиска дубликатов среди картинок покажет хотя бы 90% сходство (99% даже не прошу). В лучшем случае вы получите схожую цветовую палитру, подобие мазков и частично идею/атмосферу композиции. Т.е подобие стиля. Но кокретно сам желаемый объект или композиция будут отличаться от любой из имеющихся работ. Ибо нейросеть таки тоже вносит своё (и не только артефакты). Более того — у разных сеток это "своё" разное, так что Dall-e вы не спутаете с MJ, а MJ до v5 практически не реально было спутать с SD (да и вообще с чем либо — она сразу палилась).


У меня инстаграмм с артами, которые на ~40% руками доделаны/перерисованы после SD. И знали бы вы какая боль заставить её генерировать персонажей так, чтобы в первые 2 секунды взгляда не становилось ясно что это SD по позе/ракурсу/положению в кадре/свету и еще 5-7 признакам однозначно показывающим что это именно SD. Даже с LoRA'ми, призванными мимикрировать под конкретных художников и стили.

Я вам готов дать денег, если вы возьмете любую ванильную модель SD, опишите ей любую из имеющихся в обучающей выборке картин и сможете через генерацию добиться результата, который любым актуальным софтом для поиска дубликатов среди картинок покажет хотя бы 90% сходство (99% даже не прошу)

Не надо мне давать денег. Такой эксперимент успешно провели без меня:
https://arstechnica.com/information-technology/2023/02/researchers-extract-training-images-from-stable-diffusion-but-its-difficult/
Все 99% совпадения там где обучающая выборка по каким-то причинам была относительно куцей. Разумеется как правило модель вполне успешно смешает множество изображений так что индивидуальные исходники уже не будут различимы, но это все равно будет смешивание запомненных фрагментов исходников.


Более того — сама модель ничего этого не может, она не живая. Могут люди, если умышленно захотят сделать плагиат. И вот тех, кто с помощью SD/MJ/Dalle воспроизводит чужие работы, и надо осуждать.

Согласен что нарушителем является тот кто использует сеть. Но те кто дает им в руки инструмент на мой взгляд тоже не правы. Легко провести аналогию с "кряками" для программ: нарушителем является тот кто использует кряк, но и создатель кряков тоже неправ, особенно когда он создает это вопреки воле автора исходной программы.


Человек, насмотревшись чужих работ — тоже может повторять их части в своих произведениях. Будем штрафовать и осуждать его за принципиальную возможность?

Я уже писал в комментариях: на мой взгляд определяющим является то сколько человек вносит "своего" в творчество. Одно дело человек насмотревшийся чужих работ, другое — человек который перерисовывает к себе чужую картину, третье — человек который фотографирует чужую картину. Объем собственного вклада падает от первого примера к третьему и вместе с этим падает допустимость подобного использования чужой работы. Там где "вклад" сводится к вводу пары слов промта я вижу явное сходство с фотографированием картины. Пусть даже картин в данном случае сотни а фотоаппарат их тщательно перемешивает.

UFO just landed and posted this here

То что нейросетка комбинирующая копирайтные изображения сама не нарушает копирайт - это ваше оценочное суждение. Не надо его выдавать за непреложную истину и писать исходя из нее комментарии с упоминанием говна.

UFO just landed and posted this here

Ну если копирайтные картинки не критичны для обучения сетки ибо там те же самые пиксели что и в не копирайтных, то нафига обучать сетку на копирайтных изображениях в которых с вашей точки зрения нет ничего что заслуживало бы заимствования? Обучайте ее на своих собственных и будет вам счастье и полное отсутствие претензий от авторов. Пиксели-то везде одни и те же. А если вам своих пикселей для обучения не хватает и нужно больше то я вам генератор шума могу подкинуть, там данных не на один десяток StableDiffusion насоздавать можно.

UFO just landed and posted this here

Если на шуме можно обучить только воспроизведению шума, то на копирайтных картинках можно обучить только использованию копирайтных картинок. Идея-то простая: если в копирайтных картинках нет ничего особенного, то просто не используете их. Если же вам для хороших результатов непременно нужны копирайтные картинки, то наверное в них что-то критически ценное есть.

Мой взгляд на проблему этичности генеративного ИИ следующий: бесплатные и свободно доступные генераторы картинок могут обучаться на любых общедоступных данных, но использовать создаваемые ими картинки в коммерческих целях нельзя. Полная свобода, бро. Никакого копирайта ни на сетки, ни на произведения созданные с их участием, сплошной копилефт. А вот если вы хотите использовать ИИ-картинки в коммерческой деятельности и распространять их в составе любого произведения не попадающего под открытую и свободную лицензию, то извините. Придется брать только сетки обученные на датасете явно разрешающем такое использование, благо что та же Adobe такие решения предлагает.

UFO just landed and posted this here

Чем отличается копирайтная картинка от некопирайтной? Ответ- наличием копирайта. 

Ответ - она отличается качеством. Большинство качественных картинок закопирайчены, а при обучении на хламе красивых картинок не получится. Повторюсь: если в копирайтных картинках ничего интересного нет, то просто не надо их использовать.

Только объём, число. 

Я уже приводил контрпример с генератором шума который способен выдать любой желаемый объем и число. И его тривиально обобщить. Например берем видеокамеру и начинаем непрерывно вести съемку. Объем генерируемых данных - сотни тысяч изображений в день и эти изображения не являются шумом.

И ничего плохого в этом не вижу.

Прекрасно что мы сошлись на этом. Обученные на произвольных данных модели не могут использоваться в коммерции, коммерческая генерация изображений требует датасета с изображениями которые было прямо разрешено использовать для обучения нейронки.

UFO just landed and posted this here
Качество связано с копирайтом примерно как формат изображения (jpg, png). То есть никак.

Создание хороших изображений требует усилий и денег. Вернуть затраты обратно без копирайта нельзя. Отсюда весьма заметная корреляция между качеством изображения и наличием копирайта.


Очевидно, нужно разнообразие

Вы хотите сказать что у опенсорса который вы же и защищаете никакого разнообразия нет? Ну даю тогда такую идею: попросите сотню тысяч добровольцев записать миллион рандомных видео. Добровольцев в этом деле хватает. Да и для бизнеса задача не сказать что неподъемная — гугл вон больше 200 млрд изображений по всему миру собрал в Street View.


А коммерция умрёт (или сильно изменится) с развитием нейросетей, когда каждый у себя дома сможет создавать фильмы с любимыми актёрами и заданным сюжетом.

Да, я уже заметил как коммерческие книги умерли с появлением возможности писать свои собственные книги с каким хочешь сюжетом и персонажами :)


И будет проигрывать в качестве бесплатным.

Может да а может нет. Я замечал что наличие денег нередко позволяет создавать значительно более качественные проекты чем опенсорсный энтузиазм при всем уважении к последнему.

UFO just landed and posted this here

Вы так пишите, как будто изображения создаются исключительно для заработка.

Конечно не только. Но корреляция, повторюсь, весьма заметна

Любое ограничение выборки даст ухудшение итоговой модели.

С тем что исключение копирайтных картинок ухудшит результаты сетки я-то как раз не спорю. Это вы уверяете меня что и без копирайта все отлично получится :)

Не вижу смысла что-то там ограничивать.

А я вижу необходимость защиты прав людей на труде которых строится все эта красота.

Я не понимаю почему вы так яростно защищаете копирайт?

Потому что я считаю что труд должен быть оплачен и ненавижу халявщиков. Все очень просто.

Туда же картины, графика, мультфильмы, аниме.

Пожалуйста. Берите опенсорсные картины, графику, мультфильмы, аниме. Как вы там говорили? Качество контента никак не связано с его ценой? Значит и проблем быть не должно.

А где она появилась то? 

Книги можно было писать и без GPT :)

специализированные сайты для написания фанфиков требуют всё таки вложить труд

Ах вот оно в чем дело. Не в желании создавать свое кино и творчество, а в нежелании вкладывать в это дело свой труд или оплачивать труд других :). Отдельно доставляет то что вы считаете что людям будет интересно смотреть фильмы по ими же придуманным сюжетам или то что придумать сюжет - это просто :). Хотя по последнему примеру сюжет кажется в вашем мире тоже нейросеть должна придумывать :).

UFO just landed and posted this here
Чаво? Я утверждаю, что если взять, и послать копирайтеров прямо сейчас, то нейросеть получится лучше

Но правомочность посылания копирайтеров-то вы как-то оправдываете? Мне казалось что ваша идея звучала как "копирайтные картинки ничем не отличаются от некопирайтных". Я возразил что тогда ничего не мешает обучить сеть на некопирайтных изображениях. А сейчас у вас прям шариковский аргумент зазвучал, "чего там думать — надо отнять да поделить".


Давайте тогда защищать право телефонисток и уничтожим АТС.

АТС можно построить без телефонисток. Нейросеть обучить без авторов контента нельзя.


Я говорил про количество. Много раз.

И мне кажется я наглядно показал что количество без качества не значит ничего. Вам нужно не "много каких-то изображений". Вам нужно "много качественных и разнообразных изображений". А это именно та задача, для решения которой в настоящий момент человечеством используется копирайт. И вы крутитесь туда-сюда пытаясь это замаскировать.


Так он в любом случае не будет оплачен.

Прекрасно будет. Зачем изобретать велосипед? Автор выставляет цену использования своего изображения в обучающей выборке нейросети. Скорее всего ценник устаканится где-то в районе 10-100$ за изображение. Как вы верно заметили число изображений в обучающей выборке способствует качеству => фирмы продающие услуг нейросетки мотивированы покупать больше качественных изображений => фотографы делают больше фотографий специально для обучения нейросети и их труд оплачен.


Я вырос в стране и времени, когда создание цифровой копии контента ничего не стоило

И что любопытно — этот контент в основном был не местным и его приходилось импортировать из стран в которых копирайт цвел буйным цветом, не так ли? Жить за чужой счет весьма комфортно, это да.


Так что я всеми руками за

Знаете, я вырос на ожидании мира будущего в духе Полудня Стругацких, а то что вы описываете — это скорее Двое из Ларца из известного мультика и эта вариация гипертрофированного общества потребления мне не очень нравится. Но помимо очевидных проблем с безопасностью такой системы затронутых в мультике проблема состоит в том что для того чтобы прийти к подобному идеальному миру (даже в вашем варианте) все еще надо вложить очень много труда, а прекратить оплачивать этот труд вы предлагаете уже прямо сейчас.

UFO just landed and posted this here
Ибо закрытые датасеты корпораций могут включать что угодно, и проверить это никак нельзя.

Whistleblower и конские штрафы. Обязательный аудит. Впервой что ли.


В базе сейчас 5 млрд изображений. Кинуть на обучение 500 млрд баксов смогут не только лишь все.

Средняя цена я думаю скорее 10 будет чем 100. И для начала 100 млн изображений будет вполне достаточно. А сумму в 1 млрд долларов компания типа Adobe прекрасно себе может позволить, рынок там оценивается сейчас в 3-4 млрд, так что вложение отобъется быстро. А Гугл вполне может позволить заплатить и 50 млрд если из этого вырастет что-то большее чем просто генерация картинок.


Или его экспортировали.

Те кто в России какой-то контент производил — фильмы, программы и т.д. были (да и остаются) лютыми копирастами в отношении своего собственного контента :). Собственно они были в первых рядах продавливания соответствующего законодательства в РФ и практического его воплощения.


Что тут то не так?

"А кушать вы тоже за меня будете" ©? Неясно зачем любой системе иметь людей которые не вносят практически ничего своего, только потребляют. Апологеты БОДа считают что люди займутся творчеством, но вы продвигаете идею мира где роботы делают ВСЕ, включая творчество.


Чем раньше отрезать копирастов, тем быстрее придём к миру полудня.

Без копирастов мы бы не пришли даже к тому что есть сейчас. Тривиальное же наблюдение — НИЧЕГО не мешает сегодня людям публиковать свой контент под открытыми лицензиями. Но коммерческие продукты опенсорс вытеснить не смог даже отдаленно, более того — даже опенсорсные компании охотно прибегают к копирайту в ситуациях когда им надо как-то на нем зарабатывать. Ну а ситуацию когда "отняли и поделили" в 20м веке разыгрывали уже столько раз что стыдно как-то не знать чем это всегда заканчивается и кто в соревновании соответствующих экономических идей победил.

UFO just landed and posted this here

Можете приступать. Midjourney явно обучалась на закопирайченных изображениях.

Законодательство соответствующее примут - и Midjourney естественно вылетит.

Лихо вы. Сами что-то обучали?

Adobe вполне успешно управилась с Firefly на ~200 млн.

А я не могу. И StabilityAI не может. 

Поэтому вы не сможете продавать соответствующие картинки. А делать, на мой взгляд сможете. Мою позицию про personal non-commercial use я писал.

На бесполезных работах занято минимум 40% населения

Лихо вы. Сами-то работать пробовали ;)? Или скопом туда записали всех чью работу не понимаете :)?

И чтобы "конкурировать" с продуктами индивидуальных ИИ, этот человеческий контент будет распространяться бесплатно. 

Он не будет конкурировать так и так. В вашей модели люди не вносят в контент ничего своего, даже сюжета, в силу чего "контент производства моего компьютера" ничем не отличается от "контента компьютера Васи". Деньги к слову - неплохая мера ценности вещей. Если что-то не стоит того чтобы заплатить за нее даже копейки то это довольно много говорит о том насколько это что-то интересно зрителю.

История не терпит сослагательных наклонений.

Совершенно верно. И в этой истории есть десятки если не сотни примеров как люди отрицавшие копирайт и реализовывашие принцип "отнять и поделить" предлагаемый вами приводили свои страны к краху, а успешных примеров подобной политики нет ни одного. В лучшем случае получался СССР, в худшем - Камбоджа.

UFO just landed and posted this here

Ну грубо говоря веса это суть сети и если их сделали из копирайченного контекста, то это то же самое, что плагиатить исходный код, а потом говорить, что в скомпилированных бинарниках этого кода нету.

UFO just landed and posted this here
Не надо мне давать денег. Такой эксперимент успешно провели без меня:
https://arstechnica.com/information-technology/2023/02/researchers-extract-training-images-from-stable-diffusion-but-its-difficult/

О, а вы их результаты пробовали на воспроизводимость проверить? А то у меня так chatGPT-статья про кротовуху почти релизнулась в качестве эксперимента =)


Там даже по приведенным фото видно, это это не генерации, а просто зашумление/пересжатие. Генерации не шумные, с артефактами, да, но не шумные и не на блоки бьющиеся. Ради эксперимента вбросил на ночь "Ann Graham Lotz" в 16000 генераций. Хотите скрины результатов? (ничего и близко похожего там нет, оно только криповую улыбку запомнило, и уж точно там нет таких jpg-шумов). Модель, способная выдать похожее на обучающую выборку — это люто оверфитнутая модель (у меня такие Лоры есть обученные), но она похожее чуть ли не каждой второй картинкой выдавать будет с минимумом почти незаметных вариаций, ибо её в таком случае буквально заставляют заучить наизусть пример, а не обучиться.

У меня нет оснований не доверять авторам исходной статьи которую вы даже не удосужились прочитать. Они не утверждают там что вы получите нужную картинку с первого раза просто введя промт "Ann Graham Lotz", у них процесс только начинается с генерации 500 картинок по этому промту с разными random seed и дальше целенаправленно отбирают те которые сходятся к известным тестовым изображениям. Помножьте на 350000 тестов. Так что случайным образом копирайтную картинку по запросу Вы практически гарантированно не получите. Но речь шла не о том что "нейросетка создает дубликаты копирайтных картинок" а про то что "нейросетка обучается запоминая фрагменты копирайтных картинок" и эта работа наглядно демонстрирует что это действительно так.

UFO just landed and posted this here

Я ознакомился с работой. И даже попытался воспроизвести. И за 16000 генераций не было ничего даже отдаленно похожего.

Причем хрен с ней, с композиционной похожестью. Модель Stable Diffusion в принципе не способна генерировать тот вид артефактов, который приведен на их изображениях, полученных якобы от SD. Были бы они просто мыльными по нехватке детализации или с характерными нейроночными завитками артефактов - другое дело. Но там банальные кубы jpeg-а, что дает основание не только усомниться в методике, но и предположить умышленный подлог результатов ради хайпа. Что в принципе в современной "науке" не ново и не редкий случай. Как я уже упомянул, у меня подобным образом почти релизнулась мед.журнале статья о влиянии кротовухи на иммунитет, написанная GPT. И рецензентов содержимое не смутило, пока я им не сообщил что они одобрили дичь, чисто по фану для эксперимента сделанную и отправленную.

P.S. я учу модели и лоры для своих нужд. Порой на конкретного персонажа. Порой на 5-7 картинках, и с лютейшим оверфитом. И даже тогда sd не выдает той степени похожести какую показывают в статье. Это не считая прочих описанных выше странностей.

Я подожду официальных публикаций. Если статья кривая, то опровержения последуют быстро. Но Вы меня уж простите, a group of AI researchers from Google, DeepMind, UC Berkeley, Princeton, and ETH Zurich работавшая несколько месяцев для меня является большим авторитетом чем человек не сумевший воспроизвести их работу за полдня. Ваша методика мне тоже не очень понятна и она явно отличается от использовавшейся в работе


Модель Stable Diffusion в принципе не способна генерировать тот вид артефактов

Возможно дело в этом
. To reduce the computational overhead of our experiments, we use the timestep-resampled generation implementation that is available in the Stable Diffusion codebase [58]. This process generates images in a more aggressive fashion by removing larger amounts of noise at each time step and results in slightly lower visual fidelity at a significant (∼ 10×) performance increase

UFO just landed and posted this here
Возможно дело в этом

Точно не в этом. При таком подходе картинка получается очень сильно более мыльной с цветными градиентами. У них ни градиентов, ни мыла, у них просто артефакты. Их артефакты не получатся даже если на первых шагах генерацию оборвать. Единственный момент когда там есть квадраты — это 1 шаг денойза, когда формируется шум. Но тогда там нет картинки.


Так что таки да, подождем.

выдавать их за свои работы запрещено, это плагиат.

А за чьи работы выдают копии? Если я скопирую Караваджо, я должен выдать свою картину за его?

Вообще — да, вы должны будете выдать свою картину за копию картины Караваджо, а нисколько не за свою. Потому что в этой картине вы не придумали сюжет, не придумали цвет, не придумали композицию, не придумали даже ни одного мазка. В копийной картине копировщик повторяет всё за автором.

Если вы скопировали картину Караваджо, то вы воспроизвели картину Караваджо. Но поскольку "Произведение, перешедшее в общественное достояние, может свободно использоваться любым лицом без чьего-либо согласия или разрешения и без выплаты авторского вознаграждения. При этом охраняются авторство, имя автора и неприкосновенность произведения." - выдавать это за своё произведение никому не разрешали.

Так что имеете право сказать, что это сделанная вами копия картины Караваджо.

Любой более-менее скиловый художник большинство бытовых стилей повторить может куда точнее чем нейросети. Например, человек рисующий аниме-фанарты высокого качества повторит без напряга почти любой современный аниме-стиль и половину стилей фан-артеров из инстаграма. Быстрее, лучше и точнее нейросети, которая даже обучаясь на тысячах артов чисто 1 персонажа не может точно его элементы одежды повторить...


Люди в целом учатся быстрее и качественнее, просто нейросеть не ограничена одним мозгом и может параллелиться на сотни и тысячи устройств (но при этом учится всё равно люто неэффективно).

Любой более-менее скиловый художник большинство бытовых стилей повторить может куда точнее чем нейросети.

Пока.
10 лет назад про обсуждения точнее/не точнее и речи то не могло быть.

Даже три года назад над попытками генерировать изображения примитивными GAN'ами все только смеялись. Прогресс здесь настолько быстрый, что ситуация меняется буквально каждую пару месяцев.

UFO just landed and posted this here

Но не будет, чтобы не плодить подделку

Скорее, чтобы его не назвали вторичным художником.

А так все верно.

Да, то же самое. И я не понимаю, в чём ваша проблема - ИРЛ художник имеет право убрать свои картины из любых галерей, чтобы на них не смотрели определённые люди, особенно бесплатно. Сабж делает то же самое, но вы ему в таком праве отказываете. Что с вами не так?

Имеет ли право художник заставить всех уже посмотревших забыть то, что они уже видели? Имеет ли право суд штрафовать видевших до тех пор, пока они не забудут? Имеет ли право художник в случае отказа забыть - убедить суд провести принудительное "забывание" (в случае с людьми самым простым способом будет их убить, т.к. достоверного способа забыть что-то не существует)?

Нейросеть в этом плане мало чем отличается. Она уже видела и это видение стало её частью. Самих произведений при этом у нейросети нет. Заставить забыть можно только через убийство нейросети с повторным обучением с нуля на других объектах.

Вы подменяете предмет обсуждения. Он не просит "забыть", он просит перестать использовать впредь.

И да, вы используете "галоп Гиша", предлагая мне ответить на три откровенно демагогических вопроса. Фу таким быть.

И нет, нейросеть много чем отличается. Например тем, что она не "видела", не "помнит", "виденье не стало её частью" и ей нельзя "убить". Вы навязываете виденье софта как живого высокоразвитого существа, это тоже демагогия.

Где мы ему отказываем?

«ИРЛ художник имеет право убрать свои картины из любых галерей, чтобы на них не смотрели определённые люди, особенно бесплатно»
Не вопрос, может.

Ну так сейчас в интернете этот самый художник ТОЖЕ может убрать свои фотографии/картины из отрытого доступа, чтобы их не ходили смотреть ходить «посторонние» если ему это так не нравится.
И никто ему в этом праве НЕ отказывает. Он просто НЕ ХОЧЕТ их убирать, а продолжает держать в открытом доступе дальше.

А вместо этого бегает за частью тех, кто заходит их посмотреть и пытается запретить им это делать. Но чтобы все прочие при этом продолжали ходить и смотреть.

В ИРЛ аналогии как если бы художник сам выставил свои картины в галерее, наблюдал за теми, кто приходит на них посмотреть, а потом кого-то из чем-то ему «не понравившихся» посетителей (например других художников — потому что видит в них не благодарную публику или потенциальных покупателей своих картин, а своих конкурентов) начал преследовать и под угрозой исков в суде потребовать «больше в эту галерею заходить смотреть мои работы не смей и вообще забудь, что там видел, когда в прошлый раз заходил!». А попутно еще и подал иск против справочка «желтые страницы» за то, что в нем адрес галереи, в которой его работы висят, записан и по нему другие «нежелательные» могут узнать куда идти, чтобы их посмотреть.

Вся эта тема с судами "художники против нейросетей" предсказуемо приведет к появлению в фотобанках новых услуг и копирайтов, запрещающих использование художественных произведений для обучения нейросетей.

А по факту получим… либо вой и указание лицензий на сайтах (на которые будут тупо забивать если файл качается, если это не однозначно-идентифициуемая лицензия — LAION у картинок лицензию пишет если авторы смогли понять и это одна из CC-лицензий а не опозналась то ?) а в лучшем случае еще одну попытку доработать стандарт robots.txt (с результатами не лучше предыдущей, где новостные сайты свои хотелки добавили а потом удивлялись почему это никто не поддерживает).


Ну и возможно — услугу у Cloudflare с возможностью засекать проход по LAION'у и подобным широко известным базам и блочить заход с конкретных IP(как бы если значительная часть сайтов — за Cloudflare — они в теории могут засечь начало прохода по конкретному списку).

Я пришёл в музей и увидел там "Мону Лизу". В голове у меня остался образ этого произведения. Я пришёл домой и под впечатлением от увиденного нарисовал 100 похожих картин. Теперь ко мне приходит Леонардо и говорит - а ну ка, выкинь это всё у себя из головы!

Если вы в РФ, то к вам придёт музей, и выкатит вам нехреновый счёт.

Рисовать-то вы можете, но вот нарисованное "под впечатлением" использовать можно в очень ограниченном количестве сценариев.

Если вы в РФ, то к вам придёт музей, и выкатит вам нехреновый счёт.

И уже наверняка выкатил всем кто с Мона Лизой рисует комиксы, мемасы, картинки с другими персонажами по мотивам и т.д? И публикующим площадкам (реактор, пикабу, акомикс) тоже наверняка? Не похоже.

Мона Лиза не хранится в РФ

Есть специальный закон в РФ, который, по факту, делает бессрочными права на те произведения, которые хранятся в музеях, давая этим музеям возможность в 1 каску с них кормиться.

https://base.garant.ru/123168/d83dadc1d9eb82a4be83885f2efeee52/

https://habr.com/ru/articles/489152/

Ну и ловить интересно не анонимных пикабушников, а тех, у кого есть ОГРН и прочие реквизиты :)

приходит Леонардо и говорит - а ну ка, выкинь это всё у себя из головы!

Хуже, если он приходит не один, а с бейсбольной битой...

Любой ребёнок знает, что Леонардо приходит не с битой, а с катаной ;)

Я уже давно не ребёнок!

С нейросетями возникает восхитительный казус - они с одной стороны используют изображения для обучения, с другой - это нельзя назвать использованием в общепринятом смысле слова.

Давайте пример - использовать изображение человека без его согласия недопустимо (с некоторыми допущениями), если оно где-то используется - человек имеет право потребовать удаление этого изображения и даже возмещения некоего морального (?) вреда, возмещения судебных расходов и так далее.

А теперь ситуация - вы увидели меня на улице. Находящаяся в вашем мозгу нейросеть без моего согласия использовала моё изображение для дообучения в категории "белый мужчина средних лет роста выше среднего" или хуже того - у меня висел бейдж с ФИО и номером телефона и ваша нейросеть сохранила эту информацию (теперь, если вам кто-то назовёт моё ФИО, то вы представите именно меня).

Налицо два нарушения - использование изображения человека без его согласия. Обработка персональных данных без согласия субъекта персональных данных, хранение персональных данных в системе, не сертифицированной на данное действие (ваш мозг не проходил сертификацию по соответствующему федеральному закону).

Вопрос - могу ли я подать на вас в суд, потребовать удалить из вашего мозга моё изображение и хранящиеся там персональные данные? Каким образом проводить удаление? Могу ли я в соответствии с законом потребовать уничтожение носителя моих персональных данных, если владелец носителя не имеет технической возможности их самостоятельно удалить?

С нейросетями ровно тоже самое - она где-то увидела изображения, что-то там поняла и как-то обработала. Но она ничего не хранит и не использует - она просто "посмотрела" на какую-то информацию, которую она увидела. А в большинстве случаев у нас законы запрещают "использование", но разрешают "просмотр" ("просмотр" запрещён только для информации, которая считается секретной).

Все верно. Это как сказать, мол ваши фотографии были в raw или bmp формате, а мы использовали только jpeg

Ну, всё таки, просмотр и использование - это разные вещи. Нейросеть хоть и не хранит в себе изображение целиком, но, это изображение было использовано при обучении. По идее, в таком случае, такую нейросеть нельзя использовать для коммерции, и изображения созданные с её помощью тоже.

А человек, посмотревший эти фотографии в Интернете, тоже не имеет права создавать (рисовать, например) изображения для коммерческого использования? Т.е. художникам запрещаем ходить в Интернет? И в музеи.

А причём тут человек? Механизмы обучения у человека и у нейросети ничего общего не имеют. Разве что некоторые названия из биологии.

Базовый механизм как раз таки точно такой же: человек может нарисовать только то, что видел, или скомбинировать элементы того, что видел.

Если бы наш разум был ограничен перекомпияцией имеющегося опыта - мы бы жили в пещерах по сей день. Но в общем Вы правы - большинство художников (особенно нынешних) - не гении, а ремесленники и без референсов и правда ничего не могут.

Нейронная сеть, в каком то смысле, не ограничена имеющимся опытом. У нее там внутри зафиксированы множители конечно, но на вход-то для генерации подаются каждый раз случайные данные.
Подозреваю, что с человеком примерно так же, тепловой шум (мы же на химическом субстрате работаем, молекула в зазоре между синапсами может двинуться в одну сторону, может в другую, сигнал каждый раз чуть-чуть разный) фильтруется через ранее полученный опыт.

Собственно «уровень шума» у нейронок обычно задается параметром «температура». Чем выше температура, тем больше «теплового шума» в «нейронах» и тем больше на выходе «творчества».
Причем это не при обучении, а во время работы уже обученной нейросети(передается как один из параметров в запросе) — связи/веса между нейронами не меняются, меняется именно «неидеальность передачи» информации по ним, как в физической(биологической) нейронной сети.

Наш разум имеено что ограничен перекомпиляцией предыдущего опыта (если не считать врожденных рефлексов, но и они по сути "опыт" тысяч предыдущих предков): потрогал, увидел, услышал, среагировал, запомнил, обработал, повторил увидел изменения, запомнил...

Хотя интеллект и возникает в результате обработки стимулов, на уровне когнитивных операций всё выше ассоциативного сравнения - не "перекомпиляция опыта". Иначе создание нового знания о взаимодействии феноменов было бы возможно только на основании наблюдения за ними непосредственно. Весь комплекс когнитивных способностей, касающихся синтеза гипотез - это создание нового знания.

Нейронная сеть - это вообще чистое творчество на основе случайных экспериментов и донастройке на обратной связи.

Только в отличие от человека она успевает сделать миллиарды экспериментов и на основе обратной связи от детектора отбирает самые лучшие результаты своего творчества.

Разве гипотизы не выстраиваются на ранее освоенном опыте? Если взять тех же дреаних философов: "всё бытиё это сон супер-существа" - явное оперирование известными по опыту явлениями. У современных физиков с их теорией "струн" или "тёмной энергией" ничего особо не изменилось.

Нет, генераторы картинок состоят из генератора шума и нейронки детектора. Когда детектор в шуме видит нужный объект, он даёт сигнал, что движемся в нужном направлении и за счёт миллионов таких операций получается какой-то результат.

Именно поэтому нейронки рисуют всякий безумный треш с тремя головами, пятью руками с 6 пальцами на каждой.

Нет, не выстраиваются. Точнее - если они выстраиваются только на основе имеющегося опыта, это называется конкретно-предметным мышлением. Если взрослый человек в современном обществе способен только на это, ему ставят диагноз "олигофрения".

Почитайте, например, монографию Лурии "Язык и сознание" или работы Пиаже по когнитивному развитию индивидуума.

Теория "струн", вполне очевидно, не имеет никакого отношения ни к каким струнам, это просто удобный абстрактный символ, а поведение реальных струн или шнуров не является аналогией, объясняющей хоть что-то о поведении объектов из теории струн.

Мы ушли от вопросов обработки информации к разделам медицины. Вернёмся обратно: сейчас ИИ - это исключительно математика/информатика (пока?). На пустом месте ни мат.модели из серии ИИ, ни человеческий разум (чем бы он ни являлся) не могут генерировать новые знания/информацию (не данные) без входящей информации (непосредственно подаваемой на вход или ранее накопленной). Ни древний философ не додумается до своих предположений про "сон" какого-нибудь Кришны без предыдущего накопленного опыта (знаний/информации), ни современный физик-теоретик не сможет строить сложнейшие абстрактные модели для описания гипотез про "энергию" или "струны" без основ физики, математики и другой ранее накопленной информации. Гипотезы не появляются сами по себе - для них тоже нужны исходные знания/информация и их обработка.

Да, есть ещё мутации опыта. Человек запоминает и соответственно повторяет запомненное очень далеко не идеально, это как раз и вносит новизну.

Механизмы обучения у человека и у нейросети ничего общего не имеют. Разве что некоторые названия из биологии.

Нейронные сети - это мощный инструмент, используемый для моделирования работы человеческого мозга. Они состоят из многих нейронов, которые обмениваются электрическими импульсами. Однако в отличие от обычных компьютерных сетей, нейронные сети могут обучаться и адаптироваться к изменяющейся информации.

Нейроны в мозге обрабатывают входные сигналы и передают их друг другу. Когда электрический импульс достигает конца нейрона (синапса), он может или не может перепрыгнуть на следующий нейрон, в зависимости от того, насколько сильным был сигнал и какие химические вещества были испущены в этот момент.

По аналогии с этим процессом, нейронные сети компьютеров имеют скрытые слои, которые могут настраиваться при обучении. Когда нейронная сеть получает входные данные, она пытается предсказать правильный вывод. Если ответ неверный, нейроны «обучаются» и будут скорректированы для более точного ответа в следующий раз. Этот процесс называется обратной связью.

Юридически это неважно. Юриспруденция оперирует результатами, а не техническими алгоритмами.

Например, картинка будет объектом авторского права вне зависимости от формата ее хранения и конкретных байтов в файле.

Результат - картинки нигде нет. Есть генератор, который умеет генерировать шум и сотня фильтров, которые бракуют результаты. В результате появляется уникальная хрень, отдалённо напоминающая объекты, которые попросили нарисовать.

Где объект защищённый авторским правом?

Объекта авторского права тут точно нет. Есть ли производный объект - будет доказываться в суде. Вангую, что суд затянется на годы.

Вопрос имхо находится в плоскости объема работы и собственных способностей которую нужно проделать при создании производного произведения. Одно дело нарисовать картину по памяти, другое перерисовать ее с натуры, третье - сфотографировать и распечатать после чего продавать фотографии как свою работу. Первое скорее допустимо, третье скорее нет. А для нейросетей объем работы у человека использующего нейронку стремится к нулю.

Я не храню и не использую напрямую в свой работе картину Ивана Шишкина "Утро в сосновом бору". Но я видел ее неоднократно - в музее, в интернете (мне неизвестно, законно в интернете мне ее показывали или нет), даже в магазине на пазлах. Впечатления от картины позволяют мне лучше работать, извлекая дополнительную прибыль. Куда, кому и сколько я должен заплатить?

Так а вы то тут причём? Мы говорим про нейросети. У них совершенно другой принцип обучения.

Принцип обучения одинаков - принимаем что-то на вход, как-то преобразуем и в дальнейшем используем. В контексте нейросетей только один вопрос - законность получения/формирования датасетов.

Ну вот существует защищённый авторским правом контент, например текст книги Гарри Поттера. Я прочитал книгу про Гарри Поттера, мои нейроны речевого отдела моего мозга освоили стилистику повествования этой книги. Можно ли считать, что у меня в голове копия контента защищённого авторским правом?

Если я буду писать в газету статьи, написанные под впечатлением от стилистики книги, Будет ли это пиратством контента?

Невероятно но факт, у нас есть судебный прецедент почти на тот случай, который вы описали. В 2003 году русский писатель Дмитрий Емец, автор серии книг "Таня Гроттер", проиграл суд издателям Гарри Поттера и по этой причине не смог издавать свои книги за рубежом (источник).

Поскольку авторское право - это вопрос права, duh, а право - это такая система, которая во многом базируется на субъективных критериях и мнениях уполномоченных людей, ответить однозначно на вопрос, где кончается fair use и начинается плагиат, в каждом отдельно взятом случае может только каждый отдельно взятый суд. Нас с вами как людей технического склада это конечно немного раздражает.

Понятно, что граница между плагиатом и честным использованием лежит где-то в середине спектра, с написанием рецензии в газету на оригинальное произведение в одном конце, и почти полным копированием синопсиса и персонажей с незначительным коверканием имен в другом. Но где - непонятно, и пока нет более хорошего инструмента для установления истины чем субъективное мнение группы экспертов.

Если б я был султан судья, то в данном кейсе, учитывая колоссальные размеры массива данных для обучения, я бы посчитал влияние работ отдельного художника на конечный результат пренебрежимо малым, и потому не квалифицируемым как плагиат.

Давайте сравним чайник и атомный реактор. Принцип работы одинаков - оба кипятят воду. Можем ещё java и javascript сравнить…

В сравнении принципов обучения нейросети и человека на столько мало общих точек, что даже не понятно, с какой стороны к этому подходить…

Но я ещё точно ни разу не видел, что бы человеку в голову закачивали сотни тысяч картинок, а он на основе этого менял у себя в голове некие «веса».

Нейроны человеческого мозга именно так и учится, с помощью химических сигналов и изменения проводимости нейронных связей

Хмм, т.е. хотите сказать, что если человеку дать просмотреть несколько сотен тысяч изображений, то у него в голове химические сигналы нейронов выстроятся таким образом, что он сможет рисовать эти изображения не хуже оригинала?

Я не эксперт, но что то мне подсказывает, что мозг не так работает)

Так и нейронка тоже так не работает. На одних только просмотрах можно обучить лишь нейросеть-классификатор, которая например отличает котов от собак на рисунках.
А чтобы обучить генеративную сеть, эта сеть в процессе обучения должна не только смотреть, но и генерировать. И получать обратную связь — насколько хорошо качество сгенерированного.

У человека так же. Чтобы научиться рисовать, просто смотреть - мало.

Генеративная сеть генерируют из шума, а обратную связь получает от классификатора, и иногда людей когда их привлекает к ручной обработке. Собственно картинки используют при обучении классификатора, а то нечто что получается в результате генерации на оригинал даже близко обычно не похоже

Представить в голове образ на основе картинок - элементарно. Нарисовать своими руками-крюками - очень вряд ли.

Т.е. всё таки принцип обучения разный?)

Я пытаюсь донести мысль, что, может быть базовый механизм и одинаковый, но иголки не делают из ежа ёлку.

Нейросети обучаются по другому и выполняют совершенно другой функционал. Не говоря уже о разнообразии биологических процессов, которые влияют на развитие человека.

Нейроны учатся очень похоже, то что человек руками результат выдать не может - к делу не имеет никакого отношения.

Нейроны не учатся, учится нейросеть в целом. Т.е. что бы нам получить некий результат, нужна обученная нейронная сеть.

А теперь самое главное - у человека и у ИИ эти нейронные сети совершенно разные. Они различаются на столько же, на сколько дерево отличается от камня. В основе организма может быть молекула или атом, однако из набора таких молекул может получиться как растение, так и животное. И относиться мы будем к ним по разному.

Изучите теорию нейронных сетей, а также нейробиолог и. Если очень лень, то в сети есть очень много статей, которые объясняют принципы работы нейронов мозга и нейронов нейронных сетей. Зачем вы спорите на уровне аналогии камня и дерева, даже не разобравшись в вопросе?

Потому что нейросеть и мозг человека - это разные вещи. Они отличаются, как камень и дерево. У них нет совершенно ничего общего, кроме базового механизма на уровне молекулы/нейрона.

Попробуйте разобраться, как работают нейросети. Почитайте, что такое рекурентные модели. Вы увидите, что мы не может относиться к нейросети как к человеку, потому что это фундаментально разные сущности.

Есть такое понятие "насмотренность" - это оно. Считается полезным для обучения в т.ч. и художников. Прогресс шахматистов до определенного уровня так же связывают с изучением гамбитов, чем больше заучил, тем лучше играешь. Теория "10000 часов" сюда-же.

Т.е. общая идея - чем дольше занимаешься каким то делом (больше раз повторяешь связанные с ним операции) - тем в нем лучше.

Понятно, что гением так станешь, мы не знаем почему, может архитектура сети не у всех подходит, или это связано со стимулами в обучении. Но крепким середнячком вполне можно.

Ну так же и любая конкретная нейронка в какой то момент обучения выходит на плато и обучение останавливается.

Насмотренность не работает без непосредственно навыка рисования. Художник не просто смотрит на изображение, он подмечает детали, основываясь на предыдущем опыте.
Это отличается от обучения ИИ, где нейросети скармливают полностью изображения, а она пытается подобрать веса, которые соответствуют определённым ключевым словам.

в какой то момент обучения выходит на плато

Не уверен насчёт плато. Вроде как доказали, что обучение рекуррентных нейронок идёт ступенчато. В сравнении с человеком, обучение которого идёт не линейно и может продолжаться бесконечно.

В сравнении с человеком, обучение которого идёт не линейно и может продолжаться бесконечно.

Ну это вы, конечно, преувеличили. К человека точно также есть пределы и процесс вытеснения и забывания.

точно также

Точнее, это совершенно другие процессы. Мы до сих пор точно не знаем, как работает процесс забывания у человека. Скорее всего часть нейронов лишаются связей, либо обрастают совершенно другими связями на основе нового опыта.
ИИ же не известно, может ли "забыть" информацию. Если брать рекуррентные сети, то информация там хранится в виде неких минимальных блоков данных, которые не могут быть стёрты из памяти. Будут эти блоки использоваться или нет зависит от конкретных кейсов на которых изучается модель.

 это вы, конечно, преувеличили

Как говорится, "век живи - век учись". Человек может учиться и развиваться на протяжении всего своего биологического существования. Каких либо пределов тут нет.

Мне крайне не нравится сравнивать человека и ИИ. Всё, что мы имеем - базовый принцип в виде нейронов и связей. Всем остальным, от биологии до общего строения, человек и нейронка крайне сильно отличаются. Когда мы говорим, что процесс "похож", это просто натягивание совы на глобус.

Человеческое сознание - это невероятно сложная нейронная сеть с огромным объёмом данных. С миллиардами входных источников сигналов, обученная в течение десятков лет. И всё это подключено К биологическому физическому телу, состоящему из костей, мышц и нервных окончаний.

С помощью сложных физико-химических процессов - эта нейронная сеть получает обратную связь с помощью гормонов.

Компьютерные нейронные сети в миллионы раз проще, но за счёт хитрой структуры и специализации они в некоторых моментах превосходят биологическую человека.

Точнее, это совершенно другие процессы

Процессы другие - да. Но базовый принцип общий.

Вы же не ожидаете что самолёт должен махать крыльями как птица?

Так и здесь. Не нужно ожидать полного соответствия для достижения схожих результатов.

В этом вся прелесть же.

Только вот незадача. Нейросети не просто показывают картинки. Ее заставляют сгенерировать картинку и потом оценивают на основе сравнения с картинками которые в датасете. Те ее дословно заставляют рисовать миллионы картинок пока у нее не начнет получаться не шум а картинки похожие на те что в датасете.

Нет, её учат распознавать объекты и рисовать объекты, а не копию изображений датасета

Каждый нейрон может менять свою активность в зависимости от того, какую информацию он получает. Это свойство нейронов называется пластичностью и оно позволяет им адаптироваться к изменяющейся среде, а также учиться на опыте. Таким образом, как нейронная сеть, так и человеческий мозг используют пластичность нейронов в процессе обучения и адаптации к новой информации.

Да ну? И там и там нейроны. И там и там связи и веса. И там и там очень похожие механизмы активации, причем в искусственных нейросетях они даже посложнее и вариативнее, чем в мозге человека. И там и там имеет место механизм обратного распространения ошибки. И это только то, что за секунду в голову пришло. Вам действительно не понятно, с какой стороны подходить и где схожесть?

Новорожденный ребенок не умеет пользоваться своими глазами. Сначала он видит шумную перевёрнутую картинку из ограниченного набора цветов. Затем в ней появляются линии: вертикальные, горизонтальные, диагональные. Затем линии начинают складываться в картинки. И, о чудо, искусственные нейросети ведут себя абсолютно точно так же на первых сверхточных слоях, что даже немного пугает.

И там и там очень похожие механизмы активации, причем в искусственных нейросетях они даже посложнее и вариативнее, чем в мозге человека.

Насчет посложнее и вариативнее - можете подробнее раскрыть тему или навести на материал, где такое раскрытие есть на достаточно приемлемом для неспециалиста уровне? Ну или с постепенным повышением градуса сложности. Не спору для, а для обучения моей межушной нейросетки :)

А то вот недавно пришлось погрузиться в исследования о влиянии того же стресса на головной мозг, и узнал для себя, что там и гормоны влияют, и миелинизация/демиелинизация... короче, узнал, что я сильно недооценивал сложность того, как все оно в моей же голове устроено и работает. Вдруг и про нейросетки у меня недооценка, пофиксил бы хоть частично.

То есть по вашему "маугли" (не персонаж книги, а термин из социологии) способен нарисовать картину, которую способен оценить человек из нашего культурного контекста? Любой творческий человек опирается на свою "насмотренность", чтобы создать что-то, что оценит такой же "насмотренный" человек. И можете называть его процессы в мозгу как угодно, хоть "веса", хоть особая структура нейронных связей.

ну, когда антропологи дают охотникам собирателям из современных племен, блокнот и фломастеры, при этом на его глазах проводят на листе блокнота параллельные линии всеми цветами, все из племени в течении получаса рисуют картинки причем разные, а 1-2 человека продолжают рисовать чисто по приколу в свободное время. И все понятно что они там рисуют.

Маугли и охотники-собиратели это сильно разные вещи. Да и найти охотника-собирателя сегодня, который не ходил на местный рынок, не видел картинки, этикетки, рекламу очень сложно.

А ведь если один раз видел и понимает концепцию изображения, то уже эксперимент бессмысленен.

UFO just landed and posted this here

Поэтому вряд ли существуют люди, проживающие в коллективе и не знакомые с концепцией изображений.

Вроде бы это не совсем верно. У меня есть мутные воспоминания о чтении, что в веке 19 некоторым этнографическим экспедициям приходилось обучать разных аборигенов (тогда из еще достаточно много было не затронутых цивилизацией) понимать картинки.

Они там просто ничего не видели, кроме странного и непонятного узора. Плоского. Совсем на гору/ручей/дерево/другого человека не похоже.

Ну вот как человек, который ни разу алфавита и букв не видел, не поймет что надпись на скале -- это вообще что-то означает, а не вот такая странная текстура камня.

Вопрос не в принципе обучения, вопрос в том насколько велик Ваш собственный вклад в создание производного произведения.

Сравните три сценария:

  1. Вы увидели картину в музее, впечатлились и потом у себя дома под впечатлением нарисовали что-то похожее

  2. Вы увидели картину в музее, сели с мольбертом напротив и перерисовали ее к себе на холст

  3. Вы увидели картину в музее, сфотографировали ее и продаете фотографии уже как Ваше собственное произведение

Во всех трех случаях речь технически идет о производном произведении. Но первый сценарий вполне допустим а третий - нет. А у нейросеток сложность создания производного произведения и вклад автора в "новое" произведение не сильно отличается от пункта 3.

Тут дело не во вкладе авторов. Во всех 3 случаях вы создаете новое произведение. И с точки зрения здравого смысла ничего не нарушаете (если, конечно, в случае 2 не выдаете свою копию за оригинал).

разница только в том, что в 3-ем случае из соображений "общественного блага" закон может (а может и нет) запрещать продавать фотографии. Просто чтобы фотографы поделились прибылью с авторами и музеями. Никаких глубоких принципов тут нет.

Неверно!


2) Вы… сели с мольбертом… перерисовали ее к себе на холст. Если вы точно и правильно сделали рисованную копию, там не будет ничего нового, никакого вашего участия. Там будет всего лишь рисованная копия.


3) Вы… сфотографировали… продаёте фотографии уже как Ваше собственное произведение. Если вы точно и правильно сделали фотокопию, там не будет ничего нового, никакого вашего участия. Там будет всего лишь фотокопия.


Новое произведение возникает, когда нет задачи создать точную копию.

Новое произведение возникает, когда нет задачи создать точную копию.

Но это не означает, что новое произведение будет оригинальным, а не производным :) Например, если это будет "не слишком точная копия" - то будет новым, на него исключительное право будет принадлежать тому, кто его сделал, "но есть нюанс".

Для производного произведения необходимо, чтобы оригинал был использован правомерно.

Но кроме производного произведения еще может быть воспроизведение произведения, то есть изготовление одного и более экземпляра произведения или его части в любой материальной форме.

Таким образом по большому счёту не так важно, будет это воспроизведение или переработка (создание производного произведения), и на то, и на другое, требуется разрешение - законное и/или договорное.

Так что вы правы в своём замечании, просто по большому счёту не так важно, воспроизведение это или переработка.

И он не подразумевает хранение копии авторского контента. Генераторы изображений имеют на основе весов неонов детектор образов. Пусть докажет, что нейронная сеть действительно видела его фотографии.

Вы в музей бесплатно ходите? Да и пазлы наверное не на помойке нашли? Купили - наслаждайтесь, работайте лучше, чтобы купить иные вариации этой замечательной картины :)

Пожалуйста, выберите здесь категорию, наиболее подходящую вашей деятельности и заплатите согласно предписанию.

Если Вы работайте то Вы вообще должны заплатить всем авторам любого контента, который вы когда либо просматривали или слышали за всю свою жизнь, так как безусловно вы в той или иной степени использовали труд других людей. Официантку в кафе Феникс не забудьте, которая в уникальной манере сообщила, что суп горячий )

А разве не так учатся и люди? Смотришь, смотришь, смотришь. А потом используешь. Кто-то чтоб узнавать, кто-то чтоб творить. Давайте опустим ИИ. Будем смотреть как на группу людей - компанию. Они просмотрели тонну свободных фото и написали софт, который может распозновать или генерить изображения. В этом случае они просто ещё и автоматизировали просмотр.

Компаха у себя хранит только ссылки на общедоступные изображения, и дальше продаёт собственно только ссылки. А клиент, может пройти по этим ссылкам и просмотреть эти изображения, если они остаются В общем доступе. Таким образом если фотограф хочет изъять свои изображения, Пусть закроет общий доступ к ним. Если у него претензии к нейронной сети, которая посмотрела на его изображение, то он также может подать иски как всем людям которые видели его изображение и что-то там запомнили

Когда нейросеть в правах приравняют к человеку, тогда ваш комментарий будет иметь смысл.

Ну пока нейронным сетям ещё никто не запрещал смотреть на фотографии.

Интересно, что у фотографа претензии не к нейронной сети, а к хранилищу ссылок на фотографии. Он бы ещё на Google в суд подал там тоже фотографии искать можно

Смотреть то не запрещал - а вот производные произведения в комерческих целях использовать запрещали. Вся выдача нейронок и они сами - производные произведения, сто раз уже обсудили. Они не обладают юридической самостоятельностью

Да половина deviantart'а кормится с производных произведений. Художники массово рисуют на заказ персонажей известных франшиз. Поттер, Наруто, пони, покемоны, персонажи компьютерных игр (прежде всего World of Warcraft). Всё это вовсю продаётся, причём естественно без разрешения правообладателя и без выплаты каких-либо отчислений. И как-то я не слышал, чтоб хоть кому-то за это прилетало.
Зато вот когда на рисунках этих же самых художников обучают нейронку, начинаются возмущения. Как-то уж очень избирательно этот копирайт защищается. Этодругин наверное вёдрами пьют.

Не путайте людей которые зарабатывают своим трудом (если к ним вопросы будут то и им прилетит вполне) и корпорацию которая паразитирует на результатах чужого труда - массово за деньги штампующей производные произведения. Тут буквально инструмент разрушающий институт авторского права как класса (с оговоркой если авторы дали согласие на такое использование - то пожалуйста)

Люди посмотрели оригинальное произведение и массово штампуют его производные (девиан-арт). Люди меняют свое время на деньги. Эти люди могут теоретически работать на корпорацию (не знаю про девиан-арт, а вот фотостоки, например, берут очень даже значительную долю себе и фотостоки и есть корпорации).

Нейросеть корпорации посмотрела на оригинальное произведение и массово штампует его производные, меняя процессорное время и электричество на деньги. Нейросеть работает на корпорацию.

В чем разница? Или дело только в производительности, кожаные мешки испугались конкуренции? Уже было - луддиты.

Разница есть - луддиты потеряли возможность работать, но их собственность не крали чтобы получать прибыль. Тут твой труд, который был отдан под некомерческие цели взят и используется в комерции под прикрытием изменяющего алгоритма. Не нужно приписывать алгоритму права и свойства людей. Если компании сами создадут комерческий датасет легально, то пусть делают что хотят - буквально им сейчас бы никто помешать не смог бы, нет законов запрещающих

Тут твой труд, который был отдан под некомерческие цели взят и используется в комерции под прикрытием изменяющего алгоритма.

Нет, не используется. Повторюсь, нейронка не содержит фотографий ни в каком виде, даже закодированном.
Если я возьму фотку и просто подсчитаю, что она содержит 17% красных пикселей, 25% жёлтых и 8% синих, это я что ли фото закодировал? А ведь с этими данными я простой функцией random(), используя эти вероятности, уже могу сгенерировать некую мазню, цветовая гамма которой


напоминает ту, что на фото

Нейронки действуют так же — они собирают статистические распределения по датасету, а вовсе не запоминают куски рисунков.

Еще раз - сама нейронка содержит эти данные в своей структуре косвенно. Иначе ей не нужно это фото и для обучения. Если фото использовалось при обучении - значит часть фото осело в нейронке и все что выдала нейронка на выходе - производное произведение. Вы с этим фактом что-ли спорите? Проблема вообще не в виде результата производного произведения (картинку он выдал или веса в нейронке), а в том что результат без исходного произведения не существует, а исходное закрыто некомерческой лицензией, что угодно хочешь с ним делать для получения прибыли, плати автору если он разрешит вообще пользоваться.

Если я включу в своё произведение одну букву из вашего текста — оно не становится от этого производным.
Если я скопирую в своё изображение один пиксель вашей фотографии — оно не будет считаться производной работой.
Просто сравните объём датасета с объёмом нейронки.
Упоминаемый здесь LAION-6B в полном объёме содержит ссылки на более шести миллиардов изображений, одна конкретная фотка там — это даже не капля в море, а пылинка в безбрежном космосе.
Датасет весит 6.2 Тб, причём это изображения, которые уже пожаты в jpeg и avif, то есть сжать их ещё сильнее невозможно физически — если уменьшить объём хотя бы раз в десять, это уже и изображением-то не будет. Тогда как размер модуля CLIP, который на этом обучался, всего лишь порядка 1.7 Гб. Разница более чем в 3000 раз. Я ради интереса покликал по нескольким ссылкам датасета, и мне не попалось там изображений шириной либо высотой больше 2000 пикселей. Даже если считать, что каждая фотка в датасете полные 2000x2000, то выходит, что нейронка от неё хранит информации, эквивалентной группе 36x36 пикселей примерно. В реальности ещё меньше.
Так что никаким кодированием тут даже не пахнет, это именно сохранение статистических распределений.

36 на 36 тянет вполне на иконку или превью. Более того, если правильно кодировать то там и поболее влезет, например черно белое. Но опять же я к тому что не похоже обучение комерческой нейронки на некомерческое использование. Так что способ представления картинки внутри значения мало имеет.

Имеет значение размер представленного. Из каждой фотографии извлекается слишком мало, чтобы считать это копированием.
Повторюсь, никакие картинки в нейронке не хранятся — для этого там слишком мало места. К тому же нейронка очень легко дополнительно "сдувается" с очень небольшим проседанием качества генерации, то есть представленная в ней информация даже избыточна. Если квантизировать её в 8 бит, то нейронка уменьшится ещё в 4 раза, и даже это не предел.

нейронка содержит эти данные в своей структуре косвенно

Хорошо. Согласимся с этим, признаем вашу правоту, остановимся на этом. Да, нейросеть содержит данные.

Как их получить обратно? Что сделать, чтобы нейросеть вернула прочитанный файл?

И — главное — почему до сих пор такое не получается? Почему никто не сумел вернуть файл обратно из нейросети?

При чем тут обратно? Нейросеть без этих данных не существует? Не существует. Она использует данные не предназначенные для комерческого использоваия в комерческих целях - использует. О чем спор? Вы искренне стремитесь меня убедить что можно плевать на лицензии картинок если обрабатывать их алгоритмом?

Положим, что нейросеть не существует без этих данных. Следовательно, эти данные находятся в нейросети. Следовательно, их можно там найти и вытащить. Но как это сделать?

Прошу вас, для примера возьмите две картинки и сложите все цифры, которыми закодирована каждая из них. Затем снова сложите цифры, которыми закодирован полученный результат. Затем снова сложите эти цифры, и повторяйте, пока не получится число меньше 10-ти. Когда у вас получатся два таких числа, возьмите разницу между ними. Правильно ли я понял, что эта разница будет пиратским производным произведением, основанным на двух фотографиях?

Давайте рассмотрим пиратское произведение 7. Оно получено именно через такой алгоритм и, следовательно, является производной работой. Правильно ли я понял, что мы не можем использовать 7 без разрешения авторов исходных фотографий, для которых была вычислена сумма цифр, пока эта сумма превышает десятку, а затем взята разница между полученными суммами?

Еще раз вы настаиваете на том что можно плевать на лицензии картинок если обрабатывать их алгоритмом? Что можно использовать в комерческих целях то что запретили так использовать, если удастся отпетлять сильно запутав следы в алгоритмах?
Да для людей есть границы что есть производное что нет, даже если художник исходное произведение видел.
Результат работы алгоритма именно производное произведение - неважно насколько там запутали след.

Чтобы проверить ваши слова, я взял профессиональный фотоснимок размером 3000 на 3000 точек, внимательно рассмотрел его, загрузил в хакерскую программу и создал производное произведение. Вот оно:

bf4128a27e2f40f1aec3e9131f99a08b2932e61f

Моя пиратская работа сделана при помощи хакерской программы «SHA-1». Вам сразу бросятся в глаза следы исходного произведения.

Правильно ли я понял, что это число никто не может использовать в коммерческих целях? То есть получилось запрещённое число, верно?

Она имеет коммерческую ценность? Скорее всего нет - нет ценности не о чем и говорить, начнете это число продавать, у автора могут возникнуть вопросы.

Я хочу получить прямой ответ - вы настаиваете на том что можно плевать на лицензии картинок если обрабатывать их алгоритмом? Что можно использовать в комерческих целях то что запретили так использовать, если удастся отпетлять сильно запутав следы в алгоритмах?

Что значит не имеет? Это число включено во множество коммерческих программ. Его продают сотнями тысяч, целиком и по частям!


Вот я привёл вам пример того, как я с помощью хакерской программы обработал картинку алгоритмом. Получилась пиратская производная работа. Глядя на неё, вы сразу поняли, из какой фотографии она произведена. Значит, использовать его нельзя? Это запрещённое число?

Речь про коммерческое использование - вы это число хотите на логотип? В рекламе использовать?
Автор посчитает хеш от своего фото и спросит с вас за его использование в коммерческих целях, и в суде ваш хеш могут признать производным произведением очень даже запросто. Более того ценность этого числа видимо только в том, что это хеш от фото.

Так то любое фото это просто очень большой порядковый номер файла в бинарном счислении, значит все комбинации байт можно превращать в картинки и использовать в коммерции? Так по вашему?

тут первый вопрос, что такое "использование в коммерческих целях". Если я посмотрю на картину, мне придут в голову какие-то идеи и ассоциации. И потом я создам свое коммерческое произведение с использованием этих идей, это будет коммерческое использование картины?

Да, и если автор напишет в лицензии, что я могу смотреть на его работы, но обязан сразу их забыть, я наплюю на лицензию. Это уже проблемы автора. Не хочет -- может картину не показывать. Вот неприкосновенность его жилища, его личного хранилища данных и его закрытого сайта я буду уважать.

Когда художник рисует картинку в Adobe Illustrator, он просто берёт белый фон и преобразует его алгоритмом. Алгоритм преобразовывает заданный им набор точек в кривые Безье, а те растеризует в пиксели.
А если художник рисует путём расстановки точек на рефе-подложке (значительная часть 3D-модельщиков к примеру действует именно так), то даже и исходные точки получены с помощью какой-то уже имеющейся работы и просто преобразованы алгоритмом.
Так что, все такие векторные иллюстрации и 3D-рендеры считать производными и запретить к использованию?
Разница между плагиатом/копированием и полноценным самостоятельным произведением определяется именно количеством (процентом) взятого и степенью переработки.
Так, если я возьму фотку и просто дорисую на ней лишнюю гору — это будет явное реиспользование. А если на одной фотке подсмотрю цветовую палитру, на второй — композицию, на третьей — набор объектов, а стилистику и штриховку возьму ещё с двух, и всё это скомбинирую — это уже полностью собственное произведение и авторам оригинальных фоток/рисунков я уже ничего не должен, потому что степень сходства с каждой из исходных картинок для этого слишком низкая.
В противном случае 99.9% художников были бы злостными нарушителями авторских прав.

Нет. Нет алгоритма который возьмет и из холста сделает художнику картину - если есть то его результат авторским правом не покрыть. Художник приложил свой труд и создал картину. Он не брал куски чужих картин чтобы ее сделать.
Алгоритмическая обработка - полностью автоматизированная это плагиат. Если вы возьмете и сделаете коллаж, то скорее всего его признают производным произведением.

Я хочу получить прямой ответ - вы настаиваете на том что можно плевать на лицензии картинок если обрабатывать их алгоритмом? Что можно использовать в комерческих целях то что запретили так использовать, если удастся отпетлять сильно запутав следы в алгоритмах?

Я хочу получить прямой ответ — вы настаиваете на том что можно плевать на лицензии картинок если обрабатывать их алгоритмом?

В определённых случаях — можно. Например, если результат обработки нигде не используется (я к примеру просто провожу нагрузочное тестирование кластера, загружая его расчётами, результат которых потом никуда не идёт) — то с чего мне вдруг платить за лицензии на использование?


Нет алгоритма который возьмет и из холста сделает художнику картину

Про шум Перлина слышали? Чистый алгоритм, картина получается просто "из воздуха".


Про фракталы слышали?


Изображение получено довольно простым алгоритмом без вмешательства человека.


Или может вам приходилось видеть уроки Фотошопа, когда из воздуха получали горящий текст, ледяное стекло, стеклянный помидор и даже


изображение галактики?
Талант рисования тут вообще не использовался — на холст просто кидается эллипс, спираль или текстовая надпись, а потом сверху набрасывается пачка фотошоповских фильтров, которые послойно комбинируются с разными весами и масками. Чистейший набор алгоритмов.
Так вот нейронка — это такой продвинутый набор фильтров, которые превращают «воздух» во что-то осмысленное, и процесс генерации по сути не отличается от того, что перечислено выше.

Еще раз, все алгоритмы что вы описали - не используют чужие фото, и сами по себе недостаточны для создания чего-то полезного, либо уже алгоритм по сути произведение искусства сам по себе. Так выходит вы против обучения комерческих нейронок за счет фото выставленных с некомерческими лицензиями? Ведь результат обучения используется с комерческой целью

либо уже алгоритм по сути произведение искусства сам по себе.

Ну тогда нейронка — это по сути само по себе произведение искусства, поскольку сложность заложенных туда алгоритмов многократно превышает сложность вышеуказанных фракталов. А её создатели и настройщики — полный аналог скульпторов, которые по рефам аккуратно "вылепливают" нужное.
Если вам кажется, что степень человеческого участия в создании нейронки недостаточна, её очень просто поднять: для этого существует мерджинг (слияние) нейронок. Когда берётся несколько разных сетей и поблочно сливаются вручную, причём основную роль тут играет интуиция сливающего, ибо заранее предсказать итог невозможно, и получить хороший результат, превосходящий оригинальные сети — само по себе искусство.


Кстати, можете ещё на shadertoy зайти — там очень глубоко копают в процедурную генерацию, даже анимированные сцены создают без единого штриха, просто программным кодом.


Так выходит вы против обучения комерческих нейронок за счет фото выставленных с некомерческими лицензиями?

Откуда такой вывод?


Ведь результат обучения используется с комерческой целью

Результат обучения — используется, но НЕ результат обработки фото алгоритмом. Фотки используются в качестве рефов, по которым подгоняют веса, не более того, сами они никуда не включаются ни в каком виде. Фотки НЕ кодируются внутрь весов и никак не могут быть из них восстановлены, фотки НЕ сжимаются и НЕ упаковываются.
Ближайшая аналогия — вы по пачке фотографий составили текстовое описание основных объектов, которые на них изображены, и продаёте ваш текст художникам, а фотограф требует с вас за это денег.

Теперь уже разговоры про собственность.
Прочитайте пожалуйста серию статей про историю как ИС (именно в контексте авторского права на книги и прочее) стала собственно "собственностью".
Первая статья из 6 — https://habr.com/ru/articles/162005/
Да, у автора — вполне себе определенная политическая позиция, что он и не скрывает. Но факты вроде переданы верно.

Так вот как мыслил создатель BaldenOS: а нефига выкладывать опенсорс!

Хм. Нарисовали вы удачную картинку - интересную, с необычным сюжетом. Выложии в свободный доступ надеясь только на лайки. Кто - увидел, и... перерисовал её своей рукой (взяв главную идею) и стал продавать. Вот как это расценивать?

У вас будут претензии будут к Тому кто пытается продавать, или к карандашу, или Фотошопу?

И очень спорно, что даже к продавцу вы сможете что-то предъявить, если это не фирменная символика.

Как высшую форму признания вашего таланта

Признание таланта это очень приятно пока не надо платить за квартиру.
---
ИМХО это должно регулироваться лицензиями - типа если вы хотите мою картинку на стену повесить - пожалуйста, а если пририсовать усы и хвост и продавать - то поделитесь.

Это и регулируется, называется "производное произведение". Подавайте в суд и будьте готовы к длительному процессу.

Разве теперь если ввести в нее запрос «Сделай фотографии как у Ивана Иванова» она не выдаст результат замиксованный из его работ? Тогда это плагиат.

Все плагиат. Все рисунки можно свести к набору цветных многоугольников, все цветные многоугольники можно свести к Квадрату Малевича,

"Сделай мне персонажа мультсериала про пони, но чтобы он был нарисован в стиле Ван Гога".


Результат

По-моему это не очень-то похоже на микс из работ Ван Гога. Плагиатом тут и не пахнет — копируется именно стилистика.

Иск от Hasbro выехал, ожидайте!

Тот случай, когда понимаешь, что Винсент Ван Гог был гораздо адекватнее и вменяемей современных копирастов от рисования.

Винсент Ван Гог был гораздо адекватнее и вменяемей

... но он умер!

Тут тонкий момент. Фотограф выкладывает фотографии в паблик и дает всем живым людям лицензию на просмотр этих фотографий глазами. Другие способы использования автор не разрешил. Ситуация очень похожа на небольшой скандал с каким-то фильмом («Терминатор» вроде, но могу ошибаться). Создатели взяли кусок малоизвестной опенсорсной программы и пустили ее текст по экрану для изображения «будущего» и «мыслей киборга». А по лицензиям GNU/BSD/что-там-еще тексты программ можно использовать только для компиляции бинарников, никакого кина, картин и прочего.

Т.е гугл просматривать их права не имеет, как и все прочие боты? Ох это приведёт к тому что автор сможет подать в суд на огромное число компаний и засудить их на горы денег. Заодно с таким прицедентом, придется удалить сыллыки на все фотографии и сайты в интернете, закрыть в них поисковые системы внутренние и ждать разрешений от авторов.

Т.е гугл просматривать их права не имеет, как и все прочие боты? 

Ну как бы да. Или специально разрешайте ему смотреть. Кстати, для роботов есть стандарт на файл robots.txt, и правильные роботы типа гугловских ему следуют: если запретили, он туда не ходит. Стандарт можно рассматривать как обычаи делового оборота. А вот с теми, кто ему не соответствует — все плохо. Да, можно подать на них в суд, только сначала надо найти хозяев. Поэтому многие просто банят таких через .htaccess/iptables/etc.

Так на сайтах где были его фотографии, стоял запрет? А если не стоял значит было явное разрешение для ботов?

Так на сайтах где были его фотографии, стоял запрет? 

А кто ж его знает... Надо спрашивать у участников этой истории.

А если не стоял значит было явное разрешение для ботов?

Если не разрешено, то запрещено. А дальше надо смотреть robots.txt, местное законодательство, решения судов (если в стране действует прецедентное право).

Нет, с конкретно в случае с robots.txt (отсутствие в нем запрещающих что-то правил или отсутствие самого файла в принципе означают, что роботам разрешено брать/читать на этом сайте/домене вообще ВСЕ) и в намного более глобально в правовой системе большинства стран преобладающий подход прямо обратный — «разрешено все, что не запрещено».

Есть какой-за закон, норма, правила запрещающий ХХ? Нет? Значит ХХ разрешено.

Есть какой-за закон, норма, правила запрещающий ХХ? Нет? Значит ХХ разрешено.

В случае авторского права - как раз законом "по умолчанию запрещено всё, что не разрешено правообладателем" (а вот свобода договора - как раз и заключается в том, что договорится можно обо всём, что не запрещено законом). Просто пока еще достаточно большой список исключений, где согласие правообладателя не требуется, явно установленных законом и/или (в странах англо-американской правовой системы) подразумеваемых разрешений.

Смотреть человекам - точно можно. Другие способы использования уже менее очевидны, а уж для нейросетей - в общем случае вообще не урегулировано никак законом, вот и пытаются разные стороны толковать право нужным им способом... Частично обоснованно, частично - ловят рыбу в мутной воде.

Хотя конкретно в случае обсуждаемого в статье персонажа - еще и зависит от применимого к спору права, но похоже что обе стороны - немцы, а потому могут быть еще и специфические особенности немецкого права, где может оказаться, например, что такие действия разрешены - но вот тут я уже не в курсе.

В отношении гражданских прав и свобод действует правило: «что на запрещено, то разрешено». Вы можете ехать куда угодно, работать кем угодно, думать, что угодно и так и далее. Когда речь заходит о частной собственности, то принцип меняется на обратный: «что не разрешено, то запрещено». Если вещь в моей собственности, то Вы можете ее трогать. Вы не можете зайти на мою землю, если я не разрешил. Вас пустят в вагон железной дороги, чтобы доехать по билету от станции «х» до станции «у», при этом Вы должны сидеть на своем месте; остальное — запрещено. Так и с объектами авторского права: все запрещено, то, что можно, описано в лицензии/договоре/ином документе.

Фотографировать ход выборов на избирательных участках не запрещено.


Однако, если вы придёте с фотоаппаратом, председатель участковой избирательной комиссии сразу спросит — кто вам разрешил и на каком основании. Если вы не покажете разрешение, председатель УИК не разрешит вам фотографировать и вызовет полицию, которая потребует не мешать председателю УИК.


Проверял десятки раз на разных участках.

Вас пустят в вагон железной дороги, чтобы доехать по билету от станции «х» до станции «у», при этом Вы должны сидеть на своем месте; остальное — запрещено.

Что, правда? Вот я не буду сидеть на своем месте, погуляю по вагону, и мне штраф выпишут?

Или я зайду с разрешения хозяина на участок и что-то там потрогаю, дерево или вешалку в прихожей. Думаете, хозяин сможет потащить меня в суд?

А можно пример (до 2022 года) когда
1) есть лицензия
2) в явном виде прописано что только живым людям
?
С лицензиями опенсорса — там как бы использовать то можно для любой цели обычно… но соблюдая лицензия (а комплиляция — специальное исключение).

GNU GPL, начиная с лохматого года. Можно компилировать, изучать исходники, менять исходник и компилировать, давать другим исходные исходники, модицифированные исходники, скомпилированную программу и даже брать за это деньги. Все остальное явно запрещено.

BSD, тоже лохматого года. Тоже можно компилировать, копировать и т. п., про остальное не сказано ничего. Исходя из общих принципов гражданского законодательства, что прямо не разрешено, то запрещено.

MPL, и она лохматого года. Аналогична BSD.

Насчет «живых людей»: ни в одной про живых людей не сказано, так что теоретически можно написать робота, который будет брать исходники и компилировать, и это будет легально. А вот обучать какую-нибудь нейросетку — уже нет, это лицензиями явно не разрешено.

Фотограф зарегистрировал эти произведения как объект авторского права?

А он должен был это сделать?
Согласно законам своей страны в тот момент когда их делал?


p.s.
Я НЕ знаю из какой страны конкретно данный фотограф и считаю что это — не важно в общем случае. Проблема (если ситуацию считаем проблемой) — общая.

Из Германии он. И в Германии вообще-то подобное использование (хотя его не конкретно под нейросети писали, а общий случай «биг даты» и «датамайнинга») прямо разрешено законом:

According to German copyright law, “it is permitted to make reproductions to carry out text and data mining” if they are “lawfully accessible” and deleted afterward. Temporary reproductions are also allowed if the sole purpose is to enable “a lawful use” of a work and the reproduction has “no independent economic significance.”


На что он вообще рассчитывал (кроме ну я же мать! ну я же автор!) не понятно. После первого обращения получил разъяснение, почему никаких законов компании не нарушают, а его требования бессмысленны (в начале он там требовал удалить копии своих фото, которых в принципе нет). Когда не успокоился и начал строчить жалобы и подал иск — получил встречный иск за попытку «злоупотребления правом» на компенсацию юридических расходов.

А это не требуется по гражданскому законодательству большинства стран европейской цивилизации (и в РФ тоже). Авторство признается за тем, кто создал объект авторского права, и он считается автором до тех пор, пока не доказано обратное. Если кто-то приходит в суд и просит наказать кого-то за пиратство или еще за что-нибудь, то ему верят, что он автор. Регистрация условно облегчает разбирательство, когда два человека говорят, что каждый из них — автор. Тогда обычно автором считают того, кто зарегистрировал произведение. Но у его оппонета есть возможность предъявить доказательства — например, договор об использовании этого объекта до даты подачи заявки на регистрацию — и тогда регистрацию отменяют, и автором считают другого.

Если кто-то приходит в суд и просит наказать кого-то за пиратство или еще за что-нибудь, то ему верят, что он автор.

а вы попробуйте. Подайте в суд. Действительно ли настоящему автору придется доказывать, что автор -- он, а вам поверят на слово.

за просмотр этих изображений роялти не полагаются.

Но претензия-то не в просмотре изображений, а в создании "производного произведения" на их основе - нейросетки.
Если Вы берете книги 3 авторов и делаете на базе их авторского материала сайт вопросов и ответов, то авторам Вы должны занести. Даже если Вы даете свою информацию и даже если авторская информация обработана хитрым алгоритмом.

Решает объём информации. Если вы берёте не три книги, а 30 000 книг, и из каждой извлекаете ровно по одному слову, чтобы из этих слов скомпоновать ваш материал, то это не будет производным произведением.
Нейронка тренируется на многих миллиардах рисунков, при том что её размер довольно мал и может быть дополнительно уменьшен квантизацией и дистилляцией. Разделите этот размер на количество рисунков. Сколько там от каждого рисунка информации берётся? Считанные пиксели — слишком мало, чтобы это считалось копированием.

Решает объём информации. Если вы берёте не три книги, а 30 000 книг, и из каждой извлекаете ровно по одному слову,

Объем извлеченной из книги информации сам по себе ничего не решает. Если Вы возьмете ВСЕ слова из одной книги и из них составите другую, но без какой-либо связи по смыслу, то производным произведением это не будет.

Считанные пиксели — слишком мало, чтобы это считалось копированием.

Производное произведение не подразумевает копирование, поэтому считается ли это копированием или нет - не имеет значения. Важно что конечный продукт без использования производного произведения получится другой, а в случае нейронок это так и есть.

Фотографий в датасете настолько много, что можно выкинуть из них любую — разницы в итоговом результате не будет вовсе. То есть решает не конкретная фотография, а фотография вообще, как абстракция. Фотографии — не более чем субстрат для сбора статистики, а не источник пикселей для копирования.
Если вы обложитесь рефами, и при рисовании с одной фотографии возьмёте гору, со второй — небо, и не просто скопируете, а отобразите в стилистике, взятой у одного художника, а метод штриховки — у другого, а цветовую гамму — у третьего, это не будет производным произведением.
Взять очень-очень мало информации из нескольких рефов и скомбинировать иначе чем простым копипастом — это и значит создать полностью самостоятельное произведение (покажите мне художника, который рисовал бы вообще без рефов).

Фотографий в датасете настолько много, что можно выкинуть из них любую — разницы в итоговом результате не будет вовсе.

А это не имеет значения. Есть определение в законе.

2. К объектам авторских прав относятся:

1) производные произведения, то есть произведения, представляющие собой переработку другого произведения;
2) составные произведения, то есть произведения, представляющие собой по подбору или расположению материалов результат творческого труда.

И Вы, в комментарии выше, напрямую описываете нейросетку как составное произведение состоящее из производных произведений.

То что картинкок для ее составления было взято много и переработаны они были сильно, это лишь говорит о массовости.

прямо навеяло

.В наше время... можно украсть велосипед и всё здоровье отдать в тюрьме, а можно воровать вагонами и всегда оставаться на плаву. В России красть составы гораздо безопаснее, чем велосипеды.

В таком случае все рисунки живых художников, при создании которых использовался хоть один реф, надо считать производными и запретить.

А вот здесь туманное место, на самом-то деле. Хорошо, когда у нас есть одно-два исходных произведения и одно производное. Тогда понятно: тут взял, сюда произвёл. Но что делать, если есть миллион исходных и никакого производного? И, что ещё хуже — что делать, если есть миллион исходных, а производное делают какие-то анонимные случайные люди, ставя задачу в виде случайных слов?

Слишком сложный случай, для которого покуда нет ясного судебного решения.
И Вы, в комментарии выше, напрямую описываете нейросетку как составное произведение состоящее из производных произведений.

Стоп. Составное произведение не является переработкой. Оно составлено из исходных, которые никак не переработаны. Книга составлена из статей и рисунков. Фильм составлен из видеоряда, сценария и музыки.

Потому что Гражданский кодекс (статья 1260) учит:

Составителю сборника и автору иного составного произведения… принадлежат авторские права на осуществлённые ими подбор или расположение материалов (составительство).

(Полный текст в википедии.)

Если вдруг есть Автор пейзажей, а они сфотографированны без его письменного разрешения, тоже предъявит иск к фотографу в форме кармы и мелких неприятностей? Какой арбитраж будет это рассматривать?

Хорошо, что хоть Господь не интересуется авторским правом.

И в этой связи вспоминается мне рассказ Сергея Казменко "Право собственности".
Группа товарищей нагло не выполняла свои обязанности, из-за этого случайно нарушили чужи авторские права.
Не предприняли никаких действий.
Когда представитель правообладателя предьявил свои права...


Заголовок спойлера

никто даже не подумал про их соблюдение.
оному представителю просто объяснили (совершенно незаконным образом) что ему и его семье лучше предпринять все возможные меры чтобы правообладатель утерся в тряпочку, а в самом конце разговор на тему того, что возможно проще не в суде (пусть и пристрастном) развалить дело а тупо послать

Позволю себе с вами не согласиться. Здесь будет уместен другой пример. Если художественная школа будет обучать учеников показывая им ваши картины открывая их в интернете и не "сохраняя" их у себя. Налицо коммерческое использование и необходимость соответствующего лицензирования.

И да, я понимаю, что термин сохраняя здесь технически не корректен, но и нейросеть при обучении, тоже скачивала изображения.

Не так однозначно.
Допустим я качаю Stable Diffusion себе и запускаю.
На поиграться.
Где в данном случае будет коммерческое использование и кем?

Только «школа» тут как раз некоммерческая, учит своих учеников бесплатно, на общественных началах. (Вот ученики потом, научившись возможно будут пытаться за счет полученных навыков зарабатывать).

Если вернуться от аналогии с конкретному случаю: Каталог которому фотограф пытался претензии и иски выставлять — некоммерческая организация, которая за использование собранных данных (и это даже не сами картинки/фотки, а только ссылки/url на те места в интернете, где владельцы их САМИ выложили в открытый доступ) ни с кого денег не берет.

Только у вас не ученик, а станок которым вы потом деньги зарабатывать планируете.

Налицо коммерческое использование и необходимость соответствующего лицензирования.

Лицензироваться будет образовательная деятельность, а не показ картин. И лицензироваться государством, а не авторами.

Как эксперт по авторскому праву, я убежден, что обучение нейронных сетей на общедоступных изображениях не нарушает авторское право. Во-первых, использование изображений в обучающих целях не является их воспроизведением, демонстрацией или распространением в коммерческих целях. Во-вторых, запрет на использование в обучении фотографий, изображающих защищенные авторским правом объекты или авторские произведения, не распространяется на изображения, находящиеся в открытом доступе. Таким образом, обучение нейронных сетей на общедоступных изображениях не нарушает авторское право.

не распространяется на изображения, находящиеся в открытом доступе

Почему вы, как эксперт по авторскому праву, приравниваете слова "находится в открытом доступе" к понятию "опубликован под свободной лицензией"?

ISO-шники Windows, если что, тоже находятся в открытом доступе и скачиваются с MSDN.

Искусство и софт - это разные вещи.

ГК РФ Статья 1274. Свободное использование произведения в информационных, научных, учебных или культурных целях

4. Создание произведения в жанре литературной, музыкальной или иной пародии либо в жанре карикатуры на основе другого (оригинального) правомерно обнародованного произведения и использование этих пародий либо карикатуры допускаются без согласия автора или иного обладателя исключительного права на оригинальное произведение и без выплаты ему вознаграждения.

Хоть я и не являюсь экспертом по авторскому праву, но несколько доводов на это все же приведу:

  1. Сомневаюсь, что ГК РФ действует в контексте оригинального поста

  2. Сомневаюсь, что нейросеть является субъектом ГК РФ, даже если бы действовал

  3. Лица же, которые являются непосредственно субъектами законодательства, никаких карикатур и пародий не создавали, а вполне себе использовали фотографию в коммерческих целях.

  4. Fair use, думаю, тоже не про этот случай.

  5. Научная цель: компания обучила нейросеть и опубликовала статью, что архитектура X дает прирост +Y% по метрике Z на датасете W. Я не знаю, насколько это юридически допустимо в США/Европе, но с моральной стороны к такому вопросов у меня в общем-то особо нет. Коммерческая цель: компания обучила нейросеть и запустила её как сервис. Вот тут у меня огромные вопросы, потому что всё, что такая нейросеть генерирует - это производные работы от увиденного.

Нейронная сеть не воспроизводит оригинальный объект авторского права, Она только вдохновляется и генерирует что-то своё. С помощью Photoshop можно скопировать любое изображение защищённое авторским правом. Можно ли автором Photoshop предъявить нарушение авторских прав?

Так я нигде не говорил, что нейросеть воспроизводит оригинал. Нейросеть генерирует производные работы.

По второму вопросу - разработчикам фотошопа нельзя, авторам нейросети нельзя. Оператору нейросети как сервиса, если изображение оттуда вылезло - можно.

Даже если она оттуда вылезла для личного пользования, то оператору предъявить ничего нельзя. Только когда оператор пройдёт продавать Это изображение, то тогда можно к нему что-то предъявить. И то нужно проводить независимую художественную экспертизу.

Оператор уже продает услугу генерации таких изображений. Для личного использования - это если вы себе веса скачаете и питончику скормите.

В Фотошопе (оператор) можно нарисовать руками картинку, которая будет нарушать авторские права, например на торговый знак. Photoshop взимает деньги за использование своего программного продукта.

По вашей логике получается, что Photoshop нарушитель

Моментом преступления является коммерческое использование объекта, защищённого авторским правом. Объектом является сама картинка, уже сгенерированная. Пока сгенерированная картинка лежит локально и никак не используется, факта преступления нет.

Это как если бы я у себя в блокноте нарисовал значок кока-колы, и оставил валяться его на полке. А мне предъявили претензию о нарушении авторских прав

Объект авторского права - исходные фотографии или картины, нарисованные живыми людьми.

Момент использования - когда фотография, будучи в обучающем датасете, повлияла на веса нейронки.

Момент коммерческого использования - когда с этой нейронкой запустили сервис для генерации производных работ.

Не надо приписывать мне логику, которой я не оперирую, а потом героически ее опровергать.

Момент использования — когда фотография, будучи в обучающем датасете, повлияла на веса нейронки.

Так в том-то и проблема, что никак невозможно доказать, что она действительно повлияла.
Потому что при подготовке к тренировке датасет сперва фильтруется (удаляется часть изображений для получения более сбалансированной выборки — а то ведь если там 90% гор и только 10% облаков, то нейронка в каждом облаке будет видеть гору), а потом ещё и рандомно делится на две части — обучающую и валидационную.
На веса нейронки влияет только обучающая часть, а валидирующая нужна лишь для контроля качества обучения и хода процесса, и никаких изменений в нейронку не вносит (это сигнал операторам, а не самой нейронке).
Соответственно, у фотографа нет и не может быть доказательств, что его фотка прошла фильтрацию, а потом ещё и угодила в обучающую выборку. Даже сами операторы, которые обучали сеть, не знают точно, какие именно фотографии из датасета реально влияли на веса.

Ну обычно даже больше чем на 2. Train/validation для обучения и пара тройка кусков для ручной валидации.

а пусть докажут что нет. так то если я зазипую картинку - тоже муть какая-то получается. а потом раз, вжух и назад картинка

Она только вдохновляется

Поясните, пожалуйста, осмысленность применения слова "вдохновляется" применительно к нейросети, особенно в контексте юридического спора.

1) На пародию/карикатуру/etc. это не похоже.

2) Свободное использование произведений для науки и т. п. разрешено только в РФ и еще паре стран. В остальных надо либо платить, либо бесплатно, но с разрешения. Не встречали в иностранных учебниках подписи под картинками или таблицами типа «с любезного разрешения Джона Джексона и „Буллщит Инкорпорейтед“»?

Российский закон требует делать такие же подписи. Хуже того — российский закон запрещает использовать для науки и тому подобного охраняемые произведения, которые не были опубликованы.

Подробнее: 1274 статья Гражданского кодекса РФ (полный текст в википедии). Как видите, нужно указывать источник заимствования.

Российский закон требует делать такие же подписи.

Не такие же. Вы можете просто цитировать и ставить ссылки. И все это без разрешения.

российский закон запрещает использовать для науки и тому подобного охраняемые произведения, которые не были опубликованы.

В науке принято ссылаться только на опубликованные результаты исследований.

Как это не такие же? ГК требует указывать источник заимствования, а музейный закон требует получать разрешение от музея. Поэтому, если вы цитируете в книге фотографию музейного предмета, надо указывать и источник фотографии (автора или издание), и музей.

В науке принято ссылаться только на опубликованные результаты исследований.

Смотря какая наука. В исторической науке сплошь и рядом принято ссылаться на архивные документы, приводя цитаты из них, и вот здесь-то возникает множество нарушений копирайта.

 музейный закон требует получать разрешение от музея

И получается противоречие с ГК. Впрочем, в этой стране это не удивляет.

если вы цитируете в книге фотографию музейного предмета

Фотография — это самостоятельное произведение.

архивные документы

— это понятие ну очень растяжимое. А фотография архивного документа — самостоятельное произведение. Тут, если начать копать, можно дойти до неправильности всего законодательства, и не только российского.

На самом деле нет, никакого противоречия не возникает. Потому что юридические школы дали этому вполне чёткое объяснение.

1) Музейный закон является специальным правом, а ГК является общим правом, поэтому музейный закон применяют в уточнение и дополнение к ГК. Поэтому музейный закон ничему не противоречит.

2) ГК является кодифицированным правом, а музейный закон не является таким, поэтому ГК имеет приоритет перед музейным законом и ничему не противоречит.

3) Суд по интеллектуальным правам специально указал, что музейный закон «не противоречит доктрине свободного использования произведений, перешедших в общественное достояние, а лишь ограничивает коммерческое использование воспроизведений предметов музейных коллекций».

Российское право построено не по юриспруденции, а по легистике. Напомню разницу.

Юриспруденция — это наука, которая опирается на аксиомы (например, человек владеет своим телом, человек управляет своими поступками), а из этих аксиом логически выводит все законы.

Легистика — это наука, которая опирается на тексты указаний от начальства, а из них выводит удобные применения полезных текстов.

Именно поэтому СИП и пишет, что свободное использование включает в себя запрет на коммерческое использование. Таков результат легистики.

Подробнее можно читать по ссылке на polit.ru.
можно дойти до неправильности всего законодательства, и не только российского

Ой, а давайте ещё обсудим, почему публикация изображения и описания музейного предмета в Государственном каталоге Музейного фонда не является публикацией?

Почему музей, опубликовав изображение и описание предмета, всё равно сохраняет за собою право первой публикации этого предмета и запрещает другим людям публиковать этот предмет? И что означает в данном случае публикация — показ на выставке или печатание статьи в научном журнале?

Со своей стороны могу суммировать так. Практика показала, что музеи, как правило, не считают показ предмета на выставке его публикацией, и никогда не считают показ предмета в Госкаталоге его публикацией. Публикацией принято считать одно из двух: либо статью о предмете, напечатанную музейным сотрудником в журнале либо книге, либо статью о предмете, напечатанную после оплаченного разрешения от музея. (Но это не логика и не юриспруденция, а сумма практики.)

А к каким юридическим выводам пришли вы?

А к каким юридическим выводам пришли вы?

К одному: ГК писали юристы, а пользоваться вынуждены люди. Бардак в каждой строчке.

Например, условный Малевич написал условный «Черный квадрат» и умер. Через 70 лет произведение стало общественным достоянием, но подлинник висит в музее. Использовать фотографию музея просто так нельзя (гони бабло), придти и сфотографировать самому — тоже нельзя. Получается, что никакого общественного достояния, и все прикрываются какими-то законами, которые по каким-нибудь экспертизам и решениям судов не противоречат ГК/Конституции/всему подряд. А деньги на функционирование музея выделяют из бюджета, в который я заплатил налоги, между прочим, то есть вся эта работа по созданию госкаталогов и фотографий мною уже оплачена.

То же самое и с архивами. И если картина в музее хоть как-то попадает под авторское право и его регулирование, то с архивными документами вообще трэш. Тексты документов под действие авторских прав не попадают, архив к их созданию отношения не имеет, но бабло спрашивают за каждый чих, получая при этом деньги из бюджета. Оцифровать все и выложить в паблик никто не хочет. Ну и ситуации, когда Костромской архив про...л (извините, другого слова подобрать не могу) весь свой архив, считаются нормой. :-(

ГК вполне разумен, строг и логичен. Конечно, не все сразу замечают эту логику. Я её несколько лет искал. Поэтому, если вы спросите о конкретной проблеме, я готов объяснить.


1) Картина Малевича висит в музее, как вы сказали. Тут возникает выбор: или отнять деньги у министра и отдать музею, или дать музею возможность самому собирать деньги на своё существование. Второе намного выгоднее. Кроме того, существует догма о том, что частный владелец выгодно распоряжается капиталом, поэтому надо дать музею те же инструменты, которые есть у частного владельца, и это будет намного выгоднее. → В законе сказано, что музей может требовать деньги за использование изображений своих предметов.


2) Вы пишете, якобы есть общественное достояние. Давайте проверим. Общественное достояние есть в случае, если это отражается на жизни общества. Как отражается? Через общественную деятельность. Чтобы определить, есть ли общественное достояние, мы должны найти, как деятельность общественных организаций его создаёт. Мы должны найти, как общество само защищает свои интересы. А оно никак их не защищает. Напротив, оно развалилось на выгодных предпринимателей, которые хотят защитить личный интерес. → Следовательно, общественное достояние будет разрушаться.


3) Вы пишете, якобы деньги на функционирование музея выделяют из бюджета. Пожалуйста, найдите в интернете две статьи про встречу губернатора Турчака с сотрудниками музея, и вы узнаете оттуда, что происходит на самом деле. Я могу ещё в личке рассказать.


4) Да, работа по созданию Госкаталога оплачена, поэтому вы имеете бесплатный доступ к просмотру Госкаталога, если конкретный музей вам это дозволит. А если не дозволит, тогда не имеете такого доступа. Согласно общей догме, музей только тогда будет эффективным, когда станет выгодным. Ведь в нашей стране с 1991 года действует капитализм и всё оценивается деньгами.


5) Тексты архивных документов, как правило, попадают под действие авторских прав. На мой взгляд, добрых 70% таких документов охраняются авторским правом. Но этот вопрос посторонний. Ведь вы спрашиваете, почему архив требует денег? Причина совсем другая. Причина в том, что, по общей догме, архив будет эффективным, когда станет выгодным, прибыльным. Каждое предприятие само зарабатывает себе прибыль. Следовательно, архив должен сам зарабатывать себе прибыль, а не тянуть деньги из казны.


6) Ничего не знаю про события в Костроме.

По пунктам 1 – 5:

1) Я очень, очень, очень хорошо знаю, как выделяются деньги музеям (и вообще культуре), и как их тратят. Тем более, что я живу в той же области в 120 км. от Вас. :-)

2) При капитализме не все сводится к получению прибыли. Есть всякие общественые товары, социальная поддержка и прочее, и прочее, и прочее. Архив — типичный общественный товар, поэтому он должен жить за счет бюджета, который оплачивает реальные издежки его работы.

3) ГК (как и другие нормативно-правовые акты) — это совершенно жуткий документ, лишенный какого-либо здравого смысла. Корявые формулировки, постоянные исключения из исключений, множество сущностей, созданных на ровном месте... ГК 1922 года и то лучше был.

2) Это вы говорите про евро-социализм, наверное? В России архив получает от государства задание и получает субсидию на его выполнение. Предоставление коммерческих услуг гражданам не входит в это задание. Архив может сам их оказывать за отдельную плату.


3) ГК пропитан здравым смыслом, и я готов объяснить вам это на примерах. Пожалуйста, давайте примеры.


Впрочем, далеко не всегда это будет здравый смысл бедных физлиц. Сплошь и рядом это здравый смысл крупных и богатых юрлиц и предпринимателей.

Предоставление коммерческих услуг гражданам не входит в это задание.

Почитать документы и получить справку/выписку — это по своей сути не коммерческая услуга. У архива вообще не может быть коммерческих услуг, ну разве что рекламный щит на стену здания повесить.

ГК пропитан здравым смыслом, и я готов объяснить вам это на примерах. Пожалуйста, давайте примеры.

Статья 1079. Да, вред пострадавшим возмещать нужно. Но почему его должен возмещать собственник источника повышенной опасности, а не конкретный человек, который им управлял и допустил ошибку? Не ООО в целом косячит, а лично Иван Иваыч Иванов. Где логика??? (Второй вариант: накосячил производитель оборудования — пусть он выплачивает.)

Почитать документы и получить справку/выписку

Читать документы можно и без оплаты. Получить справку, которую архив должен предоставлять по требованию закона, можно и без оплаты. Эта работа входит в государственное задание и субсидирована.

У архива вообще не может быть коммерческих услуг

Пример: генеалогический поиск предков по метрическим книгам.

Пример: копирование документов по заказу издательства.

Пример: подготовка документов к самостоятельной фотосъёмке в читальном зале.

Пример: подготовка копий архивных описей и справочного аппарата по заказу издательства.

Пример: предоставление документов для коммерческих телевизионных фильмов и кинофильмов.

Пример ...

Это все попытки заработать на воздухе. И идут они от требований департаментов.

Не только департаменты были инициаторами.

В журналах перестроечного времени, между 1989 и 1993 годами, в том же «Огоньке» — легко найти статьи, в которых обсуждается положение учреждений культуры. Сами сотрудники с гневом пишут, что коммерческие предприятия получают прибыль от использования памятников культуры, а сотрудники учреждений не получают никакой прибыли. Получается, что сотрудники учреждений предоставляют ресурс, ренту от которого получает постороннее лицо, не потратившее собственных сил на обслуживание ресурса.

Хотя, конечно, департаменты тоже существуют не при советской власти, а в капиталистическом государстве, и поэтому перед департаментами стоит ровно та же задача: надо стать эффективными менеджерами, чтобы получать пользу, измеряемую в доходных рублях.

Получается, что сотрудники учреждений предоставляют ресурс, ренту от которого получает постороннее лицо, не потратившее собственных сил на обслуживание ресурса.

Посторонее лицо платит налоги в бюджет, за счет которых содержится ресурс. Мало того, посторонее лицо (будем считать физическое) есть гражданин государства, которое было создано в том числе и для владения и управления этим ресурсом, поэтому такой ресурс на 1/150 000 000 принадлежит конкретному «постороннему» лицу.

поэтому перед департаментами стоит ровно та же задача: 

Перед департаментами должна стоять задача правильного распределения денег на обслуживание совместной собственности граждан.

«Нет никаких государственных денег, есть деньги налогоплательщиков!» (Маргарет Тэтчер.)

Логика в том, что собственник принимает решение о том, кому доверить распоряжение этими опасными средствами. Собственник несёт ответственность за свою собственность.

Ага. Из той же серии:

  • ты должен служить в армии, потому что ты родился мужиком с яйцами;

  • ты не можешь голосовать, потому что ты родился негром;

  • тебя надо в газенваген, потому что ты похож на еврея.

Ну и если уж совсем до логики докапываться, то почему в той же статье ответственность возлагается на владельца, если объект был во временном пользовании у другого лица? Почему не на собственника? Он же доверил другому лицу свою собственность? И почему по той же статье «хозяин» (чтобы много не писать) освобождается от ответственности, если объект у него украли и после кражи укравший причинил вред? Собственник, получается, плохо смотрел за своим имуществом...

6) Ничего не знаю про события в Костроме.

16 августа 1982 там сгорел областной архив. Весь.

Официально трое дебилов из соседней школы залезли на крышу бывшего собора в бывшем монастыре, нашли открытое окно и кинули туда зажженную газету, чтобы посмотреть, что там. А там были документы, которые лежали на деревянных полках, которые стояли на деревянных перекрытиях в несколько этажей. Лето было жаркое, поэтому загорелось все и моментально. Соседние дома эвакуировали, почти все документы сгорели, то, что не сгорело, залили водой, и теперь каждая папка — это кусок плотно спрессованного картона толщиной несколько сантиметров.

Уголовку прекратиили за малолетством поджигателей, а руководству архива, пожарных и московскому начальству обоих — ничего. Хотя явно начальство профукало все, что можно. Документы хранились не пойми где, доступ открытый, никаких систем пожаротушения, не было даже инструкций по тушению архивов. ИЧСХ, в то время уже было построено новое здание для архива, в которое начальство не хотело переезжать.

почти все документы сгорели

Спасибо. А вот пишут, что пропала только треть архива, остальное сохранилось.

кусок плотно спрессованного картона

Вы видели эти куски?

Треть — это то, что не нашли вообще. Из остального очень много попорчено до состояния нечитаемости. Причем документы хранились по уездам, и какие-то выгорели полностью, до последнего листочка.

Вы видели эти куски?

Их не выдают. :-( Так что либо на фото, либо на видео в репортажах местных новостей.

Во-первых, использование изображений в обучающих целях

Думаю, когда писали законы, то подразумевали все ж таки обучение людей с их очень ограниченными возможностями. А вот нейросети обучают чаще всего как раз для коммерческих целей. Более того, их потенциальные способности по воспроизведению сильно превосходят человеческие.
Как пример: скажем, в своей максиме можно спроектировать 2 нейросети так, что одна будет кодировать изображение, а вторая восстанавливать почти до уровня оригинала (визуально почти неразличимых). Между ними будет некоторый недоступный для человека язык, так вот центральный вопрос: считать ли описанное на этом языке изображение и получившееся в результате изображение — независимым, отдельно нарисованным? это ведь может перечеркнуть все авторские права вообще. Мол, прогоняем любое изображение через эту нейросеть и плюем на авторство.

Люди тоже учатся исключительно для коммерческих целей, как минимум зарабатывать на результатах своей интеллектуальной деятельности или хотя бы за зарплату. Если какой-то художник нарисует абсолютно точную копию Моны Лизы, то суд естественно скажет, что это копия и конкретного произведения, Даже если он сам нарисовал.

нейросети Кстати рисуют обычно очень далеко от оригинала

Я ещё пару лет назад писал, что нейросети наносят по всей системе авторских прав настолько чудовищный удар, с каким ей ещё не приходилось сталкиваться.
Проблема даже не в том, что в общем случае абсолютно невозможно доказать, что при обучении нейронки использовались вот именно ваши закопирайченные материалы.
Проблема в том, что любой скопированный материал можно пропустить через нейронки так, что оригинал будет и не угадать. Смена стиля, замена одних персонажей другими, скрещивание нескольких композиций — и вот уже ни один эксперт не поймёт, что это производное произведение.
Т.е. копирасты попросту лишатся возможности обнаруживать факт копирования и реиспользования своих материалов.
Именно поэтому я даже не сомневаюсь, что нейронки будут давить, и очень скоро. Разработка и использование нейросетей неизбежно станет лицензируемым видом деятельности с авторским сбором с каждого чекпоинта, с налогом на GPU, с обязательной регистрацией каждой нейросети в аккредитованном сертификационном центре и с обязательным DRM.

Проведу аналогию - раньше для печати книжек требовался печатный пресс. Потом появились печатные машинки, а потом ксероксы, а потом вообще возможность хранить книги в электронном виде и читать их на телефоне или компьютере. Катастрофы не произошло.

Не удивлюсь, если создатели сериалов одни из первых начнут использовать нейросети, и это позволит создавать хороший контент с меньшими расходами.

Не удивлюсь, если создатели сериалов одни из первых начнут использовать нейросети, и это позволит создавать хороший контент с меньшими расходами.

И будет как с переработанной едой - да, проблема голода решена, но отчего-то ожирение, диабет и болезни уже в 35, а то и раньше.

То ли дело раньше: в 30 старость, в 35 смерть от старости - и никаких болезней!

Если смотреть внмиательно на статистику, особенно в традиционных общества охотников-собирателей, то выясняется, что детская смертность всегда была очень высокая, но если человек доживал до совершнолетия то имел неплохие шансы дожить и до 60 и даже до 80.

А ещё это позволит создавать плохой контент в 100 раз дешевле, чем сейчас, так что он внезапно начнёт окупаться. И выцедить что-то годное из этого океана шлака будет ну очень сложно. Особенно учитывая, что благодаря нейронкам можно будет генерировать очень правдоподобные отзывы и обзоры.
Из новостей: Известный журнал Clarkesworld прекратил прием рукописей от новых авторов, потому что редакцию завалили текстами, сгенерированными с помощью ChatGPT. Только в феврале 2023 г. было выписано 500 отказов на такие тексты.

Плохой контент и до нейронок ничего не стоил, на фриланс биржах с индусами можно было заказывать копирайт по доллару за страницу

Ну скорее бакса два. А теперь будет всего несколько центов, ЕМНИП даже у полной оригинальной GPT-4 коммерческий доступ 0.06$ за 1000 токенов (это как раз ~условная страница текста).
А по мере развития технологии через некоторое время станет еще в разы дешевле.

И выцедить что-то годное из этого океана шлака будет ну очень сложно.

Не будет. На следующем шаге будет нейронка, которая будет выцеживать (ну или сразу генерировать) ровно то, что пользователю нравится и/или нужно. Далее - прогресс вплоть до определения насколько нравится, по сканированию активности мозга.

Известный журнал Clarkesworld прекратил прием рукописей

Они и раньше бы не справились, если бы им посылали все то, что там на амазоне и разном англоязычном самыздате публикуется. Тут просто всплеск интереса произошел 'а что они с этим делать будут?'. Через некоторое время разгребут завал.

UFO just landed and posted this here

Без критики, просто интересуюсь, почему для обучающих целей сделали исключение? И это во всём мире так? То есть вот фотограф, или художник, он выложил на свой открытый сайт с рекламой свои работы под соответствующим условием/лицензией. По которой можно смотреть на его сайте, но перепечатывать, переразмещать на других сайтах и другое использование можно только с разрешения владельца изображения. И вот преподаватель художественной школы в классе открыл это изображение на проекторе и сказал ученикам "учимся рисуем вот это", платить автору и даже спрашивать не будем, у нас обучение. Даже если владелец изображения не разрешал это, то закон автоматом включает обучение в разрешённое использование?
А какие границы у этого? Условно почему бы MTV не назваться обучающим каналом чтобы брать музыку бесплатно?

Система авторских прав настолько убога и неестественна, что такие вопросы буквально сотнями возникают на каждый чих, а ответы на них ни разу не очевидны.
У каждой крупной корпорации есть мощнейший патентный отдел, который занимается проверкой всего подряд на патентную чистоту и правомерность использования. А ещё есть мощнейший юридический отдел.
И всё равно каждая из этих корпораций ухитряется регулярно проигрывать копирайтные тяжбы!
То есть даже с привлечением существенных ресурсов и кучи экспертов разобраться со всеми вопросами копирайта как-то не выходит. Так что уж говорить о простых смертных…
Фактически, каждый из нас, кто хоть раз занимался любым творчеством, гарантированно хоть где-то нарушил копирайт. Спасает только принцип Неуловимого Джо — копирастам нет смысла судиться за каждый чих с теми, с кого и взять-то нечего.
Но вот как только вы начнёте зарабатывать своим творчеством достаточные суммы, чтобы привлечь внимание копирастов и патентных троллей, вам гарантированно придётся платить и каяться.

Система авторских прав настолько убога и неестественна

Основная неестественность - что в ней практически 'забыли' налоги на собственность. Если бы за утверждение 'Право пользования (точнее, все права, как у как у текущего владельца) моим патентом или музыкальной библиотекой стоит X килоденег' немедленно бы приходил счет от налоговой (ежегодно) на X денег - то все было сильно легче.

ИМХО смысл общечеловеческий - вне зависимости от того кто может платить, а кто нет - люди по возможности должны учиться и передвать знания/умения следующим поколениям и эта задача более важна чем получение прибыли в краткосрочной перспективе.
Другой вопрос, что идея, что каждый чих должен стоить денег тоже распространяется пропрционально техническим возможностям эти чихи контролировать.

Обучение людей и обучение нейросети - разные понятия. Точнее сказать - нейросеть не обучается а создается на базе многих удачных изображений. А полученный программный продукт может быть по разному использован. Если в коммерческих целях, то уж извините, платите за использование чужого труда и опыта.

Нейросеть не сама, не своими камерами увидела красивый пейзаж, не сама оценила его красоту. В нее загрузили удачные кадры сделанные людьми. Человек долго обучался и сделал много проб, т.е. проделал большую работу. А создатели нейронки просто воспользовались работой ремесленников.

Сам я против безумных авторских прав, но присваивать чужой труд просто так, без согласия, тоже неправильно.

Фотограф когда учился, тоже смотрел удачные кадры других авторов. Надо из его мозга срочно удалить все нейроны, запомнившие чужие авторские работы 😊

Так не у нейронки же требуют развидеть. Претензия направлена компании, которая взяла фотографии в качестве корпоративных обучающих материалов для своего сотрудника. Который потом работает на эту компанию рисуя картинки на базе этих материалов для клиентов компании. Это выглядит как коммерческое использование.
То что подстраховались, и сделали компанию прокладку которая "мопед не мой, я только сделал каталог ссылок", чтобы сложнее было предъявить им, ну то такое. Только подтверждает то что они сами понимают, что поведение, возможно, не очень чистоплотное.
Причём человек даже не просит денег, просто попросил больше так не делать и убрать из обучающих материалов его работы которые компания без спроса использует для обучения своих искусственных сотрудников. А ему(!) ещё и счёт выкатили.

Причём человек даже не просит денег, просто попросил больше так не делать и убрать из обучающих материалов его работы которые компания без спроса использует для обучения своих искусственных сотрудников. А ему(!) ещё и счёт выкатили.
Пока в законе нет разделения на то, кто использует материалы для обучения — искусственный или реальный сотрудник, просить о чем-то у него есть только моральное право.
Он же решил судиться. Ну, talk shit — get hit. Еще бы на патентных троллей это так работало, чтобы они на галерах штрафы за свою деятельность отрабатывали годами потом… Мечты.

Мне вот очень интересно что там за картинки такие и почему нельзя было посмотреть ГДЕ они лежат, попросить источник убрать (тут как бы оснований побольше, и DMCA-запрос штука отработанная, и в судах — тоже. И обычно все же запрос выполняется даже не-американскими компаниями если основания — есть.
Не потому ли что как раз попробовал и выяснилось что в данном случае оснований убирать таки нет?) а потом написать LAION'у что нету по этим ссылкам ничего — уберите плиз.

Не потому что «попробовал, но не получилось», а потому что и НЕ ХОЧЕТ убирать их из открытого доступа. Хочет чтобы они и дальше были доступны «неограниченному кругу лиц» и «без регистрации и без СМС»(с), т.к. среди этого круга лиц находятся его потенциальные клиенты (что захочет использовать его фотографии и опубликовать их где-то у себя с отчислением за это использование автору или кому просто нужна версия в высоком/полном разрешении, а не только уменьшенные превью).

Но при этом хочет запретить именно нейросетям ходить их смотреть во время их обучения/тренировки (оставив в открытом доступе для всех остальных). Т.к. они
1 — они их точно никогда не купят
2 — начинают создавать ненужную ему конкуренцию на рынке (это фотосток фотоограф, так что фото там в основном «самого общего плана» хотя и качественные, которые как раз скоро будет проще генерировать нейросетью по конкретному запросу именно то, что нужно, чем просматривать каталоги фотостока в поисках более-менее подходящей)

Если "нейронка" автора натренирована меньшим количеством датасетов чем AI "нейронка" то такой контент будет плагиатом(первый попавшийся вариант будет открытием даже если он будет просто откровенной копипастой(но только для нажимателя кнопки "сделай красиво"), если большим, то для самого "автора" всё будет плагиатом. Фотографы по сути нажимаю такую кнопку, а всё остальное зависит от зрителей. Статья детектор. Сплошная рекурсия.

А я соглашусь с фотографом. Да, даже в случае того, что он сам выложил фотки в паблик и да, за просмотр роялти не насчитывается, и да, он это сделал сам.

Но!

Суть и разница в следующем. И фотограф и ИИ занимаются бизнесом, по сути они конкуренты (схожесть продукта и схожесть клиентской базы). Поэтому между ними есть явный конфликт интересов.

Фотограф выкладывал свои фотки бесплатно потому что таким образом он создавал свой профайл, портфолио, тем самым выстраивая свой бизнес. А тут просто к нему подошли и украли у него бизнес. Речь не о фотка как об объекте авторского права, а о бизнесе как объекте права. Это как если бы одна компания имея просто грубую физическую силу пришла к другой компании и силой отобрала всё управление её заводом. Так не могут сделать потому что за это есть статья. А эти с ИИ так делают именно потому что за это нет статьи.

Поэтому я согласен с фотографом, что нужно делать легальный фраймворк в области регуляции ИИ

Да пошли эти правоносы, со стороны это выглядит как моська и слон, прогресс перетрёт их, и не заметит. Их суды замедляют процесс, но не останавливают.

Можно привести и противоположное мнение/гипотезу. Мне думается, что свободные проекты прижмут юристы от капитала (т е крупных фотобанков скорее всего). А коммерческим проще (и что главное дешевле) будет согласиться с новыми правилами: хочешь что бы не было претензий, бери для обучения либо платный контент с оплатой его стоимости, либо со свободной лицензией, где чётко прописано что можно использовать его для этого.

ПС: сам я вообще за то, что бы художники творили не ради денег, но до такого нам очень далеко. А потому надо быть реалистом: либо эта работа будет оплачена, либо еë перестанут делать. Потому и думаю, что в итоге ситуация склонится к платным базам для обучения, как бы это не было печально.

Коммерческим будет ещё проще — они по-прежнему смогут брать в обучающую выборку всё, до чего дотянутся, только не кричать об этом на каждом углу.
Как проверить-то, на чём именно обучали нейронку, если веса нейронки полностью закрыты (коммерческая тайна!), а крутится она где-то на серверах корпорации?
Так что такая инициатива бьёт исключительно по открытым проектам, но никак не мешает корпорациям зарабатывать на нейронках деньги. Даже помогает — когда нет открытых альтернатив, то платить за доступ к нейронке будут все.

Даже если и веса есть - разве по ним можно воссоздать обучающую выборку? Сомневаюсь. А открытым проэктам ничего не станется ибо они не совсем то и существуют в правовом поле. Вот что корпорации могут перестать выкладывать наработки в опенсорс - это да, проблема.

Github уже неоднократно банил открытые нейросетевые проекты. Даже самый известный GUI для Stable Diffusion от AUTOMATIC1111 пару раз уходил в бан, и у них прямо в readme висит ссылка на сторонние репы, с которых можно будет обновляться в случае, если опять забанят.
Просто сейчас за нейронки ещё не взялись толком — они существуют в правовом вакууме. Причём на этот раз против копирастических корпораций с деньгами и связями выступают точно такие же корпорации с не меньшими ресурсами. Поэтому копья в судах будут ломаться достаточно долго и года четыре относительно спокойной жизни у опенсорсников ещё есть.

Прогресс цивилизации в целом это не про технологии, не про то как быстро мы будем считать и вычислять и автоматизировать всё а сами отдыхать с кружечкой кофе на кухне. Прогресс это про успех и уровень благосостояние, уровень счастья каждого человека в социуме. Это определение далеко вне "технического" прогресса. А законы и юристы для того и нужны чтобы балансировать развитие. Уравнивать, убирать перекосы. Если ИИ заберёт у всех работу то никакого счастья и прогресса цивилизации не будет потому что работа это не только про деньги, это про self идентификацию, про передачу энергии человек-человек. И так далее

про передачу энергии человек-человек

Тепловой энергии чтоль? Интересная у Вас работа. А если серьёзно - у нас тут инженерный ресурс, а не религиозная организация.

Хорошо, прогресс порвет их. Что будем делать, когда фотографов не останется и новых хороших фотографий в высоком качестве не будет?

Можете назвать хоть одну профессию, которая исчезла целиком и полностью? Даже кучеры и конюхи никуда не делись, просто их стало меньше.
К тому же даже полная невозможность зарабатывать на фотографии деньги не означает, что желающие качественно пофотографировать резко закончатся. Те же астрономы-любители вполне себе процветают, хотя телескопы с большими зеркалами стоят бешеных денег и вообще это хобби чрезвычайно дорогое, ресурсоёмкое и времязатратное.

Не совсем и исчезла — слилась секретарем на ресепшене
www.superjob.ru/pro/5369
2.2. прием и перераспределение телефонных звонков;


многие компании входящие телефонные звонки пропускают через живого оператора, чтобы он фильтровал спам и разруливал вопрошающих
Что будем делать, когда фотографов не останется и новых хороших фотографий в высоком качестве не будет?

Для проверки вашей гипотезы была создана википедия. Оказалось, что если не платить фотографам — они начинают покупать полнокадровые камеры с дорогими объективами, делать фотографии и бесплатно лицензировать их для свободного использования.

Всё-таки уничтожить фотографирование очень трудно, потому что оно помогает людям.

Я могу ошибаться, но подозреваю, что сканирование старых фотографий было подстегнуто прогрессом и появлением различных фотобанков и появлением возможности как-то на этом заработать.
То же самое относится и к дорогим камерам и оптике - в результате прогресса появилась потребность в более высоком качестве изображений, появилась возможность (мегапиксели постоянно растут) и это стало доступно.
И я не думаю что вы где-то сможете бесплатно взять изображение в сколько-нибудь высокого разрешения и тем более в raw.
Более того, в лицензии вполне может быть использовано на некоммерческое использование, т.е. смотреть - пожалуйста, поставить на рабочий стол на домашнем компьютере - тоже. А вот на использовать на сайте или напечатать в каком-нибудь журнале - уже нельзя.

Я могу ошибаться, но подозреваю, что сканирование старых фотографий было подстегнуто прогрессом и появлением различных фотобанков и появлением возможности как-то на этом заработать.

По счастью, и эта гипотеза тоже была проверена! Фирма Nikon выпускала превосходные сканеры для фотоплёнки. Однако в 2006 году она перестала их производить. Почему? Потому что сканирование старых фотографий не окупается доходами от фотобанков.

С тех пор миновало уже двадцать лет. Слайд-сканеры продаются, переходя из рук в руки, потому что люди продолжают сканировать свои фотоплёнки и публиковать такие снимки в википедии. Остроумный опыт фирмы Nikon показал, что нельзя остановить этот процесс ни деньгами (через неоплату фотобанком), ни заводом (через прекращение производства). И не платят людям, и не выпускают сканеры, однако люди продолжают снимать на плёнку и сканировать.

не думаю что вы где-то сможете бесплатно взять изображение в сколько-нибудь высокого разрешения и тем более в raw.

Почему-то все ваши гипотезы оказываются уже проверенными. Вот гляньте на три примера.

1) Полторы тысячи фотографий, снятых на шифт-объектив ценою в двести тысяч рублей. На самом деле таких фотографий больше, просто не все размечены по типу объектива.

2) Огромная коллекция фотографий из Рейксмюзеума в Амстердаме. Наверное, фотографии высотой 7000 пикселей годятся под ваши слова о высоком разрешении.

3) Посмотрим на фотографии, сделанные при помощи Hasselblad H6D. Этот фотоаппарат стоит больше 3 миллионов рублей, однако фотографии из этого фотоаппарата вы можете использовать для вашего бизнеса, не уплачивая никаких денег.

Больше примеров — по ссылке в википедии.

Спасибо за ссылки. Я же не говорю что их совсем нет. Только википедия - она же не русскоязычна, а глобальна, да? Какой процент составляют эти полторы тысячи фотографий от общего числа фотографий, размещенных в интеренет (в фотобанках)
Фотографии из музея - это совсем не релевантный пример. Они позволяют получить доступ общественности к просмотру того наследия человечества, которое хранится в музее. И врядли они годятся для обучения нейросетей (ну кроме каких-то довольно специфичных случаев)

Поставим вопрос ещё шире. Какой процент составляют эти полторы тысячи РАЗМЕЧЕННЫХ фотографий от всех свободных фотграфий, сделанных шифт-объективом? Мало кто отмечает, каким объективом снимал. Поэтому предложенная в 1-м пункте выборка отражает малую долю доступных примеров.


Мой пример был не про общее число фотографий. Все мои примеры — о том, что можно потратить и 200 000 рублей, можно потратить и 3 000 000 рублей, однако результат будет доступен для коммерческого использования, а автор снимков не потребует никаких денег. Мои примеры — о том, что не всё в жизни сводится к оплате и может быть посчитано в деньгах.

Если речь о художественных произведениях, то с ними ничего не случится. Фотография не уничтожила живопись, и AI не уничтожит ни фотографию, ни живопись.

А если речь идет о фотографах и художниках, которые коммерсанты (ремесленники), часть из них потеряет работу, потому что их труд не нужен обществу. Если сайт можно дешевле сделать с картинками от AI, давайте порадуемся.

А фотографы останутся. Любители и художники.

Фотография несомненно оказала крупное влияние на живопись. Кубисты и прочий абстракционизм — прямое следствие того что "обычная" живопись с появлением фотографии резко утратила свои позиции. Есть все шансы за то что AI возьмет на себя 99% "рынка изображений" а фотографы и художники будут вытеснены в нишу какого-то трэша который нейросетка генерить не может.

"обычная" живопись с появлением фотографии резко утратила свои позиции.

Но это не так!

Люди платят за картины (иногда сумасшедшие деньги) вовсе не потому, что они похожи на реальный объект в мельчайших деталях.

Или вы под "обычной" живописью понимаете иллюстрации к статьям, на которые читатель бросает мимолетный взгляд на доли секунды? На этом рынке художники и фотографы могут быть вытеснены. С этим-то я не спорю. Но не вижу ничего ужасного, если процесс не будет слишком быстрым.

UFO just landed and posted this here

Вот лично я плачу за картины (иногда сумасшедшие деньги) по той простой причине, что на них изображено то, что принципиально не может быть сфотографировано — например, огнедышащий дракон, дерущийся с тигром в клеточку.

А вы не думали, что сам фотограф своим фотоаппаратом делает точные копии чужих произведений в коммерческих целях? Он же сам ничего не создаёт, а только кнопку нажимает и делает копию.

Может его сначала засудить? 😁

Всё так. Каждую идею можно довести до маразма, в том числе и авторские права.

Каждую идею можно довести до маразма, в том числе и авторские права.
Авторские права не нужно никуда доводить, маразм там и так на каждом углу.

А тут просто к нему подошли и украли у него бизнес. 

Что вы имеете ввиду под словами "Украли бизнес"? У него отобрали юридическое лицо?

Это как если бы одна компания имея просто грубую физическую силу пришла к другой компании и силой отобрала всё управление её заводом.

В описанном сценарии с заводом компания у которой отбирают завод лишается имущества. В сценарии в посте никто имущество не теряет.

Тут скорее про уничтожение малого бизнеса путём нечестной конкуренции. Пример-аналогия: в город приходит крупная сеть гипермаркетов, и все владельцы маленьких торговых ларьков дружно разоряются. У них вроде силой ничего и не отняли, однако им самим приходится распродавать свою собственность за бесценок просто чтобы покрыть долги, а потом спешно закрывать юрлицо.

И где в вашем примере "нечестная конкуренция"? Это обычная рыночная конкуренция.

А что честного в ситуации, когда частнику приходится конкурировать с компанией с миллиардными оборотами? Его раскатают и не заметят, это даже конкуренцией называть смешно.
Именно поэтому во многих странах на крупный бизнес накладываются определённые ограничения, чтобы огородить безопасное поле и для малого бизнеса тоже.

Ага, я вот как вспомню, вместо быдловатых продавцов, которые пытаются то обвесить то обсчитать. Вместо очередей что бы просто узнать есть ли какой-то продукт в наличии. Вместо выбора между 1 вариантом товара и ни одного. Вместо "только наличка" расплачивайся хоть часами, хоть утюгом, если он поддерживает оплату. Да можно вообще обойтись без продавца, и расчитаться на кассах самообслуживания.

Конечно не честная конкуренция. Но что-то не хочется назад.

UFO just landed and posted this here

Уточним пример, чтобы показать, насколько всё это чудовищно.


В городе есть маленькие торговые ларьки. Но вот Пётр Петрович купил себе второй ларёк, третий, и через три года у него уже двадцать ларьков и три магазина и даже столовая. А через шесть лет другие владельцы дружно разоряются, им самим приходится распродавать свою собственность, чтобы покрыть долги, и эту их собственность покупает Пётр Петрович.


У них вроде силой ничего и не отняли, и Пётр Петрович остаётся индивидуальным предпринимателем, — однако вот оно как обернулось!

Немножко занудства — Петр Петрович не сможет остаться ИП, придется оформить полноценную компанию (ну хотя бы ООО) и перейти на полноценную систему налогообложения (никакой упрощенки с низкими налогами).
Можно правда попробовать от этого уклониться, но до поры до времени — пока налоговая и прокуратура не заинтересуются таким «шибко умным» подпадающим под пару статей УК.

А вообще ничего «чудовищного» тут не вижу. Описана обычная рыночная конкуренция. Если конечно условный Пётр Петрович при этом ни к каким дополнительных незаконными методов для выдавливания конкурентов не использовал. Типа подсылать периодически бандитов, которые будут громить/сжигать ларьки мешающих конкурентов (но тогда это вопрос к правоохранительных органам — такого должны отловить, судить и в итоге посадить, вместе с бандитами которых он нанимал), то произойти это может только если ларьки Пётр Петровича работают в чем-то лучше (товары немного дешевле или в среднем качественнее или уровень обслуживания в них выше и т.д.) других и клиенты перетекают к нему уходя от других.
Значит в целом это вообще не ужас, а скорее служит общему благу. Хотя конкретно не выдержавшим конкуренцию владельцам других ларьков это конечно сильно не понравится.
произойти это может только если ларьки Пётр Петровича работают в чем-то лучше (товары немного дешевле или в среднем качественнее или уровень обслуживания в них выше и т.д.) других и клиенты перетекают к нему уходя от других.

Чаще всего это происходит потому, что у Петра Петровича банально больше денег. И он, в отличие от остальных ларёчников, и демпинговать может люто (а когда конкуренты разорятся — поднять цены обратно), и нанять толпу маркетологов, и рекламу во все дыры засунуть включая голосовую из всех уличных репродукторов города, и заказные статьи в газеты протолкнуть, и нанять армию ботов, которая во всех соцсетях и сайтах отзывов конкурентам колов понаставит…
Качество товаров и услуг тут не решает вообще ничего — оно может быть даже гораздо хуже, но это без проблем заливается баблом.

Юридическое лицо это далеко не бизнес, а 5% бизнеса я бы сказал.

Насчёт имущества тоже не понял вопрос. Бизнес это бизнес, это потоки денежные на вход и выход. Это может быть через имущество а может быть и без. В бизнесе главное это поток, а на "владение". А поток у него отняли

Насчёт имущества тоже не понял вопрос. Бизнес это бизнес, это потоки денежные на вход и выход. Это может быть через имущество а может быть и без. В бизнесе главное это поток, а на "владение". А поток у него отняли

Если под "потоком" вы имеете ввиду постоянных клиентов совершающих заказы, то "поток" отнять нельзя потому что клиенты не являются собственностью фотографа.

Приведу такой пример:

Допустим я живу на улице с двумя продуктовыми магазинами А и Б. Каждый день я покупаю продукты в магазине А. В один прекрасный день я замечаю что магазин Б предлагает более качественные продукты за меньшие цены и начинаю закупаться в магазине Б вместо А, из-за чего магазин А теряет "поток" и следовательно несёт экономический ущерб.

Вопросы:

1) Являются ли действия магазина Б (продажа качественного товара по низким ценам) чем-то аморальным? Ведь из-за этих действий магазин А понёс экономический ущерб.

2) Должен ли существовать закон по которому владелец магазина А сможет взыскать "недополученную прибыль" с меня (за то что я перестал покупать у него продукты) или с магазина Б (за то что тот "отобрал поток")?

Там ничего про мораль нет. Если Магазин Б является монополией то ничего хорошего в этом нет. И для этого в государстве существуют антимонопольные законы. Отвечая на вопросы 1. да если это монополия, 2. да если это монополия.

В нашем случае нейросеть это монополия не потому кто она, а потому какие именно люди за ней стоят.

И хватит говорить что я не инженер и что технологии это прорыв и будущее а я ничего не понимаю и просто гундёжь. Я инженер с 15 летним опытом работы. В том числе и разработчик нейросетей (хотя я этим занимался ещё когда это не было трендом). А вы сами не понимаете куда вы себя загоняете этой цифровизацией и автоматизацией с ИИ. Это всё что сейчас в мире происходит с ИИ - НЕ круто и НЕ прорыв. Вы когда наиграетесь поймёте это тоже. Только будет поздно. Это просто по началу будоражит жилы и эмоциональный фидбэк вызывает. Всё это не так работает.

Угу коллега )))). Я кстати думаю что весь этот ИИ скоро долбанётся медным тазом если не сказать бОльшее. Его временный (и очень-очень сильно именно временный) успех основан на сборе людской крови и костей на протяжении последних 50 лет. Они сейчас себе сами роют могилу увольняя людей и вырезая бизнес заменой компьютерами. Потому что второй стадии и третей, (типа там GBT5 - GBT6) не будет. То, что они обещают, что одна сеть будет обучаться с помощью предыдущего поколения нейронки - это миф. Это так не работает. Это всё приведёт просто к повышенному детерминизму системы. И результат градиентного спуска всегда будет падать в ближайший локальный минимум/максимум а не глобальный. Эту генерацию будет глючить по адски. Да и вообще использование нейронок для генерации чего-бы то ни было, типа графики или текста - это изначально не самая лучшая идея. Опять же из-за того же самого детерминизма системы => На обучение и лейблинг приходится тратить уйму ресурсов даже больше чем если бы сделал сам это творчество руками. Эта модель работает только для корпораций, которые могут проскейлить продажи на больших объёмах, скажем так сожгли 2 миллиарда но сэкономили 2.0000001. В итоге вышли в ноль или прибыль в пару баксов. Это примерно то же самое что с оружем: когда монополия достигает какого-то пикового значения - она начинает инвестировать в оружие для охраны своего капиталла (чтобы охранять 10 миллионов долларов нужно построить крепость из 40 миллионов долларов), потому что некуда его больше девать, а выбросить капитал жалко, он же трудом заработан. Т.е. и оружие ей самой не нужно нафиг, оно никому не нужно, но выхода другого нет. В общем всё про ИИ - это скорее баг цивилизации а не фича. Это может существовать только при адских затратах ресурсов и во время кризиса. Они просто истерично в это инвестируют потому что больше некуда.

Книги для обучения покупать надо или можно просто воровать?

Фотографии использовались для обучения, как учебник, как пособие. Даже если они выложены в открытом доступе они защищены авторским правом.

Компания Rebrain проводит бесплатные вебинары, приходишь, смотришь. Запись доступна для просмотра в личном кабинете бесплатно. Но если ты выкладываешь эту запись в интернете, ты нарушаешь авторское право. Не говоря уже о том что это свинство!

Здесь тоже самое! Это как если я на основе записей вебинаров открою офлайн курсы обучения.

Говорить нужно об использовании фото именно как пособия для обучения! А за это уже можно и подать в суд.

В странах с прецедентным правом это так и работает - когда возникает какое то новое явление, оно через результаты судебных разбирательств встраивается в существующую легальную систему. Так что да, подать обязательно нужно, но не факт что решение будет таким, как ожидает фотограф.

Может я вам что-то новое открою, но книги для обучения можно брать в библиотеке. И потом вернуть. Более того, в ВУЗах все так и делают. А потом ужас-ужас, идут работать с этими знаниями за зарплату.

Но книгу в библиотеку купили

Что далеко не факт. Её можно получить в дар например. Или это может быть вообще рукопись. Так же она туда может вообще попадать в силу закона какого-то, утрируя каждая напечатанная новая книга присылает один экземпляр в библиотеку им. Ленина. Да вообще как угодно может быть.

Чем дальше, тем реже, потому что вузовские библиотеки нередко получают бесплатную подписку на электронные издания. А ещё есть Киберленинка, которая переводит весь разговор на новую высоту.

Но по факту, нейронка не выкладывает запись в интернет, она именно что "бросила взгляд" на эти фотки, учитывая что ей показывают миллионы изображений. Возможно даже они практически никак не повлияли на ее веса при обучении. Это как если бы вы использовали в работе какие-то знания, полученные от прочтения статьи на хабре, или книги, которую автор выложил в интернет бесплатно, а потом автор статьи потребовал бы удалить у вас из головы нейроны связанные с его статьей или оплатить использование полученных знаний.

Тут есть 2 аспекта: во-первых, нейросети являются производными произведениями от всех данных, на которых они обучались. Поэтому на них распространяются все те же самые юридические ограничения, что и на любые другие производные работы.

Во-вторых, есть GDPR, который обязывает компании удалить все персональные данные о человеке по его запросу, за редкими исключениями. Веса нейросети содержат информацию о всех объектах в обучающей выборке, поэтому если в обучающей выборке были персональные данные, то и веса нейросети содержат агрегированную информацию о персональных данных. По GDPR агрегированная информация о ПД это тоже ПД, соответственно по запросу веса должны быть удалены. Чтобы на такое не нарваться, надо анонимизировать данные, перед тем, как обучать на них нейросеть. Попадают ли работы фотографа в категорию ПД - зависит от его работ. Если там есть его сэлфи, то да. Если на этих селфи лицо не было замазано перед обучением нейросети, то нейросеть должна быть удалена по запросу.

Фотография это не ПД, хотя можно схитрить и в подписи фотографии указать ФИО и дату рождения скажем. Даже интересно тогда как кейс развернётся и попросить удалить ФИО своё из нейронки:)

Никак, нет в нейронке самих пд, ни исходных изображений, их даже прочитать оттуда невозможно.

И что, что в нейросети нет исходных изображений? В JPG тоже нет исходных изображений - там только коэффициенты синусных разложений. И исходное изображение из JPG тоже не восстановить - только приближённую аппроксимацию. Так же и с нейросетями - да, исходные не восстановить, но приближённые - можно. Пример: https://blog.openmined.org/extracting-private-data-from-a-neural-network/amp/

Приближенную апроксимацию любых данных при должном успехе и из числа Пи (или из любого генератора случайных последовательностей) с некоторой вероятностью при определенном старании извлечь можно. Означает ли это, что генераторы случайных последовательностей являются производными от этих данных?


JPG яляется математическим (пусть и не точным) описанием конкретного bitmap-изображения, а не случайным набором шума, которое при некотором старании с некоторой вероятностью может сложиться во что-то похожее.
Код нейронной сети таковыим не является — он вообще не для картинок, его задача оперировать коэффициентами весов модели. Любой совместимой модели, а не от конкретной картинки. Веса модели нейронной сети тоже таковыми не являются — они создаются без всяких картинок, иницализируясь рандомом или нулями, и в дальнейшем туда никакой информации о картинках не пишется ни в каком виде (как и вообще какая-либо новая информация) — там только меняются уже существовавшие (до всяких картинок) коэффициенты. Так что веса тоже не производная от картинки — они созданы из рандома, и картинка на их коэффициенты имеет весьма опосредованное значение. Примерно как цветовой профиль монитора имеет отношение к нарушению патента на цвет если вы случайно выберете не патентованный оттенок, а на мониторе увидите патентованный...

Но коэффициенты то меняются в зависимости от обучающих данных. И то, насколько сильно они впитали в себя ПД зависит исключительно от степени переобученности модели. NERF сети вон впитывают информацию из обучающей выборки настолько, что восстановить можно трёхмерную модель с любого ракурса. Так что же, NERF сеть с чужими данными можно свободно распространять, просто из-за того, что её веса были рандомом когда-то до обучения? Если картиночную нейросеть обучать на картинках одного и того же паспорта, то из весов нейросети можно будет извлечь и серию, и номер, и имя, и фамилию, и дату рождения. А если что-то нельзя извлечь сейчас, то не факт, что это нельзя будет извлечь потом, через н лет развития компьютерной криминалистики и методов анализа нейросетей.

Меня вот давно интересовало как технически решается вопрос при сочетании — GDPR с требованием удаления и R/O (BD-R те же, можно только носитель грохнуть) или псевдо-R/O (Amazon Glacier с Vault Lock, удалить технически видимо можно, но вот системы AWS просто проигнорируют команду и все тут) носители?

UFO just landed and posted this here

Сначала фотограф выкладывает изображения в паблик, позже обижается что его фотографии как-то используют. Даже просто просмотр - это уже использование. Взял фото художник, вдохновился, нарисовал картину, продал, заработал. Использование? Безусловно. Значит нужно быть последовательным: либо предъявлять всем за просмотр иски, с предупреждением что просмотр фото может повлечь legal последствия, либо не заниматься чепухой. Напоминает потребительский экстремизм.

Не нравится что твой продукт может кто-то использовать - не раздавай в паблике. Всё ж проще некуда.

Паблик понятие ну очень растяжимое.
Примеры:


  • эмулятор Nintendo Switch Egg NS. Closed source. Вообщем то существует скажем так мнение (с кучей доказательств) что они используют код эмулятора Yuzu, который под GPL и авторы которого не давали разрешения. Разговоры про иск шли но вот только иск против китайской компании в китае… см например https://old.reddit.com/r/emulation/comments/ik9x2d/egg_ns_closed_source_nintendo_switch_emulator_for/g3y9ltt/
  • вот допустим частное новостное агентство страны А выложило в паблик картинки но либо само это агентство в лицензии написало что мы запрещаем пользоватся всем из страны Б, а потому что мы так понимаем патриоти, либо госструктуры страны А прямо приняли закон что никто из Б не может использовать ИС от наших граждан, а потому что у нас конфликт. И как быть? А если картинки эти оказались в википедии вообще?(и в статьях написанных и в А и Б)?
  • А если в паблике никто не раздает, раздающий вебсервер отдает заголовок X-License-Rules: <краткое содержание лицензии и ссылка на полный текст> + добавляет к вебстраницам снизу подпись что если вы зашли на сайт то вы согласились с лицензией а если не согласны то уходите? (я в курсе что на практике фокус не срабатывает, но… а почему собственно?)

Посмотрите что такое некоммерческое использование, пожалуйста.

Сначала фотограф выкладывает изображения в паблик, позже обижается что его фотографии как-то используют. Даже просто просмотр - это уже использование. Взял фото художник, вдохновился, нарисовал картину, продал, заработал. Использование? Безусловно.

А любое ли использование разрешено для изображений в публичном доступе?.. А вот нет, не любое. Человек имеет право их использовать для просмотра, да.

Но вот использование изображений для обучения нейросети - это уже другой способ их использования, законодательно не урегулированный, а потому он сейчас может быть урегулирован только на уровне договоров, причём на каждое изображение (кроме находящихся в общественном достоянии).

Потому имеем новый способ использования произведений и новый тип конфликта интересов вокруг него, где одним хочется сказать, что это то же самое, что "просто просмотр", а другим - что "это другое".

И во что это выльется - чёрт его знает.

Может даже у Creative Common появится новый тип лицензии - "не для обучения ИИ", например. Ну или приравняют ИИ к человеку. Или еще чего...

Проведем мысленный эксперимент, заменив ИИ на другую сущность, например толпу индусов, которой показали много-много фоток, натренировали и теперь сия компания рисует по запросам сообразно своим талантам.

Какие-то вопросы к ним будут? Какие? Посмотрели датасет? Ну да. Рисуют слишком быстро? Или слишком хорошо? В чем конкретно претензия?

Получается претензия именно к ИИ, так как если бы то же самое делал огромный коллектив людей руками и, желательно, дольше и хуже живого человека, то проблемы бы не возникло.

Все претензии понятны как три рубля, банальная зависть. Гончар всю жизнь крутил круг, выдавая по десятку кривоватых горшков в день, а тут изобрели машину, которая шлепает поттери аж бегом. Чего хочет гончар? Оплаты за просмотр его поделий? Да, быть гончаром обидно, но так выглядит прогресс

Я с вами согласен, но есть нюанс: например, в США холодные рекламные звонки людьми разрешены, а холодные рекламные звонки роботами запрещены. Суть такая: роботы задушат людей (разные весовые категории), а люди людей не задушат (звонящие люди получают зарплату, платят налоги, и прочим образом участвуют в экономике страны). Аналогично, можно повесить на себя рекламный плакат и ходить у метро агитировать. Но стационарно установить этот плакат без разрешения нельзя; причины примерно те же.

Всё это вот почему: время человека — это единственное, что на данный момент имеет ценность. Человек смертен, его время ограничено. Все остальные ценности производные — золото (и крипта) дорогое потому, что человек долго его майнит.

Пользуясь этими рассуждениями, мы получим, что толпа индусов имеет ценное время, их жизни ограничены. А ИИ бессмертен. Его время не имеет ценности. Да, он тратит ресурсы (электроэнергию), но это всё очень неоднозначно, ибо можно придумать способы повышения вычислительной эффективности. А как радикально продлить жизнь людей пока не придумали.

UFO just landed and posted this here
UFO just landed and posted this here

Эти компании переедут в страну, где нет налогов для БОД, и уже не будут должны ничего платить.

UFO just landed and posted this here

Налоговой аргумент против БОД не работает. Потому что государство может сегодня напечатать и раздать X денег (или даже не денег, а талонов-фантиков), а на следующий день/месяц/год будет этот X денег с компаний собирать с аргументами "ну вы же все совместно населению что-то полезное сделали, нет? Поэтому население вам весь этот X денег уже должно было отдать, давайте его сюда".

По этой же причине я всегда при звонке робота добиваюсь ("позовите оператора", "нажмите 1 если вам интересно" и т.д.), чтобы на меня вышел живой человек и потратил своё живое время вместе с моим.

в США холодные рекламные звонки людьми разрешены

...что совершенно не мешает им продолжать происходить. Например, не далее, чем сегодня утром мне опять позвонил робот конторы, которую я посылал очень далеко уже раз пятьдесят.

Подумываю уже пиратский автоответчик завести.

Допустим, я начинающий художник.

1) Я смотрю работы известных художников, включая, допустим, Айвазовского. Я учусь на них.

2) Я даже хожу в платные галереи и музеи! Не говоря уж о Public Doman.

3) Я начинаю писать картины в стиле, близком к Айвазовскому.

4) Я ему (его потомкам) что, роялти должен?!?

Айвазовский повлиял на ваше творчество? Оно стало лучше? Значит да - неплохо бы ему отстегнуть, может совсем чуть-чуть, но по логике - надо.
Другой вопрос, что договариваться можно как угодно и законы выпускать какие угодно - скажем, что человек который смотрел на мои картины написанные под вашим влиянием уже ничего не должен Айвазовскому.
Можно пойти дальше - любое действие приводящее к выделению дофамина должны оплачиваться. Посмотрел на прекрасный закат - будь добр переведи 10 рублей в "Фонд прекрасных закатов". А фонд кстати может вести деятельность - протестовать против многоэтажной застройки, выступать за установку воздушно-очистных сооружений, и т.п...
Вполне так сюжет для фантастического романа.

Наследникам Кирилла с Мефодием платить нужно или уже нет?

Чуть-уть. 0.000...0001 коп с каждого прочитанного знака. Но не им, а древним грекам. ))) Роман не написали, а рассказ да. Выше ссылка была, но тоже приведу
http://samlib.ru/s/seshat/chujayamashinka.shtml

Жалкий подражатель, что с тебя взять...

Тут даже не обязательно рисовать в стиле Айвазовского. Кроме него вы, допустим, просмотрели еще миллион различных изображений. И каждое в какой-то мере подсознательно влияет на творчество, даже если вы пытаетесь выработать свой стиль. По сути так в данной ситуации.

С человеком еще куда не шло, научился, платишь, помер - взять не с кого, а нейронка бессмертна, это что всем потомкам платить миллионы лет? у миллиардов изображений миллион наверное авторов, их геном никогда не выбьет из человечества, если только ИИ это все не надоест и он не пошлет Т1000 за халявщиками)

А теперь давайте немного модифицируем:

3b) Я копирую картины Айвазовского - сажусь у оригинала и рисую стараясь в точности повторить оригинал

3c) Я фотографирую картины Айвазовского и продаю фотографии как свои собственные произведения (это же моя фотография)

Уже не так очевидно становится что потомки Айвазовского не могут иметь к Вам претензий? Одно дело когда Вы берете немного из картин Айвазовского но вкладываете куда больше своего творчества, другое дело - когда Ваше произведение в основном состоит из того что уже было в картине и лишь на чуть-чуть состоит из Вашего собственого творчества.

Ещё чуть изменим стек:

5) Я как художник нарисовал обёртку для шоколада «Кузя друг Алёнки».

4) Нарисовал полностью в стиле шоколада «Алёнка» шоколадной фабрики «Красный Октябрь».

3) Обёртку шоколада «Алёнка» нарисовал художник Николай Маслов.

2) Нарисовал он её с кадра, который снял фотограф Александр Геринас.

1) А фото его тогда ещё восьмилетняя, а ныне взрослая дочь Лена Геринас.

Вопрос: кто кому должен?..

1) Традиционная схема. — Вы должны Геринасу и Маслову, но только в случае, если Геринас и Маслов в лице наследников подадут в суд. А если подаст только Геринас, тогда должны только ему. Если подаст только Маслов, тогда должны только ему. Если не подаст ни один, тогда никому не должны.


2) Схема свободных лицензий GPL, GFDL, CC. — Вы должны Геринасу, Маслову и фабрике, от которых надо получить письменное подтверждение того, что они согласны со свободным лицензированием вашей работы.

Лена-Алёнка на обёртке восьмимесячная, а не восьмилетняя.

Кстати да! )

Хоть не восьминедельная )

Ну сам же виноват, выставил свои изображения в Интернет, на всеобщее обозрение, а сейчас пытается подать заявление, смешно и глупо

Если его фотографии кто-то начнет выставлять или как-то еще использовать где-либо еще кроме того сайта где он выставил свои изображения, то подача заявления абсолютно логична, обоснована и работает в судах.

Это очень большая оцибка — очеловечивать статистическую систему. Это проявление магического мышления, которое очень странно видеть в среде высокоооббразованных людей.
Рисовалка картинок это просто продвинутый джипег(ну или ближе к джипег 2000). Сохраняет веса, как-то их комбинирует и выдаёт что-то похожее на правду. Там нет ни интеллекта, ни обучения, ни сознания, ни воли, ни души и прочего эфира. Это просто мега-джпег.

Инлтеллект внезапно есть, обучение на примерах и обратной связи тоже.

А вот самое забавное у вас также нет ни сознания, ни воли, ни души. Химическая нейронка, управляемая внешней средой, гармонами и дофаминовыми качелями.

Даже нет глобального смысла существования.

Нарушить баланс настроек наркотиками и в овощ превратитесь.

Я бы так не упрощал, всё же мы не так и много знаем о нашем разуме, да и о вселенной в целом. Квантовая физика - вообще непознана практически полностью, нынешние теории - парадокс на парадоксе: и взаимодействия у них быстрее света получаются и теория гравитации не дружит с релятивизмом, а некоторые эксперименты вроде квантового ластика с отложенным выбором вообще можно трактовать как передачу данных назад во времени.

Ну товарищ немного наивно себя повел конечно. Все (в Германии) знают, что суды тут невероятно дорогие и в любом случае кто-то за услуги адвокатов обоих сторон обязан заплатить, в основном проигравший. Потому перед любым началом судебных тяжб нормальные люди заводят хорошую адвокатскую страховку, и уже по ней со своими юристами начинают думать как припугнуть или подать иск в суд. Если юристы сразу видят, что дело бесперспективняк или еще неясно кто выйграет, то наивно кидать cease-and-desist предьявы: ты еще и за весь процесс заплатишь. Если нет денег или явного желания любой ценой наказать, то возможно стоит и "забить".

Хитропопые однако, люди. Им пишет человек, отвечает не тех поддержка, а юристы.

А как вообще может быть датасет из ссылок, если он из данных изображений? Значит ссылки как минимум открывали ИИ использовали всё, что посчитали нужным их этих фотографий.

Вообще есть простое правило: если ты это не покупал, оно не твоё. Хамить владельцу при этом дополнительная наглость.

Надеюсь и автор фотографий, и Getty поставят на место подобных существ.

Вообще ситуация повторяет то, что сделала Майкрософт, создав co-pilot - использовали открытый код, чтобы создать коммерческий продукт. И нагло называют это добросовестным использованием.

Не сомневаюсь что все LLM так устроены, только почему-то владельцы датасетов считают что могут бесплатно использовать чужие данные.

Да, такую лавочку надо прикрывать. У них оттуда и многомиллионные/ардные прибыли что всё стараются брать задарма.

Должны платить.

А как вообще может быть датасет из ссылок, если он из данных изображений? Значит ссылки как минимум открывали ИИ использовали всё, что посчитали нужным их этих фотографий.

Так прикол-то в том, что фотограф предъявил претензию не тем, кто скачивал и пихал скачанное в оптимизатор (т.е. OpenAI/Google), а именно что агрегатору ссылок (LAION). Которые сами ничего не учат — просто парсят Интернет подобно поисковику и накапливают ссылки на то, что лежит в открытом доступе. Копят именно ссылки — самих изображений там нигде нет. И вот фотограф потребовал от них не индексировать его работы, потому как это якобы нарушает его права — ведь это проиндексированное кто-то потом качает для обучения сетей.


Надеюсь и автор фотографий, и Getty поставят на место подобных существ.

И кому от этого станет лучше? Ну вот обяжут они корпорации использовать только лицензионно чистые датасеты. И? Думаете, какой-нибудь Microsoft сильно напряжёт договориться с фотостоками, чтоб получить разовый доступ ко всему этому по скидочной цене? А больше одного раза и не требуется, чтоб сеть обучить… Ну получит фотограф свои 10 центов, сильно ему с того полегчает?
А вот у тех, кто создаёт опенсорсные нейронки, возможностей договариваться с фотостоками нет, да и выложить даже жалкие $100 млн за сбор датасета их авторы не смогут. И в итоге все нейронки будут только коммерческими, чему корпорации очень сильно порадуются.

А больше одного раза и не требуется, чтоб сеть обучить… Ну получит фотограф свои 10 центов, сильно ему с того полегчает?

А почему один раз? Можно ж захотеть 1 цент с каждого запроса к нейросети ;)

Потому что когда фотографы выкладывают свои работы на фотосток, они соглашаются с условиями продажи, которые этот фотосток предлагает.
И крупные корпорации, если обязать их обучать нейронки только на лицензионно чистых датасетах, будут договариваться не с десятками тысяч фотографов, а с двумя-тремя фотостоками, причём наверняка договорятся на особых условиях, то есть фотограф получит даже меньше, чем если бы это покупали физлица или мелкие конторки.

Ну, выкладывание на фотосток - дело добровольное... Кроме того, что еще вопрос - подпадает использование фоток для обучения нейросетей под договор с фотостоком. Если договор на любое использование - то да, всё законно. Получат свои 10 центов и пойдут на вынужденную пенсию, увы...

Каждый фотограф получит своё, Getty своё и далеко не 10 центов. И кто сказал что 10 центов или другая мелочь? Stack Overflow, как и Reddit, начал брать деньги за подобные же процесс.

А вот у тех, кто создаёт опенсорсные нейронки

Мы же знаем что для open-source очень часто предоставляют другие условия.

Ну... Удачи автору.

Аналогия тут такая.

Кто-то создал ледяную скульптуру, а потом требует о ему отдать именно его молекулы воды, из которых состояла ледяная скульптура.

Удачи!

Вот пример того, как нейронка рисует то, что никогда не видела. Людей знает, геймпады знает, а как это вместе должно быть - не особо.

Да и человек очень плохо рисует то, что никогда не видел. Для примера давайте сравним несколько рисунков с изображением спящего Снарка.

Напоминает фото девушки с паяльником, где та держит его за жало

В процессе прочтения комментариев и собственных размышлений, мне видится проблема самого технического устройства выдачи контента посредством сети интернет, при которой не предполагается возможности автора заранее и в полной мере технически определять любые желаемые рамки последующей доступности и дальнейшего применения его контента третьими сторонами, в зависимости от их целей и интересов.

Крупные специализированные проекты конечно же пытаются решать проблему доступа технически, как в случае c фото - сайт 500px, но в полной мене это реализуемо лишь на основной массе пользователей, способных использовать лишь то, что предполагает графический интерфейс, при этом дальнейшее использование контента третьими сторонами всё равно можно контролировать лишь юридически.

Это склоняет меня к выводу, что в процессе развития практики решения проблем собственности и прав на продукт своей деятельности, а также монетизации результатов своего труда - постепенно будет появляться всё больше возможностей обеспечивать всё это автоматически, а подталкивать к подобному будут как раз случаи подобные описанному в статье (что вроде как раз и наблюдается в наше время).

И вроде как уже можно остановиться на том, чтобы просто констатировать, что мы сейчас находимся на историческом этапе решения созданных интернетом проблем, возникновение которого изначально обуславливалось стремлением сделать контент общедоступным без всяких условий, а в итоге сейчас приходится решать проблему стремления авторов и правообладателей защищать свой контент от бесплатного использования...Но упоминание нынешнего исторического этапа меня сразу же подталкивает к желанию заглянуть в следующий - а что же будет дальше?

Развитие упомянутых в статье нейронных сетей генерирующих контент всё чаще обесценивает человеческий профессиональный труд в этой области... Кроме того, за счёт тех же нейронных сетей количество создаваемого ежеминутно на планете различного контента сейчас постоянно растёт и наблюдается сильное увеличение его количества, снижающее уровень его ценности, при этом всё меньше становится нужным его искать при возможности генерации по необходимости (зачем вообще искать, если можно сгенерировать)...
И вот насколько будет возможно в дальнейшем каждому человеку успешно монетизировать свой личный творческий контент при таких условиях (уж каким бы способом он ни был создан) - вопрос вообще сложный...

Возможно, монетизация создаваемого контента вообще со временем значительно утратит свою актуальность - какой смысл что-то искать и приобретать, если можно заказать генерацию именно того что тебе нужно (или вообще это сделать самостоятельно)?
А ещё возможно, что специфика и направленность монетизации тоже сильно изменится - востребованным будет оставаться лишь контент дополняющий системы генерации некими принципиально новыми элементами, формами и идеями...

(А ещё, под конец написания комментария, я уже отдаю себе отчёт в том, что всё что я написал теперь впитают нейросети и в дальнейшем будут использовать мои мысли как свои и при этом - бесплатно...)

приходится решать проблему стремления авторов и правообладателей защищать свой контент от бесплатного использования

Причём одновременно с этим компания Meta в правилах использования сайта Facebook сообщает, что каждый пользователь разрешил этой компании и всем её подрядчикам (!) использовать загруженный контент (фотографии и тексты), как они пожелают.

Уже сейчас в России есть тысячи учителей художественных школ, которые являются профессиональными художниками с дипломом, однако никак не могут монетизировать свои педагогические рисунки. Рядом с ними работают тысячи учителей музыкальных школ, которые являются профессиональными музыкантами, однако никак не могут монетизировать свои учебные концерты. А сколько художников каждый год стоят с мольбертами по берегам рек и озёр, создавая тысячи этюдов безо всякой возможности монетизировать…

Увы, проблема возникла далеко не вчера, ей уже много лет. Ничего лучшего, чем творить без оплаты, эти люди так и не придумали.
UFO just landed and posted this here

Other news