Pull to refresh

Comments 38

Мне кажется ограничения выборки для обучения не будет.
Те кто не хочет чтобы их данные попадали в дата сеты просто вымрут.
Остальные же наоборот будут делать данные с более качественной обработкой для обучения.
Пытаться запретить свои данные для обучения... Ну ок, твоих данных не будет в выборке. Вопрос в том, насколько эти данные уникальны что датасет от этого станет хуже. Вангую: ни на сколько.

Мне вспоминается, когда на девиантарте и артстейшоне начали массово постить картинки "нет AI", то это подпортило модели, которые обучались на массиве картинок, которые тупо стянули с этих сайтов.

Опять же, есть популярные художники с большим массивом работ, художественному стилю которых подражают даже другие художники. Ну например какая-нибудь sakimichan или cutesexyrobbuts, у которых сотни работы и энное количество подражателей. Если они запретили обучение на своих работах, то это опять же вполне повлияет на модели. Впрочем, они могут продавать право на обучение через какой-нибудь патреон.

В целом не вижу причины, почему бы те, чьи данные не попадают в датасеты, должны вымирать. Я как-то не заметил оттока подписчиков у художников в твиттере, к примеру. Наоборот, замечаю, как у некоторых знакомых число подписчиков растет.

Так генеративным сетям пару лет отроду. Вымирание в перспективе, а не "прям щас", естественно что его сейчас не видно.

Ну и опять же, вымирание не до нуля, а до нишевого применения. Просто актеров, художников, сценаристов с такой припиской не будут брать на работу в большинство студий и всё.

Просто актерам, художникам и сценаристам надо будет становиться брендом и работать над своим образом, и тогда это студиям надо будет добиваться разрешения, чтобы обучить нейросети на их работах и получить похожий стиль.

Многие музыканты и художники сейчас зарабатывают и получают известность без продюсеров, лейблов и студий. Их рекламирует ютуб, спотифай, твиттер. В отличие от студийных музыкантов и художников они от появления нейросетей много не потеряли. Скорее даже получили дополнительный инструмент.

У музыкантов ещё часто встречается трюк с продажей пресетов. Ну, например, сначала вырабатывает стиль, становится популярным, а потом выдает продукт типа «хочешь так же? Купи пакет сэмплов и пресетов всего лишь за $99.99» (ибо один хрен звуки могут быть те же самые, но стиль самой мелодии вряд ли передерут, хотя некоторые ещё и этюды в миди добавляют к покупке)

Так вот, можно то же самое просто расширить, и представить что-то типа: нанять актёра, чтобы он снялся живьём — 10Х денег, купить официально созданную им самим (или командой техников) нейронку — Х денег, плюс триалка за 0.01Х/час чтобы посмотреть, а пойдет ли актер на роль или лучше кого другого взять.

Мне вспоминается, когда на девиантарте и артстейшоне начали массово постить картинки "нет AI", то это подпортило модели, которые обучались на массиве картинок, которые тупо стянули с этих сайтов.

Когда они это делали - модели уже давно были обучены и существовали, уже позно что-либо портить. Народ генерил с ватемаркой чисто ради троллинга.

UFO just landed and posted this here

Насколько я понимаю (а я не специалист по этой юрисдикции даже близко), не очень важно, пульт это был или алгоритм. Важно, кто стал инициатором. Появление обезьяны в кадре — это не инициация, а нажатие на кнопку спуска затвора — это инициация. То есть обезьяна совершила конклюдентное действие. Проблем там море, но, вроде бы, работает так.

А разве конклюдентность не подразумевает осознания результатов действия?

Вот вы идете по улице и видите монетку. Поднимаете ее - а к ней привязана ниточка, ниточка дёргает ведро, и вас обливает водой. Выразили ли вы поднятием монетки согласие на обливание?

Так и обезьяна. Она вряд ли понимала, что за нажатием кнопки последует фото, и это, мне кажется, ничем не отличается от монетки.

UFO just landed and posted this here

нет, это так не работает. Если вы поставите на столе на даче бутылку водку, нальете туда метанола и крупно, не меньше шрифта названия на этикетке, напишете "яд", а кто-то вломится в ваше отсутствие, выпьет и помрет - это будет считаться убийством. Вот предумышленным или нет - не помню, случай реальный.

Тупые вопросы ответы вот:

  • Кому принадлежат права на вывод LLM вроде ChatGPT? Оператору, модели, материнской компании?

    Написавшему промпт. Но если он раскрыл свой промпт в интернете, любой может им пользоваться.

  • Если в выводе попадается кусок обучающей выборки, получается, модель меня конкретно подставляет и я внезапно становлюсь обладателем плагиата (привет, Озон, Copilot беспокоится, когда вы таску закроете). Что с этим делать?

    Ничего не делать, никакой вывод модели никого не подставляет. Это просто набор токенов, сгенерироаанный в тотвнт на другой набор токенов.

  • Если модель обучена на сценариях одного сценариста (статьях одного автора), идеально копирует стиль и форму, учитываются ли его права как-то?

    Если он разместил это все в открытом доступе, любой имеет право учить свою мокрую или сухую нейронку на этом наборе. Этот сценарист сам на чьих-то работах учился.

  • Когда Битлы спели новую песню полным составом, Пол Маккартни не возражал против такого обучения? Что делать с дипфеками в кино?

    Ничего не делать, принять новый мир - дипфейки в кино будут все менее отличимы от неавтоматизированного кино.

  • Что делать с образом гражданки Скарлетт Йохансен, которая «снялась в порно» с использованием Stable Diffusion?

    Ничего, просто не доверять никаким сходствам ни в каких видео роликах. Доверять (пока) можно только виденному своими глазами.

  • Я сгенерил музыку для фильма с помощью сервиса со свободной лицензией, но никак не могу доказать, что она моя. Что делать в случае страйка от Ютуба?

    Принять риски, искать другую площадку.

  • Как всё это работает в российском законодательстве и вообще по миру, какие практики есть?

    Практика только формируется, и будет формироваться еще годами. Не тратьте время на судебные тяжбы. Если подали на вас, пытайтесь договориться без суда и предоставить доказмтельства саой позиции другой стороне

Ваш текст комментария это просто набор букв, написанный в ответ на другой набор букв. Никакого авторского права у вас на него нет. Все права принадлежат тому, кто стриггерил ваш комментарий своим набором букв.

На счет музыки. Доказывать авторство не нужно, если музыка для ютуба. Права должен предоставить тот, кто кидает страйк.

Написавшему промпт. Но если он раскрыл свой промпт в интернете, любой может им пользоваться.

Ничего не делать, никакой вывод модели никого не подставляет. Это просто набор токенов, сгенерироаанный в тотвнт на другой набор токенов.

Промт: "сочини мне стихотворение о зиме".

Вывод модели: "буря мглою небо кроет, вихри снежные крутя"

Права принадлежат Пушкину. Копирайт (если б он не истёк) нарушила модель, ответственность за его нарушение - на предоставивших мне доступ к модели. Если б он не истёк, использовать результат генерации можно было бы только с разрешения обладателя прав.

Я сгенерил музыку для фильма с помощью сервиса со свободной лицензией, но никак не могу доказать, что она моя.

Музыка либо в общественном достоянии (модель не создаёт авторского права, но может его трансформировать, создавая производное произведение, в котором существенные элементы из промта или тренировочной базы данных), либо у неё есть автор (в случае если АИ черезчур хорошо зазубрил чужую музыку, как в вышеупомянутом примере с Пушкиным).

Доказывать должен тот, кто послал страйк и считает, что право - его.

С каких пор права Йохансен охраняются и защищаются ГК РФ? Она гражданка России?

Ну если гражданка - пусть идёт в суд (и там доказывает факт нарушения)!

Как практикующий юрист скажу - у нас в России послать в суд всё равно что послать в лес.
Ибо перед законом все равны, но некоторые ровнее.

>С каких пор права Йохансен охраняются и защищаются ГК РФ? Она гражданка России?
То есть вы как практикующий юрист считаете, что не гражданин России на территории России не защищается никак в принципе? Ни ГК, ни УК?

Я как практикующий юрист "считаю" (это сквозит и у автора статьи тоже, и видно в моей "цитате" посыла в суд/лес), что хоть гражданин ты России, хоть нет, права не защищаются у нас в принципе. От слова совсем. Вы можете "отстоять" в суде что угодно, годами судиться, но на это вам нужно всего-лишь огромный бюджет и мохнатые лапки.
Иначе суды (прям вам в лицо смеясь) примут решение против вас!

Из личной практики: Место - мировой суд. Я не уведомлён по делу и исковое не получал (суд не может рассматривать дело!) . Обращаю на это внимание суда - судье просто пофигу! Указываю на обзоры ВС РФ про надлежащее уведомление сторон в деле. А тут вообще не получение искового! Судья орёт прям! Покажите мне это! Сама ксерит потерянное исковое. Ознакамливаюсь. Протестую по делу (аргументировано! Притом каждый аргумент исключает вообще принятие решения). Судье как о стенку горох!
Обжалование в вышестоящем суде ещё более эпическое.

К сожалению правду в наших судах многие и не ищут именно потому, что найти её там крайне тяжело. Я находил, но... там реально судей наказывали аж. Только так. И на это уходят годы. Ну или иные "методы" есть решения проблем. Я уже хотел пошутить над тем что писал автор про гарантии исхода дела. Они есть, если ты знаком с нужными людьми.
Очень и очень многое решается вне стен суда вообще и зада судебных заседаний.
Были случаи когда прокуроры к примру, за сутки до начала СЗ уже говорили что завтра будет принято вот такое вот решение! Подчёркиваю ещё раз. Суд принимает решения заранее, т.е. по-сути судье вообще до лампочки что ты там будешь говорить в процессе, плевать на все аргументы, решение будет вывернуто так, как надо. А гражданин ты там или не гражданин. Пффф. Я вас умоляю.

У вас в первом комментарии было (ну или по крайней мере мне кажется что было) два независимых утверждения: первое про ГК РФ и Йохансен (если я правильно понимаю, то речь про Scarlett Johansson, т.е. правильнее было бы написать её фамилию как Йоханссон), и второе - про то, что суды в РФ часто не руководствуются законом.
Второе утверждение Сергей @Milfgard никак не прокомментировал, а с первым не согласился и спросил ваше мнение как "практикующего юриста" - это словосочетание взято из вашего первого комментария. Во втором комментарии вы, воспользовавшись отсылкой к этому же словосочетанию "практикующий юрист" ответили развитием второго тезиса из первого комментария, но проигнорировали вопрос о первом.

"Автором в случае того же ChatGPT является оператор."

Определение "программы для ЭВМ" из ГК выглядит так:

"ГК РФ Статья 1261. Программы для ЭВМ

... Программой для ЭВМ является представленная в объективной форме совокупность данных и команд, предназначенных для функционирования ЭВМ и других компьютерных устройств в целях получения определенного результата, включая подготовительные материалы, полученные в ходе разработки программы для ЭВМ, и порождаемые ею аудиовизуальные отображения."

В соответствии с этим определением, автором картинки, порождаемой ChatGPT, является автор ChatGPT.

совокупность данных и команд,

промпт в этом контексте тоже есть совокупность данных и команд которые и являются определяющими для порождаемых отображений. А по вашему можно сказать, что и картинка сбацанная в фотошопе принадлежит Адобе, а не юзеру.

Есть концепция творческих усилий. Условно, если два разных оператора получают разные результаты, то процесс творчества зависит от них. Если абсолютно повторяемые при разных усилиях — то не от них. Нужна прямая связь между творческими усилиями оператора и результатом.

А вы сядьте с юристом Димой и подумайте, а как можно обойти эту формулировку. В определении программы, напомню, нет ничего про "творческие усилия", там простой критерий.

Фотошоп используется для технической работы, которая не порождает авторства. Как ту или иную линию в нем провести -- это автор решает. А в случае с чатгпт все немного не так.

 А в случае с чатгпт все немного не так.

Как те или иные токены на вход подать для получения нужного распределения вероятностей - тоже автор решает. Никакой разницы.

ChatGPT - это лишь инструмент бессмылсенного порождения токенов. А вот то, какие и в каком порядке оно будет порождать - напрямую зависит от выставленных настроек семплера и подданых на вход последовательностей. На выставленное случайным образом оно породит вам шум, внешне похожий на base64 например, а не что-то кажущееся людям осмысленным.

Кто там и что "решает" -- нет про это ничего в приведенной цитате. В данном случае у автора токена возникает авторское право на токен, поданный на вход. На "порождаемое отображение" -- права у автора программы.

В случае фотошопа аналогично "Кто там и что "решает" -- нет про это ничего в приведенной цитате." Автор возит мышкой по столу в случайном месте и права у него на передачу координат кликов мыши, выходит. На "порождаемое отображение" (линии, определенным цветом, кистью и толщиной) - права у автора программы.

А автором написанного в Word - компания Microsoft?

Буквами от Кирилла и Мефодия!

Отлично, выписываем в общественное достояние - 70 лет со дня смерти обоих явно прошло.

Но в вашей цитате ни чего не сказано про авторское право. Откуда вы стелали такой вывод? Ваши слова ни как из цитаты не следуют.

Если "порождаемые отображения" -- часть программы, то кто будет считаться их автором?

А с чего бы им быть такой частью?

То есть сейчас всё то же самое можно сделать без инструмента — почему это должно быть недопустимо с инструментом?

Может быть, потому что в работе модели нет творческого труда человека?

ставили бы флаг «нельзя использовать для обучения нейронных сетей»

А куда его ставить? Расскажите, какие вообще есть права на контент, доступный без логинов и паролей. Когда логиниться нужно, вопросов нет. Обычно при регистрации мы принимаем условия. А когда ты просто вводишь адрес сайта и сразу читаешь статьи? Если даже в подвале сайта есть ссылка на какие-то правила, мы же их не акцептировали, верно? Так в какие правоотношения мы в таком случае вступаем и с кем?

Исключительное право означает не только само использование, но и возможность запрещать использование другим. Это если исключительное исключительное, а не неисключительное исключительное.

Во-первых, не запрещать другим, а наоборот разрешать, запрещающее правило в этом файрволе стоит по дефолту, с небольших количеством законных разрешений.

Во-вторых, можно поподробнее, что за два типа исключительного права?..

Следует понимать, что если вы занимаетесь созданием интеллектуального продукта, то соблюдать копирайт на все 100% вы не сможете в любом случае - это абсолютно невозможно. Потому что вся эта система - такая безумная и неестественная хрень, что даже крупные корпорации с мощнейшим патентным отделом и толпою опытных юристов регулярно нарываются на проблемы с авторскими правами. Раз за разом. И попадают на бабки. Бывает, что очень даже немаленькие.

И если даже такие зубры не способны обеспечить лицензионную чистоту своих произведений, то что уж говорить о простых смертных без ИП, без юридического образования и заметных бюджетов?

Поэтому нарушают все. Но на стороне большинства - принцип Неуловимого Джо. То есть думать надо не о том, нарушает ли то или иное действие авторские права (этого вам и лучшие юристы достоверно не скажут), а о том, каковы шансы того, что к вам прикопаются и вы не сможете отбиться от наезда.

Вот тут нейронки как раз очень сильно снижают шансы попасть, потому как доказать, что вы у кого-то взяли исходный материал, очень и очень сложно.

Следует понимать, что если вы занимаетесь созданием интеллектуального продукта, то соблюдать копирайт на все 100% вы не сможете в любом случае - это абсолютно невозможно.

Копирайт-то как раз можно, просто каждый раз изобретать велосипед с нуля придётся. Что очень дорого, проще заложиться на некоторые риски возможного нарушения.

Практически невозможно не нарушить чей-то патент или товарный знак.

Вот тут нейронки как раз очень сильно снижают шансы попасть, потому как доказать, что вы у кого-то взяли исходный материал, очень и очень сложно.

Тут есть нюанс: в гражданском праве нет презумпции невиновности (а в некоторых случаях и наличие вины не требуется для наступления ответственности, достаточно факта нанесения ущерба).

Так что если вы используете что-то, нарисованное нейронкой, похожее на что-то, нарисованное другим, и тот другой подаст иск против вас - то именно вам как ответчику придётся доказывать свою невиновность. И сказать, что "это не я, это нейросеть" не получится.

Если в случае с человеком-художником еще можно попытаться доказать, что разные художники рисовали по одной и той же концепции в одинаковой технике - и таким образом получили независимо друг от друга два одинаковых результата, всё законно... То в случае нейросети вы точно не докажете (за разумные по стоимости экспертизы), что она не воспроизвела материал, на котором обучалась.

А если совпадение или сходство до степени смешения с товарным знаком - то уже вообще не важно, почему так вышло, важно, кто раньше его зарегистрировал.

и Джек Воробей

и капитан Джек Воробей!

Сократ: Платон, задумался ли ты когда-нибудь о том, кому принадлежат права на творения, созданные не человеком, а нейросетью?

Платон: В самом деле, Сократ, вопрос этот весьма загадочный и полный размышлений. Как можно определить правообладателя, когда дело касается инструмента, подобного нейросети? Сам инструмент, оператор, или же материнская компания?

Сократ: И вот еще, Платон, представь, что в результате работы нейросети появляется кусочек обучающей выборки. Не поставит ли это нас перед фактом невольного плагиата?

Платон: Действительно, Сократ, и что если модель научена на произведениях одного автора и идеально копирует его стиль? Не касаются ли нас в этом случае права того автора?

Сократ: А как насчет Пола Маккартни и Битлов? Создание новой песни полным составом без их согласия кажется мне нарушением их прав. Как и поступок в отношении Скарлетт Йохансен, когда её образ использовали недопустимым образом с помощью нейросети.

Платон: Вот и вопрос о музыке для фильма, которую не можешь доказать своей, Сократ. Что делать, если возникают споры о правах на неё?

Сократ: И еще одна дилемма, Платон, как это всё работает в законах страны и мира? Чем руководствоваться?

Платон: Верно, Сократ. В нашем мире для использования в делах требуются исключительные права. Юрист Дима Гриц, в частности, умело ориентируется в этих темах, опираясь на советы, которые напоминают нам о непостоянстве и многозначности мира нашего.

Сократ: Понимаю, Платон. Значит, в вопросах, где нет ясности, мы стремимся к пониманию через диалог и осознание ограничений наших знаний.

Платон: Так точно, Сократ. Ибо истина зачастую скрывается за пеленой неопределенности, побуждая нас к бесконечным поискам и размышлениям.

(авторство не моё)

Sign up to leave a comment.