24 июля 2023 г., 14:31

18K

Авторы подали иск против OpenAI за незаконное «использование» их книг

51 понравилось 4 комментария 7 добавить в избранное

Мона Авад и Пол Тремблей утверждают, что их книги, защищенные авторским правом, были «использованы для обучения» ChatGPT, поскольку чатбот создавал «очень точные изложения» произведений

Два автора подали иск против OpenAI, компании, стоящей за созданием искусственного интеллекта ChatGPT, утверждая, что организация нарушила закон об авторском праве, «обучив» свою модель на романах без разрешения авторов.

Мона Авад , чьи книги включают «Зайка» и «13 Ways of Looking at a Fat Girl», и Пол Тремблей , автор «The Cabin at the End of the World», подали коллективный иск в федеральный суд Сан-Франциско на прошлой неделе.

ChatGPT позволяет пользователям задавать вопросы и вводить команды в чат-бот, который отвечает текстом, напоминающим человеческий язык. Модель, лежащая в основе ChatGPT, обучается на данных, которые находятся в открытом доступе в Интернете.

Однако Авад и Тремблей считают, что их книги, защищенные авторским правом, были незаконно «заимствованы» и «использованы для обучения» ChatGPT, поскольку чат-бот создал «очень точные резюме» романов, говорится в жалобе. Образцы резюме включены в иск в качестве вещественных доказательств.

Это первый иск против ChatGPT, который касается авторских прав, по словам Андреса Гуадамуза, специалиста в области права интеллектуальной собственности в Университете Сассекса. Иск будет исследовать неопределенные «границы законности» действий в пространстве генеративного ИИ, добавляет он.

Книги идеально подходят для обучения больших языковых моделей, потому что они, как правило, содержат «высококачественную, хорошо отредактированную, длинную прозу», — сказали адвокаты авторов, Джозеф Савери и Мэтью Баттерик, в электронном письме в Guardian. «Это золотой стандарт хранения идей для нашего вида».

В жалобе говорится, что OpenAI «нечестно» извлекает прибыль из «украденных произведений и идей» и требует возмещения денежного ущерба от имени всех американских авторов, чьи произведения якобы использовались для обучения ChatGPT. Хотя авторы работ, защищенных авторским правом, имеют «большую юридическую защиту», говорят Савери и Баттерик, они сталкиваются с такими компаниями, «как OpenAI, которые ведут себя так, будто эти законы на них не распространяются».

Однако может быть трудно доказать, что авторы понесли финансовые потери именно из-за того, что ChatGPT обучался на материалах, защищенных авторским правом, даже если последнее окажется правдой. ChatGPT может работать «точно так же», если бы компьютер не поглощал книги, — сказал Гуадамуз, потому что ИИ обучался на большом количестве информации в Интернете, которая включает, например, обсуждения книг пользователями Интернета.

OpenAI становится «все более скрытной» в отношении своих обучающих данных, говорят Савери и Баттерик. В документах, опубликованных вместе с ранними версиями ChatGPT, OpenAI дала некоторые подсказки относительно размера «интернет-базы книг», который она использовала в качестве обучающего материала и который она называла только «Books2». По мнению юристов, размер этого набора данных — по оценкам, содержащего 294 000 наименований — означает, что книги могли быть взяты только из теневых библиотек, таких как Library Genesis (LibGen) и Z-Library, через которые книги можно получить оптом через торрент-системы.

Это дело «скорее всего, будет зависеть от того, будут ли суды рассматривать использование авторских материалов таким образом как «честное использование», — говорит Лилиан Эдвардс, профессор права, инноваций и общества в университете Ньюкасла, — или как простое несанкционированное копирование». Эдвардс и Гуадамуз подчеркивают, что аналогичный иск, поданный в Великобритании, не был бы решен таким же образом, потому что в Великобритании не существует такого определения как «честное использование».

Правительство Великобритании «очень хотело продвинуть исключение из авторского права, которое позволило бы свободно использовать авторские материалы для поиска текстов и данных, даже в коммерческих целях», — говорит Эдвардс, но реформа была «сорвана» после того, как авторы, издатели и музыкальная индустрия были «возмущены».

С момента запуска ChatGPT в ноябре 2022 года издательская индустрия обсуждает, как защитить авторов от потенциального вреда технологий искусственного интеллекта. В прошлом месяце Ассоциация авторов (The Society of Authors, SoA) опубликовала список «практических шагов для членов ассоциации», чтобы «обезопасить» себя и свои работы. Вчера исполнительный директор SoA Nicola Solomon заявила торговому журналу Bookseller, что организация «очень рада» видеть авторов, подавших в суд на OpenAI, поскольку «давно обеспокоена» «массовым копированием» авторских работ для обучения больших языковых моделей.

Ричард Комбс, глава отдела прав и лицензирования Общества авторского права и коллекционирования (ALCS), заявил, что нынешнее регулирование в области ИИ «фрагментировано, непоследовательно в разных юрисдикциях и не успевает за развитием технологий». Он призвал политиков прислушаться к принципам, разработанным ALCS, которые «защищают истинную ценность авторства человека для нашей жизни и, особенно в случае Великобритании, для нашей экономики и международной идентичности».

Савери и Баттерик считают, что ИИ в конечном итоге будет напоминать «то, что произошло с цифровой музыкой, телевидением и фильмами» и будет соответствовать закону об авторском праве. «Они будут основаны на лицензированных данных с раскрытием источников».

Юристы также отметили, что «иронично», что инструменты «так называемого «искусственного интеллекта» опираются на данные, созданные людьми. «Их системы полностью зависят от человеческого творчества. Если они обанкротят человеческих создателей, то вскоре обанкротятся сами».

В OpenAI запросили соответствующие разъяснения.

Элла Кример (Ella Creamer)

Совместный проект Клуба Лингвопанд и редакции ЛЛ

В группу Клуб переводчиков Все обсуждения группы

Авторы из этой статьи

51 понравилось 7 добавить в избранное

Комментарии 4

Также более 10 000 авторов уже подписали письмо Гильдии авторов США с призывом к лидерам отрасли ИИ защищать писателей от неправомерного использования их произведений: "В письме обращается внимание на неотъемлемую несправедливость создания прибыльных технологий генеративного ИИ с использованием произведений, защищенных авторским правом, и содержится просьба к разработчикам ИИ получить согласие, указать авторов и справедливо вознаградить их".

Источник: https://authorsguild.org/news/thousands-sign-authors-guild-letter-calling-on-ai-industry-leaders-to-protect-writers/

ApologeticGalaxy, Замечательное дополнение! Значит проблема ненадуманная.

Спасибо )

Прикольно, а если я по чьей-нибудь просьбе перескажу какое-нибудь из их гениальных произведений, они и с меня бабок потребуют?
Или мне -- можно, а ChatGPT -- почему-то нельзя?

Ничего не понимаю...

Впрочем, что ж тут не понять? Каждый, кто как может, пытается заработать побольше. Всем бабки нужны, и писателям этим тоже. На то они и адвокатов держат :)))

sq, если вы при пересказе произведения заработаете пару миллионов, то конечно у вас потребуют поделиться.

Читайте также