Световни новини без цензура!
Как се обучават AI инструментите тревожи създателите. Законът за авторското право достатъчно ли е пречка, за да ги спре?
Снимка: euronews.com
Euro News | 2024-02-21 | 17:16:23

Как се обучават AI инструментите тревожи създателите. Законът за авторското право достатъчно ли е пречка, за да ги спре?

Спечелили ли са вече компаниите с изкуствен интелект по въпросите на авторските права? Някои експерти казват, че може да имат, въпреки че може да се решава за всеки отделен случай.

Когато немският фотограф Робърт Кнешке използва онлайн уебсайт преди година, за да види дали неговите снимки, защитени с авторски права, са били използвани за обучение на инструменти за изкуствен интелект (AI), той беше „зашеметен и шокиран“ от това колко много е открил.

Поне 20 изображения с воден знак от неговото портфолио бяха събрани в набори от данни, предоставени от немската организация с нестопанска цел AI LAION за обучение на системи за машинно обучение като Stable Diffusion.

Но когато фотографът попита за да премахнат снимките, адвокатите на LAION твърдят, че базата данни предоставя достъп до изображения, публично достъпни в интернет, и не запазва копия от тях.

С датата на процеса, определен за 25 април в Хамбург, делото на Кнешке ще бъде едно от първите съдебни процеси по рода си в Европа, тъй като артисти, автори и компании завеждат съдебни дела срещу компании с изкуствен интелект, които са обучавали върху съдържание, бракувано от интернет.

Експертите обаче казват, че проблемът с тези инструментите, използващи защитени с авторски права произведения за обучение, нямат предрешен резултат, като е вероятно да бъдат тълкувани от съдилищата за всеки отделен случай, ако се появи повече.

OpenAI казва, че е „невъзможно“ да се обучава AI без защитени с авторски права материали

Нарушаването на авторските права ще бъде „трудно за доказване“

Генеративните AI модели като ChatGPT се обучават върху огромни количества материали и информация, за да се научат как да създават човешко съдържание.

“ Да обучавам модел, който генерира съдържание, е много като аз да прочета куп романи на Джон Стайнбек и след това да напиша роман, за да се опитам да имитирам стила на Джон Стайнбек“, каза Марк Кауфман, партньор в Rimon Law във Вашингтон.

Ако той напише роман, който разказва същата история като някой от романите на Стайнбек, това може да е нарушение на авторските права, докато ако имитира стила на писане, това вероятно няма да се счита за такова.

„Имитирането на стил наистина не е нарушение на авторските права. Копирането на история е нарушение на авторските права“, каза той.

Google и OpenAI предоставиха подобни аргументи за обучението за машинно обучение в края на миналата година в отделни отговори до Службата за авторско право на САЩ, като част от нейното разследване относно AI и авторските права .

Google сравни инструментите за обучение на AI с предишно съдебно дело, заявявайки, че „действието на четене на книга и научаване на фактите и идеите в нея“ няма да се счита за нарушение.

OpenAI подчерта, че системите не запазват копия и трябва да генерират ново съдържание.

„Когато бъде поискан отговор, моделът използва своите тегла, за да напише нов отговор всеки път, когато бъде поискан“, генералът на OpenAI адвокатът възрази.

„Той не копира отговора си от своите данни преди обучението или осъществява достъп до него чрез база данни. Подобно на човек, който е прочел книга и я е оставил, нашите модели нямат достъп до информация за обучение, след като са се научили от нея”.

Кауфман казва, че нарушаването на авторските права трябва да се основава „на изхода на модела AI” и колко сходен е той с оригиналното произведение, което е мнение, споделяно от други експерти.

Той обаче твърди, че може да има предположението, че е купил романите законно, докато някои създатели биха могли да твърдят, че компаниите за изкуствен интелект са копирали тяхното изкуство или текст директно от интернет нелегитимно.

Един от проблемите е, че хората може да не знаят дали техният материал е бил използван, което го прави „трудно за доказване, защото защитеното произведение не е „Вече го няма, това е просто резултат от машинното обучение, което е там“, каза Даниел Уестман, независим правен съветник по авторското право в Швеция.

В САЩ са подадени няколко видни дела, с New York Times по-специално съди създателя на ChatGPT OpenAI за „милиарди долари законови и действителни щети“ за използване на неговите статии за обучение.

Адвокатите на вестника твърдят, че „незаконното използване“ на неговите статии ще позволи на AI инструменти за създаване на съдържание, което да се конкурира с New York Times, като делото включва конкретни примери за „резултат, който рецитира съдържанието на Times дословно“.

Но докато случаи като този могат да зависят от клауза за „честна употреба“ в САЩ, който предоставя определени изключения за нелицензирано използване на произведения, има някои разлики в Европейския съюз, които може да са в полза на притежателите на права.

Носителят на наградата Пулицър сред авторите съди създателя на ChatGPT OpenAI за нарушаване на авторски права

Директивата на ЕС позволява 'opt-out'

Въпреки че имаше усилие да се включи „клауза за честна употреба“, подобна на тази на САЩ, в правото на ЕС, според експерта по интелектуална собственост Мариан Левин от Стокхолмския университет, всички европейски страни стигнаха до таблица със специфични изключения.

„Сега имате нещо като шведска маса в този параграф [от директивата на ЕС за авторското право] с много различни изключения“, обясни тя.

Вместо тези изключения, експертите посочиха по-нова директива на ЕС като основа за дела за авторски права, свързани с AI.

Говорител на Европейската комисия каза пред Euronews Next, че като общо правило „разработчикът или потребителят на изкуственият интелект трябва да иска съгласието на притежателя на правата“ за използване на произведения, защитени с авторски права, за обучение на системи за изкуствен интелект.

Комисията по-рано посочи директива от 2019 г., която се прилага в държавите от ЕС от юни 2021 г., която предоставя повече конкретна клауза за „извличане на текст и данни“, автоматизиран процес на претърсване на големи количества съдържание, за да се намерят модели.

Директивата позволява на творци като художници и автори да се откажат от използването на произведенията им за тази цел.

„В днешно време много дискусии, които се водят в Европа, са за това дали това изключение изобщо е приложимо за вземане на материал на някой друг и използването му за машинно обучение“, каза Уестман, но в момента няма „стандартизиран начин за отказ от всяка употреба“, като някои експерти се съмняват относно прилагането му.

Комисарят по вътрешния пазар Тиери Бретон каза, че тази директива се отнася за „контекста на ИИ“ в отговор наЕвропейския парламент през март 2023 г.

Ако е необходимо съгласието на притежателите на права, може да има ограничено лицензиране на произведения за обучение на AI инструменти в Европа.

„Има естествена претенция от страна на артистичното, музикално общество, където те казват, „но сега те използват нашите произведения, защо не ни плащат?“, каза Левин.

Това беше сред опасенията подчертано от миналата година на сценаристите и актьорите, която затвори индустрията за месеци. И все пак последвалите споразумения не завършиха с категорична забрана за използване на тяхната работа за обучение на ИИ.

„Това е тема, която ще продължим да наблюдаваме и, в зависимост от резултата от съдебния спор и проучванията, можем преразгледайте тази тема, ако съдилищата и службата за авторски права установят, че обучението изисква съгласие“, каза гилдията на актьорите SAG-AFTRA на своя. например да използват техните материали за обучение. Axel Springer, който притежава BILD и WELT, сключи такова партньорство с производителя на ChatGPT през декември 2023 г.

Немската база данни за обучение LAION посочва, че хората биха могли да помогнат на компаниите с изкуствен интелект, като използват лиценз за обществено достояние, за да осигурят достъп до техните данни като добре, което те твърдят, че би помогнало за демократизирането и захранването на индустрията.

Предстои повече прозрачност?

Новият закон за ИИ на Европа включва разпоредба за прозрачност, задължаваща компаниите да разкриват резюмета за „ съдържание, използвано за обучение” модели за машинно обучение.

То ще стане приложимо две години след влизането му в сила след представянето му в Европейския парламент, с изключение на някои забрани, които влизат в сила по-рано.

Westman каза, че този вид задължение може да направи нещата „малко по-добри за притежателите на права“, но не променя нищо на „фундаментално ниво“.

Жения Жицев, съосновател на базата данни LAION която е изправена пред делото на германския фотограф в съда тази година, каза пред Euronews Next в имейл, че организацията за изкуствен интелект поддържа прозрачност за модели за машинно обучение, като посочи, че те предлагат единствените прозрачни набори от данни за обучение.

Европейски Говорителят на Комисията добави, че докато „взаимодействието между AI и авторското право е сложно и изисква постоянно наблюдение“, настоящите правила „като цяло са достатъчни, за да се справят с различните повдигнати проблеми“.

Те очакват, че бъдещите проблеми с авторското право ще да се определя за всеки отделен случай.

Левин каза, че по много начини създателите на AI инструменти са спечелили, като са били първи, докато другите играят регулаторно догонване.

„Те имат определена дистанция, където те вече започнаха, така че смятам, че спечелиха“, каза тя.

Източник: euronews.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!