"Meta" patvirtino "Book3" duomenų panaudojimą, teigdama laikosi sąžiningo naudojimo principų

Technologijų milžinė „Meta” atsidūrė dėmesio centre po to, kai patvirtino, kad jos dirbtinio intelekto modelių kūrimui buvo naudojami „Book3” duomenys – vienas didžiausių knygų tekstų rinkinių, sukėlusių nemažai diskusijų autorių teisių apsaugos srityje. Kompanija teigia, kad jos veiksmai atitinka „sąžiningo naudojimo” principus, tačiau autoriai ir leidėjai turi kitokią nuomonę. Šis pripažinimas iškėlė fundamentalius klausimus apie intelektinės nuosavybės teises skaitmeniniame amžiuje ir DI modelių mokymo praktikas.

Kas yra „Book3” ir kodėl tai svarbu?

„Book3” – tai milžiniškas tekstų rinkinys, sudarytas iš daugiau nei 196,000 knygų, kuris buvo sukurtas ir naudojamas dirbtinio intelekto modelių mokymui. Šis duomenų rinkinys tapo ypač kontraversiškas, kai paaiškėjo, kad jame esantys tekstai buvo surinkti be aiškaus autorių sutikimo. Rinkinys apima įvairių žanrų literatūrą – nuo grožinės iki mokslinės, nuo bestselerių iki mažiau žinomų kūrinių.

Duomenų rinkinio svarba glūdi ne tik jo apimtyje, bet ir kokybėje – knyga yra vienas sudėtingiausių žmogaus sukurtų tekstinių kūrinių, kuriame atsiskleidžia subtilios kalbos niuansai, naratyvų struktūros ir idėjų raiška. Būtent dėl to knygų tekstai yra ypač vertingi mokant DI modelius generuoti nuoseklų, kontekstualų ir prasmingą turinį.

Daugelis autorių sužinojo apie savo kūrinių panaudojimą tik po fakto, kas sukėlė teisėtą pasipiktinimą ir virtinę teisinių iššūkių DI kompanijoms, įskaitant „Meta”.

Meta pozicija: kodėl jie mano veikiantys teisėtai?

„Meta” atstovai, patvirtindami „Book3” duomenų naudojimą savo LLaMA modelių mokymui, remiasi JAV autorių teisių doktrina, vadinama „sąžiningu naudojimu” (angl. fair use). Ši doktrina leidžia ribotą autorių teisėmis apsaugotų kūrinių naudojimą be leidimo tam tikrais atvejais, įskaitant mokslinius tyrimus, komentarus ar transformatyvinį naudojimą.

Kompanijos teigimu, jų DI modelių mokymas atitinka transformatyvinio naudojimo kriterijus, nes:

Originalūs tekstai nėra tiesiogiai atkuriami ar platinami
Duomenys naudojami naujai technologijai kurti, o ne konkuruoti su originaliais kūriniais
Modeliai išmoksta kalbos struktūras ir semantiką, o ne konkrečius tekstus
Galutinis produktas (DI modelis) yra visiškai skirtingas nuo pradinių kūrinių

„Meta” teisininkai taip pat pabrėžia, kad kompanija investuoja į priemones, padedančias užkirsti kelią tiesioginiam autorių tekstų atkūrimui, ir kad jų modeliai yra sukurti taip, kad generuotų originalų turinį, o ne kopijuotų esamus kūrinius.

Autorių ir leidėjų kontrargumentai

Rašytojai, leidėjai ir jų teisių gynimo organizacijos kategoriškai nesutinka su „Meta” pozicija. Jų argumentai remiasi keliais esminiais prieštaravimais:

Pirma, autoriai teigia, kad „sąžiningo naudojimo” doktrina nebuvo sukurta tokio masto komerciniam naudojimui pateisinti. Jie pabrėžia, kad „Meta”, kaip pelno siekianti korporacija, kurios vertė siekia šimtus milijardų dolerių, naudoja jų intelektinę nuosavybę kurdama produktus, generuosiančius milžiniškas pajamas.

Antra, kyla fundamentalus klausimas apie sutikimą. Daugelis autorių niekada nedavė leidimo jų kūriniams būti įtrauktiems į „Book3” ar panašius duomenų rinkinius. Autorių teisių ekspertai argumentuoja, kad automatizuotas tekstų „nugramdymas” iš interneto ar skaitmeninių bibliotekų neatitinka teisėto duomenų gavimo standartų.

Trečia, kyla ekonominio poveikio klausimas. Jei DI modeliai, išmokyti naudojant autorių kūrinius, pradės generuoti kokybišką turinį, kuris konkuruos su žmonių kūryba, tai gali turėti neigiamą poveikį autorių pragyvenimo šaltiniams. Kai kurie rašytojai jau dabar praneša apie sumažėjusias pajamas dėl DI sugeneruoto turinio plitimo.

Galiausiai, autoriai pabrėžia, kad jų kūriniai dažnai atspindi asmenines patirtis, kultūrines perspektyvas ir unikalų balsą – elementus, kuriuos DI kompanijos „išgauna” be atlygio ar pripažinimo.

Teisiniai precedentai ir besiformuojanti praktika

Teisinis kraštovaizdis, susijęs su DI mokymu naudojant autorių teisėmis apsaugotą turinį, vis dar formuojasi. Tačiau jau dabar matome keletą svarbių atvejų, kurie gali nulemti būsimą praktiką:

2023 metais grupė autorių, įskaitant Sarah Silverman, pateikė ieškinį prieš „Meta” ir „OpenAI”, teigdami, kad jų kūriniai buvo neteisėtai naudojami DI modelių mokymui. Nors bylos dar neišspręstos, jos jau dabar formuoja teisinį diskursą.

Neseniai JAV teismas priėmė sprendimą „Thaler v. Perlmutter” byloje, kuriame nurodė, kad DI sugeneruoti kūriniai negali būti saugomi autorių teisėmis, nes jiems trūksta žmogiškos kūrybos elemento. Šis sprendimas netiesiogiai pabrėžia žmogaus kūrybos vertę ir unikalumą.

Europos Sąjungoje Bendrasis duomenų apsaugos reglamentas (GDPR) ir naujoji Dirbtinio intelekto aktas (AI Act) nustato griežtesnius reikalavimus duomenų naudojimui, įskaitant skaidrumo ir sutikimo principus, kurie gali būti taikomi ir autorių teisėmis apsaugotam turiniui.

Šie teisiniai pokyčiai rodo, kad „sąžiningo naudojimo” argumentas nėra universalus ir jo taikymas DI mokymui gali būti apribotas ateityje.

Alternatyvūs modeliai: kaip suderinti inovacijas ir autorių teises?

Augant įtampai tarp technologijų kompanijų ir kūrėjų bendruomenių, pradeda formuotis alternatyvūs modeliai, kurie galėtų suderinti DI inovacijas su pagarba autorių teisėms:

Licencijavimo modeliai. Kai kurios kompanijos, pavyzdžiui, „Shutterstock” ir „Adobe”, jau pradėjo kurti licencijavimo sistemas, kurios leidžia atlyginti kūrėjams už jų darbų naudojimą DI mokymui. Šie modeliai galėtų būti pritaikyti ir literatūros kūriniams.

Opt-in/opt-out mechanizmai. Autoriai galėtų turėti galimybę pasirinkti, ar jų kūriniai bus naudojami DI mokymui, ir nustatyti tokio naudojimo sąlygas. Tai galėtų būti įgyvendinta per centralizuotas platformas ar registrus.

Sintetiniai duomenys. Technologijų kompanijos galėtų investuoti į sintetinių mokymo duomenų kūrimą, kurie nebūtų tiesiogiai pagrįsti autorių teisėmis apsaugotais kūriniais.

Atviri duomenų rinkiniai. Bendruomenės kuriami atviri duomenų rinkiniai, sudaryti iš viešo naudojimo kūrinių ar specialiai DI mokymui sukurtų tekstų, galėtų tapti alternatyva problemiškiems rinkiniams kaip „Book3”.

Šie alternatyvūs modeliai reikalauja bendradarbiavimo tarp technologijų kompanijų, autorių, leidėjų ir reguliuotojų, tačiau jie gali sukurti tvaresnę ekosistemą, kurioje būtų gerbiamos tiek inovacijos, tiek kūrėjų teisės.

Praktinės rekomendacijos suinteresuotoms šalims

Šioje sudėtingoje situacijoje kiekviena suinteresuota šalis gali imtis konkrečių veiksmų:

Autoriams ir kūrėjams:

Susipažinkite su savo kūrinių licencijavimo sąlygomis ir, jei įmanoma, įtraukite nuostatas dėl DI naudojimo
Prisijunkite prie autorių teisių gynimo organizacijų, kurios aktyviai dalyvauja formuojant politiką
Apsvarstykite galimybę naudoti Creative Commons licencijas su „NoAI” sąlyga, kuri draudžia naudoti kūrinius DI mokymui
Sekite teisinius pokyčius ir, jei įmanoma, dalyvaukite viešose konsultacijose dėl DI reguliavimo

Technologijų kompanijoms:

Investuokite į skaidrumo priemones, kurios leistų identifikuoti mokymo duomenų šaltinius
Sukurkite kompensavimo mechanizmus kūrėjams, kurių darbai naudojami jūsų modeliams mokyti
Bendradarbiaukite su autorių organizacijomis kuriant etiškus duomenų rinkimo protokolus
Vystykite technologijas, kurios padėtų išvengti autorių kūrinių plagijavimo ar atkūrimo

Politikos formuotojams:

Atnaujinkite autorių teisių įstatymus, atsižvelgdami į DI keliamus iššūkius
Sukurkite aiškias gaires dėl „sąžiningo naudojimo” taikymo DI kontekste
Remkite mokslinius tyrimus, skirtus DI poveikiui kūrybinėms industrijoms įvertinti
Užtikrinkite, kad reguliavimas būtų subalansuotas – skatintų inovacijas, bet ir apsaugotų kūrėjų teises

Kūrybos ir technologijų sankryžoje: ko tikėtis ateityje

Konfliktas tarp „Meta” ir autorių bendruomenės dėl „Book3” duomenų naudojimo atspindi platesnį lūžį tarp technologijų ir kūrybos pasaulių. Tačiau šis įtemptas momentas gali tapti katalizatoriumi naujiems sprendimams ir bendradarbiavimo modeliams.

Tikėtina, kad artimiausioje ateityje matysime daugiau teisinių procesų, kurie padės nubrėžti aiškesnes ribas tarp leistino ir neleistino autorių teisėmis apsaugoto turinio naudojimo. Šie procesai gali užtrukti metų metus, tačiau jie formuos DI industrijos ateitį.

Tuo pačiu metu technologijų kompanijos greičiausiai taps atsargesnės ir skaidresnės dėl savo mokymo duomenų. Jau dabar matome, kad kai kurios kompanijos pradeda dokumentuoti savo duomenų šaltinius ir kurti „duomenų kilmės” sistemas.

Galiausiai, šis konfliktas gali paskatinti naują kūrybos erą, kurioje žmogaus ir mašinos bendradarbiavimas taps norma. Vietoj to, kad DI pakeistų žmogaus kūrybą, ji gali tapti įrankiu, išplečiančiu kūrybines galimybes – bet tik jei bus sukurta sistema, kurioje autorių teisės ir indėlis yra tinkamai pripažįstami ir atlyginami.

Istorija mus moko, kad technologiniai lūžiai visada kelia įtampą, bet galiausiai visuomenė prisitaiko, sukurdama naujas normas ir praktikas. „Book3” kontroversija gali būti tik pradžia ilgo kelio link naujos pusiausvyros tarp technologinių inovacijų ir kūrybinės išraiškos vertės.

„Meta” patvirtino „Book3” duomenų panaudojimą, teigdama laikosi sąžiningo naudojimo principų