Pokud požádáte GPT-4, aby udělal pasáž ve stylu Carmen Machado nebo Margaret Atwood nebo Alexander Chee, odvede v tom dobrou práci a má to dobrý důvod: Pravděpodobně pohltil všechna jejich díla v tréninkovém procesu a nyní využívá jejich vynalézavosti pro své vlastní. Ale tito autoři a tisíce dalších nejsou s touto skutečností spokojeni.
V otevřeném dopise podepsaném více než 8 500 autory beletrie, literatury faktu a poezie jsou technologické společnosti stojící za velkými jazykovými modely, jako je ChatGPT, Bard, LLaMa a další, pověřeny používáním jejich psaní bez povolení nebo náhrady.
„Tyto technologie napodobují a opakují náš jazyk, příběhy, styl a nápady. Miliony autorsky chráněných knih, článků, esejů a poezie poskytují ‚potravu‘ pro systémy umělé inteligence, nekonečná jídla, za která nebyl žádný účet,“ píše se v dopise.
Navzdory tomu, že se jejich systémy ukázaly jako schopné citovat a napodobovat dotyčné autory, vývojáři AI se výrazně nezabývali původem těchto děl. Jsou vyškoleni na vzorcích seškrábaných z knihkupectví a recenzí? Půjčili si každou knihu z knihovny? Nebo si snad jednoduše stáhli jeden z mnoha nelegálních archivů, jako je Libgen?
Jedna věc je jistá: Nešli za vydavateli a nelicencovali je – nepochybně preferovaná metoda a pravděpodobně jediná legální a etická. Jak píšou autoři:
Nejenže nedávné rozhodnutí Nejvyššího soudu ve věci Warhol v. Goldsmith jasně ukazuje, že vysoká komerčnost vašeho použití hovoří proti principu fair use, ale žádný soud by kopírování děl z nelegálních zdrojů neomlouval jako fair use. V důsledku zabudování našich spisů do vašich systémů hrozí, že generativní umělá inteligence poškodí naši profesi tím, že zaplaví trh průměrnými, strojově psanými knihami, příběhy a žurnalistikou založenou na naší práci.
Ve skutečnosti jsme to již viděli. V poslední době řada děl vytvořených umělou inteligencí velmi nízké kvality stoupala na žebříčku nejprodávanějších YA na Amazonu; vydavatelé jsou zaplaveni vytvořenými díly; a každý den je právě tato webová stránka (a v krátkosti i tento příspěvek) seškrabávána pro obsah, který má být přepracován do kamaráda pro SEO.
Tito zákeřní aktéři používají nástroje, rozhraní API a agenty vyvinuté společnostmi jako OpenAI a Meta, o nichž lze v tomto kontextu sami o sobě říci, že jsou zákeřnými aktéry. Koneckonců, kdo jiný by vědomě ukradl miliony děl, aby poháněl nový komerční produkt? (No, Google, samozřejmě – ale indexování vyhledávání se podstatně liší od přijímání AI a Knihy Google měly alespoň výmluvu, že to měl být vyhrazený index.)
Vzhledem k tomu, že méně autorů je schopno se uživit psaním kvůli složitosti a úzkým okrajům rozsáhlého publikování, otevřený dopis varuje, že je to pro ně neudržitelná situace, zejména pro novější autory, „zejména mladé spisovatele a hlasy z nedostatečně zastoupených komunit“.
Dopis žádá společnosti, aby učinily následující:
1. Získejte povolení k použití našeho materiálu chráněného autorským právem ve vašich generativních programech umělé inteligence.
2. Odměňte autory spravedlivě za minulé a pokračující používání našich děl ve vašich generativních programech umělé inteligence.
3. Odměňte autory spravedlivě za použití našich děl ve výstupu AI bez ohledu na to, zda výstupy porušují autorská práva podle současných zákonů.
Neexistuje žádná právní hrozba – jak řekla generální ředitelka The Author’s Guild (a signatářka) Mary Rasenberger NPR: „Soudy jsou obrovské množství peněz. Trvá jim to opravdu dlouho.” A AI teď autorům škodí.
Která společnost jako první řekne „ano, postavili jsme naši AI na ukradených dílech a je nám líto a zaplatíme za to“? Někdo se to může dohadovat, ale zdá se, že k tomu není příliš podnětů. Většina lidí si není vědoma nebo se obává, že LLM jsou vytvářeny v jakém množství až nezákonnými prostředky a že mohou ve skutečnosti obsahovat a vyvracet díla chráněná autorským právem. Je snazší vidět (velmi podobný) problém, když se jedná o vygenerovaný obrázek reprodukující osobitý styl umělce, a tam je nějaký odraz.
Ale jemnější poškození používání všech knih George Saunderse nebo Diany Gabaldon jako „potravy“ pro něčí AI nemusí tolik podnítit k akci – ačkoli spousta autorů je připravena bojovat.