A Wikipedia alapítója, Jimmy Wales egy friss interjúban arról beszélt, hogy az enciklopédia üzemeltetője új licencmegállapodásokat keres nagy technológiai cégekkel. A cél az, hogy a Wikipedia ne csak „ingyen adatbányaként” szolgáljon az AI-modellek számára, hanem kompenzációt kapjon az óriási terhelésért, amit az AI-botok generálnak a rendszeren.
Wales szerint az AI-vállalatok nagy nyelvi modelljei úgy használják a Wikipedia szövegeit, hogy közben a megnövekedett szerverköltséget a nonprofit Wikimedia Foundation állja – miközben a tartalomra épülő kereskedelmi termékek sokszor milliárdos értékű üzleti projektekké válnak.
AI-botok terhelése: amikor a nyílt tudásnak ára lesz
Az AI-botok ma már nem egy-egy cikket töltenek le, hanem a teljes Wikipedia-adatbázist végigpásztázzák. Ez azt jelenti, hogy:
-
több szerverre van szükség,
-
több memória és cache-kapacitás kell,
-
összességében aránytalanul nagy költségnövekedést okoz az automatizált AI-forgalom.
Miközben a tartalom továbbra is szabadon elérhető az egyéni felhasználók számára, a nagy volumenű, automatizált hozzáférés már egészen más kategória. Wales szerint a közösségi adományozókat nem arra kérik, hogy OpenAI-t, Metát vagy más AI-óriásokat támogassanak közvetve a szerverköltségeken keresztül.
Google volt az első, most jöhetnek a többiek
A Wikimedia Foundation már korábban licencmegállapodást kötött a Google-lel, amelyben a keresőóriás fizet a Wikipedia-tartalmak AI-modellek tréningjéhez való hozzáféréséért. A Wikipedia-cikkek a nagy nyelvi modellek egyik alapvető adatszetjét jelentik, ezért a Google-deal fontos precedensnek számít.
Wales most azt mondja:
-
a cél, hogy más nagy AI- és techcégek is hasonló megállapodást kössenek,
-
a tárgyalások több szereplővel már folyamatban vannak,
-
a Wikipedia továbbra is nyitott marad a tudásmegosztásra, de üzleti felhasználásnál szeretnék rendezni a terheket.
Soft power, szégyenfal és jogi lépések kérdése
Felmerült az is, hogy a Wikipedia jogi útra tereli-e az ügyet, ha egy AI-cég fizetés nélkül használja a tartalmait modelltréningre. Wales szerint egyelőre nem ez az első számú forgatókönyv: úgy látja, hogy a Wikipedia „puha ereje”, azaz nyilvános nyomásgyakorlása és reputációs súlya önmagában is elég erős lehet ahhoz, hogy a cégek megállapodjanak.
Közben a vita túlmutat egyetlen nonprofit szervezeten:
-
ki fizessen az AI-forradalomhoz szükséges alapadatokért,
-
kötelesek-e a kereskedelmi AI-cégek kompenzálni a közösségi és nonprofit tudásbázisokat,
-
és hogyan lehet ezt jogilag, technikailag és etikailag is kezelni úgy, hogy ne sérüljön a nyílt tudás eszménye.
Cloudflare-es fék az AI-botoknak? Technikai lépések az asztalon
Wales azt is jelezte, hogy a Wikipedia technikai védelmi megoldásokat is fontolgat az AI-botok visszafogására. Az egyik opció a Cloudflare AI Crawl Control, amellyel szabályozható, hogy az AI-crawlerek milyen gyakran és milyen módon férnek hozzá a tartalmakhoz.
Ez viszont komoly dilemmát okoz:
-
a Wikipedia ideológiai alappillére a nyílt hozzáférés,
-
ha elkezdik korlátozni az AI-botok hozzáférését, az üzenet az, hogy a nyíltság már nem feltétlenül feltétel nélküli,
-
ugyanakkor a pénzügyi teher jelenlegi formában hosszú távon nehezen fenntartható.
A most zajló licenc- és technikai tárgyalások arról szólnak, hogyan lehet úgy védeni a Wikipedia működését, hogy közben ne sérüljön a szabad tudás eszméje.
Közösség, neutralitás és az AI-korszak
A Wikimedia Foundation több mint két évtizede működteti a Wikipediát nonprofit alapon, önkéntes szerkesztők globális közösségére és kis összegű adományokra támaszkodva. Közben a projektnek folyamatosan meg kell küzdenie azzal, hogy megőrizze semleges nézőpontját, különösen háborúk, politikai válságok vagy érzékeny társadalmi témák idején.
Az AI-korszak rátesz még egy réteget:
-
a Wikipedia egyszerre inputja az AI-rendszereknek,
-
és ellenpontja is, mert a szerkesztői közösség továbbra is megpróbál ellenőrzött forrásokra támaszkodva, vitás témákban is kiegyensúlyozott tartalmat adni.
A most zajló licenctárgyalások így nemcsak arról szólnak, hogy mennyi pénzt kap a Wikipedia a szerverköltségek ellentételezésére, hanem arról is, hogy hogyan viszonyul egymáshoz a nyílt tudás és az üzleti AI-ipar az elkövetkező években.