Menü Bezárás

Wikipedia: új AI-licencszerződéseket keres a Google-megállapodás mintájára

A Wikipedia alapítója, Jimmy Wales egy friss interjúban arról beszélt, hogy az enciklopédia üzemeltetője új licencmegállapodásokat keres nagy technológiai cégekkel. A cél az, hogy a Wikipedia ne csak „ingyen adatbányaként” szolgáljon az AI-modellek számára, hanem kompenzációt kapjon az óriási terhelésért, amit az AI-botok generálnak a rendszeren.

Wales szerint az AI-vállalatok nagy nyelvi modelljei úgy használják a Wikipedia szövegeit, hogy közben a megnövekedett szerverköltséget a nonprofit Wikimedia Foundation állja – miközben a tartalomra épülő kereskedelmi termékek sokszor milliárdos értékű üzleti projektekké válnak.


AI-botok terhelése: amikor a nyílt tudásnak ára lesz

Az AI-botok ma már nem egy-egy cikket töltenek le, hanem a teljes Wikipedia-adatbázist végigpásztázzák. Ez azt jelenti, hogy:

  • több szerverre van szükség,

  • több memória és cache-kapacitás kell,

  • összességében aránytalanul nagy költségnövekedést okoz az automatizált AI-forgalom.

Miközben a tartalom továbbra is szabadon elérhető az egyéni felhasználók számára, a nagy volumenű, automatizált hozzáférés már egészen más kategória. Wales szerint a közösségi adományozókat nem arra kérik, hogy OpenAI-t, Metát vagy más AI-óriásokat támogassanak közvetve a szerverköltségeken keresztül.


Google volt az első, most jöhetnek a többiek

A Wikimedia Foundation már korábban licencmegállapodást kötött a Google-lel, amelyben a keresőóriás fizet a Wikipedia-tartalmak AI-modellek tréningjéhez való hozzáféréséért. A Wikipedia-cikkek a nagy nyelvi modellek egyik alapvető adatszetjét jelentik, ezért a Google-deal fontos precedensnek számít.

Wales most azt mondja:

  • a cél, hogy más nagy AI- és techcégek is hasonló megállapodást kössenek,

  • a tárgyalások több szereplővel már folyamatban vannak,

  • a Wikipedia továbbra is nyitott marad a tudásmegosztásra, de üzleti felhasználásnál szeretnék rendezni a terheket.


Soft power, szégyenfal és jogi lépések kérdése

Felmerült az is, hogy a Wikipedia jogi útra tereli-e az ügyet, ha egy AI-cég fizetés nélkül használja a tartalmait modelltréningre. Wales szerint egyelőre nem ez az első számú forgatókönyv: úgy látja, hogy a Wikipedia „puha ereje”, azaz nyilvános nyomásgyakorlása és reputációs súlya önmagában is elég erős lehet ahhoz, hogy a cégek megállapodjanak.

Közben a vita túlmutat egyetlen nonprofit szervezeten:

  • ki fizessen az AI-forradalomhoz szükséges alapadatokért,

  • kötelesek-e a kereskedelmi AI-cégek kompenzálni a közösségi és nonprofit tudásbázisokat,

  • és hogyan lehet ezt jogilag, technikailag és etikailag is kezelni úgy, hogy ne sérüljön a nyílt tudás eszménye.


Cloudflare-es fék az AI-botoknak? Technikai lépések az asztalon

Wales azt is jelezte, hogy a Wikipedia technikai védelmi megoldásokat is fontolgat az AI-botok visszafogására. Az egyik opció a Cloudflare AI Crawl Control, amellyel szabályozható, hogy az AI-crawlerek milyen gyakran és milyen módon férnek hozzá a tartalmakhoz.

Ez viszont komoly dilemmát okoz:

  • a Wikipedia ideológiai alappillére a nyílt hozzáférés,

  • ha elkezdik korlátozni az AI-botok hozzáférését, az üzenet az, hogy a nyíltság már nem feltétlenül feltétel nélküli,

  • ugyanakkor a pénzügyi teher jelenlegi formában hosszú távon nehezen fenntartható.

A most zajló licenc- és technikai tárgyalások arról szólnak, hogyan lehet úgy védeni a Wikipedia működését, hogy közben ne sérüljön a szabad tudás eszméje.


Közösség, neutralitás és az AI-korszak

A Wikimedia Foundation több mint két évtizede működteti a Wikipediát nonprofit alapon, önkéntes szerkesztők globális közösségére és kis összegű adományokra támaszkodva. Közben a projektnek folyamatosan meg kell küzdenie azzal, hogy megőrizze semleges nézőpontját, különösen háborúk, politikai válságok vagy érzékeny társadalmi témák idején.

Az AI-korszak rátesz még egy réteget:

  • a Wikipedia egyszerre inputja az AI-rendszereknek,

  • és ellenpontja is, mert a szerkesztői közösség továbbra is megpróbál ellenőrzött forrásokra támaszkodva, vitás témákban is kiegyensúlyozott tartalmat adni.

A most zajló licenctárgyalások így nemcsak arról szólnak, hogy mennyi pénzt kap a Wikipedia a szerverköltségek ellentételezésére, hanem arról is, hogy hogyan viszonyul egymáshoz a nyílt tudás és az üzleti AI-ipar az elkövetkező években.

TÁRCSÁZOM