Encyclopedie vrij van ai-inhoud, niet van ai-geld
De vrije encyclopedie Wikipedia verbiedt door ai-gegenereerde inhoud. Maar terwijl de menselijke redacteuren van Wikipedia een verbod op ai-teksten konden afdwingen, sloot de encyclopedie deals met Microsoft, Meta en Amazon voor hun ai-training op Wikipedia-inhoud.
Wikipedia, de grootste encyclopedie ter wereld met meer dan 67 miljoen artikelen verspreid over meer dan 360 taalversies, trekt een duidelijke grens: kunstmatige intelligentie mag geen inhoud meer schrijven of herschrijven voor het platform.
Het besluit komt er na maanden van intern debat onder de vrijwillige redacteuren, in totaal zijn dat er een kwart miljoen, die de encyclopedie dag in dag uit draaiende houden. Zij stemden uiteindelijk vóór het verbod. Op zich geen verrassing, want Wikipedia draait al zowat twintig jaar op menselijke verificatie.
Toch twee uitzonderingen
De nieuwe beleidsregel bepaalt dat het gebruik van grote taalmodellen ‘vaak de kernprincipes van Wikipedia schendt’. Twee uitzonderingen zijn er wel: ai mag worden ingezet voor vertalingen en voor kleine tekstcorrecties, op voorwaarde dat een mens de aanpassingen controleert.
Maar zelfs daarvoor geldt een waarschuwing: ‘Voorzichtigheid is geboden, want llm’s kunnen verder gaan dan gevraagd en de betekenis van de tekst zodanig veranderen dat die niet langer wordt onderbouwd door de geciteerde bronnen’, aldus de beleidstekst.
Bij Wikipedia zijn ze als de dood voor door ai misleidende of ‘verzonnen’ resultaten. Een situatie die Jimmy Wales, de oprichter van Wikipedia, eerder als een ‘puinhoop’ omschreef.
Bots die de boel leegschrapen
Wikipedia worstelt ook in ander opzicht met ai-perikelen. De voorbije jaren heeft de online encyclopedie te maken gehad met een stortvloed aan geautomatiseerde bots die de site leegschrapen om trainingsdata te verzamelen. Dit verstoort de toegang tot de site en dwingt de organisatie tot extra capaciteit en hogere datacenterfacturen.
Alleen al de bandbreedte voor multimediadownloads steeg met 50 procent tussen begin 2024 en april 2025 door bots die afbeeldingen ophaalden voor ai-modellen. Minstens 65 procent van het resource-intensieve verkeer bleek van bots afkomstig, disproportioneel hoog tegenover hun aandeel van ‘slechts’ 35 procent in het totale paginaverkeer.
Bij Wikipedia luidden ze daarom een jaar geleden al de noodklok. ‘Onze inhoud is gratis, onze infrastructuur niet’, zo klonk het.
Opmerkelijke spreidstand
Begin dit jaar maakte de non-profitorganisatie dan ook grote partnerschappen bekend met Microsoft, Meta en Amazon, naast eerder gesloten deals met Perplexity, Mistral AI en Google. Via het enterprise-product betalen die bedrijven voor toegang tot Wikipedia-inhoud als trainingsdata, in ruil voor data op maat van hun grootschalige behoeften.
Daarmee schetst Wikipedia een opmerkelijke spreidstand: het beschermt zijn encyclopedische integriteit door ai-tekst te verbieden, terwijl het zijn voortbestaan deels financiert door diezelfde techreuzen toegang te geven tot zijn inhoud voor ai-training.
