Wikipedia verbiedt het gebruik van AI-gegenereerde content op het platform. De organisatie, een van de grootste open kennisbronnen ter wereld, wil voorkomen dat automatisch gegenereerde content de kwaliteit en betrouwbaarheid van informatie aantast.
▼
Kwaliteit onder druk
Het besluit volgt op maanden van intern overleg onder de ruim kwart miljoen vrijwillige redacteuren die het platform onderhouden. Uiteindelijk stemde een meerderheid voor het verbod, wat niet verrassend is. Het platform, met 67 miljoen artikelen in meer dan 360 taalversies, is gebouwd op menselijke verificatie en vrije toegang tot kennis.
Die openheid maakt het waardevol, maar ook kwetsbaar. Generatieve AI kan in korte tijd grote hoeveelheden tekst produceren en bewerken, wat het risico vergroot op onnauwkeurigheden, onduidelijke bronnen en content waarvan de herkomst lastig te achterhalen is. Voor een platform dat draait op controleerbaarheid en transparantie is dat een direct probleem.
Er zijn twee uitzonderingen. Redacteuren mogen AI nog gebruiken voor spellings- en grammaticacorrecties en voor het vertalen van artikelen. Maar ook daar geldt een waarschuwing. Taalmodellen kunnen verder gaan dan gevraagd en de betekenis van een tekst zodanig veranderen dat die niet langer wordt onderbouwd door de geciteerde bronnen. Menselijke controle blijft verplicht.
De ironie zit in de samenwerking
De stap is opvallend om een andere reden. Wikipedia is zelf een van de belangrijkste bronnen waarop AI-systemen zijn getraind. De organisatie werkt inmiddels samen met Microsoft, Meta en Amazon en sloot eerder al deals met Perplexity, Mistral AI en Google. Via betaalde toegang kunnen die partijen Wikipedia-inhoud gebruiken als trainingsdata.
Dat schept een dubbele positie. Wikipedia beschermt zijn encyclopedische integriteit door AI-tekst te weren, maar financiert zijn voortbestaan deels door diezelfde techbedrijven toegang te geven tot zijn inhoud. Die spanning lost het verbod niet op.
Wat betekent dit voor data en kennis?
Wikipedia is niet alleen een naslagwerk voor gebruikers. Het is ook een van de weinige grote, open en redactioneel beheerde databronnen die AI-systemen voeden. Als die bron strenger wordt bewaakt, verschuift de afhankelijkheid naar andere databronnen, vaak in handen van commerciële partijen. Dat heeft gevolgen voor de kwaliteit en diversiteit van de informatie waarop AI-systemen draaien.
Voor data- en insights professionals raakt dit aan een breder vraagstuk. Open data staat onder druk en de herkomst van informatie wordt steeds relevanter in analyses en besluitvorming. Wikipedia’s keuze is een signaal: betrouwbaarheid vraagt om menselijk toezicht, ook als dat minder schaalbaar is.

