AI presteert al op het niveau van professionals. Wat nu?

Door Alexandro Felipa | 01-05-2026

In de discussie over AI in marktonderzoek klinkt al een tijdje hetzelfde geluid. Het is handig, maar het maakt nog veel fouten. Dat klopt, maar dat beeld raakt steeds sneller achterhaald. Het vertrekpunt is een benchmark die OpenAI heeft ontwikkeld: GDPval. Die test geen triviale vragen of rekenpuzzels, maar geeft AI-modellen dezelfde soort opdrachten die betaalde professionals dagelijks uitvoeren. Juridische memo’s, financiële analyses, medische plannen en technische rapporten. Onafhankelijke experts beoordelen de uitkomsten blind, zonder te weten welk werk van een mens komt en welk van een machine.

Goed én fout tegelijk

De score van het meest recente model van GDPval is 85 procent. Dit betekent dat in 85 van de 100 vergelijkingen een expert het AI-werk gelijkwaardig of beter vond dan dat van een ervaren collega. Dat getal vraagt om nuance. AI-vermogen is niet gelijkmatig verdeeld. Hetzelfde model dat een sluitende juridische memo schrijft, kan bijvoorbeeld een nepstudie citeren die er op papier volstrekt geloofwaardig uitziet en bronnen verzint die niet bestaan. Dat maakt samenwerken met AI vaak ingewikkelder dan het lijkt. Je kunt niet simpelweg vertrouwen op de output, maar je kunt het ook niet negeren.

Drie uitgangspunten voor de praktijk

Er zijn daarom een paar uitgangspunten voor wie hier serieus mee aan de slag wil.

  • Verantwoordelijkheid blijft bij mensen.
    Lever geen analyse aan een klant die je niet zelf hebt doorgelopen en kunt verdedigen. AI verandert hoe werk tot stand komt, niet wie ervoor tekent.
  • AI versterkt, het vervangt niet.
    Gebruik het voor eerste versies, samenvattingen en het genereren van alternatieven. Daarna begint het vakmanschap. Jij bepaalt wat er mee gebeurt.
  • Collectieve actie is nodig.
    Dingen als synthetische respondenten die worden doorgegeven als echte mensen, en AI-adviezen die klinken alsof ze van een professional komen, vormen risico’s waar de sector scherp op moet blijven.

Conclusie voor nu

De eerlijke lezing van GDPval is dat AI professionals niet morgen zal vervangen. De benchmark meet geïsoleerde taken, maar geen klantrelaties en zeker geen carrièregebonden oordeelsvermogen. Op het niveau van individuele opdrachten is de output nu al vaak goed genoeg om een expert te overtuigen. En de ontwikkeling gaat door. Ook het feit dat OpenAI zelf achter de benchmark zit, is iets om bij stil te staan. Het bedrijf heeft er commercieel belang bij dat AI-prestaties hoog uitvallen. Aan de andere kant worden op het leaderboard ook modellen van concurrenten getest, wat een volledig eenzijdig beeld minder waarschijnlijk maakt.

Auteur: Alexandro Felipa, Redacteur en contentcoördinator

Deze artikelen vind je vast ook interessant

Ook de laatste bytes ontvangen?