AI presteert al op het niveau van professionals. Wat nu?

Door Alexandro Felipa | 01-05-2026

In de discussie over AI in marktonderzoek klinkt al een tijdje hetzelfde geluid. Het is handig, maar het maakt nog veel fouten. Dat klopt, maar dat beeld raakt steeds sneller achterhaald. Het vertrekpunt is een benchmark die OpenAI heeft ontwikkeld: GDPval. Die test geen triviale vragen of rekenpuzzels, maar geeft AI-modellen dezelfde soort opdrachten die betaalde professionals dagelijks uitvoeren. Juridische memo’s, financiële analyses, medische plannen en technische rapporten. Onafhankelijke experts beoordelen de uitkomsten blind, zonder te weten welk werk van een mens komt en welk van een machine.

▼

Goed én fout tegelijk

De score van het meest recente model van GDPval is 85 procent. Dit betekent dat in 85 van de 100 vergelijkingen een expert het AI-werk gelijkwaardig of beter vond dan dat van een ervaren collega. Dat getal vraagt om nuance. AI-vermogen is niet gelijkmatig verdeeld. Hetzelfde model dat een sluitende juridische memo schrijft, kan bijvoorbeeld een nepstudie citeren die er op papier volstrekt geloofwaardig uitziet en bronnen verzint die niet bestaan. Dat maakt samenwerken met AI vaak ingewikkelder dan het lijkt. Je kunt niet simpelweg vertrouwen op de output, maar je kunt het ook niet negeren.

Drie uitgangspunten voor de praktijk

Er zijn daarom een paar uitgangspunten voor wie hier serieus mee aan de slag wil.

Verantwoordelijkheid blijft bij mensen.
Lever geen analyse aan een klant die je niet zelf hebt doorgelopen en kunt verdedigen. AI verandert hoe werk tot stand komt, niet wie ervoor tekent.
AI versterkt, het vervangt niet.
Gebruik het voor eerste versies, samenvattingen en het genereren van alternatieven. Daarna begint het vakmanschap. Jij bepaalt wat er mee gebeurt.
Collectieve actie is nodig.
Dingen als synthetische respondenten die worden doorgegeven als echte mensen, en AI-adviezen die klinken alsof ze van een professional komen, vormen risico’s waar de sector scherp op moet blijven.

Conclusie voor nu

De eerlijke lezing van GDPval is dat AI professionals niet morgen zal vervangen. De benchmark meet geïsoleerde taken, maar geen klantrelaties en zeker geen carrièregebonden oordeelsvermogen. Op het niveau van individuele opdrachten is de output nu al vaak goed genoeg om een expert te overtuigen. En de ontwikkeling gaat door. Ook het feit dat OpenAI zelf achter de benchmark zit, is iets om bij stil te staan. Het bedrijf heeft er commercieel belang bij dat AI-prestaties hoog uitvallen. Aan de andere kant worden op het leaderboard ook modellen van concurrenten getest, wat een volledig eenzijdig beeld minder waarschijnlijk maakt.

Auteur: Alexandro Felipa, Redacteur en contentcoördinator

Deze artikelen vind je vast ook interessant

Actueel, Onderzoek | 08 juli 2026

08 juli 2026

Waarschuwingslabels maken mensen ook wantrouwiger bij correcte informatie

Waarschuwingslabels onder online berichten helpen lezers desinformatie te herkennen, maar maken hen tegelijkertijd ook sceptischer over correcte informatie. Dat is de centrale bevinding uit het proefschrift van communicatiewetenschapper Lina Buttgereit aan de Universiteit van Amsterdam. ▼ Buttgereit onderzocht hoe mensen in het dagelijks leven omgaan met desinformatie. Daarvoor gebruikte zij een ongebruikelijke methode. Deelnemers uit…

Actueel, Onderzoek | 08 juli 2026

08 juli 2026

Vaardigheidskloof tussen migrantengezinnen en andere Nederlanders krimpt sterk binnen één generatie

Kinderen van migranten uit Turkije, Marokko, Suriname en de voormalige Nederlandse Antillen halen een groot deel van de achterstand van hun ouders in op het gebied van taal en rekenen. Volgens nieuw onderzoek van hoogleraar Dinand Webbink van Erasmus School of Economics en wetenschappers Tijana Prokic-Breuer en Stan Vermeulen van Maastricht University krimpen de verschillen…

Actueel, insights impact, Onderzoek | 08 juli 2026

08 juli 2026

Niet kopers zijn een goudmijn voor marktonderzoek

Stel: je voert een survey uit voor een bekende fastfoodketen. Logisch dat je je richt op kopers en potentiële kopers, zij leveren tenslotte de omzet. Toch blijft daarmee een belangrijke groep buiten beeld: mensen die het merk bewust links laten liggen. Dat is een gemiste kans, stellen onderzoekers in een analyse op Quirk’s. Wie begrijpt…

Analytics

Data Science

Marktonderzoek

Branches

Events

Overig

AI presteert al op het niveau van professionals. Wat nu?

Goed én fout tegelijk

Drie uitgangspunten voor de praktijk

Conclusie voor nu

Gerelateerde bytes

Waarschuwingslabels maken mensen ook wantrouwiger bij correcte informatie

Vaardigheidskloof tussen migrantengezinnen en andere Nederlanders krimpt sterk binnen één generatie

Niet kopers zijn een goudmijn voor marktonderzoek

Onderzoek: steeds meer kiezers zijn de Tweede Kamerverkiezingen moe

Essent over data en klantgedrag: modellen voorspellen, mensen verklaren

Vacatures

Fulltime Senior (Neuromarketing) Researcher at Unravel

Over Daily Data Bytes

Adverteren

Kennispartner worden?

Meld je nu aan voor de Daily Data Bytes nieuwsbrief!

Analytics

Data Science

Marktonderzoek

Branches

Events

Overig

AI presteert al op het niveau van professionals. Wat nu?

Goed én fout tegelijk

Drie uitgangspunten voor de praktijk

Conclusie voor nu

Deze artikelen vind je vast ook interessant

Gerelateerde bytes

Vacatures

Meld je nu aan voor de Daily Data Bytes nieuwsbrief!

Over Daily Data Bytes

Adverteren

Kennispartner worden?

Meld je nu aan voor de Daily Data Bytes nieuwsbrief!