AI-detectietools filteren te streng

Door Romana van Marrewijk | 22-02-2024

Data van mindere kwaliteit vormen een risico, en ze leiden tot minder effectieve zakelijke beslissingen. Logisch dat er dus veel tijd en middelen worden besteed aan het opschonen van kwantitatieve data, en aan de kwaliteit van open antwoorden. En wat is de – soms twijfelachtige – rol van AI in dat geheel? Over dat laatste schreven Karin Pepin en Dan Wasserman een artikel voor Greenbook.

Hoewel onderzoekers van oudsher open antwoorden beoordelen door nauwgezet te lezen, zijn AI-tools steeds meer een hulpmiddel door hun snelheid en kostenvoordeel. De tools proberen te bepalen of een respondent AI, zoals ChatGPT, gebruikt om te antwoorden op een open enquête. Als een respondent zijn eigen antwoord niet schrijft, wordt de kwaliteit van het antwoord over het algemeen op zijn minst als verdacht beschouwd.

Met zowel de release van GPT4 als verbeterde training in het opstellen van prompts, is het moeilijker om te bepalen wat is gemaakt door een taalmodel en wat is geschreven door een mens.

Nauwkeurigheid

Onderzoek heeft aangetoond hoe moeilijk het is om het verschil te zien. Uit een peer-reviewed-onderzoek bleek dat experts slechts in 38,9% van de gevallen AI konden onderscheiden van een menselijke reactie. Een andere evaluatie van AI-detectietools toonde aan dat ze vaak vals-positieven en vals-negatieven laten zien en dat ze niet voldoen aan de nauwkeurigheidsclaims die ze zelf nastreven. Zelfs OpenAI zegt dat AI-detectoren niet altijd goed werken.

Echt mens

Hoewel de technologie in de loop van de tijd waarschijnlijk wordt verbeterd, moeten we ons vertrouwen in die middelen toch blijven testen. Het is van cruciaal belang om open data te beoordelen, maar vertrouwen op geautomatiseerde AI-checkers om de kwaliteit van de respondent te beoordelen, kan misleiding in de hand werken. Vals-positieve en vals-negatieve antwoorden kunnen niet opvallen of juist uit het onderzoek worden gegooid, ondanks het feit dat ze echt door een mens geschreven zijn.

Too good to be true

Onze aandacht is meestal gericht op het uitsluiten van respondenten met slecht geschreven open antwoorden, op antwoorden die als irrelevant worden beschouwd of antwoorden die schaamteloos van internet zijn gekopieerd. Hoewel we consequent voorzichtig zijn met antwoorden die ‘too good to be true’ lijken, wordt de waakzaamheid juist door de AI-tools verder versterkt. Zo kan het gebeuren dat we per ongeluk de beste respondenten diskwalificeren in plaats van de slechtste.

Vooringenomenheid

Het afwijzen van waardevolle respondenten verzwakt niet alleen het onderzoeksecosysteem. Te midden van de aanhoudende discussie over datakwaliteit zijn goede respondenten juist essentieel. Het aantrekken en behouden van panelleden van hoge kwaliteit is noodzakelijk om de geloofwaardigheid van de sector te waarborgen. Elke keer dat we met AI-tools onterecht data opschonen, geven we vooringenomenheid de ruimte. En we verspillen ook kostbare tijd en middelen aan het opschonen van correcte data. Bovenal sluiten we bedachtzame mensen uit, en zo worden inzichten vertekend.

Datakwaliteit

Onderzoekers moeten dus blijven leren over AI, zowel wat betreft fundamentele kennis als over hoe je specifieke tools toepast op marktonderzoek. Het is voor de sector ook absoluut noodzakelijk om initiatieven rond datakwaliteit te ondersteunen, zoals gebeurt in de Global Data Quality-samenwerking. Hoe kritischer we nadenken over tools die respondenten toelaten of uitsluiten, hoe positiever voor de branche.

Karine Pepin is co-founder bij The Research Heads, en Dan Wasserman is Chief Operating Officer bij KJT.

Bron: greenbook.org

Auteur: Romana van Marrewijk, Functietitel

Deze artikelen vind je vast ook interessant

Actueel | 22 oktober 2024

22 oktober 2024

Nominaties DDMA Customer Data Awards 2024 bekend

De genomineerden voor de DDMA Customer Data Awards zijn bekend. In de categorie Innovation strijden FrieslandCampina Professional, Intergamma, Rituals en viaBOVAG.nl om de winst. Op 28 november worden de winnaars bekendgemaakt tijdens DDMA NEXT. ▼ De DDMA Customer Data Awards worden dit jaar voor de 18de keer uitgereikt en ze gaan naar organisaties die het managen…

Actueel | 22 oktober 2024

22 oktober 2024

Ipsos I&O continueert deelname aan raamcontract DPC

Ipsos I&O is vanaf 1 januari 2025 opnieuw onderdeel van het raamcontract kwantitatief communicatieonderzoek als vaste onderzoekpartner voor communicatievraagstukken van ministeries en uitvoeringsorganisaties. ▼ Op 9 oktober jl. ondertekende algemeen directeur Gerben Huijgen (foto) namens Ipsos I&O het raamcontract kwantitatief communicatieonderzoek met de Dienst Publicatie Communicatie (DPC) van het ministerie van Algemene Zaken. Vanaf 1…

Actueel | 22 oktober 2024

22 oktober 2024

Service Management Group neemt Bulbshare over

De Service Management Groep neemt Bulbshare over, een AI-aangedreven platform dat bedrijven met klanten verbindt. Met de overname wil SMG de activiteiten op BX- en CX-gebied uitbreiden. Bulbshare was aanwezig op de AI Summit van september jl., en Kirby Johnson van het bureau komt op 7 november spreken over synthetische data op het Data &…

Analytics

Data Science

Marktonderzoek

Branches

Events

Overig

AI-detectietools filteren te streng

Nauwkeurigheid

Echt mens

Too good to be true

Vooringenomenheid

Datakwaliteit

Gerelateerde bytes

Nominaties DDMA Customer Data Awards 2024 bekend

Ipsos I&O continueert deelname aan raamcontract DPC

Service Management Group neemt Bulbshare over

Once Inch Whale neemt iVisual Tech over

‘Er moet altijd iemand overzicht hebben over wat jouw AI-tool doet’

Vacatures

Research Manager

Over Daily Data Bytes

Adverteren

Kennispartner worden?

Meld je nu aan voor de Daily Data Bytes nieuwsbrief!

Analytics

Data Science

Marktonderzoek

Branches

Events

Overig

AI-detectietools filteren te streng

Nauwkeurigheid

Echt mens

Too good to be true

Vooringenomenheid

Datakwaliteit

Deze artikelen vind je vast ook interessant

Gerelateerde bytes

Vacatures

Meld je nu aan voor de Daily Data Bytes nieuwsbrief!

Over Daily Data Bytes

Adverteren

Kennispartner worden?

Meld je nu aan voor de Daily Data Bytes nieuwsbrief!