Toen de ChatGPT-hype begon, zo’n twee jaar geleden, groeide de bezorgdheid over fraude in online enquêtes binnen de sector. In april 2023 lanceerden organisaties als de Insights Association en ESOMAR het Global Data Quality Initiative, een wereldwijde campagne gericht op het handhaven van kwaliteit van enquêtes, en het tegengaan van fraude. Sebastian Berger (Head of Science bij ReDem) schreef voor Greenbook een artikel over het onderwerp.
▼
Hoewel fraude met online enquêtes al meer dan 20 jaar bestaat, blijft de vraag: waarom heeft het zo lang geduurd voordat het aandacht kreeg? Hoewel de link met de hype rond ChatGPT en AI voor de hand ligt, is het niet de enige reden. De verhoogde aandacht komt ook omdat marktonderzoekers een toename constateren van data van slechte kwaliteit.
Uit recente analyses blijkt dat het aantal interviews dat het afgelopen jaar als frauduleus werd beoordeeld, is verdubbeld. Dat AI daarvoor de meeste schuld draagt is maar gedeeltelijk waar. De stijging kan ook worden toegeschreven aan drie andere factoren.
1. De pandemie ontketende een golf van enquêtefraude
Vóór de COVID-19-pandemie werd professionele enquêtefraude voornamelijk uitgevoerd in ‘gecentraliseerde’ omgevingen, vergelijkbaar met callcenters, in lagelonenlanden zoals China. Deze frauduleuze activiteiten werden vaak gedetecteerd door geo-locatie van de respondent en door het opsporen van verdachte gedragspatronen, zoals herhaaldelijk snel klikken (speeding) en uniforme reacties (straightlining).
Toen de pandemie toesloeg, verloren veel werknemers in deze zogenaamde click farms echter hun baan. Geconfronteerd met financiële moeilijkheden en beperkte alternatieven, zetten ze hun frauduleuze activiteiten vanuit huis voort. Daarvoor kochten ze goedkope gebruikte smartphones om tegelijkertijd deel te nemen aan meer enquêtes. Met deze konden ze aanzienlijk hogere inkomens verdienen dan het gemiddelde in hun land.
2. Professionalisering via sociale media
Exploitanten van deze particuliere ‘telefoonboerderijen’ begonnen steeds vaker hun ervaringen, tips en trucs te delen op sociale media. Naast algemeen advies verspreidden deze fraudeurs gedetailleerde informatie over specifieke enquêtes en hun verificatiecontroles op online forums en groepen.
Ze leerden anderen hoe ze controles en strikvragen konden omzeilen, waardoor een breder netwerk van fraudeurs onopgemerkt kon deelnemen. De mogelijkheid om met minimale inspanning een fors inkomen te verdienen – met hulp van automatisering – leidde tot de verspreiding van online enquêtefraude buiten de gangbare lagelonenlanden. Een ware multinationale expansie en een golf van professionalisering van gedecentraliseerde enquêtefraude, uitgevoerd vanuit ’thuiskantoren’.
3. Gebruik van moderne technologieën
Moderne technologieën zoals AI, bots, botnets en VPN’s zorgen ervoor dat telefoonclubs en traditionele click farms bijna volledig automatisch talloze nepinterviews genereren. Deze frauduleuze interviews zijn moeilijk op te sporen omdat ze geen merkbare digitale vingerafdrukken achterlaten en opzettelijk typische detectiemarkeringen vermijden.
Zelfs identiteitsverificatie via sms, spraak en mogelijk (toekomstige) visuele herkenning wordt steeds meer geautomatiseerd, wat het opsporen en voorkomen van fraude nog ingewikkelder maakt. Omdat deze tools vaak eenvoudig te verkrijgen zijn (gratis of goedkoop, gebruiksvriendelijk, webbased) zijn ze populair onder fraudeurs.
Verdedigingslijn
De toename van gegevens van slechte kwaliteit en de groeiende bezorgdheid daarover hebben de vraag naar geavanceerde technologische verdedigingsmiddelen opgestuwd. Traditionele methoden zoals oogherkenning en het handmatig opschonen van gegevens zijn niet langer voldoende om fraude te bestrijden. In plaats daarvan wordt kwaliteitsborging steeds meer geautomatiseerd door middel van nieuwe tools die zijn ontworpen om zowel kosten als tijd te besparen. Deze tools vallen in twee hoofdcategorieën uiteen:
1. Controles voorafgaand aan de enquête
Deze categorie omvat technologieën die zijn ontworpen om frauduleus gedrag te voorkomen voordat aan de enquête wordt deelgenomen. Tools in deze groep blokkeren meerdere deelnames door verschillende kenmerken en parameters te analyseren, zoals IP-adressen, cookies en hardware- en softwareconfiguraties. Fraudeurs omzeilen deze verdediging echter vaak door tools zoals VPN’s of proxyservers om hun ware IP-adressen te maskeren, waardoor de illusie wordt gewekt dat de reacties komen vanaf verschillende locaties. Ze maken ook gebruik van gespecialiseerde browsers en verwijderen cookies om detectie verder te omzeilen.
2. Controles tijdens de enquête
Deze tools evalueren de kwaliteit van de gegevens die tijdens of na de enquête worden verzameld, waarbij interviews die op onoplettendheid of frauduleus gedrag wijzen, worden uitgefilterd. AI-algoritmen die gebruik maken van machine learning zijn heel effectief omdat ze voortdurend leren en zich aanpassen aan nieuwe fraudetechnieken, waarbij ze patronen detecteren, zoals ongebruikelijke reactietijden, terugkerende antwoorden of verdachte overeenkomsten tussen deelnemers.
De effectiviteit van deze controles is echter sterk afhankelijk van de opzet van de vragenlijst. Traditionele enquête-ontwerpen komen niet helemaal tegemoet aan de mogelijkheden van deze moderne tools, waardoor ze minder effectief zijn in het opsporen van nieuwere fraudemethoden.
In een volgend artikel gaat Sebastian Berger verder in op de mogelijkheden om fraude te bestrijden.
Bron: greenbook.org