Tips voor omgaan met data-analyse

Door Lotte van Bakel | 16-12-2020

Steeds meer marketeers en cx-professionals komen met data-analyse in aanraking. Dat betekent ook dat zij voor de uitdaging staan om de uitkomsten van deze onderzoeken te begrijpen en vervolgens te gebruiken om goede vervolgacties te ondernemen. Lotte van Bakel, data-scientist bij Underlined, geeft 5 tips voor het trekken van conclusies uit data-analyse.

1 Bekijk data met een open mindset

Het is goed om van tevoren te bedenken welke resultaten je uit een onderzoek verwacht, bijvoorbeeld op basis van eerdere onderzoeken of ‘onderbuikgevoelens’. Op deze manier kun je gerichter zoeken naar data die relevant is voor je data-analyse. Het is ook belangrijk open te staan voor onverwachte resultaten uit de data. Het is aannemelijk dat die er zijn en het is goed om dat niet als een verkeerde analyse te zien. Wanneer je er voor open staat om nieuwe dingen te leren uit de data, zul je uit een data-analyse de beste conclusies trekken.

2 Maak duidelijk wat je kunt concluderen: correlatie of causaliteit?

Een vraag die statistici al jaren krijgen: kun je uit een bepaalde analyse ook een causaal verband trekken of is er alleen sprake van een correlatie? Dit is een belangrijk verschil omdat vanuit correlatie vaak te snel causaliteit wordt geconcludeerd. Maar wat betekenen deze twee termen eigenlijk? In het kort zegt een correlatie hoe waarschijnlijk het is dat er een verband is tussen twee variabelen. Een causaal verband daarentegen concludeert dat er een oorzaak en een gevolg is, zoals: omdat het regent, nemen mensen hun paraplu mee. Soms zijn deze aannames logisch te verklaren. We hebben dan duidelijk in beeld wat de oorzaak en wat het gevolg is, zoals bij de regen en het gebruik van de paraplu. Helaas is dat niet altijd zeker. Dan is het goed om jezelf af te vragen of correlatie tot causaliteit kan leiden, of dat je alleen een correlatie mag vaststellen. Het belangrijkste is om goed na te denken of het een de ander kan voorafgaan en of er geen andere verklaring kan zijn voor het verband. Door te deduceren dat het logisch kan zijn dat er een causaal verband is, kom je al een heel eind in de richting van de juiste conclusie.

3 Vorm één verhaal uit verschillende conclusies

Iedere data-scientist of -analist zou willen dat de data een objectief en compleet beeld van de werkelijkheid geven. Helaas is dit in de praktijk onhaalbaar. Er zal altijd een bepaalde mate van subjectiviteit zijn. Zo kunnen twee onderzoekers over dezelfde hypothese verschillende conclusies trekken. Dat betekent niet dat een van de twee het direct ‘fout’ heeft. Vaak betekent dit (met de aanname dat beide onderzoeken legitiem zijn) dat beide een deel van de waarheid naar boven brengen. Dit verschil kan worden bepaald door het onderzoeken van verschillende soorten data; maar ook de aanpak van het onderzoek kan een rol spelen. Beschrijvende analyses en correlatie-analyses kijken op een andere manier naar de data dan machine learning-modellen. Ook machine learning-modellen bekijken de data op vele verschillende manieren. Hieruit kunnen dus andere inzichten komen, maar het zijn de gezamenlijke conclusies uit deze verschillende onderzoeken die samen het beste resultaat geven. Om uit meerdere onderzoeken de beste conclusies te halen is het belangrijk om de onderzoeken naast elkaar te leggen en te bekijken hoe ze uiteindelijk samen één verhaal kunnen vormen.

4 Heb geen cijferangst

Tegenwoordig worden we overspoeld met cijfers. Wanneer je als marketeer of cx-professional jezelf niet datavaardig vindt, kan dit zorgen voor onbegrip en zelfs cijferangst. Gelukkig is het interpreteren van cijfers te leren. Wanneer data analisten complexe technieken gebruiken, verwacht dan niet dat alles makkelijk uitgelegd kan worden. Data-analyse heeft vaak moeilijke modellen nodig om een grote hoeveelheid aan data te analyseren. Zo’n black box-model betekent niet dat een onderzoek niet betrouwbaar is, maar wel dat het heel moeilijk tot in de details is uit te leggen. De exacte werking van de modellen is niet de vraag die je moet willen beantwoorden, maar probeer wel het doel van de modellen en de keuzes – of aannames die hierbij gemaakt worden – beter te begrijpen. Dit kan helpen bij de interpretatie van de uitkomsten. Het kan ook helpen om jezelf te verdiepen in de wereld van cijfers en data-analyse. Als je zelf een beter beeld hebt van de mogelijkheden van data-analyse, dan zal het begrijpen en interpreteren van de cijfers ook beter gaan.

5 Accepteer tekortkomingen

Laatste tip, maar zeker niet de minste: accepteer tekortkomingen van data. Met data-analyse kun je vele hypotheses analyseren en interessante conclusies trekken maar onthoud dat niet álles kan. Een data-analyse zal nooit het gehele verhaal vertellen, het schetst een beeld van de werkelijkheid, maar het beeld zal nooit compleet zijn. Zo zorgen missende factoren of slecht gelogde kolommen er al snel voor dat bepaalde aspecten gemist worden bij het onderzoek. Er moet ook rekening gehouden worden met een gedeelte aan missende factoren die niet verklaard kunnen worden vanuit de data. Wanneer iemand bijvoorbeeld op het nieuws leest over mogelijke fraude van een bedrijf, kan dat invloed hebben op zijn tevredenheid. Dit zal echter niet terugkomen in je data. Het feit dat er factoren zijn die niet worden gedetecteerd in de data, is geen belemmering voor de uitkomsten van het onderzoek. Met behulp van data-analyse vind je namelijk het deel van de factoren die wel belangrijke impact hebben en daarnaast beïnvloedbaar zijn. Vanuit hier kun je de eerste stappen zetten om verbeteringen door te voeren en acties te verbinden aan de conclusies van de data-analyse.

Underlined is kennispartner van Daily Data Bytes. Word ook kennispartner en bereik onze lezers via web, socials en nieuwsbrief met jouw content. Neem contact op met Tjitske Buurman voor meer informatie.

Auteur: Lotte van Bakel, data-scientist bij Underlined

Deze artikelen vind je vast ook interessant

Ook de laatste bytes ontvangen?