Wereldwijd uploaden mensen dagelijks meer dan 100 miljoen foto’s naar Instagram. Daarin worden regelmatig, bewust of onbewust, ook merkproducten afgebeeld. Met de toenemende populariteit van visuele sociale media zoals TikTok en Instagram, zorgen mensen dus voor steeds meer visuele merkgerelateerde content. En dat draagt bij aan de merkbeleving. Belangrijk dus om hier zicht en grip op te krijgen.
Tekst Annemarie Nanne en Guda van Noort
Een handmatige analyse van de merkgerelateerde content op visuele sociale media is vrijwel onmogelijk, maar automatische analyse biedt de oplossing, alhoewel die nog in de kinderschoenen staat. Dat automatisch analyseren van beelden heet machine vision. Daarmee kunnen aan de hand van algoritmes in enkele seconden duizenden foto’s geanalyseerd worden. De machine vision-tool maakt voor iedere foto een inschatting voor de aanwezigheid van een reeks inhoudelijke kenmerken (zie foto). Wat kan een computer ‘zien’? Allereerst kan die objecten herkennen (bijv. een auto of biertje). Dat gaat niet foutloos. Op de foto worden duidelijk mensen afgebeeld, terwijl de computer aangeeft zowel ‘people’ als ‘no people’ te herkennen. Maar de tools verbeteren snel. Tegenwoordig is het al mogelijk om duizenden verschillende objecten te herkennen. Daarnaast wordt machine vision ook steeds beter in gecompliceerdere taken zoals het inschatten van de leeftijd of de gezichtsuitdrukking van een persoon. Drijvende kracht Machine vision kan belangrijke inzichten opleveren voor het merk. Zo is het bijvoorbeeld mogelijk om te analyseren of er een logo op de foto staat en hoe duidelijk dat aanwezig is – als indicator van ‘brand centrality’. Ook kun je gebruikersmomenten en segmenten detecteren. Om extra inzichten te verkrijgen kan de output van machine vision-modellen gekoppeld worden aan andere beschikbare metrics: aantal views, likes en comments van een post. Door deze gegevens te combineren is het mogelijk om te analyseren welke visueel inhoudelijke kenmerken de drijvende kracht zijn voor engagement. Zo blijkt uit onderzoek van Mazloom en collega’s (2016) naar de populariteit van merkgerelateerde Instagram-posts dat foto’s met een persoon erop meer likes en comments krijgen dan eentje zonder persoon.
Machine vision-output voor Clarifai (food, people, cake, doughnut, pastry, adult, bakery, group, woman, sweet, cookie, child, sugar, table, meal, man, no person, cup, chocolate, bread) en Google (food, doughnut, person) is gedeeltelijk accuraat.
Machine vision kun je inzetten om populaire content te identificeren en op basis daarvan in te schatten hoe je het hoogste engagement kunt bereiken voor een merk. Trainen Machine vision gebruiken is niet moeilijk. Commerciële bedrijven zoals Google, Microsoft en Amazon, brengen hun eigen ‘pre-trained’ machine vision-modellen op de markt die je tegen betaling kunt gebruiken. Deze modellen zijn over het algemeen accuraat, omdat ze zijn ontwikkeld door grote digitale spelers die toegang hebben tot zeer veel data om de modellen te trainen. Aangezien het niet duidelijk is op welke afbeeldingen (bijv. vakantiefoto’s, beelden van merken, social media posts, afbeeldingen op websites) de commerciële modellen zijn getraind, is het noodzakelijk om te toetsen hoe accuraat ze zijn voor merkgerelateerde content. Recent onderzoek wijst uit dat deze modellen inderdaad prima in staat zijn om content te analyseren. Google Cloud en Clarifai scoorden een dikke voldoende, de verwachting is dat dit ook voor andere commerciële modellen geldt. Toch presteren ze niet allemaal even goed en herkennen ze niet allemaal dezelfde inhoudelijke visuele kenmerken. Het ene model herkent logo’s, het andere model emoties. Als je overweegt om een pre-trained model te gebruiken is het advies daarom om een doelstelling te formuleren. Is er geen model dat aan je eisen voldoet? Dan is het altijd nog mogelijk om een pre-trained model zelf bij te trainen voor specifieke taken.
Annemarie Nanne promoveert aan Tilburg University op het gebied van merkgerelateerde visuele content. Guda van Noort is professor persuasion & new media technologies aan de Universiteit van Amsterdam en directeur van SWOCC.
Dit artikel is gebaseerd op: Nanne, A.J., Antheunis, M.L., van der Lee, C.G., Postma, e.o., Wubben, S. & van Noort, G. (2020). The use of computer vision to analyze brand-related user generatedmage content. Journal of Interactive Marketing, in press. https://doi.org/10.1016/j.intmar.2019.09.003 meer informatie: www.swocc.nl
Clou© nr 97, april 2020