Kunnen LLM’s inzichten voorspellen?

Door Geplaatst door de redactie | 06-02-2024

Voorspellen van inzichten, dat is een vak… en een gave. Nu werpen ook grote taalmodellen zich op als krachtige instrumenten voor bedrijven om juist die inzichten te generen. Helpen ze? Phillip Sewell, chief executive officer bij Predyktable, schreef er een artikel over.

Slimme data-professionals weten dat begrip van consumentengedrag en voorspellen wat consumenten gaan doen, sterk afhangt van de dynamiek van de omgeving. Daarom is diepgaand begrip nodig van databronnen, of zelfs zaken als het weer en de economie. Maar ook ongestructureerde tekst en afbeeldingen kunnen helpen. Gestructureerde data kunnen leiden naar een model, op basis van logica. Maar het modelleren van ongestructureerde gegevens is veel uitdagender vanwege de semantische rijkdom ervan. Het is bijvoorbeeld een veel complexere taak om op een numerieke manier te bepalen of rood superieur is aan groen.

In het snel evoluerende landschap van (AI) zijn grote taalmodellen (LLM’s) potentieel krachtige instrumenten voor ‘data-savvy’ bedrijven. Met als vraag: hoe kunnen dataprofessionals bruikbare voorspellende inzichten verkrijgen uit het enorme veld van menselijke taal en interacties?

Modellering

Allereerst is het belangrijk om te begrijpen wat LLM’s kunnen doen. Hun primaire functie is het genereren van informatie in de vorm van chat of code. Door intensieve training met enorme datasets van tekst en code, verwerven LLM’s een steeds uitgebreider begrip van de subtiliteiten van de menselijke taal. De echte waarde van LLM’s ligt echter in hun vermogen om contextuele gegevens om te zetten in een numeriek formaat dat voorspellende modellering verbetert.

Taylor Swift

LLM’s onderwerpen waarden aan algoritmische berekeningen, of een ’tokenisatie’-proces. Eenmaal ‘getokeniseerd’, gebruikt de LLM zijn taalvaardigheid om betekenis aan de tekst te ontlenen. Wanneer bijvoorbeeld de zin ‘Taylor Swift is een popzangeres’ wordt uitgesproken of geschreven, dan ontleedt de LLM de zin en herkent Taylor Swift als een persoon, een zangeres en een artiest in het popgenre. Het begrijpt de ingewikkelde relaties tussen deze concepten omdat het deze informatie al heeft geleerd.

Ingewikkelde relaties

Er zijn twee belangrijke voordelen aan het gebruik van LLM’s voor contextuele gegevenscodering. De eerste is het vermogen om complexe en ingewikkelde relaties tussen verschillende concepten vast te leggen. De tweede is het verwerken van niet-kwantificeerbare gegevens, waarbij LLM’s ‘moeilijk te kwantificeren’ gegevens makkelijker maakt, zoals het onderscheid tussen verschillende soorten gebeurtenissen.

Chique boetiek

Laten we eens kijken naar een realistisch scenario met een voorbeeld uit de detailhandel. Stel je een chique boetiek voor, midden in het hart van een bruisend stedelijk landschap, met een uitgebreid scala aan high-end mode die is afgestemd op verschillende smaken en voorkeuren. Stel je nu de retailer voor die een holistisch inzicht wil krijgen in hoe verschillende gebeurtenissen in de kledingmarkt verkooptrends beïnvloeden. Om dat doel te bereiken, moet je de kracht benutten van LLM’s die bedreven zijn in taalbegrip. Je begint met gegevens verzamelen over gebeurtenissen die relevant zijn voor de markt van de retailer. Deze evenementen kunnen een breed spectrum omvatten, waaronder modeshows, culturele festivals, concerten en sportevenementen. Voor elke gebeurtenis gaat de LLM essentiële informatie coderen. Die kan betrekking hebben op:

1. Type evenement – categoriseren van het evenement, of het nu gaat om een modeshow, concert, sportwedstrijd of een ander type evenement.

2. Datum van het evenement – de exacte datuminformatie wordt vastgelegd om de planning van het evenement vast te stellen.

3. Locatie van het evenement – de LLM legt details vast over de locatie van het evenement; is het in de stad van de retailer of op een andere locatie.

4. Codering van kledinglijngegevens – tegelijkertijd codeert de LLM informatie over de kledinglijnen van de retailer. Dat omvat een grondige analyse van het productaanbod, waarbij de nadruk ligt op factoren zoals kledingtype of merkinformatie.

Uitgebreide prognoses

Zodra de gegevens van het evenement en de kledinglijn met succes zijn gecodeerd door de LLM, kunnen datawetenschappers een voorspellend model bouwen. Door gebruik te maken van de gecodeerde gegevens kan het voorspellende model analyseren hoe specifieke soorten gebeurtenissen de verkoop van bepaalde kledingstukken beïnvloeden. Het kan bijvoorbeeld vaststellen of modeshows de verkoop van high-end designerjurken daadwerkelijk stimuleren, of dat concerten een grotere impact hebben op vrijetijdskleding. Het model let op de timing van gebeurtenissen en zorgt ervoor dat verkoopvoorspellingen rekening houden met zowel de datum als de aanlooptijd van het evenement. Het integreert data rond de gebeurtenis met andere relevante factoren, zoals historische verkoopgegevens, demografische gegevens van klanten en marketinginspanningen. Vervolgens genereert het uitgebreide prognoses.

Cruciale verschuiving

Dit voorspellende model voorziet de kledingretailer van onschatbare inzichten zodat hij beter geïnformeerde en nauwkeurigere beslissingen kan nemen over voorraadbeheer, marketingstrategieën en deelname aan evenementen. Uiteindelijk gaan LLM’s verder dan tekst- en chattoepassingen door tekstuele informatie om te zetten in numerieke waarden. Dit is essentieel om een genuanceerd begrip van complexe relaties en niet-kwantificeerbare gegevens mogelijk te maken. De integratie van LLM’s in voorspellende methoden betekent een cruciale verschuiving in data-analyse die in toenemende mate nauwkeuriger, op prognoses gebaseerde besluitvorming kan ondersteunen.

Bron: research-live.com

Deze artikelen vind je vast ook interessant

Ook de laatste bytes ontvangen?