Textgain bouwt taalmodel dat haatspraak detecteert in alle EU-talen

Door Jan Roekens | 16-07-2024

Het Belgische Textgain, een AI-spin-off van de Universiteit Antwerpen, bouwt een gloednieuw AI-instrument dat online haatspraak detecteert in alle officiële Europese talen. 

Textgain werkt aan CaLICO, het eerste Large Language Model (LLM) wereldwijd dat haatspraak in alle officiële EU-talen herkent en verwerkt. Het bureau op termijn de marktleider worden in meertalige haatspraakdetectie op basis van AI.

Textgain was onlangs een van de vier laureaten van de Large AI Grand Challenge, een competitie voor Europese AI-ontwikkelaars waaraan 94 internationale bedrijven deelnamen. Het won niet alleen 250.000 euro, maar ook zo’n 2 miljoen uur ontwikkeltijd op een Europese ‘supercomputer’. Daardoor kan het zijn nieuwe AI-modellen versneld trainen.

Transparante technologie

CEO Guy De Pauw: ‘Grote taalmodellen, zeker de commerciële, weigeren om toxische taal te verwerken. Daardoor is het zo goed als onmogelijk om ze in te zetten om bijvoorbeeld haatspraak te verwerken. Wij bouwen nu from scratch een eigen taalmodel dat dit soort content wél kan verwerken, maar niet zelf produceert.’ Textgain zet zich in om maatschappelijke problemen in kaart te brengen met behulp van AI-technologie. ‘De Europese Unie heeft daarvoor strenge normen bepaald’, stelt De Pauw. ‘De technologie moet transparant, uitlegbaar en ethisch zijn. Die waarden zitten in ons DNA. Het is de enige manier om mensen vertrouwen te geven in deze nieuwe technologie.’

Auteur: Jan Roekens, Hoofdredacteur

Deze artikelen vind je vast ook interessant

Ook de laatste bytes ontvangen?