“Tal van use cases mogelijk”
Van onderzoeker naar ondernemer, het is het verhaal van Guy De Pauw van Textgain uit Bredene. De spin-off van UAntwerpen kan 10 jaar na de start mooie use cases voorleggen. “Wij bieden automatische analyseoplossingen voor elke situatie waar er meer tekst is dan mankracht om die te verwerken. Maar dan wel voor sectoren waar ‘bijna goed’ niet goed genoeg is.”
“We waren aan de UAntwerpen pioniers in social media monitoring voor het Nederlands, specifiek in sentimentsanalyse: achterhalen of mensen positief of negatief over iets posten op sociale media. Maar wat werkte op onze laptop, wilden we ook verder commercialiseren. Oorspronkelijk werkten we algemener: technologie aanbieden om grote collecties tekst te analyseren en daar inzichten uithalen. Maar na de aanslagen in 2016 begonnen we artificiële intelligentie te bouwen om jihadistische taal automatisch te detecteren op sociale media. Daarna bekeken we ook andere vormen van extremisme, zoals racisme dat welig tiert op sociale media. Via diverse Europese projecten creëerden we een unieke positie in de markt omdat we dat toxisch taalgebruik in cijfers konden uitdrukken en automatisch en vooral heel snel detecteren, wat nodig is als je miljoenen berichten per dag moet checken.”
Wij bieden oplossingen voor elke situatie waar er meer tekst is dan mankracht om die te verwerken.
Guy De Pauw
Vroegdetectie
“Een use case is deDuider. We noemen het wel eens ‘de meest deprimerende krant van Vlaanderen’.” (lacht) “De tool geeft communicatiemedewerkers van lokale besturen in Vlaanderen meer zicht op wat er zich online in hun gebied afspeelt, waar mensen van wakker liggen of boos over zijn. Door vroegdetectie kunnen ze het beleid en hun communicatie aanpassen. Ons vlaggenschipproject momenteel is de European Observatory of Online Hate in opdracht voor de Europese Unie, waarbij we toxische taal herkennen en classificeren voor alle 24 EU-talen en ook Russisch, Oekraïens, Arabisch en Turks. Daarvoor wonnen ze in 2022 de AHA-award van Voka voor innovatieve bedrijven. De klemtoon ligt nu meer en meer op illegale vormen van haatspraak. Ook zaken die de nationale veiligheid in gevaar brengen, krijgen grote aandacht. Toen we bijvoorbeeld de zaak Jürgen Conings uitspitten, vonden we een Russische groep op Telegram die op onze sociale media de gemoederen ophitste door de polarisering te verhogen. Zo probeert men onze democratie te breken. Maar er zijn tal van andere use cases mogelijk.”
De sterkte van Textgain, dat is technologie bouwen om de conversaties met enorme hoeveelheden tekstbronnen waarachtig en betrouwbaar te maken. “ChatGPT hallucineert soms en gebruikt niet de meest recente informatie. Wij doen dat wel, onder meer in samenwerking met de VRT die via een conversatieapp zijn nieuwsarchief wil ontsluiten voor het brede publiek. Maar ook in de private sector liggen er kansen. CALICO, ons eigen large language model dat met toxisch taalgebruik om kan - in tegenstelling tot ChatGPT - kan onze kansen in de markt van cybersecurity vergroten. Veiligheidsdiensten laten trainen op simulaties van haatcampagnes, of regionale sentimenten meten als een politicus naar het buitenland gaat zodat de security kan worden aangepast, zijn maar enkele toepassingen. We zien nu al in ons partnerschap met Sopra Steria dat we daar heel wat impact kunnen hebben.”





