Verandert AI de manier waarop we spreken en schrijven?

Orphée De Clercq staat voor microfoon
UGent'ers over AI
Artificiële intelligentie is alomtegenwoordig en lijkt op weg om onze maatschappij voorgoed te veranderen. Hoe denken UGent’ers hier over?

We vroegen taalkundige Orphée De Clercq hoe ze kijkt naar de invloed van AI op ons taalgebruik. Verliezen we binnenkort ons taalgevoel? Orphée De Clercq schreef dit opiniestuk naar aanleiding van het evenement ARTIFICIËLE INTELLUGENTIE op 4 maart 2026. 

De drijvende kracht achter de huidige generatieve chatbots is taal, meer bepaald grote taalmodellen. Computersystemen die werden getraind op gigantisch veel data, op gigantisch veel taal. Taal werd zo een technologisch product, een product dat momenteel een erg prominente plek inneemt in het AI-veld. Paradoxaal genoeg brokkelt tegelijkertijd de maatschappelijke aandacht en waardering voor taal af: studierichtingen met taal worden in vraag gesteld en ook de basisvaardigheden staan onder druk. Want waarom zou je nog zelf een (vreemde) taal leren, iets grondig lezen of al worstelend tot een tekst komen als je deze taken ook perfect kan uitbesteden aan een chatbot die altijd beschikbaar is? Het resultaat is toch “goed genoeg”. 

Maar taal is niet louter een taak, het is geen probleem dat moet worden opgelost of uitbesteed. Taal is een middel, hét middel dat wij mensen hebben gekozen om onze verhalen te vertellen, met elkaar te verbinden en om, onder andere via het schrift, kennis proberen vast te pakken en met elkaar te delen. Dat talige data zorgden voor de doorbraak binnen AI toont aan dat we in dat laatste tot op zekere hoogte zijn geslaagd. Taal lijkt de sleutel tot echte artificiële intelligentie en als we het narratief van de big tech mogen geloven is dat soort intelligentie en zelfs superintelligentie nabij.  

Vandaag wil ik ingaan op twee aspecten die aantonen dat een oplossingsgerichte focus op taal misschien niet datgene is waarnaar we moeten streven, want (1) taalmodellen zijn maar zo goed als de data waarop ze werden getraind en (2) taal gaat over veel meer dan woorden.

In het domein van machine learning spreken we van GIGO: garbage in, garbage out. Automatische systemen zullen enkel waardevolle output leveren als de input die ze kregen kwaliteitsvol en relevant is. Kwaliteit boven kwantiteit dus. Daar wringt het schoentje, want schaal (kwantiteit) nam de afgelopen jaren de bovenhand. De huidige generatie taalmodellen werd getraind op quasi elke menselijke tekst die ooit werd geschreven. We weten niet exact op welke teksten en welke talen allemaal, die informatie wordt niet vrijgegeven. Maar we weten wel dat het grootste deel van die trainingsdata bestaat uit een dump van het wereldwijde web. Het internet, dat een schat aan informatie bevat, maar soms ook aanvoelt als een riool (garbage in, garbage out). 

Wat we ook weten is dat het web hoofdzakelijk uit Engelse data bestaat, ongeveer 1/3. Bovendien zijn er van de naar schatting 7000 talen die wereldwijd worden gesproken slechts enkele honderden online terug te vinden. De bekendste en meest populaire modellen - denk aan de GPTs, Llamas, Geminis en Claudes - zijn dus meertalig of multilinguaal tot op een bepaald niveau. Daarnaast hebben ze ook een duidelijke voorkeur voor het Engels, een taalbias. Een oplossing zou kunnen zijn om te gaan hertrainen, maar het probleem is dat er momenteel amper nog authentieke teksten overblijven. Daarom wordt nu ingezet op synthetische data of een hybride vorm. Dat is natuurlijk niet zonder risico want voor je het weet zit je in een zelfversterkende loop (garbage in, garbage out). 

Die taalbias sijpelt door naar de output en kruipt op die manier ook in onze Nederlandse taal. Dat is op zich niks nieuws, de invloed van het Engels op onze taal is al langer bezig dan vandaag. Maar naast meer anglicismen, kortere woorden en zinnen en de fameuze em-dash (het gedachtestreepje), “voelen” we ook iets anders in de vele teksten die nu worden geschreven met generatieve AI.  Hier aan de universiteit bijvoorbeeld merken we dat in de vele bachelor- en masterproeven die we lezen. Er wordt precies veel meer baanbrekend onderzoek verricht. Tenminste als we afgaan op de grootspraak die in deze teksten sluipt, een grootspraak die doet denken aan de Amerikaanse cultuur. 

Dat brengt ons bij mijn tweede punt. Taal gaat over veel meer dan woorden, taal gaat ook over denken en zowel ons denken als onze taal staan niet los van de geschiedenis en de cultuur waarin we opgroeiden, waarin we leven. We weten dat een taal evolueert doorheen de tijd en door in contact te komen met andere talen en culturen. We weten ook dat communiceren soms een delicaat proces is. Iedereen die zich op reis al eens “lost in translation” voelde weet ook dat als je effectief meertalig wil gaan communiceren, het belangrijk is om los te komen van de woorden. Je moet als het ware de bril van de doelcultuur kunnen opzetten. 

Ook daar stokt het wat betreft de taalmodellen. Zij zijn misschien wel multilinguaal, maar daarom niet multicultureel. De meerderheid aan Engelse trainingsdata waar ik het daarnet over had vertaalt zich ook naar een eerder anglocentrisch beeld op de wereld. Wanneer je met mensen uit andere culturen communiceert, en zelfs als je dat doet via het Engels als lingua franca, word je er vroeg of laat wel op gewezen als je ergens uit de bocht gaat. Bij de chatbots is dat niet het geval, sterker nog, onbewust worden we via de taalmodellen allemaal beïnvloed richting een bepaald wereldbeeld en glijden we op die manier af naar eenheidsworst. Eenheidsworst in onze teksten, eenheidsworst in onze taal en misschien ook wel eenheidsworst in ons denken? En verliezen we daarmee niet ook een deel van onze identiteit, van onze authenticiteit? 

Dat brengt me terug bij het begin, taal is een middel en valt niet louter te reduceren tot taken of problemen die moeten opgelost worden. Het geheel is meer dan de som van de delen. We moeten weg van het oplossingsgericht denken en de mens en diens taal weer centraal plaatsen. Vandaag gaat het te veel over AI die alles overneemt, maar het is belangrijk dat de mens de controle behoudt, de mens moet als het ware aan de knoppen kunnen blijven zitten.

De mens centraal, dat is ook het motto van de alfawetenschappen. Ik geloof dan ook dat we voor de toekomst meer nood hebben aan meer sterke alfaprofielen, meer sterke denkers. Nu lijkt het alsof ik de twee verschillende benaderingen van kennis (alfa versus STEM) tegenover elkaar plaats. Maar dat is niet het geval, beide blijven belangrijk. Maar we moeten beter ons best doen om dezelfde taal te spreken, om een brug te vormen. Wat mij betreft is er geen betere plek dan de universiteit om deze brug mee te helpen vormgeven. Ik ben dan ook trots dat we hier aan de UGent een dergelijke voortrekkersrol nemen: op publieksavonden, maar evengoed in ons onderzoek en in de opleidingen die we aanbieden aan de sterke denkers van morgen.

In het kort

  • Generatieve AI steunt op taal en vormt taal om tot een taak die kan worden opgelost.
  • Taalmodellen zijn maar zo goed als de data waarop ze zijn getraind. Er is risico op verarming, eenheidsworst en voorkeur voor het Engels.
  • Taal gaat over cultuur en denken. Daarom moet de mens, niet AI, centraal blijven in kennis en onderwijs volgens Orphée De Clercq.

Orphée De Clercq is professor Taaltechnologie voor educatieve toepassingen aan de faculteit Letteren en Wijsbegeerte (vakgroep Vertalen, Tolken en Communicatie). Haar onderzoek situeert zich binnen het onderzoeksdomein van de taaltechnologie (Natural Language Processing of NLP) en met behulp van lerende technieken (machinelearning) gaat ze na hoe taaltechnologische toepassingen aangewend kunnen worden voor computerondersteund taalleren.

Meer lezen over Artificiële Intelligentie

De UGent bruist van de AI-expertise. Duik er mee in en lees nog meer opiniestukken van onze onderzoekers.

Lees ook

Maakt AI ons brein slim of lui?

We vroegen neuroloog Kristl Vonck hoe ze kijkt naar de invloed van AI op onze hersenen. Wat gebeurt er met ons brein wanneer we denkwerk systematisch uitbesteden aan een algoritme?

Kristl Vonck zit in een zaal met stoelen op de achtergrond
weergeven

Zorgen robots ervoor dat er straks geen werk meer is voor iedereen?

We vroegen econoom Amy Van Looy hoe ze kijkt naar de inzet van robots op de werkvloer. Zijn onze jobs in gevaar?

Amy Van Looy kijkt een collega aan
weergeven

Het bedrieglijke genius: wat René Descartes ons over AI te vertellen heeft

We vroegen filosoof Ignaas Devisch om na te denken over hoe we moeten omgaan met AI. Hij grijpt terug naar het gedachte-experiment van Descartes.

Ignaas Devisch spreekt publiek toe
weergeven

Wie bepaalt wat AI mag zeggen en wat niet?

We vroegen professor Artificiële Intelligentie Tijl De Bie hoe hij kijkt naar de grenzen die we AI al dan niet moeten opleggen.

Tijl De Bie spreekt de zaal toe
weergeven