AI en psycholinguïstiek

Als neurocomputationeel psycholinguïst doe ik onderzoek naar taalbegrip en – verwerking in het menselijk brein. Ik implementeer computermodellen die proberen te verklaren hoe, waar, en wanneer onze hersenen betekenis toekennen aan talige input terwijl wij deze woord voor woord lezen of horen. Deze computermodellen hebben een beknopt lexicon en zijn daarmee succesvol in staat betekenissen voor simpele zinnen te construeren en voorspellingen te doen over menselijke hersensignalen tijdens taalverwerking. Implementationeel zijn de modellen neurale netwerken, verzamelingen van kunstmatige, gesimplificeerde hersencellen verbonden in opeenvolgende lagen. Deze neurale netwerken, die geïnspireerd zijn op de netwerken van biologische neuronen in ons brein, vormen ook de basis voor Large Language Models (LLM’s), grote taalmodellen zoals ChatGPT en LLaMa, die getraind zijn om gegeven een context het meest waarschijnlijke volgende woord te voorspellen.

Het onverwachte, enorme succes van deze LLM’s heeft een gigantische impact op de psycholinguïstiek en verwante vakgebieden. Door slim gebruik van LLM’s hebben onderzoekers onlangs laten zien dat het mogelijk is om bij redelijke benadering de tekst van een podcast te voorspellen uit hersenmetingen die gemaakt zijn terwijl mensen deze beluisterden. Dit soort technologie heeft mijns inziens de potentie om in de toekomst fundamentele vragen over taal in het brein te kunnen beantwoorden. Vragen zoals hoe en waar de betekenissen van individuele woorden gerepresenteerd zijn en hoe, waar, en wanneer deze vervolgens gecombineerd worden tot de betekenis van zinnen en teksten.

Buiten methodologische implicaties heeft het ogenschijnlijk bijna mensachtige taalbegrip en -gebruik van LLM’s ook de theoretische discussie over het menselijk taalvermogen opgeschud, in het bijzonder betreffende de fundamentele vraag of het menselijk taalvermogen is aangeboren of aangeleerd. Een kernargument voor een aangeboren taalvermogen is dat een kind de omvangrijkheid en expressiviteit van onze taal niet kan leren door simpelweg statistische patronen te extraheren uit de talige input waar het mee in aanraking komt. Het succes van LLM’s laat echter zien dat, gegeven genoeg talige input, het extraheren van deze patronen wel degelijk kan leiden tot een adequaat taalmodel en dat taal dus in principe aangeleerd kan worden zonder aangeboren taalvermogen.

Ondanks dat deze en andere theoretische discussies verre van voorbij zijn, illustreert het hoe LLM’s een enorme impact hebben op de psycholinguïstiek. Hoe deze invloed van kunstmatige intelligentie zich de komende jaren gaat ontwikkelen is kijken in een glazen bol, maar één ding is zeker: er zal nooit meer een psycholinguïstiek bestaan zonder de fundamentele, methodologische en theoretische invloed van AI.

 

Deel via: