Geesteswetenschap op het terras 3/8

12 May 2014
toegevoegd door

Veel wetenschappers kunnen de neiging niet onderdrukken om ook in hun vrije tijd de wereld door een wetenschappelijke bril te bezien. Het is dan ook weinig verrassend dat terrasbezoek nogal wat onderzoek geïnspireerd heeft, met als meest recente voorbeeld een studie die onomstotelijk aantoont dat het terras drukker is wanneer de zon schijnt.

Het is interessant om te zien wat voor soort vragen onderzoekers uit verschillende disciplines zichzelf stellen op het terras. Zo vraagt een natuurkundige zich af wat de beste manier is om een donut in de koffie te dippen, zodat deze wel het vocht absorbeert maar niet uit elkaar valt in het kopje. Psychologen willen weten welk gedrag van een serveerster de meeste fooien oplevert (antwoord: de bestelling van de klant letterlijk herhalen). En een geesteswetenschapper? Die zal zich bijvoorbeeld afvragen hoe mensen met elkaar communiceren tijdens het terrasbezoek. Niet alleen is dat een van de belangrijkste redenen waarom mensen naar het terras gaan, het is evolutionair gezien allicht ook het meest relevant. Als je ouders destijds niet goed hadden kunnen communiceren, was de kans klein dat je dit stukje nu zou lezen.

En waar praten mensen dan over op het terras? Meestal begint het met praten over wat er op of om het terras zelf gebeurt (“Kijk wat die man met zijn donut doet!”, “Hoorde jij ook hoe onze serveerster me net papegaaide?”). Omdat wijzen onbeleefd is (en nogal opvalt op het terras), gebruiken sprekers taal om te wijzen op de mensen en dingen in hun omgeving (“die man”, “zijn donut”, “onze serveerster”). Dit soort uitdrukkingen worden om voor de hand liggende redenen dan ook verwijzende expressies genoemd. Hoe mensen dergelijke expressies produceren, en hoe we dat aan computers kunnen leren, waren de twee centrale vragen van het Bridging the Gap NWO-Vici project.

Waarom zou je computers willen leren hoe ze verwijzende expressies kunnen produceren? Een redelijke vraag, het antwoord is simpel: omdat ze een essentiële rol spelen voor zowel de tekst-naar-tekst als de data-naar-tekst generatiesystemen waar ik eerder over schreef. Verwijzende expressies zorgen voor samenhang in een tekst: een schrijver kan alleen een verwijzende expressie als “zijn donut” gebruiken wanneer uit de context duidelijk wordt van welke man die donut is. Bij tekst-naar-tekst generatie is het dus cruciaal om goed in de gaten te houden dat contextuele verbanden tussen verwijzende expressies in tact blijven. Bij data-naar-tekst generatie spelen verwijzende expressies ook een grote rol, bijvoorbeeld omdat ze de gaten in de zinstemplaten (“X scoorde Y”) vullen en zo een verband leggen tussen de geproduceerde tekst en de werkelijkheid (“De aanvaller van Willem II scoorde zijn tweede treffer”). Dat is mooi meegenomen, maar nog interessanter is wellicht dat computers ons kunnen helpen bij het begrijpen van hoe mensen verwijzende expressies produceren.

afbeelding blog Krahmer 3

Voor mensen (en voor computers trouwens ook) is de productie van verwijzende expressies vooral een keuzeprobleem. Stel je weer voor dat je op het terras zit, en de aandacht van je gesprekspartner wilt richten op een van de drie personen die net voorbij lopen (en hierboven netjes naast elkaar staan). Je belangrijkste uitdaging is een aantal eigenschappen van deze persoon te benoemen, zodanig dat je partner weet wie je bedoelt; een ondergespecificeerde beschrijving als “die man” zal niet werken, omdat er twee mannen voorbij lopen. Tegelijkertijd wil je de ander niet vervelen met een te lange, overgespecificeerde beschrijving als “de man in het pak, met de blauw-wit gestreepte stropdas en de bril, daar aan de linkerkant, die als twee druppels water lijkt op PC uit die oude Apple reclame, je weet wel, van Get a Mac”. Het is duidelijk dat er vele combinaties van eigenschappen zijn om deze man te beschrijven, die er allemaal in slagen om duidelijk te maken wie je bedoelt. Hoe maken sprekers dan snel een keuze uit die grote groep beschrijvingen?

Op basis van het liever-lui-dan-moe principe zou je verwachten dat sprekers kiezen voor de kortst mogelijke beschrijving; eentje die precies voldoende eigenschappen van de desbetreffende man benoemt, maar zeker niet meer dan dat. Een computermodel dat automatisch minimale beschrijvingen produceert is inderdaad voorgesteld, maar de auteurs hebben ook meteen bewezen dat dit computationeel te complex wordt, omdat het aantal mogelijke combinaties dat bekeken moet worden om te bepalen welke de kortste is al snel uit de hand loopt. Het zoeken naar een minimale beschrijving zou in een realistische situatie, met veel personen en objecten (zoals op een druk terras, bijvoorbeeld), eenvoudig een aantal minuten kunnen duren (zelfs op de snelle computer die ons brein is), en dat maakt direct duidelijk dat mensen dus een andere strategie hanteren. Dit blijkt ook uit analyses van de verwijzende expressies die sprekers daadwerkelijk produceren; die zijn vaak net niet minimaal, en bevatten in de regel iets meer informatie dan een gesprekspartner nodig heeft. Meer recente algoritmes modelleren dit door aan te nemen dat sprekers voorkeuren hebben voor bepaalde eigenschappen boven andere (bijvoorbeeld omdat ze eenvoudig waarneembaar zijn) en deze een voor een aan een beschrijving toevoegen totdat deze goed genoeg lijkt te zijn.

De kruisbestuiving tussen experimenteel onderzoek naar verwijzende expressies en computationele modellering van de bevindingen is wederzijds nuttig gebleken. Door te kijken naar wat sprekers doen kunnen betere modellen ontwikkeld worden, die op hun beurt weer inzicht verschaffen in hoe het spraakproductieproces in elkaar zou kunnen zitten. Maar het roept ook allerlei nieuwe vragen op. Bijvoorbeeld: Hoe kunnen we voorkeuren van sprekers voor bepaalde eigenschappen achterhalen? Wat verklaart die voorkeuren? Wanneer is een beschrijving goed genoeg? En zijn sprekers consistent in de beschrijvingen die ze produceren? Hoe bepaalt wat ze zien wat ze zeggen? Wat is de rol van de gesprekspartner bij dit proces? Kortom: wordt vervolgd!

Dit is het derde deel in een serie die Emiel Krahmer voor deze blog verzorgt over zijn onderzoek naar menselijke en automatische taalproductie.

 

Reageer

Uw e-mailadres wordt niet getoond.