zaterdag 24 februari 2007

Is de Taalprof een Britse jongere?



Het Grammaticale Onbenul is overal. Op de Amerikaanse site Language Log voeren taalkundigen al jaren een wanhopige strijd tegen taalkundige mythen en misvattingen in de media. Zo besteedden ze het afgelopen jaar een paar keer aandacht aan de uitspraak dat Britse jongeren tegenwoordig een zo kleine woordenschat zouden hebben, dat ze maar 20 woorden gebruiken voor 30% van alles wat ze zeggen. In Nederland deed Quest Magazine die uitspraak deze maand nog eens dunnetjes over.

Lekkere uitspraak, mediatechnisch gezien, dat natuurlijk wel. Voorbeeldje erbij van het typetje Vicky Pollard uit Little Britain ("yeah but no but yeah but no"), en het punt is gescoord. Britse jongeren worden taalkundig neergezet als gedegenereerde brabbelaars die alleen maar stopwoordjes herhalen en de woordenschat van een getrainde chimpansee hebben.


Toch blijkt dit allemaal niet uit die cijfers, zo lieten de taalkundigen op Language Log zien. Het is namelijk bij alle teksten het geval dat de 20 meest frequente woorden ongeveer 30% van alle woorden uitmaken. De meest frequente woorden komen namelijk heel erg vaak voor. En gek genoeg gebruik je maar 100 woorden voor de helft van wat je zegt of schrijft, hoeveel dat ook is.


Ik heb het gecontroleerd, met de teksten van mijn eigen website. Die kan ik downloaden in één groot bestand, van ongeveer een kwart miljoen woorden. Ruwe woordtelling erop, en de aantallen van de 20 meest frequente woorden bij elkaar opgeteld. Waar kwam dat op uit? Op ongeveer 87.500. Dat is 35% van het totaal. De Taalprof schrijft dus 35% van al zijn teksten met maar 20 woorden.


Het is natuurlijk een telling van niks. Er zit flink wat vervuiling in, omdat er in het bestand ook codes staan, waarvan alleen de meest frequente even met de hand zijn weggestreept. En de telling betreft alleen woordvormen. Als je bijvoorbeeld is, zijn, was, ben, bent zou samennemen tot één woord zijn, dan zouden in elk geval twee woordvormen uit de top-20 op elkaar worden geklapt en ruimte maken voor een ander woord. Dat betekent dat het percentage dan nog hoger komt te liggen! Toch geeft zelfs die knullige telling een indruk van de orde van grootte van de getallen.


Maar wat zégt dat nou eigenlijk? Dat de taalprof weinig woorden kent? Weinig woorden gebruikt? Welnee. Bedenk eens het volgende. Als je eenvoudige zinnen gebruikt, beperk je die zinnen tot veel verschillende inhoudswoorden: zelfstandige naamwoorden, bijvoeglijke naamwoorden, werkwoorden. Maak je je zinnen ingewikkelder, dan komen daar voorzetsels, hulpwerkwoorden, lidwoorden en voornaamwoorden bij: de zogeheten functiewoorden. Maar daar zijn er veel minder van! Dat betekent dat die weinige functiewoorden allemaal heel erg vaak gaan voorkomen. Het gevolg is dat je per saldo minder woorden voor meer tekst gaat gebruiken. Als je dat in een percentage uitdrukt zoals voor die Britse jongeren berekend, dan zal dat percentage hoger worden naarmate je ingewikkelder zinnen maakt.


Statistiek is een mooie wetenschap. Meten is weten. Maar als je geen flauw benul hebt wat je getallen betekenen, kun je net zo goed niet tellen. Een beetje grammaticaal benul had de redactie van Quest Magazine behoed voor deze uitglijder.

4 opmerkingen:

  1. Zou dit nu iets zijn om de redactie van Quest gericht op aan te spreken of niet? Of heeft de Taalprof zoiets al ondernomen?

    BeantwoordenVerwijderen
  2. @Wouter van Wingerden: ja, daar heb ik wel aan gedacht, maar dat staat dan meteen weer zo belerend. Bovendien heb je dan kritiek op de suggestie die er van zo'n feitje uitgaat, en niet op de feitelijke inhoud zelf. Dat is een moeilijk verhaal.

    BeantwoordenVerwijderen
  3. De prof kaart het mooi aan. Cijfers liegen niet, zegt men, maar de conclusies kunnen wel leugens zijn.

    BeantwoordenVerwijderen