Mijn Fellowship bij de Maatschappij verloopt anders dan gedacht. Ik had me verheugd op eindeloos puzzelen in de UB, niet alleen bij Speciale Collecties maar ook op een flexplek in de bibliotheek, afgewisseld door koffiedrinken met oud-docenten en vrienden. Dat liep allemaal anders: ik ben minder dan tien keer in Leiden geweest, werk nu alweer weken thuis, en drink alleen koffie, of met vrouw en kat. Op zich zeker niet erg, maar juist de afwisseling was fijn geweest. Inmiddels is daarnaast duidelijk geworden dat ook mijn inhoudelijke plan anders loopt dan ik me had voorgesteld...
Verschillen
Ik schreef twee weken geleden al dat een deel van mijn voorgestelde tijdvakken was afgevallen. Voor de andere vier tijdvakken heb ik inmiddels de twee versies, originieel en Resolutie, getranscribeerd. Ik deed dat omdat ik in een pilot verschillen had gevonden tussen de twee versies (waar ik ook al eerder over schreef), en omdat ik vermoedde dat die verschillen er in andere periodes ook zouden zijn. Die verschillen zouden me vervolgens inzicht kunnen geven in de manier waarop met taalvariatie en taalnormen werd omgegaan in verschillende perioden.
Helaas bleek dit leuke plan niet te werken. Er waren namelijk alleen verschillen in de periode 1600-1649, waarin ik mijn pilot had gedaan. Voor de andere perioden bleken de originelen braaf te zijn gekopieerd. De twee verschillende versies waren dan nog wel interessant, want het was niet helemaal duidelijk in welke periode de kopie was gemaakt. De spelling was op sommige punten nogal modern (consequent aa i.p.v. ae, geen -ck meer maar alleen -k), en het handschrift lijkt ook meer vroeg-18e-eeuws te zijn. De band daarentegen leek wel uit 1610 te kunnen komen, en sommige woorden waren voor de 18e dan weer vrij conservatief gespeld (soo, Boexken). Molhuysen, in zijn bronnenpublicatie, zegt er het volgende over: "twee deelen Resoluties, loopend over de jaren 1589—1595 en 1595—1617, die (...) in later tijd samengesteld zijn, (...) zijn geheel onbetrouwbare copieën." Maar wanneer dat precies was, en wie dat heeft gedaan, dat blijft onduidelijk...
Wat nu (niet)?
Het plan zoals ik het voor ogen had (een diachrone, kwantitatieve vergelijking tussen twee tekstversies) blijkt het beschikbare materiaal dus echt niet mogelijk. Een vergelijkbare aanpak zou wel op een meer kwalitatieve manier mogelijk zijn, op een van twee manieren. Ten eerste zouden de beschikbare versies van de Resolutiën uit 1610-1611 kunnen worden vergeleken met de kopie. Probleem daarbij is alleen dat dus niet precies duidelijk is van wanneer die kopie is, of wie de schrijver is. Als datering en auteurschap onduidelijk zijn, is ook lastig te beoordelen wat voor rol taalnorm eventueel heeft gespeeld, of waarom juist deze veranderingen zijn doorgevoerd en niet andere. Is het een conservatieve speller, of juist een progressieve? Daar is geen antwoord op te geven zonder datering.
Een tweede plan zou echt ander materiaal gebruiken, door kladnotulen van één schrijver te vergelijken met de Resolutiën. Het archief bevat namelijk klad-resolutiën van secretarissen P. Burgersdijk (voor 1674-1685) en J. de Fremery (voor 1807-1811). Ik heb de stukken van Burgersdijk bekeken, en die hebben echt het karakter van kladwerk, met allerlei doorhalingen en losse flarden tekst. Hoewel dit interessant lijkt, lijkt het me om praktische redenen geen goed idee dit binnen mijn Fellowship te onderzoeken. Ik ben nu al op twee derde van de tijd, en hoewel het project niet hoeft te zijn gecompleteerd binnen de tijd van het Fellowship, moet ik wel zoveel mogelijk doen. Nu aan een totaal nieuwe dataselectie beginnen is daarvoor geen goede oplossing.
Wat nu wel?
Is alles dus verloren als tranen in de regen? Niet per se. Zoals het een wetenschapper betaamt heb ik al een alternatief bedacht. Er zijn namelijk voor het Nederlands helaas weinig tekstverzamelingen die een lange periode beslaan en die bruikbaar zijn voor taalwetenschappelijk onderzoek (Brieven als Buit uitgezonderd). Grootschalige bronnen als Delpher en Nederlab zijn niet gecureerd, maar alleen een vergaarbak van alles wat toevallig beschikbaar is. De data daarin is niet representatief of gebalanceerd, om van de gebrekkige kwaliteit überhaupt nog maar te zwijgen. Dat maakt het doen van taalkundig onderzoek over een langere periode heel lastig.
Een dataset voor de periode 1575-1811, die geschikt is voor taalkundig onderzoek, en die openbaar beschikbaar is, blijft dus interessant, zelfs als er geen sprake is van verschillende versies. Ik ben inmiddels dan ook een eind onderweg zo_n dataset te maken. De onderzoeksvragen die je aan de zo_n dataset kunt stellen zijn begrijpelijkerwijs ook anders dan van te voren bedacht, maar het is nog steeds mogelijk te kijken naar mijn interesse, de relatie tussen gebruik en norm. Misschien kijk ik wel naar na/naar: de variatie daartussen is bekend, en neemt voor zover we nu weten vooral in de 18e eeuw af, onder invloed van de norm. Maar wordt dat bevestigd in deze data? En hoe zit het met allerlei spellingsverschijnselen, zoals de spelling van de t-klank aan het eind van woorden (in mijn data staat regelmatig werdt), of de k-klank (wanneer verdween publycque bibliotheecque?) Kortom: het gaat allemaal anders dan gedacht, maar dat hoeft de pret niet te drukken.