Heel wat onderzoeken op het gebied van onderwijseconomie hebben geprobeerd na te gaan in welke mate “tracking” (het opsplitsen van leerlingen in hiërarchische onderwijsvormen of studierichtingen) de prestaties van leerlingen op school kan beïnvloeden. Laten we even voorbijgaan aan het feit dat deze studies vaak zijn uitgevoerd vanuit een economisch (budgettair) perspectief. In dit artikel focussen we op hun resultaten. De meeste van deze studies pleiten voor het verlengen van de gemeenschappelijke vorming (gemeenschappelijke “stam” of “sokkel” of “kerncurriculum”), maar een aantal tegenstrijdige resultaten verhinderen een consensus over deze kwestie. Een recent onderzoek in Duitsland, dat methodologisch bijzonder robuust is uitgevoerd, levert sterke aanwijzingen ten gunste van de verlenging van een gemeenschappelijke sokkel. Het belangrijkste aspect van dit onderzoek ligt misschien wel in wat het ons vertelt over de relatie tussen tracking en sociale mix op school.
Scandinavische studies en internationale vergelijkingen: sterke aanwijzingen ten gunste van een langere gemeenschappelijke stam
Heel wat landenstudies vallen gunstig uit voor de voorstanders van een verlenging van de gemeenschappelijke stam. Dit geldt met name voor analyses die zijn uitgevoerd in Finland, Zweden en Noorwegen (Aakvik & al., 2010; Kerr & al., 2013; Meghir & Palme, 2005) nadat in deze landen enkele decennia geleden hervormingen waren doorgevoerd om (vroege) tracking (filiarisering of indeling in onderwijsvormen en studierichtingen) af te bouwen. Deze studies vergelijken de prestaties van leerlingen vóór en na de invoering van hervormingen (die tracking afbouwden ten voordele van een langere gemeenschappelijke stam). Ze tonen aan dat leerlingen uit de volkse en kansarme milieus veel voordeel halen uit de langere gemeenschappelijke sokkel, zonder dat andere leerlingen er veel nadeel van ondervinden. Een beperking van deze onderzoeken is dat ze niet met zekerheid kunnen aantonen dat de afbouw van tracking de enige of de belangrijkste oorzaak is van deze verbetering in schoolprestaties. Tegelijkertijd varieerden immers ook andere parameters, zoals de uitbreiding van de leerplicht, de sturing van het onderwijssysteem, of variabelen buiten het schoolsysteem die de schoolprestaties beïnvloeden.
Vergelijkbare analyses in andere landen hebben iets minder eenduidige resultaten opgeleverd (Piopiunik, 2014; Pischke & Manning, 2006): bijvoorbeeld een lichte verslechtering van de schoolprestaties van de beste leerlingen (maar een groot voordeel voor de anderen) na de invoering van een langere gemeenschappelijke stam.
Internationale vergelijkingen tussen landen met veel en weinig tracking bevestigen de conclusies van de Scandinavische studies (Hanushek & Wössman, 2006; Waldinger, 2007). Alles bij elkaar tonen deze vergelijkingen aan dat landen met een hoog niveau van “streaming” (tracking) de landen zijn die de grootste sociale ongelijkheid in hun onderwijs kennen en waar leerlingen uit kansarme milieus de minste kans hebben om aan hun sociale “voorbestemming” te ontsnappen. De studie van Hanushek en Wössman toont ook aan dat onderwijssystemen met veel “streaming” (tracking) statistisch lagere gemiddelde prestaties van de leerlingen laten optekenen. Een van de beperkingen van internationale vergelijkingen is echter dat “streaming” in elk land anders wordt geïmplementeerd. De verschillende onderwijsvormen kunnen bv méér of minder sterk hiërarchisch “academisch” geordend zijn, in die mate zelfs dat de variabele “tracking” statistisch moeilijk precies kan bepaald worden, waardoor de conclusies ook licht kunnen fluctueren. (Waldinger, 2007). Bovendien is het in deze internationale studies moeilijk om de invloed van factoren van derden uit te sluiten: het kan niet volledig worden uitgesloten dat andere ‘verborgen’ internationale variaties de statistische waarnemingen deels verklaren. De studie van Hanushek en Wössman (2006) gebruikt de statistische methode van “differences-in-differences” waardoor dit risico wordt gereduceerd.
Bewijst een quasi-experimenteel onderzoek in Kenia de voordelen van tracking?
Ondanks deze hoeveelheid gelijkluidend bewijs ten gunste van een langere gemeenschappelijke stam, bestaat hierover geen consensus. Er zijn ook onderzoeken met tegengestelde resultaten. Met name het onderzoek van Esther Duflo (die in 2019 de Nobelprijs economie won, weliswaar voor een ander onderzoek) en haar collega’s (Duflo & al., 2011). Duflo bekritiseerde eerdere studies vanwege hun methodologische beperkingen (‘endogeneity bias’, in econometriejargon) en nam zich voor om quasi-experimenteel, gerandomiseerd onderzoek uit te voeren, dat volgens haar beter in staat is om variabelen van derden te neutraliseren door het ‘ceteris paribus’-principe (‘als alle andere factoren gelijk zijn’) te garanderen.
Om hun onderzoek uit te voeren, maakten Duflo en haar collega’s gebruik van een programma om klassen in Kenia op te splitsen. Hun steekproef bestond uit leerlingen van 121 scholen. In 60 van deze scholen was er sprake van interne tracking: leerlingen werden op basis van hun initiële schoolprestaties, gemeten via een test, ingedeeld in een “sterke” of een “zwakke” afdeling. In de 61 andere scholen was er geen interne tracking: leerlingen werden willekeurig toegewezen aan twee afdelingen van gelijkaardig niveau. De leerkrachten werden willekeurig verdeeld over klassen met of zonder tracking. Na 18 maanden bleek bij testen (voor wiskunde en lezen) dat leerlingen in streamingsklassen (waar ze volgens hun niveau werden ingedeeld) meer vooruitgang hadden geboekt dan leerlingen in niet-streamingsscholen, ongeacht hun beginniveau. Duflo concludeerde dat “streaming” goed was voor iedereen en dat het voordeel voortvloeide uit het onderwijs op maat dat aan elke niveaugroep (“teaching at the right level”) werd verstrekt. Het team van Esther Duflo voegde eraan toe dat hoewel de conclusies van hun onderzoek in strijd leken te zijn met het grootste deel van de wetenschappelijke literatuur, ze toch overeenkwamen met de observaties van het Success for All programma dat in de Verenigde Staten werd geïmplementeerd, waar leerlingen ook werden gegroepeerd op basis van hun niveau.
De veralgemening van deze conclusies is betwistbaar. De context waarin dit onderzoek is ontwikkeld, is zeer specifiek. In het Keniaanse experiment hebben we te maken met leerlingen die aan het begin van het lager onderwijs tijdelijk van elkaar worden gescheiden maar vervolgens worden samengebracht in gemeenschappelijke klassen. Dit heeft gevolgen voor de houding en motivatie van leerlingen en leerkrachten, maar ook voor de inhoud van het curriculum, dat wordt vastgesteld met het oog op de herintegratie van alle leerlingen in een gemeenschappelijke opleiding.
Er is ook het feit dat het onderzoek, uitgevoerd in de context van een ontwikkelingsland, gebaseerd is op een steekproef die moeilijk te vergelijken is met onze ‘westerse’ schoolpopulatie: veel van de leerlingen in de Keniaanse steekproef zijn de eerste generatie van hun familie die naar school gaan en zijn bovendien niet eerder naar de kleuterschool gegaan. Het is dus heel goed mogelijk dat het onderwijs op maat dat Duflo prijst, wel ten goede komt aan deze zeer speciale leerlingen, maar niet aan leerlingen in Westerse landen. Andere specifieke kenmerken aan dit Keniaans experiment zijn dat de leerkrachten worden betaald op basis van hun resultaten en dat ze willekeurig aan scholen worden toegewezen.
Het krediet dat bepaalde economen (zij het in minderheid) geven aan het onderzoek van Duflo, of aan de veralgemening van de resultaten ervan, lijkt dan ook overdreven. Dit onderzoek toont hoogstens aan dat tijdelijke groeperingen volgens de moeilijkheden van de leerlingen mogelijk positieve effecten kunnen hebben in bepaalde contexten, en op voorwaarde dat het de bedoeling is om nadien iedereen opnieuw in hetzelfde leerplan te integreren. Over het bilan van het programma Success for All, dat Duflo als precedent aanhaalt, kunnen we niet méér zeggen. In dit programma zijn de niveaugroepen – gebaseerd op het principe van ‘lesgeven op het juiste niveau’ en gereserveerd voor een fractie van het leesonderwijs – ook tijdelijk en strategisch, en nemen ze slechts enkele lesuren per week in beslag. Ook hier is geen sprake van een echte streaming.
Doorslaggevende argumenten uit Duitsland
In een poging om de ambiguïteit rond de effecten van streaming op te lossen, werd in een recente Duitse studie (Matthewes, 2021) gebruik gemaakt van de verschillen in streaming tussen de verschillende deelstaten. In Duitsland vindt streaming in het onderwijs plaats op de leeftijd van 10 jaar. Na deze leeftijd gaat slechts 40% van de leerlingen verder in het ‘algemene’ onderwijs (Gymnasium). Afhankelijk van de deelstaat worden de overige 60 procent ofwel gescheiden in twee hiërarchische stromen of krijgen ze nog twee jaar gemeenschappelijk onderwijs. Matthewes’ analyse omvat een vergelijking van de academische prestaties van deze 60% van de leerlingen, afhankelijk van de deelstaat en het onderwijssysteem. De methodologische robuustheid van deze studie komt voort uit het feit dat ze bijna voldoet aan het ceteris paribus-beginsel (“als alle andere factoren gelijk zijn”). Hoewel het onderwijs in Duitsland een bevoegdheid is van de deelstaten, zijn de overeenkomsten (leerplaninhoud, omkadering, onderwijstaal, sociaaleconomische variabelen, lerarenopleiding, enz.) tussen de deelstaten groot. We staan hier dicht bij een experiment waarbij slechts één variabele tegelijkertijd verandert. In zekere zin zou je kunnen zeggen dat de studie van Matthewes de sterke punten van een internationale vergelijking combineert zonder de zwakke punten ervan te vertonen.
Wat nu de resultaten betreft: dit Duitse onderzoek toont dat de leerlingen die 2 jaar langer een gemeenschappelijke basisvorming volgen gemiddeld beter presteren dan de leerlingen die op de leeftijd van 10 jaar in hiërarchische stromen worden ingedeeld. De zwakste leerlingen profiteren het meest van enkele extra jaren gemeenschappelijke stam. Het voordeel is matig voor gemiddelde leerlingen en vrijwel nihil voor de best presterende leerlingen (we hebben het hier over de 60% leerlingen die niet naar het gymnasium gaan). Deze studie geeft geen uitsluitsel over de hypothese dat voor de ‘allerbeste leerlingen’ het niet bezoeken van het Gymnasium zeer lichte negatieve effecten kan hebben, hoewel andere studies in dit opzicht eerder geruststellend zijn (zie bijvoorbeeld Kerr & al., 2013). Vanuit democratisch oogpunt lijkt het ons hoe dan ook legitiem om in het leerplichtonderwijs voorrang te geven aan de aanzienlijke voordelen voor de meerderheid van de leerlingen boven de lichte verliezen waaraan de elite van de leerlingen mogelijk wordt blootgesteld.
Lang leve het Pact dan? Niet zo snel…
We zouden hier kunnen stoppen en ons gelukkig prijzen met de positieve impact die de verlenging van de “tronc commun” (gemeenschappelijke stam) tot 15 jaar in het Franstalig onderwijs over enkele jaren (gepland in het kader van het Pacte pour un Enseignement d’Excellence) zou moeten hebben. Hier past echter een grote waarschuwing. Matthewes (2021) verfijnt zijn statistische analyses door te controleren voor een hele reeks variabelen en toont aan dat het positieve effect van de extra jaren gemeenschappelijke vorming bijna volledig (bij lezen) of gedeeltelijk (bij wiskunde) kan worden verklaard door de grotere heterogeniteit van de leerlingen in de klas. Anders gezegd, als een gemeenschappelijke stam rechtvaardig en effectief blijkt te zijn, is dat grotendeels te danken aan het feit dat het leidt tot een grotere sociale en academische mix in de klas.
En hier botst het Pacte d’Excellence (in het Franstalige onderwijs) op zijn limieten. Het wil de gemeenschappelijke stam verlengen zonder maatregelen met een noemenswaardige impact op de sociale mix. Het Pacte d’Excellence voorziet geen ambitieuze maatregelen om de marktwerking in het onderwijs en de sociale segregatie die eruit voortvloeit te reguleren. Als de overheid de gettovorming niet tegengaat door ouders een gemengde school te garanderen, lopen we het risico de meest gesegregeerde – en dus de minst doeltreffende en rechtvaardige – gemeenschappelijke stam in Europa te hebben. Bovendien is de tronc commun die door het Pact wordt georganiseerd niet ‘structureel’ verankerd: de scholen die de gemeenschappelijke stam organiseren zijn niet gescheiden van de scholen die hoger secundair onderwijs inrichten. Ouders en leerlingen zullen bijgevolg geneigd zijn om voor de onderbouw van het secundair onderwijs de voorkeur te geven aan een school die voor de bovenbouw van het secundair onderwijs bepaalde onderwijsvormen of studierichtingen aanbiedt die als min of meer ‘ambitieus’ worden beschouwd. Dit zal zeer waarschijnlijk sociale en academische segregatie in stand houden.
Onze tronc commun (in het Franstalig onderwijs) loopt daarom het risico zijn doel voorbij te schieten. Achter het label “gemeenschappelijke stam” zal het lesgeven in de diverse scholen, die vaak concentratiescholen blijven, in werkelijkheid van zeer ongelijk niveau zijn. Als gevolg hiervan dreigt streaming (vroegtijdige opsplitsing van leerlingen in hiërarchische stromen) alleen “op papier” te verdwijnen, terwijl in de praktijk een hiërarchische ordening en polarisatie tussen scholen van hoog en van laag niveau wordt onderhouden of versterkt.
De situatie van ons onderwijssysteem is te ernstig om toe te geven aan wanhoop en geweeklaag. De strijd voor een sociale mix in alle scholen is een noodzakelijke (weliswaar geen voldoende) voorwaarde om van de verlenging van de gemeenschappelijke stam een succes te maken. Dit is precies wat Ovds voorstelt met het initiatief ‘Een plaats op een goede school voor elk kind”. Een Oproep die je kan ondersteunen en helpen verspreiden. (via https://www.skolo.org/nl/2023/04/19/steun-teken/ )
Olivier Mottint
Dit artikel verscheen in “De democratische school” (nr. 95, september 2023), het driemaandelijks tijdschrift van Ovds (Oproep voor een democratische school). Je kan Ovds steunen door een abonnement te nemen op “De democratische school” of door lid (abonnement inbegrepen) te worden van Ovds. Meer informatie: hier.
Referenties
Aakvik, A., Salvanes, K.G. & Vaage, K. (2010). Measuring heterogeneity in the returns to education using an education reform. European Economic Review, 54(4), 483–500.
Duflo, E., Dupas, P. & Kremer, M. (2011). Peer effects, teacher incentives, and the impact of tracking: Evidence from a randomized evaluation in Kenya. American Economic Review, 101(5), 1739-1774.
Hanushek, E.A. & Wössmann, L. (2006). Does educational tracking affect performance and inequality ? Differences-in-differences evidence across countries. Economic Journal, 116(510), C63-C76.
Hirtt, N., Kerckhofs, J.-P., Schmetz, P., Janss, M. & Gorré, C. (2019, 26 mars). Enseignement : allonger le tronc commun, folie ou panacée ? Carte blanche verschenen op de website van Le Vif : https://www.levif.be/belgique/enseignement-allonger-le-tronc-commun-folie-ou-panacee/
Kerr, S.P., Pekkarinen, T. & Uusitalo, R. (2013). School tracking and development of cognitive skills. Journal of Labor Economics, 31(3), 577–602.
Matthewes, S.H. (2021). Better together? Heterogeneous effects of tracking on student achievement. The Economic Journal, 131, 1269-1307.
Meghir, C. & Palme, M. (2005). Educational reform, ability, and family background. American Economic Review, 95(1), 414–424.
Piopiunik, M. (2014). The effects of early tracking on student performance: Evidence from a school reform in Bavaria. Economics of Education Review, 42, 12–33.
Pischke, J.S. & Manning, A. (2006). Comprehensive versus selective schooling in England and Wales: what do we know? Working Paper n°12176, National Bureau of Economic Research.
Waldinger, F. (2007). Does tracking affect the importance of family background on students’ test scores? Working Paper, London School of Economics.