Naar de inhoud
Kwantitatief onderzoekBachelor / Master

Beschrijvende statistiek rapporteren in academische papers: wat vermeld je en waarom

Leer hoe je beschrijvende statistiek rapporteert in een scriptie, bachelorproef of paper, met tabellen, voorbeelden en veelgemaakte fouten.

Texio Academisch Schrijfteam20 min lezen
Vier blauwe staven met één oranje spreidingslijn — beschrijvende statistiek rapporteren
Een compacte datavisualisatie waarin staven en een spreidingslijn laten zien hoe beschrijvende statistiek structuur geeft aan ruwe data.

Beschrijvende statistiek rapporteer je om je steekproef, variabelen en datakwaliteit helder te beschrijven voordat je toetsen of interpretaties bespreekt. Welke cijfers je kiest hangt af van het meetniveau: frequenties voor categorische variabelen, centrum- en spreidingsmaten voor numerieke variabelen, en altijd voldoende context om de lezer te laten zien wat de cijfers betekenen.

Beschrijvende statistiek rapporteren in academische papers: wat vermeld je en waarom

Je hebt je enquête geëxporteerd, SPSS of R heeft netjes tabellen uitgespuugd, maar nu begint het ongemakkelijke deel: welke cijfers horen echt in je paper en welke maken je resultatenhoofdstuk alleen maar voller? Veel studenten zetten elk gemiddelde, elke minimumwaarde en elke frequentietabel in hun scriptie of bachelorproef, omdat ze bang zijn iets weg te laten. Anderen schrijven juist één losse zin — “De respondenten scoorden gemiddeld 3,8” — zonder te vertellen wat de schaal was, hoeveel respondenten meededen of hoe groot de spreiding was. Beschrijvende statistiek rapporteren vraagt dus niet om zoveel mogelijk output, maar om een selectie die je onderzoeksvraag, variabelen en steekproef begrijpelijk maakt.

Beschrijvende statistiek rapporteer je om de lezer te laten zien hoe je data eruitzien vóórdat je verbanden, verschillen of effecten bespreekt. Kies je cijfers op basis van het meetniveau van de variabele: frequenties en percentages voor categorieën, gemiddelde en standaarddeviatie voor ongeveer normaal verdeelde schaalvariabelen, en mediaan plus spreiding bij scheve verdelingen. Een goede rapportage combineert een compacte tabel met korte tekst die uitlegt wat relevant is voor je onderzoeksvraag.

In this guide

Wat betekent beschrijvende statistiek rapporteren in je scriptie of bachelorproef?

Beschrijvende statistiek rapporteren betekent dat je de belangrijkste kenmerken van je data weergeeft zonder meteen conclusies te trekken over relaties, verschillen of oorzaken. Je beschrijft wie of wat in je dataset zit, hoe variabelen verdeeld zijn en of de data geschikt lijken voor verdere analyse. Daarmee geef je je lezer grip op de basis van je resultaten.

Beschrijven is iets anders dan toetsen

Beschrijvende statistiek is de samenvatting van je waarnemingen met cijfers zoals frequenties, percentages, gemiddelden, mediaan, standaarddeviatie, minimum en maximum. Deze cijfers zeggen iets over jouw dataset, niet automatisch over de volledige populatie.

Inferentiële statistiek gebruikt toetsen, betrouwbaarheidsintervallen of modellen om uitspraken te doen buiten de directe dataset. Denk aan een t-toets, chi-kwadraattoets, regressieanalyse of correlatie. Beschrijvende statistiek komt meestal vóór die toetsen, omdat je eerst moet laten zien wat de basispatronen zijn.

Een voorbeeld uit de psychologie: bij een bachelorpaper over stress en slaapkwaliteit onder eerstejaarsstudenten rapporteer je eerst het aantal respondenten, de gemiddelde stressscore, de spreiding in slaapkwaliteit en het percentage studenten met een bijbaan. Pas daarna bespreek je bijvoorbeeld of stress significant samenhangt met slaapkwaliteit.

Waarom je niet alle output opneemt

Software-output is geen resultatenhoofdstuk. Een tabel uit SPSS kan twintig kolommen bevatten, terwijl je paper er misschien maar vier nodig heeft. De vraag is steeds: helpt dit cijfer de lezer om mijn steekproef, variabelen of analyse te begrijpen?

Bij descriptieve statistiek in je scriptie is selectie dus een academische keuze. Je laat zien dat je begrijpt welke informatie relevant is voor je onderzoeksvraag. Als je onderzoekt of motivatie samenhangt met studie-uitstel, zijn het gemiddelde en de spreiding van beide schalen relevant. De gemiddelde leeftijd van respondenten kan nuttig zijn als achtergrondkenmerk, maar hoeft niet uitgebreid besproken te worden als leeftijd geen rol speelt in je analyse.

De plek in je paper

Beschrijvende statistiek staat vaak in het resultatenhoofdstuk, soms deels in de methode. Steekproefkenmerken zoals leeftijd, gender, opleidingstype of werkervaring kunnen in de methode staan als je de deelnemers beschrijft. Variabelen die je later analyseert, horen meestal in het resultatenhoofdstuk.

Als je nog twijfelt hoe je methode, meetinstrumenten en analyseopzet logisch opbouwt, helpt een duidelijke processtructuur voor een methodologiehoofdstuk. Beschrijvende statistiek werkt namelijk pas goed als de lezer eerder heeft gezien wat je hebt gemeten en waarom.

Welke descriptieve statistiek rapporteer je per type variabele?

Welke descriptieve statistiek je rapporteert hangt vooral af van het meetniveau van je variabele. Voor nominale en ordinale categorieën gebruik je meestal aantallen en percentages. Voor interval- en ratiovariabelen gebruik je centrum- en spreidingsmaten, maar de exacte keuze hangt af van de verdeling.

Meetniveau bepaalt je keuze

Nominale variabelen hebben categorieën zonder vaste rangorde, zoals studierichting, woonvorm of type organisatie. Daarvoor rapporteer je frequenties en percentages. Een gemiddelde van “studierichting” heeft geen betekenis.

Ordinale variabelen hebben categorieën met een volgorde, zoals opleidingsniveau, tevredenheidscategorieën of antwoordopties van “helemaal oneens” tot “helemaal eens”. Bij losse ordinale items rapporteer je vaak frequenties, percentages en eventueel mediaan. Bij samengestelde Likert-schalen gebruiken opleidingen vaak gemiddelde en standaarddeviatie, mits je dit kunt verantwoorden.

Interval- en ratiovariabelen zijn numeriek en hebben gelijke afstanden tussen waarden, zoals leeftijd, toetsscore, responstijd of maandinkomen. Daarvoor rapporteer je vaak gemiddelde, standaarddeviatie, minimum en maximum. Bij scheve verdelingen is mediaan met interkwartielafstand vaak informatiever.

Praktische keuzetabel

VariabeleMinder geschikte rapportageSterkere rapportageWaarom
Genderidentiteit in een steekproef“Gemiddelde gender = 1,42”“Vrouw: 62%, man: 34%, anders/wil niet zeggen: 4%”Nominale categorieën beschrijf je met aantallen en percentages.
Stressscore op schaal 1–5“Veel studenten waren gestrest”“M = 3,72, SD = 0,81, n = 148”Een schaalvariabele vraagt om centrum en spreiding.
Aantal gemiste colleges“M = 2,9”“Mediaan = 2, IQR = 1–4; bereik = 0–12”Tellingen zijn vaak scheef verdeeld.
Tevredenheid per antwoordcategorie“Gemiddelde tevredenheid = 3,6”“Eens/helemaal eens: 68%; neutraal: 19%; oneens/helemaal oneens: 13%”Bij een los ordinaal item zijn categoriepercentages vaak duidelijker.

Deze tabel laat meteen zien waarom de zoekvraag “welke descriptieve statistiek rapporteren” geen vast antwoord heeft. Het juiste cijfer hangt af van wat de variabele voorstelt.

Voorbeelden uit verschillende opleidingen

In een verpleegkundig onderzoek naar medicatietrouw bij oudere patiënten na ontslag naar thuiszorg rapporteer je bijvoorbeeld leeftijd, aantal medicijnen per dag, percentage patiënten met hulp van mantelzorg en de gemiddelde medicatietrouwscore. Leeftijd kan met gemiddelde en standaarddeviatie, terwijl “hulp van mantelzorg” een percentage vraagt.

In een onderwijsstudie naar formatieve feedback in het eerste jaar van de pabo kun je het gemiddelde aantal feedbackmomenten per student rapporteren, maar ook de verdeling over opleidingsgroepen. Als sommige studenten nul feedbackmomenten hadden en enkele studenten heel veel, is de mediaan nuttiger dan alleen het gemiddelde.

In een managementpaper over thuiswerken en teamcohesie rapporteer je bijvoorbeeld bedrijfsgrootte in categorieën, gemiddeld aantal thuiswerkdagen per week en de standaarddeviatie van de teamcohesieschaal. Elk cijfer moet aansluiten op de variabele en de latere analyse.

Hoe kun je gemiddelde en standaarddeviatie rapporteren zonder je lezer te misleiden?

Gemiddelde en standaarddeviatie rapporteren doe je alleen zinvol als de variabele numeriek is en de verdeling niet extreem scheef is. Het gemiddelde geeft het centrum van de scores aan; de standaarddeviatie laat zien hoeveel scores gemiddeld rond dat centrum variëren. Zonder schaal, n en context zijn deze cijfers moeilijk te interpreteren.

Wat M en SD echt zeggen

Gemiddelde (M) is de som van alle waarden gedeeld door het aantal waarnemingen. Het is gevoelig voor uitschieters. Eén extreem hoge waarde kan het gemiddelde merkbaar omhoogtrekken.

Standaarddeviatie (SD) is een maat voor spreiding rond het gemiddelde. Een lage SD betekent dat scores dicht bij elkaar liggen; een hoge SD betekent dat respondenten sterk verschillen. Bij een motivatieschaal van 1 tot 5 zegt M = 3,80 meer als je ook weet dat SD = 0,42 dan wanneer SD = 1,31 is.

Rapporteer daarom bij schaalvariabelen meestal minimaal: n, M, SD en het bereik van de schaal of de geobserveerde minimum- en maximumscore. Bij bachelor- en masterpapers is het vaak voldoende om twee decimalen te gebruiken, tenzij je opleiding anders vraagt.

Zwakke en sterkere formulering

Zwakke studentversieSterkere herschrijving
“De motivatie was gemiddeld 3,9, dus de studenten waren gemotiveerd.”“De gemiddelde motivatiescore was 3,86 op een schaal van 1 tot 5 (SD = 0,74, n = 126), wat wijst op relatief hoge zelfgerapporteerde motivatie binnen deze steekproef.”
“De leeftijd was normaal.”“De respondenten waren gemiddeld 21,4 jaar oud (SD = 2,8; bereik = 18–34), met de meeste respondenten in de leeftijdsgroep 18–24 jaar.”
“Er was weinig verschil tussen de scores.”“De scores op academisch zelfvertrouwen lagen dicht bij elkaar (M = 4,12, SD = 0,39), wat duidt op beperkte spreiding binnen deze groep.”

Let op het verschil in toon. De sterkere zinnen geven niet alleen cijfers, maar ook schaalcontext en voorzichtige interpretatie. Ze doen geen causale uitspraak en trekken geen grotere conclusie dan de data toelaten.

Wanneer mediaan beter is

Gebruik de mediaan als een verdeling scheef is of als uitschieters het gemiddelde vertekenen. Mediaan betekent: de middelste waarde wanneer alle scores op volgorde staan. Interkwartielafstand (IQR) geeft het gebied aan waarin de middelste 50% van de scores ligt.

Bijvoorbeeld: in een onderzoek naar maandelijkse zorgkosten na een operatie hebben de meeste patiënten lage kosten, maar enkele patiënten zeer hoge kosten door complicaties. Het gemiddelde kan dan hoog lijken, terwijl de mediaan beter laat zien wat een typische patiënt in je steekproef meemaakt.

Een goede routine is: bekijk eerst histogrammen, minimum- en maximumwaarden en mogelijke uitschieters. Daarna kies je of gemiddelde en standaarddeviatie passend zijn. Als je later een toets moet kiezen, sluit je keuze van descriptieve statistiek vaak aan op de overwegingen in een beslisroute voor het kiezen van een statistische toets.

Hoe maak je een tabel beschrijvende statistiek die echt informatie geeft?

Een tabel beschrijvende statistiek werkt goed als de lezer in één oogopslag ziet welke variabelen zijn gemeten, hoeveel geldige waarnemingen er zijn en welke centrum- en spreidingsmaten daarbij horen. De tabel moet geen kopie van software-output zijn, maar een leesbare selectie. Zet alleen kolommen in de tabel die je in de tekst of analyse nodig hebt.

Kolommen die meestal nodig zijn

Voor numerieke variabelen bevat een compacte tabel vaak deze kolommen: variabele, n, gemiddelde, standaarddeviatie, minimum en maximum. Bij scheve variabelen vervang je gemiddelde en SD door mediaan en IQR, of je voegt die toe als dat inhoudelijk nodig is.

Voor categorische variabelen gebruik je vaak een aparte frequentietabel met categorie, n en percentage. Je kunt ook steekproefkenmerken combineren in één tabel, zolang de opmaak helder blijft. Vermijd tabellen waarin elke antwoordcategorie van elk item staat, tenzij die categorieën echt inhoudelijk besproken worden.

Een voorbeeld:

VariabelenMSDMinimumMaximum
Studie-uitstel1423,410,881,205,00
Academische motivatie1423,760,691,805,00
Zelfeffectiviteit1394,020,582,105,00

Deze tabel is bruikbaar omdat de variabelen herkenbaar zijn, de steekproefgrootte per variabele zichtbaar is en de lezer meteen ziet dat niet elke variabele precies hetzelfde aantal geldige waarden heeft.

Tabel eerst ontwerpen, daarna tekst schrijven

Een handige aanpak voor je tabel:

  1. Zet alleen variabelen in de tabel die je onderzoeksvraag, deelvragen of controlevariabelen ondersteunen.
  2. Noteer per variabele het meetniveau en de schaalrichting.
  3. Kies per variabele de juiste maten: n en % voor categorieën, M en SD voor schaalvariabelen, mediaan en IQR bij scheve verdelingen.
  4. Rond cijfers consequent af, meestal op twee decimalen.
  5. Schrijf onder de tabel een korte noot als afkortingen, schaalbereik of missende waarden uitleg nodig hebben.
  6. Verwijs in de lopende tekst alleen naar patronen die relevant zijn, niet naar elk getal afzonderlijk.

APA-stijl zonder tabeloverbelasting

Veel opleidingen verwachten APA-achtige tabellen, maar niet elke bachelorproef of masterpaper volgt APA tot op de komma. Controleer daarom altijd de richtlijnen van je opleiding. In veel gevallen is het belangrijker dat je tabel consequent, sober en begrijpelijk is dan dat je elke detailregel uit een stijlhandboek citeert.

Gebruik geen verticale lijnen als je opleiding APA volgt. Zet afkortingen zoals M en SD in de tabelkop of in een noot. Vermeld ook of hogere scores meer van het construct betekenen, bijvoorbeeld: “Hogere scores op studie-uitstel duiden op meer uitstelgedrag.” Dat voorkomt interpretatiefouten bij schalen met omgekeerde items.

Hoe koppel je beschrijvende statistiek aan je onderzoeksvraag en hypotheses?

Beschrijvende statistiek hoort niet los te staan van je onderzoeksvraag. Je gebruikt de cijfers om te laten zien hoe de belangrijkste variabelen in je steekproef verdeeld zijn en of verdere analyse logisch is. Bij hypothesen geef je eerst het descriptieve beeld, daarna pas de toets of het model.

Begin bij je variabelen

Een goede koppeling begint bij de vraag: welke variabelen zijn nodig om mijn onderzoeksvraag te beantwoorden? Als je nog worstelt met die afbakening, kijk dan eerst naar de relatie tussen onafhankelijke en afhankelijke variabele. Zonder duidelijke variabelen wordt beschrijvende statistiek snel een willekeurige cijferlijst.

Stel dat je onderzoeksvraag luidt: “In hoeverre hangt sociale steun samen met burn-outklachten bij hbo-verpleegkundestudenten tijdens stage?” Dan rapporteer je descriptief minstens de sociale-steunschaal, de burn-outklachtenschaal, het aantal respondenten, mogelijk stagejaar en relevante achtergrondkenmerken. Je hoeft niet uitgebreid alle irrelevante enquêtevragen te bespreken.

Bij een hypothese zoals “Studenten met meer sociale steun rapporteren minder burn-outklachten” laat je eerst zien hoe sociale steun en burn-outklachten in de steekproef verdeeld zijn. Daarna bespreek je de correlatie of regressie. Die volgorde helpt de lezer begrijpen wat de toets eigenlijk vergelijkt.

Van operationalisatie naar rapportage

Operationalisatie betekent dat je een abstract begrip omzet in meetbare indicatoren. Motivatie wordt bijvoorbeeld een score op zes Likert-items; werkdruk wordt het aantal uren plus een ervaren-drukschaal. Als operationalisatie onduidelijk is, worden descriptieve cijfers moeilijk te begrijpen.

Daarom moet je rapportage aansluiten op wat je in de methode hebt beloofd. Heb je “studiesucces” gedefinieerd als gemiddeld tentamencijfer? Rapporteer dan het gemiddelde tentamencijfer, de spreiding en het bereik. Heb je studiesucces gedefinieerd als wel of niet doorstromen naar jaar twee? Dan rapporteer je aantallen en percentages.

Een artikel over van abstracte variabele naar meetbare indicator kan helpen als je merkt dat je cijfers niet goed aansluiten op je begrippen. Vaak ligt het probleem dan niet in de tabel, maar in de manier waarop de variabele eerder is gedefinieerd.

Voorzichtig interpreteren

Beschrijvende statistiek mag je kort interpreteren, maar niet overspelen. Schrijf liever “De gemiddelde score ligt boven het schaalmidden” dan “De interventie werkt”. Een descriptief verschil tussen twee groepen is nog geen bewijs voor een significant of betekenisvol verschil.

Bij een onderwijsvoorbeeld: als leerlingen in klas A gemiddeld 7,1 halen en leerlingen in klas B gemiddeld 6,8, kun je descriptief zeggen dat klas A in deze steekproef hoger scoorde. Je kunt nog niet zeggen dat de didactische aanpak beter is zonder toetsing, onderzoeksopzet en mogelijke verstorende factoren.

Welke fouten maken studenten vaak bij descriptieve statistiek scriptie?

Studenten maken bij descriptieve statistiek in een scriptie vaak fouten doordat ze software-output overnemen zonder inhoudelijke selectie. De grootste problemen zijn verkeerde maten per meetniveau, cijfers zonder schaalcontext en interpretaties die verder gaan dan de data. Deze fouten zijn meestal goed te herstellen door per variabele te vragen wat de lezer nodig heeft om het resultaat te begrijpen.

Vier fouten met realistische voorbeelden

  1. Gemiddelden berekenen voor categorieën
    Studentvoorbeeld: “De gemiddelde woonvorm was 2,31.”
    Correctie: woonvorm is nominaal. Rapporteer aantallen en percentages, bijvoorbeeld: “Thuiswonend: 38%, op kamers: 44%, samenwonend: 12%, anders: 6%.”

  2. Een gemiddelde zonder schaal rapporteren
    Studentvoorbeeld: “De tevredenheid was gemiddeld 4,2.”
    Correctie: voeg schaalbereik, n en spreiding toe: “De gemiddelde tevredenheid was 4,20 op een schaal van 1 tot 5 (SD = 0,63, n = 97).”

  3. Een scheve variabele samenvatten alsof die normaal verdeeld is
    Studentvoorbeeld: “Respondenten gebruikten de app gemiddeld 18 minuten per dag.”
    Correctie: als enkele respondenten extreem veel gebruik rapporteren, geef mediaan en IQR: “De mediane gebruiksduur was 9 minuten per dag (IQR = 4–21).”

  4. Descriptieve resultaten als bewijs voor een hypothese presenteren
    Studentvoorbeeld: “Omdat groep A hoger scoort dan groep B, is de hypothese bevestigd.”
    Correctie: schrijf eerst descriptief en verwijs daarna naar de toets: “Groep A had descriptief een hogere gemiddelde score dan groep B. Of dit verschil statistisch wordt ondersteund, wordt getoetst met…”

  5. Missende waarden verbergen
    Studentvoorbeeld: “Er waren 160 respondenten”, terwijl in de tabel n = 128 staat voor de hoofdschaal.
    Correctie: vermeld geldige n per variabele en leg uit waarom aantallen verschillen, bijvoorbeeld door overgeslagen items of verwijderde onvolledige responsen.

Waarom deze fouten je argument verzwakken

Deze fouten lijken klein, maar ze maken je resultaten minder controleerbaar. Een beoordelaar wil kunnen zien of je cijfers passen bij je meetniveau, of je steekproefgrootte klopt en of je interpretatie voorzichtig genoeg is. Als je tabel en tekst elkaar tegenspreken, gaat de aandacht weg van je inhoudelijke onderzoeksvraag.

Bij groepswerk ontstaan fouten vaak doordat één student de analyse draait en een ander het resultatenhoofdstuk schrijft. Spreek daarom af welke variabelenamen, schaalrichtingen en afkortingen jullie gebruiken. Dat voorkomt dat “hoge score = meer stress” in de methode iets anders betekent dan in de resultaten.

Hoe schrijf je de resultaten van beschrijvende statistiek in lopende tekst?

In lopende tekst beschrijf je alleen de patronen die de lezer moet opmerken; de tabel bevat de volledige cijfermatige details. Een goede resultatenparagraaf herhaalt dus niet elk getal, maar wijst op relevante gemiddelden, spreiding, opvallende verdelingen en verschillen in geldige n. Houd interpretatie feitelijk en bewaar grotere verklaringen voor de discussie.

Van tabel naar alinea

Begin een alinea niet met een losse cijferreeks. Start met wat de variabele inhoudelijk laat zien en geef daarna de cijfers tussen haakjes of in dezelfde zin. Bijvoorbeeld: “De respondenten rapporteerden gemiddeld een relatief hoge mate van academische motivatie (M = 3,76, SD = 0,69 op een schaal van 1 tot 5).”

Als je meerdere variabelen bespreekt, groepeer ze inhoudelijk. Eerst steekproefkenmerken, daarna hoofdvariabelen, daarna eventuele controlevariabelen. Bij een managementpaper over leiderschap en verloopintentie kun je eerst de respondenten beschrijven, dan de leiderschapsschaal, vervolgens verloopintentie en werktevredenheid.

Vermijd zinnen zoals “Zie tabel 1 voor de beschrijvende statistiek” zonder verdere toelichting. De tabel is geen vervanging voor tekst. Schrijf liever: “Tabel 1 laat zien dat de gemiddelde score op zelfeffectiviteit hoger lag dan het schaalmidden, terwijl de spreiding beperkt bleef.”

Formuleringen die academisch maar leesbaar zijn

Gebruik voorzichtige werkwoorden: “wijst op”, “laat zien”, “duidt op”, “lag hoger dan”, “varieerde tussen”. Vermijd stellige oorzakelijke woorden zoals “veroorzaakt” of “bewijst” bij descriptieve statistiek.

Voorbeelden:

  • “De gemiddelde werkdrukscore lag boven het schaalmidden (M = 3,89, SD = 0,77), wat aangeeft dat respondenten in deze steekproef relatief veel werkdruk ervoeren.”
  • “De verdeling van het aantal gemiste colleges was scheef: de mediaan was 2, terwijl enkele studenten meer dan 10 colleges misten.”
  • “Van de respondenten gaf 71% aan minstens één keer per week feedback te ontvangen.”

Let ook op decimalen. Gebruik in Nederlandse teksten een komma als decimaalteken, tenzij je opleiding of software-output expliciet Engelstalige notatie vraagt. Kies één stijl en pas die overal toe.

Niet alles hoort in de resultaten

Soms ontdek je tijdens beschrijvende analyse dat een schaal niet betrouwbaar is, dat veel waarden ontbreken of dat een variabele verkeerd gecodeerd is. Dat hoort niet altijd uitgebreid in de resultaten. Betrouwbaarheid, datacleaning en meetkeuzes passen vaak beter in de methode of een korte toelichting vóór de resultaten.

Als een probleem invloed heeft op je interpretatie, moet je het wel noemen. Bijvoorbeeld: “Voor de variabele ervaren werkdruk waren relatief veel missende waarden aanwezig (geldige n = 84 van 132), waardoor de resultaten voor deze variabele voorzichtig moeten worden gelezen.”

Hoe controleer je je beschrijvende statistiek voordat je verder analyseert?

Controleer je beschrijvende statistiek door per variabele te kijken naar meetniveau, geldige n, missende waarden, schaalrichting, uitschieters en passende rapportagematen. Vergelijk daarna je tabel met je onderzoeksvraag en methodehoofdstuk. Zo voorkom je dat je later toetsen uitvoert op verkeerd gecodeerde of onduidelijk beschreven data.

Controle in vaste volgorde

Een vaste controlevolgorde bespaart tijd, vooral als je dataset veel variabelen bevat. Werk niet alleen van boven naar beneden door je software-output, maar controleer inhoudelijk.

  1. Controleer of elke variabele in je tabel terugkomt in je onderzoeksvraag, deelvraag, hypothese of controlemodel.
  2. Noteer het meetniveau per variabele.
  3. Kijk of de gekozen descriptieve maat past bij dat meetniveau.
  4. Vergelijk n per variabele met het totale aantal respondenten.
  5. Controleer minimum en maximum op onmogelijke waarden.
  6. Bekijk bij schaalvariabelen of hogere scores betekenen wat jij denkt dat ze betekenen.
  7. Controleer of omgekeerde items correct zijn hercodeerd.
  8. Bekijk histogrammen of boxplots bij numerieke variabelen.
  9. Rond cijfers consequent af.
  10. Schrijf pas daarna de lopende tekst.

Deze volgorde voorkomt dat je een nette tabel maakt van data die inhoudelijk nog niet klopt.

Afstemming met je methode en analyseplan

Beschrijvende statistiek moet aansluiten op je methode. Als je in je methode schrijft dat je een vijfpuntsschaal gebruikt, mag je resultatenhoofdstuk niet doen alsof de schaal van 0 tot 100 loopt, tenzij je hebt uitgelegd dat je scores hebt getransformeerd. Als je respondenten hebt uitgesloten, moet het aantal in je beschrijvende tabel daarmee overeenkomen.

Bij vragenlijsten ontstaan vaak problemen door schaalconstructie, omgekeerde items en samengestelde scores. Een heldere opzet van je instrument, zoals bij vragenlijst maken voor onderzoek met schalen en biascontrole, maakt de latere descriptieve rapportage veel eenvoudiger.

Voordat je verdergaat: checklist voor beschrijvende statistiek rapporteren

  • Ik heb per variabele bepaald of die nominaal, ordinaal, interval of ratio is.
  • Ik rapporteer aantallen en percentages voor categorische variabelen.
  • Ik gebruik gemiddelde en standaarddeviatie alleen waar dat inhoudelijk past.
  • Ik gebruik mediaan en IQR bij duidelijk scheve verdelingen of sterke uitschieters.
  • Ik vermeld n of geldige n per variabele.
  • Ik geef schaalbereik of interpretatie van hogere scores waar nodig.
  • Ik heb missende waarden gecontroleerd en vermeld waar ze relevant zijn.
  • Mijn tabel beschrijvende statistiek bevat geen overbodige softwarekolommen.
  • Mijn lopende tekst herhaalt niet elk getal, maar benoemt relevante patronen.
  • Mijn descriptieve cijfers sluiten aan op onderzoeksvraag, deelvragen en hypotheses.
  • Ik trek geen causale of toetsende conclusies uit alleen descriptieve statistiek.

(Metadata voor het buildsysteem — niet verwijderen)

Veelgestelde vragen

Hoeveel beschrijvende statistiek moet ik opnemen in een bachelor- of masterpaper?

Neem genoeg beschrijvende statistiek op om je steekproef, hoofdvariabelen en controlevariabelen begrijpelijk te maken. Voor een bachelor- of masterpaper is meestal één tabel met hoofdvariabelen en eventueel één tabel met steekproefkenmerken voldoende. Extra tabellen horen alleen in de tekst als ze echt nodig zijn voor je onderzoeksvraag.

Wat is het verschil tussen beschrijvende en toetsende statistiek?

Beschrijvende statistiek vat je dataset samen met cijfers zoals n, percentages, gemiddelde, standaarddeviatie, mediaan en bereik. Toetsende statistiek onderzoekt of patronen, verschillen of verbanden statistisch ondersteund worden. Beschrijvend schrijf je bijvoorbeeld dat groep A hoger scoort; toetsend onderzoek je of dat verschil waarschijnlijk niet door toeval komt.

Moet ik altijd gemiddelde en standaarddeviatie rapporteren?

Nee, gemiddelde en standaarddeviatie rapporteren is vooral passend bij numerieke schaalvariabelen met een redelijk symmetrische verdeling. Bij categorische variabelen gebruik je aantallen en percentages. Bij sterk scheve numerieke variabelen zijn mediaan en interkwartielafstand vaak duidelijker.

Hoe maak ik een goede tabel beschrijvende statistiek?

Maak een tabel beschrijvende statistiek door eerst je variabelen te selecteren en daarna per meetniveau passende kolommen te kiezen. Gebruik voor schaalvariabelen bijvoorbeeld n, M, SD, minimum en maximum. Voor categorieën gebruik je n en percentage, eventueel in een aparte tabel.

Waar plaats ik descriptieve statistiek in mijn scriptie of bachelorproef?

Steekproefkenmerken staan vaak in de methode of aan het begin van de resultaten. De descriptieve statistiek van je hoofdvariabelen staat meestal in het resultatenhoofdstuk, vóór correlaties, regressies of groepsvergelijkingen. Volg de richtlijnen van je opleiding als die een vaste indeling voorschrijven.