A Fieldguide to Lies and Statistics - D.Levitin (samenvatting)

In zijn boek A Fieldguide to Lies and Statistics, helpt Daniel Levitin ons om gepubliceerde cijfers beter te begrijpen zonder ons te laten misleiden door representatie van de schrijver. Dit artikel staat stil bij twee van de onderwerpen die uitgebreid aan bod komen in dit boek: het representeren van data in onder anderen gemiddelden en grafieken, en het kwadrant voor kritisch denken dat helpt bij het interpreteren van cijfers.

Het internet heeft ervoor gezorgt dat informatie toegankelijk is geworden voor iedereen. Daarnaast kan iedereen informatie interpreteren, omschrijven tot nieuwe content en weer op internet publiceren.
Onderzoeksresultaten worden aan de lopende band gepubliceerd en gulzige lezers kopieren zonder nadenken de resultaten of leiden er volstrekt onterecht andere conclusies uit af. Leviton beschrijft hoe wij als individuen beter met de informatie om kunnen gaan door de onderzoeksresultaten beter te in een kader te plaatsen. Het is hiervoor belangrijk dat wij ons regelmatig afvragen hoe een cijfer tot stand is gekomen, hoe het wordt gepresenteerd, en wat het cijfer nu eigenlijk echt betekent.

 

Er zijn verschillende manier om de DATA TE BEOORDELEN, te beginnen met de context. Waar is het onderzoek gedaan? Hoeveel mensen deden mee? Hoe kleiner de groep, hoe onzekerder het resultaat. Wanneer 20% van de kinderen die geboren worden in een ziekenhuis in een maand vrouwlijk zijn lijkt dat op het eerste gezicht laag. Wanneer dit echter een klein ziekenhuis is op het platteland waar wellicht gemiddeld maar 20 kinderen per maand geboren worden, is de sample van 20 kinderen wellicht te klein om een conclusie te kunnen trekken over de verrassende uitkomst.
Door het gebruik van termen als gemiddelde (ook wel de mean) kunnen ook snel verkeerde aannamens worden gedaan. Wanneer een gemiddeld gezin 3 kinderen heeft, hoeveel broers of zussen heeft een gemiddeld kind dan? Het antwoord, anders dan meestal verwacht, is niet per ce 2. Wanneer we het aantal kinderen per gezin tellen, vergelijken we gezinnen en tellen we elk kind één keer. Wanneer we echter het gemiddelde aantal broers en zussen tellen, vergelijken we kinderen. Hoe groter het gezin, hoe vaker 1 kind wordt meegeteld als broer of zus. Een gezin van 10 kinderen telt één keer mee bij de gezins vergelijking, maar telt 10 keer mee bij de aantal broers en zussen vergelijking. Daarnaast tellen gezinnen die helemaal geen kinderen hebben in de tweede vergelijking helemaal niet meer mee.
Het gemiddelde is daarnaast ook een gevaarlijke waarde, omdat 1 groot afwijkend getal het gemiddelde radicaal kan veranderen. Daarom zijn de waarden median en mode in het leven geroepen. De median is de middelste waarde in een gesorteerde rij van nummers. 50% van de cijfers zijn groter dan dit median, en 50% is kleiner dat de median. De Mode beschrijft de waarde die het meest voor komt in een reeks.
Naast de context waarin data is verzameld en hoe de waarden worden geinterpreteerd, kan ook de representatie van de data je op het verkeerde been zetten. Wanneer assen niet zijn benoemd bijvoorbeeld, of nog slimmer, wanneer er 2 verticale assen zijn met verschillende schaal, waardoor een stijging van 10% van variabele A er net zo stijl uit kan zien dan een stijging van 5% bij variable B.
Assen kunnen ook voor een gedeelte weggelaten worden. Wanneer je een daling van 90% naar 85% wilt laten uitblinken, laat dan niet de volle 100% op een verticale as zien, maar bijvoorbeeld alleen de range 75-100%. De 5% oogt nu opeens vier keer zo groot!
Tot slot is er nog de truuk van het cumulatief laten stijgen van een grafiek. Wanneer je bijvoorbeeld voor 20 kwartalen de verkoopcijfers hebt, maar het 20e kwartaal heeft een halvering van het aantal verkopen, laat dan een cumuliatieve grafiek zien over alle 20 kwartalen. De havering wordt nu beperkt tot een iets minder stijle lijn in de grafiek in plaats van een halvering van een balk.
 

Het tweede grote thema dat in dit boek veel terug komt is het begrijpen van kansbrekening. Levitin raadt aan om een KWADRANT VOOR KRITISCH DENKEN te creeren met op elke as een variable. In de volgende voorbeeld blijkt, dat het maken van dit kwadrant helpt critisch te denken. Een Levitin beschrijft het voorbeeld van vrouwen en borstkanker. Een artikel kopt met een spannende statistiek: 93% van borstkankerpatienten vallen in de hoge risico groep. Wat betekent deze uitspraak? Het tellen van hoge risico groep vrouwen binnen een sample van borstkankerpatienten is niet hetzelfde als het tellen van borstkankerpatienten in een hoge risico groep. Om die kans te berekenen hebben we meer informatie nodig: de kans dat een vrouw borstkanker heeft is 0,8% en 57% van de vrouwen valt in de hogere risico groep.
We kunnen aan de hand van de drie bekende waarden het kwadrant van afbeelding 1 hieronder invullen.

  • Stap 1: 0,8% van de vrouwen hebben borstkanker, dat zijn 8 van de 1000 vrouwen. (zie afbeelding 1 links)
  • Stap 2: 93% van 8 vrouwen die borstkanker hebben vallen 7.44,  (afgerond 7) vrouwen in de hoge risico groep (zie afbeelding 1 midden).
  • Stap 3: 57% van de vrouwen vallen in de hoge risico groep, dus het totaal aantal vrouwen van kolom 1 is 570. (zie afbeelding 1rechts)
  • Stap 4: de kans dat een vrouw uit de hoge risico groep borstkanker heeft is 7/570= 1,2%
     

Figure 1: Het kwadrant voor kritsch denken

 

Het invullen van het kwadrant aan de hand van het stellen van de juiste vragen geeft ons meer inzicht in de kansen van een een vrouw op borstkanker. Een vrouw die in de hoge risico groep valt, heeft 1,2% kans om borstkanker te hebben in plaats van 0,8%. Een cijfer dat minder alarmerend klinkt als de 93% die het artikel had gepubliceerd.

 

Statistiek is een interessant vakgebied en de persoon die statistieken samensteld kan zijn publiek beinvloeden door slechts een gedeelte van het kwadrant voor kritisch denken te beschrijven in een artikel, of om door middel van grafische weergaven een probleem groter (of kleiner) te doen lijken dan het daadwerkelijk is.
Levitin helpt de lezer de juiste vragen te stellen bij wat hij leest. Wanneer wij allemaal leren af en toe wat kritischer naar de nieuwskoppen te kijken, kunnen we wellicht de hoeveelheid incomplete of zelfs valse informatie die over het internet verspreid wordt beperken.

Ga verder naar:

Gratis Geld voor iedereen - R.Bregman (samenvatting)

BRON:

Levitin, D., 2016, A Fieldguide to Lies and Statistics - A Neuroscienetist on how to Make Sense of a Complex World, London: Viking (bestel dit boek)

Categorie: 
Go to top