Puntenwolk

In een spreidingsdiagram kan je punten vinden die steeds twee gepaarde waarnemingen voorstellen: een puntenwolk.

Voorbeeld

q1970img1.gif

In dit diagram kan je zien wat de samenhang is van de eindexamencijfers voor wiskunde B en natuurkunde. Elk 'stipje' stelt dus een gepaarde waarneming (de cijfers van een leerling) voor .

Wat is correlatie?

Hieronder zie je 3 spreidingsdiagrammen met, respectievelijk, een negatieve correlatie, geen correlatie en een positieve correlatie.

q1970img2.gif

Hoe meer ijs er wordt verkocht, hoe meer mensen er verdrinken. Betekent dit dat ijsjes verdrinking veroorzaken?

Natuurlijk niet: er is een gemeenschappelijke onderliggende oorzaak. Als het warm weer is gaan mensen meer ijs eten én vaker zwemmen. Bij dit voorbeeld snapt hopelijk iedereen dat die ijsjes niet de oorzaak zijn van de verdrinkingen. Maar helaas is het makkelijk om correlatie (dingen die tegelijk voorkomen) te verwarren met causaliteit (dingen die elkaar veroorzaken).

Maar dingen kunnen domweg toevallig tegelijk gebeuren, of door een complex samenspel van omstandigheden, zonder dat het één het ander veroorzaakt. En soms is er een derde factor in het spel die beide dingen veroorzaakt.