\require{AMSmath}

1. Kruistabellen

Kruistabellen gebruik je om een overzicht te krijgen van het verband tussen twee of meer variabelen. Het meetniveau is nominaal of ordinaal. Soms worden interval en ratio niveau als klassen weergegeven.


Voorbeeld

Bij een bankkantoor onderzoekt men de gang van zaken bij de afbetaling van persoonlijke leningen. Voor 100 verstrekte leningen werd bekeken of deze volledig volgens de voorwaarden afgelost zijn. Bij 30 leningen bleken er problemen te zijn geweest. We noemen dit wanbetalers, bij 70 leningen is de afbetaling correct verlopen. De bank wil onderzoeken of het betaalgedrag afhangt van de leeftijd van de leners. Daarom is tevens vastgesteld wat de leeftijd van iedere lener was.

Leeftijd van de lener

betaalgedrag

totaal

wan-betalers

correct

Jonger dan 40

24

36

60

40 of ouder

6

34

40

Totaal

30

70

100

Op grond van de randtotalen zou je, als betaalgedrag en leeftijd onafhankelijk zouden zijn iets anders verwachten:

Leeftijd van de lener

betaalgedrag

totaal

wan-betalers

correct

Jonger dan 40

18

42

60

40 of ouder

12

28

40

Totaal

30

70

100

Het vergelijken van theoretische en de waargenomen frequenties doen we volgens een methode die men de $\chi^2$-toets noemt. Bij deze methode wordt een toetsingsgrootheid $\chi^2$ berekend volgens de volgende formule:

$
\chi ^2  = \sum {\large \frac{{\left( {O_i  - E_i } \right)^2 }}{{E_i }}}
$

Oi = de waargenomen frequentie (observed)
Ei = de theoretische frequentie (expected)

$
\chi ^2  = \large \frac{{\left( {24 - 18} \right)^2 }}{{18}} + \frac{{\left( {36 - 42} \right)^2 }}{{42}} + \frac{{\left( {6 - 12} \right)^2 }}{{12}} + \frac{{\left( {34 - 28} \right)^2 }}{{28}}
$

$
\chi ^2  = 2 + 0,86 + 3 + 1,29 = 7,14
$


Vrijheidsgraden


De vraag is nu voor welke waarde van $\chi^2$ je besluit dat 'leeftijd' en 'betaalgedrag' niet onafhankelijk zijn. Dat hang af van de grootte van de tabel. Je spreekt in dat geval over vrijheidsgraden.

Het aantal vrijheidsgraden v = (m-1)(n-1) waarbij m het aantal keuzemogelijkheden voor de eerste variabele en n het aantal keuzemogelijkheden voor de tweede variabele.

In bovenstaand voorbeeld is het vrijheidsgraden gelijk aan (2-1)(2-1)=1.

q6177img3.gif

In de tabel is de grenswaarde gelijk aan 3,84. Wij hadden 7,14 berekend. Dat is groter dan 3,84, dus kan je concluderen dat 'leeftijd' en 'betaalgedrag' afhankelijk zijn.


©2004-2024 WisFaq