De digitale vraagbaak voor het wiskundeonderwijs

home |  vandaag |  gisteren |  bijzonder |  prikbord |  gastenboek |  wie is wie? |  contact

HOME

samengevat
vragen bekijken
een vraag stellen
hulpjes
zoeken
FAQ's
links
twitter
boeken
help

inloggen

colofon

  \require{AMSmath}

Statistiek

Consistentie van estimator aantonen

Gegeven is een random sample Y1, ... , Yn uit een kansverdeling van een kansvariabele Y (met Y is onbekend). We weten dat de verwachting van Y gelijk is aan a en dat de variantie gelijk is aan b2. Bovendien weten we dat E(Y4) eindig is. Nu wordt er gevraagd om allereerst te bewijzen dat E(Y2) eindig is. Dat is mij gelukt. Dan wordt er gevraagd om met behulp hiervan te bewijzen dat S2 = (1/n) · (som van i=1 tot n, met als sommand: (Yp - (Y1 + ... + Yn)/n)2 een consistente schatter is voor b2. Ik weet dat er lemma's zijn op Wikipedia: Consistent estimator maar zelfs dan kom ik geen stap verder. Ik heb wel S2 herschreven tot: S2 = (som van i=1 tot n met sommand: Yp2) · n · ( (1/n) · (som van i=1 tot n met sommand: Yp) )2. Maar ik kom niet verder.

Richar
11-1-2020

Antwoord

Printen
Nog iets verder op die pagina lezen, zie hieronder. De schatter $S^2$ is onzuiver, maar niet heel erg. De verwachting ervan is gelijk aan $\frac{n-1}nb^2$. Als je hiervan de limiet neemt (voor $n$ naar oneindig) krijg je $b^2$, toch?
Zie Wikipedia: Consistent estimator

kphart
11-1-2020


Functie van een maximale likelihood estimator

Ik begrijp nog niet hoe het zit met het bewijs van de eerste stelling in More about likelihood. Met name de tweede stap, wanneer ze dit concluderen: θ-dakje = g-inverse(g(θ)-dakje). Ik zie niet in hoe we dit zomaar concluderen.

Marcos
17-1-2020

Antwoord

Printen
Dat volgt rechtstreeks uit de definitie van maximum likelihood schatter: $\hat\theta$ is de waarde van de parameter die de grootste kans op de uitkomst van het experiment geeft.

Pas dat toe op $g(\theta)$: je wilt weten voor welke waarde van $g(\theta)$ de kans op de uitkomst maximaal is. Noem die waarde even $\alpha$, dus als $g(\theta)=\alpha$ dan is de kans op de uitkomst het grootst, maar $g(\theta)=\alpha$ is equivalent met $\theta=g^{-1}(\alpha)$, dus de kans is het grootst als $\theta=g^{-1}(\alpha)$, maar dat betekent dus per definitie dat $\hat\theta=g^{-1}(\alpha)$. Maar $\alpha$ noteren we $\widehat{g(\theta)}$, en daar staat de formule.

kphart
19-1-2020


Re: Functie van een maximale likelihood estimator

Heel erg bedankt. Maar nu zoeken we dus eigenlijk een $\alpha = g(\theta)$ zodanig dat $L(\theta)$ maximaal is. Waarom hebben we het nog steeds over $L(\theta)$ als we opzoek zijn naar de MLE van een andere aannemelijkheidsfunctie, zeg bv. $M(g(\theta))$ (die dus niet een $\theta$ als input krijgt en er niets mee te maken heeft)? Schijnbaar geldt dat deze "M" gelijk is aan $L(g^{-1})$. Waarom is dat intuïtief gezien logisch?

Marcos
20-1-2020

Antwoord

Printen
Je moet het niet moeilijker maken dan het is, en duidelijk blijven met je letters. Is die $M$ nu de schatter of de likelihoodfunctie van $g(\theta)$? En wat betekent $L(g^{-1})$?

De stelling zegt dat als je, bijvoorbeeld, het kwadraat van de parameter wilt schatten een MLE van dat kwadraat krijgt door het kwadraat van een MLE van de parameter zelf te nemen.

Als $g$ injectief (ono-to-one) is dan kun je uit de waarde van $g(\theta)$ ondubbelzinnig $\theta$ bepalen en omgekeerd. En dat betekent dat de kans op de uitkomst gegeven $\theta=\alpha$ gelijk is aan de kans op de uitkomst gegeven $g(\theta)=g(\alpha)$ en omgekeerd: de kans op de uitkomst gegeven $g(\theta)=\beta$ is gelijk aan de kans gegeven $\theta=g^{-1}(\beta)$. De kans is het grootst als $\theta=\hat\theta$, en dus als $g(\theta)=g(\hat\theta)$, dus dan is $g(\hat\theta)$ is een MLE van $g(\theta)$, en per definitie geldt dus $\widehat{g(\theta)}=g(\hat\theta)$.

Waarom zou iets "intuïtief logisch" moeten zijn? Wat dat ook moge betekenen. Het volgt gewoon uit de definities door een deugdelijke redenering (die in het file dat je aanhaalt wel iets beter opgeschreven had mogen worden) en dat is genoeg.

kphart
20-1-2020


Welke toets gebruiken voor significantie?

Op onze school willen we het volgende gaan onderzoeken:
  • Havo 4 eindcijfers in vergelijking met de SE cijfers havo 5
  • Havo 4 eindcijfers in vergelijking met CE havo 5
  • Havo 4 eindcijfers in vergelijking met het eindcijfer havo 5.
  • SE cijfer havo 5 in vergelijking met het CE cijfer havo 5.
We hebben alle data hiervoor verzameld en willen nu de gemiddelden per leerling naast elkaar leggen en kijken of er een significant verschil is tussen bijvoorbeeld het eindcijfer van een leerling in havo 4 voor wiskunde en het SE cijfer voor wiskunde in havo 5.
  • Welke toets kunnen we hier het beste voor gebruiken?
  • Is dat de gepaarde t-toets?
  • Is het dan niet erg dat we niet het gemiddelde van de hele groep leerlingen nemen maar het per leerling gaan bekijken?
Alvast bedankt voor het meedenken!

Robert
4-2-2020

Antwoord

Printen
Hallo Robert,

Ik neem aan dat je wilt weten of cijfers systematisch hoger of juist lager zijn geworden bij het tweede meetmoment. Dan lijkt het me juist een voordeel dat je niet naar het gemiddelde van de hele groep kijkt, maar in plaats daarvan naar de verschillen per leerling.

Neem als voorbeeld het extreme geval dat enkele leerlingen in 4-HAVO een 1 halen en in 5-HAVO een 2, andere leerlingen gaan van 5 naar 6 en weer andere leerlingen van 9 naar 10. Duidelijk is dat er dan een significante verbetering is van de cijfers: alle leerlingen gaan een punt vooruit. Een gepaarde t-toets toont dit systematische verschil.

Wanneer je eerst voor zowel 4-HAVO als 5-HAVO de cijfers middelt, dan zal dit gemiddelde ook met 1 zijn toegenomen. Echter, de spreiding binnen beide groepen zo groot dat dit verschil nu niet significant is.

Dit laatste is te begrijpen wanneer je bedenkt dat bij deze tweede werkwijze de berekening 'niet kan weten' welk 2e cijfer hoort bij welk 1e cijfer. Het kan dus zijn dat een leerling die eerst een 1 had naar een 10 is gegaan, een andere leerling van 9 naar 6 en een derde leerling weer van 5 naar 2. In dat geval zou er geen systematische verhoging van de cijfers zijn.

GHvD
4-2-2020


Kans: lotto

Bij de lotto zijn er 45 genummerde balletjes van 1 tot 45. Bij een lottotrekking worden er 6 balletjes getrokken zonder dat de balletje terug worden gelegd.

De nummer: 9, 16, 31, 6, 23 zijn al getrokken. Wat is de kans dat de laatste bal een even getal wordt?

Antwoord: 1/2

Moet ik dan kijken hoeveel even en oneven balletjes erin zitten?
Of gewoon logisch nadenken? Dat de laatste bal even of oneven kan zijn? De laatste twee kunnen toch ook even of beide oneven zijn?

Tim B.
5-2-2020

Antwoord

Printen
Jouw logisch nadenken is niet zo logisch; ook als er nog één bal met even nummer in de zak zit en tien met een oneven nummer zou je dan ook op $1/2$ uitkomen?

Als je echt logisch nadenkt zul je zien dat tellen de enige optie is. De trekking begon met $22$ even en $23$ oneven nummerser zijn twee even en drie oneven nummers getrokken. Dus ...?

kphart
5-2-2020


Kwantitatieve gegevens

Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Moet kwalitatief zijn neem ik aan?

thijs
13-2-2020

Antwoord

Printen
Nee toch? Temperatuur in graden, snelheid in km/uur en gewicht in kg zijn kwantitatieve gegevens.

"Een kwalitatieve variabele is vaak niet uitgedrukt in een getal. Is dit toch het geval dan heeft het verschil van twee opeenvolgende getallen geen betekenis. Denk bijvoorbeeld aan de rugnummers van voetballer."

Helpt dat?

WvR
13-2-2020


Re: Welke toets gebruiken voor significantie?

Bedankt voor uw antwoord.

Inmiddels heb ik verschillende keren de gepaarde t toets toegepast via Excel nadat we alle gegevens naast elkaar hebben gezet. Echter begrijp ik niet dat bij de vergelijking tussen het SE en CE bij biologie, ondanks de grote verschillen deze verschillen niet significant zijn (p=0,96).
Zie bijlage

Kunt u mij dat uitleggen?

Robert
13-2-2020

Antwoord

Printen
Hallo Robert,

Bij 43 leerlingen is het cijfer hoger geworden, de gemiddelde verhoging is 0,6. Bij 31 leerlingen is het cijfer lager geworden, de gemiddelde verlaging is 0,8.

Dit wijst toch niet op een systematische verhoging of verlaging van cijfers?

GHvD
14-2-2020


Re: Re: Welke toets gebruiken voor significantie?

Hallo Gilbert,

Dat begrijp ik wel. Kijkt de gepaarde toets niet naar of de verschillen significant zijn? We willen namelijk antwoord kunnen geven of het SE cijfer een voorspellende waarde heeft voor het CE cijfer. Als je de cijfers los bekijkt lijkt dat niet zo te zijn omdat er grote verschillen zijn (beide kanten op). Moeten we een andere toets gebruiken om daar wel antwoord op te kunnen geven?

Robert
14-2-2020

Antwoord

Printen
Hallo Robert,

Net als elke andere toets kijkt een gepaarde t-toets wel degelijk of verschillen significant zijn. Een toets is juist bedoeld om dit op objectieve wijze te beoordelen. Je moet wel de juiste vraag stellen. Hier beoordeelt de t-test of er wel of niet sprake is van een systematische verhoging of verlaging van cijfers. Het antwoord is: nee, behaalde cijfers bij het CE zijn niet systematisch hoger of lager dan bij het SE. Het SE-cijfer voorspelt dus niet of het CE-cijfer hoger dan wel lager zal uitvallen dan het SE-cijfer.

Het zoeken naar een andere toets heeft geen zin (tenzij je eigenlijk een andere vraag bedoelt). Op een bepaalde onderzoeksvraag past een bepaalde toets. Als tussen twee sets data geen significant verschil bestaat, is het niet zo dat je door toepassing van een andere toets opeens wel een significant verschil kunt creëren.

Wellicht is het een idee om het gemiddelde en standaardafwijking van de verschillen tussen SE-cijfer en CE-cijfer te bepalen. Je kunt dan per leerling met een zekere betrouwbaarheid (bv 95%) aangeven binnen welke grenzen het CE-cijfer is te verwachten. Uiteraard is dat dan wel binnen de aanname dat de gebruikte data van het vorige examenjaar representatief zijn voor het komende examen, en dat de vorige groep leerlingen representatief is voor de nieuwe groep.

GHvD
14-2-2020


Notatie binomiale verdeling en normale verdeling

Geachte,
Kunt u mij zeggen of het gebruikelijk is om bij de binomiale c.q. normale verdeling de notatie X~Bin(n,p) te gebruiken en X~Nor(m,s)?

Volgens mij deed ik dat vroeger zo, maar de leraar van mijn dochter vond dit maar een beetje 'vreemd'.

Diana
21-2-2020

Antwoord

Printen
Dat is inderdaad een hele 'normale manier' van noteren. Heel erg handig ook. Dat je in plaats van 'X is binomiaal verdeeld met p=0,5 en n=100' kunt schrijven:

X~Bin(100;0,5)

Maar misschien wordt het in de schoolboeken niet gebruikt. Dat zou kunnen. Dat is overigens geen argument. Bij de Wikipedia staat de notatie zelfs vermeld, dus wat wil je nog meer?

Hetzelfde geldt voor de normale verdeling, ook dat is zeer gebruikelijk.

Naschrift
Je kan ook X~B(n,p) schrijven voor de binomiale verdeling en X~N(m,s) voor de normale verdeling. Persoonlijk schrijf ik liever X~Bin(n,p) en X~Norm(m,s). Dan weet iedereen waar je het over hebt. Nou ja, bijna iedereen...
Zie Wikipedia | Binomiale verdeling

WvR
21-2-2020


Toetsen van hypothesen van gemiddelden

Na heel veel opzoekwerk op het internet denk ik dat ik het begrepen heb, maar ik ben niet zeker.

Bij het toetsen van hypothesen van een gemiddelde $\mu$ is de stochast $\overline X$ de toetsingsgrootheid, waarmee we een uitspraak gaan doen over de populatieparameter $\mu$. Voor het kansmodel van dit steekproefgemiddelde wordt de normale verdeling gebruikt met gemiddelde $\mu$ en de gekende standaardafwijking $\sigma$. Als $\sigma$ niet gekend is, wordt die vervangen door de steekproefstandaardafwijking s en wordt een t-verdeling gebruikt. Dan gedraagt $T=(\overline X-μ)/(s/√n)$ zich als een Student $t$-verdeling met $n-1$ vrijheidsgraden.

Klopt dit? Dat er dus twee situaties mogelijk zijn (sigma gekend of niet) en dus twee soorten verdelingen gebruikt worden?

OPA
21-2-2020

Antwoord

Printen
Dat klopt. Je kan het terug vinden in Statistiek om mee te werken – Dr. A. Buijs – 6e druk 1998. Boeken zijn soms best handig...

WvR
25-2-2020


Optimale oplossing bepalen

Voor een bepaalde kansberekening geldt de formule :

kans P = ( 364! · (N-1) ) / ( 365N · (366-N)! )

Het blijkt dat deze kans maximaal is voor N = 20.
Hoe kan dit snel vastgesteld worden ?

Dirk L
1-3-2020

Antwoord

Printen
Schrijf even
$$a_N=\frac{364!\cdot(N-1)}{365^N(366-N)!}
$$bekijk het quotiënt $a_{n+1}/a_N$ en vergelijk het met $1$. Als het groter is dan is $a_{N+1}$ groter dan $a_N$; er is een omslagpunt waar $a_{N+1}/a_N$ voor het eerst kleiner dan $1$ is, voor die $N$ is $a_N$ maximaal.
Los dus de ongelijkheid
$$\frac{a_{N+1}}{a_N} < 1
$$op.

kphart
1-3-2020



klein |  normaal |  groot

home |  vandaag |  bijzonder |  twitter |  gastenboek |  wie is wie? |  colofon

©2001-2020 WisFaq - versie IIb