De digitale vraagbaak voor het wiskundeonderwijs

home |  vandaag |  gisteren |  bijzonder |  prikbord |  gastenboek |  wie is wie? |  contact

HOME

samengevat
vragen bekijken
een vraag stellen
hulpjes
zoeken
FAQ's
links
twitter
boeken
help

inloggen

colofon

  \require{AMSmath}

Statistiek

Shapiro–Wilk toets

Hoi,

Ik had een vraag over Shapiro–Wilk. Bij een test van twee onafhankelijke steekproeven met in steekproef A 10 gegevens en in steekproef B 12 gegevens was het resultaat van een Shapiro Wilk test gegeven voor beide steekproeven d.m.v. een statistisch programma.

De waarden van de Shapiro Wilk waren voor a 0,41 en voor b 0,39 (test met een significantie van 0.05)
Kan er hierbij iets gezegd worden over de normaliteit van beide steekproeven ondanks dat de n voor beide steekproeven afzonderlijk kleiner is dan 15?

Dus mogen de steekproeven bijvoorbeeld samengenomen worden waardoor n groter is dan 15? De Shapiro Wilk hiervan is wel niet gegeven. Of kan er op geen enkele manier gezegd worden dat hier normaliteit is, ondanks het resultaat van de beide Shapiro Wilk testen veel groter is dan alfa?

Alvast bedankt!

Thibau
11-1-2017

Antwoord

Printen
$\alpha$ is geen magische waarde, het enige waar hij goed voor is is een afspraak vooraf: als de $p$ niet groter is dan $\alpha$ dan verwerpen we de hypothese dat de verdeling normaal is. Dat is de enige afspraak die je maakt, impliciet zeg je dan ook: als $p$ groter is dan $\alpha$ dan zeggen we verder niets en concluderen we dat we niets weten. Ook al is $p$ nog zo groot.

Achteraf gaan prutsen aan je steekproeven is bloedlink. Dat samenvoegen van twee steekproeven bijvoorbeeld zou ik nooit doen, misschien zijn die wel onder totaal verschillende omstandigheden gedaan en is hun combinatie waardeloos.
Het beste wat je in zo'n situatie kunt doen is een nieuw experiment formuleren en van te voren afspreken wanneer je besluit te concluderen/accepteren dat je verdeling een normale is.

kphart
11-1-2017


Kans op neerstorten vliegtuig

Ik probeer te bepalen wat de kans is dat een vliegtuig met 4 motoren, links 2 en rechts 2, neerstort.

De kans dat een willekeurige motor stuk gaat is 0,005. Gezien de bovenstaande informatie hebben we te maken met een binomiale verdeling.

Als er meer dan 2 motoren kapot gaan stort het vliegtuig neer. Deze kans heb ik berekend en deze is 498·10-9.

Nu komt er bij dat als er 2 motoren aan één kant stuk gaan het vliegtuig ook neerstort. De vraag is wat de kans dan wordt.

Ik heb al veel dingen geprobeerd maar ik kom niet op het juiste antwoord uit.

Alvast bedankt voor de hulp!

Groeten,

Daan, Student HBO Technische Natuurkunde

Daan d
11-1-2017

Antwoord

Printen
De kans dat de twee linkermotoren kapot gaan is $0.005^2$ en dat is ook de kans dat de twee rechtermotoren kapot gaan.
De kans op de vereniging van deze twee gebeurtenissen is de som minus de kans op de doorsnede (want die tel je dubbel) en dat is $0.005^4$.
Bij elkaar dus $2\cdot0.005^2-0.005^4$ zou ik zeggen.

kphart
11-1-2017


Significantietoetsen

Toets met een betrouwbaarheid van 95% of het gevonden verschil tussen het steekproef-gemiddelde van MERK A en MERK B significant is.

Het gevonden verschil tussen A en B is 3,91. Hoe weet ik dan of het verschil significant is? Ik dacht dat de binomale verdeling toegepast moest worden maar ik kan dan geen kans vinden.. Weten jullie hoe ik moet beginnen?

Lisann
18-2-2017

Antwoord

Printen
Hallo Lisanne,

Wanneer A en B normaal verdeelde variabelen zijn, dan is het verschil V=A-B ook normaal verdeeld. A en B zijn significant verschillend wanneer het verschil A-B significant afwijkt van 0, ofwel: wanneer de waarde 0 buiten het 95% betrouwbaarheidsinterval van V ligt.
Om dit betrouwbaarheidsinterval van V te berekenen, heb je de standaardafwijking $\sigma$V van V nodig. Deze bereken je uit de standaardafwijkingen van A en B met deze formule:

$\sigma$V = √($\sigma$A2+$\sigma$B2)

Wanneer je van het verschil V het gemiddelde en de standaardafwijking kent, kan je op de gebruikelijke wijze het 95% betrouwbaarheidsinterval berekenen en nagaan of de waarde 0 binnen of buiten dit interval ligt.

GHvD
18-2-2017


Moderatie-effect

Hallo, ik volg de cursus Methoden en Statistiek op mijn universiteit. Ik studeer psychologie. En ik krijg ook iets over moderatie-effect? Bij een opdracht wordt de volgende vraag gesteld: Is leeftijd een moderator voor het effect van de voormeting van bewerkingen op de follow-up meting van bewerkingen?

Wij gebruiken SPSS, een programma waarin je statistische analyses kunt uitvoeren. Je krijgt dan een output. Het enige wat ik niet weet is wanneer ik kan spreken van een modererend effect? Er staat bij het antwoord in mijn werkboek: p$<$ .001 = significant (p waarde voor interactie is significant). Maar is .001 altijd de grens (of kan .05 ook de grens zijn bijvoorbeeld?)

yalda
19-2-2017

Antwoord

Printen
Hallo Yalda,

Stel je voor dat in verkelijkheid geen verband bestaat tussen onderzochte variabelen. Anders gezegd: de nul-hypothese is waar. Dan kan het gebeuren dat jouw steekproef zodanig ongelukkig uitvalt dat het lijkt dat er wel een verband bestaat. De p-waarde geeft de kans aan dat je, in het geval dat in werkelijkheid geen verband bestaat, door zo'n toeval toch een verband lijkt te vinden.
Wanneer deze p-waarde klein genoeg is (dat wil zeggen: de kans is klein genoeg dat we een verband lijken te vinden terwijl dit verband in werkelijkheid niet bestaat), dan nemen we aan dat het gevonden verband niet het gevolg is van een toevallig ongelukkige steekproef, maar dat het verband werkelijk bestaat. We noemen de gevonden resultaten dan significant.

De vraag is nu: welke waarde voor p is klein genoeg, ofwel: onder welke waarde van p noemen we de gevonden resultaten significant?
Je zou kunnen denken: we kiezen p heel klein, want dan is de kans heel klein dat we, in geval van geen verband, de foutieve conclusie trekken dat er wel een verband is (fout van de eerste soort). Maar het omgekeerde kan ook gebeuren: er is wel degelijk een verband, maar door een wat ongelukkige steekproef lijkt er geen verband te bestaan (fout van de tweede soort). Het vervelende is nu dat je de kans op een fout van de eerste soort klein kunt maken door een kleine waarde van p te kiezen, maar dat dan automatisch de kans op een fout van de tweede soort groter wordt.

De waarde van p is dus een compromis, zodanig dat de kansen op zowel een fout van de eerste soort als van de tweede soort aanvaardbaar zijn. Een veel gebruikte keuze is p=0,05.
Men kiest voor andere waarden wanneer bijvoorbeeld het gevolg van het optreden van de ene fout veel ernstiger is dan het gevolg van het optreden van de andere fout. Stel dat metingen in een kerncentrale op een gevaar wijzen, en men moet besluiten of de kerncentrale stilgelegd moet worden. Misschien is er niets aan de hand (geen verband), nodeloos stilleggen (fout van de eerste soort) kost dan geld. Maar er kan ook werkelijk iets aan de hand zijn (wel verband), ten onrechte doordraaien (fout van de tweede soort) levert een kernramp op. In zo'n situatie zou men voor een zeer kleine p-waarde kiezen: liever 10 keer ten onrechte stilleggen, dan 1 keer ten onrechte doordraaien.

Kortom: de keuze voor p is een compromis tussen kansen op een fout van de eerste of tweede soort, een veel gebruikte waarde is p=0,05.

GHvD
19-2-2017


Mediatie-analyse

Hallo,

Wanneer is bij een mediatie-analyse een indirect of direct effect significant? Welke grens moet ik hanteren om mijn p-waarde mee te vergelijken?

Met vriendelijke groet,
Yalda

yalda
19-2-2017

Antwoord

Printen
Hallo Yalda,

Zie mijn antwoord op jouw vraag Moderatie-effect. Er is geen vaste p-waarde aan te wijzen. Afhankelijk van het vakgebied kiest men een verstandige waarde, bij het publiceren van conclusies wordt de gekozen waarde vermeld.

GHvD
19-2-2017


De rangcorrelatiecoëfficiënt van Spearman

Hoe worden die rangordes toebedeeld?
Ik snap er echt niets van.

Nadine
27-2-2017

Antwoord

Printen
In de tekst staat:
Door de consumentenbond zijn 8 verschillende merken CD-spelers getest en voorzien van een beoordeling. Na het onderzoeken van allerlei kenmerken zoals bedieningsgemak, veiligheid en vormgeving is een ranglijst opgesteld waarbij nummer 1 de beste CD-speler is, zo oplopend tot 8 als slechtste score.
Misschien kan je beter contact opnemen met de consumentenbond en 's vragen hoe ze zoiets precies doen.

Of... geef aan wat je precies niet begrijpt (of wel begrijpt) en vertel waar je precies vastloopt... Zie ook de spelregels.

WvR
27-2-2017


Likertschaal omrekenen

Ik wil een 5puntsschaal omrekenen naar een 10puntsschaal.
er is een 3.5 gescoord op een schaal van 1 tot 5. Wat is het cijfer op een schaal van 1 tot 10? Ik weet dat ik dit moet doen aan de hand van een formule. Maar mijn vraag is WAAROM moet ik een formule gebruiken en kan het niet X2??

Sarah
10-3-2017

Antwoord

Printen
Als je met $2$ vermenigvuldigt ligt het resultaat in het interval $[2,10]$; ik neem aan dat het van $[1,5]$ naar $[1,10]$ opgeschaald moet worden, dan is $x\mapsto \frac94(x-1)+1$ de juiste weg.

kphart
10-3-2017


Kans berekenen

Zou iemand mij kunnen helpen?

Een militieplichtige uit 1972 wenst nadere informatie betreffende zijn vermoedelijke oproepingsdatum en neemt daarvoor telefonisch contact op met de bevoegde dienst. De telefoonlijn is echter in 95 % van de gevallen bezet.

1) Wat is de kans dat hij maximaal 6 pogingen moet doen om binnen te geraken?
2) Hoeveel pogingen moet hij doen om met 95% waarschijnlijkheid iemand aan de lijn te krijgen?

Alvast bedankt!

Aline
22-3-2017

Antwoord

Printen
Hallo Aline,

Vraag 1:
De omslachtige methode: bedenk dat 'maximaal 6 pogingen' betekent: 1 poging, of 2, of 3, of 4, of 5, of 6. Bereken de kansen op elk van deze 6 mogelijkheden, en tel deze kansen bij elkaar op.
Een wat slimmere methode: bereken de kans dat 6 pogingen na elkaar allemaal mislukken. Je weet dan de kans dat er méér dan 6 pogingen nodig zijn. Trek deze kans van 1 af, dan krijg je de kans dat niet meer dan 6 pogingen nodig zijn, ofwel: de kans dat maximaal 6 pogingen nodig zijn.

Vraag 2:
Hier is de omslachtige methode absurd veel werk, dus volgen we de slimmere methode: bij elke poging is de kans dat de lijn bezet is, gelijk aan 95% (0,95). Bereken hoeveel pogingen nodig zijn om de kans dat deze allemaal geen succes hebben, kleiner of gelijk wordt aan 0,05. De kans dat minstens 1 van deze pogingen wel succes heeft, is dan minimaal 0,95 (dus 95%).

GHvD
22-3-2017


Populatieonderzoek

De doelgroep die ik ga ondervragen zijn alle ondernemers die lid zijn van mijn bedrijf. Ik ga ook daadwerkelijk al deze ondernemers ondervragen. Dan is er dus geen sprake van een steekproefonderzoek. Mijn vraag is nu, moet ik wel dezelfde formule gebruiken als bij een spreekproefonderzoek om na te gaan hoeveel respons ik moet hebben, wil mijn onderzoek representatief zijn?

Nadiah
24-3-2017

Antwoord

Printen
Als je echt iedereen moet/gaat ondervragen dan is dat niet nodig. Je kunt jezelf die vraag als oefening stellen maar ook om te anticiperen op dingen die mis kunnen gaan: als je niet met iedereen op tijd een afspraak kunt maken is het goed te weten wat in ieder geval genoeg is.

kphart
25-3-2017


Kansrekenen

Zou iemand mij hiermee kunnen helpen?

Een deeltje beweegt zich willekeurig langs een lijn. Dat wil zeggen: het deeltje begint in de oorsprong, positie 0, en beweegt met onafhankelijke stappen van lengte 1 naar links of rechts. De waarschijnlijkheid dat het deeltje naar rechts gaat is bij elke stap 3/4. Zij Xi de discrete stochastische variabele die aangeeft of het deeltje bij de i-de stap naar rechts (Xi = 1), dan wel naar links (Xi = -1) gaat.

1) Bereken benaderend de kans dat het deeltje na 500 stappen op zijn minst 200 posities naar rechts is beland.

Alvast bedankt!

Aline
30-3-2017

Antwoord

Printen
Je moet dus $200$ keer vaker $1$ `rechts' hebben dan $-1$ `links'. Omdat het totaal aantal $500$ is betekent dat dat je ten minste $350$ keer $1$ moet hebben. Realiseer je je ook dat je een binomiale verdeling hebt met $n=500$ en succeskans $p=\frac34$.

kphart
30-3-2017


Stemmen in de VS

Om als kiezer je stem uit te brengen in de VS moet je jezelf registreren. Er wordt dan ook gevraagd welke partij je voorkeur wegdraagt: op deze manier worden de geregistreerde kiezers opgedeeld in Democrats, Republicans en Independents. Recente tellingen wijzen uit dat van alle geregistreerde kiezers 30% Democrats zijn, 27% Republicans en 43% Independents.

Als je geregistreerde kiezers bevraagt naar hun voorkeur bij de eerstkomende presidents-verkiezingen in november, dan blijkt er een grote partijtrouw: Hillary Clinton krijgt 90% van de Democrats achter zich en Donald Trump 86% van de Republicans.

Eerst de strijd om de Independents: we veronderstellen nu dat alle geregistreerde kiezers ook hun stem uitbrengen.

1) Recente peilingen tonen aan dat Clinton nationaal 6% voorsprong heeft op Trump in voorkeur van geregistreerde kiezers. Hoeveel procent van de Independents hebben in dat geval een voorkeur voor Clinton boven Trump?

2) Welk percentage van de Independents moet Trump minstens voor zich zien te winnen om Clinton op nationaal vlak achter zich te laten? (Rond weer af op een geheel percentage.)

In de rest van deze vraag veronderstellen we dat de Independents in gelijke mate voor Clinton en Trump stemmen.

3) Wat is de kans dat een Clinton-kiezer, respectievelijk een Trump-kiezer, een Independent is?

4) 'Get out the vote’: De strijd met rivaal Bernie Sanders voor de nominatie tot presidentskandidaat van de Democratische partij heeft Clintons positie verzwakt binnen haar eigen aanhang. Een deel van de Democraten overweegt namelijk niet te gaan stemmen. Als we ervan uitgaan dat Trump alle Republikeins geregistreerde kiezers naar de stembus krijgt en dat Trump en Clinton elk de helft van de Independents achter zich krijgen, hoeveel procent van de Democratisch geregistreerde kiezers moeten dan minstens naar de stembus trekken om Clinton de overwinning te bezorgen?

Zou iemand mij hier de uitwerking van willen uitleggen, want ik begrijp er niks van

Dankuwel!

Paulin
30-3-2017

Antwoord

Printen
Hallo Pauline,

Het is niet onze gewoonte om 'zomaar' uitwerkingen te geven, wel helpen we je graag op weg om zelf de oplossing te vinden en daarmee de stof beter te leren begrijpen.

Omdat het bij deze opgave alleen om verhoudingen/percentages gaat, kunnen we het rekenwerk vereenvoudigen door aan te nemen dat er een eenvoudig aantal kiezers zijn. Ik kies ervoor om uit te gaan van 10000 kiezers.

De gegevens kunnen we dan overzichtelijk weergeven in een kruistabel:

q84157img3.gif

Het totaal aantal kiezers staat in de cel rechtsonder. Met behulp van de gegevens kan je het totaal aantal Democrats, Republicans en Independents berekenen. Deze totalen noteer je in de cellen A, B en C.
Door de gegevens goed te lezen, kan je meer cellen invullen. Bijvoorbeeld: "Hillary Clinton krijgt 90% van de Democrats achter zich" betekent: in cel D komt 90% van het aantal uit cel A.

Met behulp van de berekende aantallen in verschillende cellen kan je dan de vragen aanpakken.

Kan je hiermee vooruit? Wanneer je vastloopt: stel dan gerust een vervolgvraag, maar laat dan zien hoe ver je gekomen bent.

GHvD
30-3-2017



klein |  normaal |  groot

home |  vandaag |  bijzonder |  twitter |  gastenboek |  wie is wie? |  colofon

©2001-2017 WisFaq - versie IIb

eXTReMe Tracker