Algebra

Analyse

Bewijzen

De grafische rekenmachine

Discrete wiskunde

Fundamenten

Meetkunde

Oppervlakte en inhoud

Rekenen

Schoolwiskunde

Statistiek en kansrekenen

Telproblemen

Toegepaste wiskunde

Van alles en nog wat


\require{AMSmath}

Output regressie-analyse Excel

Hallo,

via Excel heb ik een regressie-analyse gedaan, dit leverde de volgende output op:

R2 0,62233
Aangepaste kleinste kwadraat 0,62094
Standaardfout 1001,45
Waarnemingen 273
std fout T
X-coefficient 19,0647 0,9202 1,378
Constant 101,131 72,65 21,13

De nauwkeurigheidsmarge (e) heb ik berekend door:

(Z-waarde * (Stdev/wortel(n))/ gem X.Y = 0,05

Vragen:
1 Wat is het aangepaste kleinste kwadraat en hoe wordt deze berekend?
2 Een standaardfout van 1001, hoe is deze te interpreteren?
3 Is de e met de juiste gegevens bepaald?
4 Is de standfout (standaardafwijking) hetzelfde als standaarddeviatie?
5 Wat vindt u van de regressie-output als geheel (R2 en T-berekend, e-waarde in ogenschouw genomen)? M.a.w. kan er een 'betrouwbare' regressielijn bepaald worden?
6 Overige opmerkingen.

Erik.

Erik L
Student hbo - donderdag 12 juni 2003

Antwoord

Beste Erik,
Je hebt wat langer moeten wachten dan gebruikelijk, ik had het merendeel reeds af, maar hoopte nog op enkele opmerkingen van mede-beantwoorders, vervolgens op vakantie gegaan (2 weken) en eigenlijk vergeten het af te ronden, sorry, maar hopelijk kan je wat met de volgende 'antwoorden'/'verwijzingen'.

Vraag 1:
Wat is het aangepaste kleinste kwadraat en hoe wordt deze berekend?
Antwoord:
zie: http://mathworld.wolfram.com/LeastSquaresFitting.html

Vraag 2:
Een standaardfout van 1001, hoe is deze te interpreteren?
Antwoord:
Voor een interpretatie van de standaard fout, zou ik eigenlijk de gegevens zelf moeten zien. Net als met de standaard deviatie is dit namelijk afhankelijk van de gegevens zelf, zo is soms een standaard afwijking van 5 beschouwd als veel omdat alle waarde tussen de 1 en 10 lagen, maar soms is een sd van 400 weinig als de waarden bv. tussen 1 en 40000 lagen.
zie ook antwoord vraag 4.

Vraag 3:
Is de e met de juiste gegevens bepaald?
Antwoord:
De meest gebruikelijke formule voor een nauwkeurigheids marge is: z·Ö((p*q)/n). Kijk maar eens binnen wisfaq, zoeken op 'nauwkeurigheids marge'.

Vraag 4:
Is de standfout (standaardafwijking) hetzelfde als standaarddeviatie?
Antwoord:
Nee meestal niet. Kijk op wisfaq zelf en zoek op 'standaard fout' je zult dan enkele formules en uitleg zien wat de standaard fout precies betekend en hoe deze te berekenen is. Pas wel op er zijn namelijk aardig wat verschillende formules hiervoor.

Vraag 5:
Wat vindt u van de regressie-output als geheel (R2 en T-berekend, e-waarde in ogenschouw genomen)? M.a.w. kan er een 'betrouwbare' regressielijn bepaald worden?

NOG ONBEPAALD.

Van een mede-beantwoorder kreeg ik tevens de volgende reactie:

Het probleem is inderdaad dat deze vragensteller niet meer informatie geeft. Verder zijn de vragen te algemeen gesteld. Hij zou in zijn vragen concreter moeten verwijzen naar de berekende getallen.

Een paar opmerkingen over de vragen:

Die standaardfout 1001 uit de regressieoutput zegt iets over het verschil van de waargenomen y waarden en de bijbehorende schattingen volgens het berekende regressiemodel. Hiermee bereken je dan eerst de zgn. variantie van de storingsterm en vervolgens (wortel) de standaarddeviatie van de storingsterm. Daarmee heb je een maat om verder te berekenen hoe groot een schatting kan afwijken van de werkelijke waarde. Hoe erg dat is valt niet goed te zeggen omadt niet bekend is in welke orde van grootte de meetgegevens zich bevinden. Met die e bedoelen we doorgaans de afwijking van de schatting ten opzichte van de werkelijke waarde, of soms ook de storingsterm. Het berekenen van die (welke ???) nauwkeurmarge op de geschetste manier lijkt mij overigens volledig uit de lucht gegrepen. De standaardfout in de laatste twee regels zegt iets over de mogelijke afwijkingen van de berekende coefficienten (de helling en de constante). De T waarde vertelt vervolgens of deze coefficienten significant van 0 af kunnen wijken. Echter zo te zien kloppen de gegeven t waarden NIET met de voorafgaande getallen :o( Over vraag 5 kan niet alles gezegd worden aangezien onbekend is in welke orde van grootte de meetgegevens liggen. Echter de r^2 waarde geeft aan dat 38% van de variantie in de data niet verklaard kan worden door het regressiemodel. Dat betekent dat de regressielijn zeker geen erg goed beeld (en voorspellingen) geeft. Ook zijn de standaardfout in de coefficienten op het oog niet bepaald klein en dat wijst in dezelfde richting.

Jan

Hopelijk lukt het zo.

M.v.g.
PHS

PHS
maandag 11 augustus 2003

©2001-2024 WisFaq