WisFaq!

\require{AMSmath} geprint op donderdag 2 mei 2024

Correlatie of multiple regressie?

Hoi, ik ben bezig met een onderzoek naar gebruikte materialen in auto's in de afgelopen 25 jaar. Ik heb 6 meetpunten (1975,1980,...,2000). Op elk meetpunt heb ik 6 materiaalklassen (ijzer, aluminium, kunsstof, etc.)waarvan ik de percentages heb bepaald (voorbeeld: 1975: ijzer 74,2%;rubber 5,2%;...).

Wat ik graag wil doen is de verschillende jaren met elkaar vergelijken om daardoor bijvoorbeeld aan te tonen, dat de toename van rubber van invloed is op de afname van ijzer.

Ik dacht zelf dat ik hier correlatie voor moest gebruiken, maar ik heb 6 afhankelijke variabelen, op 6 meetpunten, kan dat dan?

Alvast bedankt!

Niels
2-6-2004

Antwoord

Hallo, Niels.
Het hangt er mede van af of er wel of niet reden is om juist rubber voor ijzer te substitueren. Je moet je allereerst afvragen wat de economische en technische achtergronden zijn van de veranderingen in materiaalgebruik.
Je kunt daarna om te beginnen wel de correlatie tussen rubber en ijzer berekenen.
Maar de gebruikte hoeveelheden van de zes grondstoffen houden allemaal verband met elkaar (ten minste, dat leid ik uit uw vraag af).
Je kunt dan vervolgens multipele regressie gebruiken, dus een lineair verband schatten tussen de zes materialen (het beste regressiehypervlak in de zesdimensionale ruimte R6 bij de zes gegeven punten P1975, ... , P2000).
Is de verhouding der coëfficiënten van r(ubber) en y(zer) in de vergelijking van het hypervlak bijvoorbeeld 3, dan laat dat zien met hoeveel eenheden y afneemt als r toeneemt met 1 eenheid (in dit geval neemt y dan af met 3 eenheden).
Men moet zich echter wel afvragen hoe nauwkeurig het berekende schattende regressiehypervlak het modeltheoretische ideale regressiehypervlak benadert.
Hier zijn stellingen over. In het algemeen geldt dat de kleinste-kwadraten-schatters nauwkeuriger zijn naarmate het aantal waarnemingen groter is, het aantal regressoren kleiner, en de regressoren onderling minder correlatie vertonen.
Bij u is het aantal waarnemingen klein (slechts zes meetpunten) en het aantal regressoren groot (maar liefst zes materialen). Als nu bovendien de correlatie tussen rubber en ijzer groot is, dan zal het schattende regressiehypervlak niet erg nauwkeurig zijn.
Je kunt ook nog overwegen de tijd t als zevende verklarende variabele mee te nemen.

hr
3-6-2004


© 2001-2024 WisFaq
WisFaq - de digitale vraagbaak voor het wiskunde onderwijs - http://www.wisfaq.nl

#24870 - Statistiek - Student universiteit