Hoe residuele afwijking te berekenen

Beleggers gebruiken modellen van de beweging van activaprijzen om te voorspellen waar de prijs van een belegging op een bepaald moment zal zijn. De methoden die worden gebruikt om deze voorspellingen te maken, maken deel uit van een veld in statistieken die bekend staan als regressie analyse. De berekening van de resterende variantie van een reeks waarden is een hulpmiddel voor regressieanalyse dat meet hoe nauwkeurig de voorspellingen van het model overeenkomen met de werkelijke waarden.

Regressie lijn

De regressie lijn laat zien hoe de waarde van het activum is veranderd als gevolg van veranderingen in verschillende variabelen. Ook bekend als a trendlijn, de regressielijn geeft de "trend" van de prijs van het activum weer. De regressielijn wordt voorgesteld door een lineaire vergelijking:

Y = a + bX

waarbij "Y" de activawaarde is, "a" is een constante, "b" is een vermenigvuldiger en "X" is een variabele die verband houdt met de activawaarde.

Als het model bijvoorbeeld voorspelt dat een huis met één slaapkamer voor $ 300.000 verkoopt, een huis met twee slaapkamers voor $ 400.000, en een huis met drie slaapkamers voor $ 500.000, zou de regressielijn eruit zien als:

Y = 200.000 + 100.000X

waarbij "Y" de verkoopprijs van het huis is en "X" het aantal slaapkamers is.

Y = 200.000 + 100.000 (1) = 300.000

Y = 200.000 + 100.000 (2) = 400.000

Y = 200.000 + 100.000 (3) = 500.000

scatterplot

EEN scatterplot toont de punten die de werkelijke correlaties tussen de activawaarde en de variabele weergeven. De term "scatterplot" komt van het feit dat, wanneer deze punten op een grafiek worden uitgezet, ze "rond" lijken te zijn in plaats van perfect op de regressielijn liggen. Met behulp van het bovenstaande voorbeeld kunnen we een spreidingsdiagram maken met deze gegevenspunten:

Punt 1: 1BR verkocht voor $ 288.000

Punt 2: 1BR verkocht voor $ 315.000

Punt 3: 2BR verkocht voor $ 395.000

Punt 4: 2BR verkocht voor $ 410.000

Punt 5: 3BR verkocht voor $ 492.000

Punt 6: 3BR verkocht voor $ 507.000

Residual Variance Berekening

De resterende variantieberekening begint met de som van de kwadraten van verschillen tussen de waarde van het activum op de regressielijn en elke bijbehorende activawaarde op de scatterplot.

De vierkanten van de verschillen worden hier getoond:

Punt 1: $ 288.000 - $ 300.000 = (- $ 12.000); (-12.000)² = 144,000,000

Punt 2: $ 315.000 - $ 300.000 = (+ $ 15.000); (15.000)² = 225,000,000

Punt 3: $ 395.000 - $ 400.000 = (- $ 5.000); (-5000)² = 25,000,000

Punt 4: $ 410.000 - $ 400.000 = (+ $ 10.000); (10.000)² = 100,000,000

Punt 5: $ 492.000 - $ 500.000 = (- $ 8.000); (-8000)² = 64,000,000

Punt 6: $ 507.000 - $ 500.000 = (+ $ 7000); (7000)² = 49,000,000

Som van de vierkanten = 607.000.000

De resterende variantie wordt gevonden door de som van de vierkanten te nemen en deze te delen door (n-2), waarbij "n" het aantal gegevenspunten op de scatterplot is.

RV = 607.000.000 / (6-2) = 607.000.000 / 4 = 151.750.000.

Gebruik voor residuele afwijking

Hoewel elk punt op de scatterplot niet perfect in lijn ligt met de regressielijn, heeft een stabiel model de spreidpunten in een normale verdeling rond de regressielijn. Restverschil is ook bekend als "foutvariantie." Een hoge restvariantie geeft aan dat de regressielijn in het oorspronkelijke model mogelijk een fout bevat. Sommige spreadsheetfuncties kunnen het proces achter het maken van een regressielijn weergeven die dichter bij de scatterplot-gegevens past.