Een van de meest elementaire concepten in statistieken is het gemiddelde, of rekenkundig gemiddelde, van een reeks cijfers. Het gemiddelde betekent een centrale waarde voor de gegevensverzameling. De variantie van een dataset meet hoe ver de elementen van die dataset uit het gemiddelde zijn gespreid. Gegevenssets waarvan de cijfers allemaal dicht bij het gemiddelde liggen, hebben een lage variantie. Die sets waarin de getallen veel hoger of lager zijn dan het gemiddelde, hebben een grote variantie.
Bereken het gemiddelde van de dataset
Bereken vierkante verschillen
De volgende stap omvat het berekenen van het verschil tussen elk element in de gegevensverzameling en het gemiddelde. Omdat sommige elementen hoger zullen zijn dan het gemiddelde en sommige lager zullen zijn, gebruikt de variantieberekening het kwadraat van de verschillen.
Dag 1 omzet - Gemiddelde omzet: $ 62.000 - $ 65414.29 = (- $ 3.414,29); (-3,414.29)2 = 11,657,346.94
Dag 2 Verkoop - Gemiddelde omzet: $ 64.800- $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94
Dag 3 omzet - Gemiddelde omzet: $ 62.600 - $ 65414.29 = (- $ 2.814,29); (-2,814.29)2 = 7,920,204.08
Verkoop op dag 4 - Gemiddelde omzet: $ 69.200 - $ 65414.29 = (+ $ 3.785,71); (+3,785.71)2 = 14,331,632.65
Dag 5 Verkoop - Gemiddelde omzet: $ 66.000 - $ 65414.29 = (+ $ 585.71); (585,71)2 = 343,061.22
Dag 6 Verkoop - Gemiddelde omzet: $ 63.900 - $ 65414.29 = (- $ 1.514,29); (-1,514.29)2 = 2,293,061.22
Dag 7 Verkoop - Gemiddelde omzet: $ 69.400 - $ 65414.29 = (+ $ 3.985,71); (+3,985.71)2 = 15,885,918.37
NOTITIE: De kwadratische verschillen worden niet in dollars uitgedrukt. Deze getallen worden in de volgende stap gebruikt om de variantie te berekenen.
Variantie en standaarddeviatie
De variantie is gedefinieerd als het gemiddelde van de gekwadrateerde verschillen.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Omdat de variantie het kwadraat van het verschil gebruikt, geeft de vierkantswortel van de variantie een duidelijkere indicatie van de werkelijke spreiding. In statistieken wordt de vierkantswortel van de variantie de standaardafwijking.
SQRT (7.544.081.63) = $ 2.746,65
Gebruikt voor variantie en standaarddeviatie
Zowel variantie als standaarddeviatie zijn zeer nuttig bij statistische analyse. De variantie meet de algehele spreiding van een gegevensset van het gemiddelde. De standaarddeviatie helpt bij het detecteren uitschietersof elementen van de gegevensset die te ver van het gemiddelde afwijken.
In de gegevensset hierboven is de variantie vrij hoog, met slechts twee dagelijkse verkooptotalen die binnen $ 1.000 van het gemiddelde komen. Uit de dataset blijkt ook dat twee van de zeven dagelijkse verkooptotalen meer dan één standaarddeviatie boven het gemiddelde liggen, terwijl twee andere meer dan één standaarddeviatie onder het gemiddelde liggen.