Standardavvik er et mye brukt og nyttig begrep i deskriptiv statistikk.
Standardavvik og varians er, i likhet med middelverdi og median, statistiske mål som sier noe om fordelingen av observasjoner i et datamateriale.
Standardavvik er et mål for spredningen av verdiene i et datasett, og gir informasjon om hvor langt de enkelte observasjonene i gjennomsnitt befinner seg fra gjennomsnittsverdien.
I denne artikkelen skal vi først se på spredning for ugrupperte observasjoner. Deretter skal vi forklare hvordan man beregner spredning for grupperte observasjoner, hvor observasjonene er inndelt i intervaller.
Man kan ikke lese av standardavvik direkte, slik man kan med for eksempel typetall, median og variasjonsbredde. Man må beregne dem. Det gjør man ved først å regne ut hver verdis avstand fra gjennomsnittsverdien. Deretter kvadreres hver avstand, og så summeres alle kvadratene. Summen deles på antall verdier. Det tallet vi da får, kalles varians. Standardavviket er kvadratroten av variansen.
Symbolet for standardavvik er den greske bokstaven sigma, σ, som er en liten gresk s.
Standardavviket er definert som kvadratroten av variansen.
I en formel ser det slik ut:
σ =
σ er standardavvik
V er varians
Gjennomsnittet er viktig for standardavviket. Gjennomsnittet inngår i formelen for varians, og har derfor også betydning for spredningen.
La oss se på et par eksempler for å komme nærmere betydningen av standardavvik.
To elever har følgende fordeling av poeng i 20 prøver angitt i frekvens:
poeng, x |
Elev 1 |
Elev 2 |
4 |
f(x) = 10 % |
f(x) = 40 % |
7 |
f(x) = 40 % |
f(x) = 10 % |
10 |
f(x) = 40 % |
f(x) = 10 % |
12 |
f(x) = 10 % |
f(x) = 40 % |
Standardavvik er definert som kvadratroten av varians, som er beregnet på bakgrunn av gjennomsnittet. Se også artiklene Gjennomsnitt og Varians for en mer utførlig beskrivelse.
Varians for elev 1 og elev 2 er beregnet til følgende:
Heretter kan spredning lett beregnes.
σ _
σ_
Spredningen gir et bilde av forskjellen på de to elevenes poengfordeling. Det virker logisk at spredningen er større for elev 2 enn for elev 1, siden elev 1 har flere resultat nær gjennomsnittet enn elev 2.
En person reiser ofte frem og tilbake mellom Oslo og København.
Pris i kr., x |
Hyppighet, h(x) |
Frekvens, f(x) |
160 |
5 |
0,50 = 50 % |
250 |
2 |
0,20 = 20 % |
404 |
3 |
0,30 = 30 % |
Se også artikkelen Gjennomsnitt for en mer utførlig beskrivelse.
Gjennomsnittsprisen for hver reise er beregnet til: = 251,20
Når man kjenner frekvens og gjennomsnitt, kan man finne varians. Se artikkelen Varians for utregning.
Varians er beregnet til: V = 11163,36
På bakgrunn av dette kan man beregne spredning.
σ =
Dermed er spredningen for prisen på reiser mellom Oslo og København = 105,66 kr.
Standardavvik for grupperte observasjoner er definert litt annerledes enn for ugrupperte observasjoner.
Formelen er den samme, nemlig at standardavviket er: σ = .
Men fordi gjennomsnitt og varians, som utgjør grunnlaget for standardavvik, beregnes på en litt annen måte for grupperte observasjoner, er selve ’innmaten’ i formelen ovenfor annerledes for grupperte observasjoner.
For grupperte observasjoner antar man at de enkelte observasjonene ligger jevnt fordelt i hvert enkelte intervall, og fastsetter et intervallmidtpunkt basert på dette for å beregne gjennomsnittet:
Samtidig er og
satt inn i formelen for varians, som man skal ta kvadratroten av for å beregne spredningen, σ.
Formelen for standardavvik for grupperte observasjoner ser slik ut:
σ er standardavvik
er det fastsatte intervallmidtpunkt
er gjennomsnittet
er intervallfrekvensen
V er variansen
Følgende datamateriale viser aldersfordelingen av 25 barn i alderen 0 - 15 år. Eksempelet inngår i eksempel 3 i artikkelen Varians.
Aldersintervall år |
Intervallhyppighet h(I) |
Intervallfrekvens f(I) |
Intervallmidtpunkt |
0 - 3 |
4 |
0,16 = 16 % |
1,5 |
4 - 6 |
5 |
0,20 = 20 % |
5 |
7 - 10 |
10 |
0,40 = 40 % |
8,5 |
11 - 15 |
6 |
0,24 = 24 % |
13 |
Middeltallet er beregnet til: = 7,76
Varians er beregnet til: V = 18,7712
På bakgrunn av dette kan man beregne standardavviket, fordi det er definert som kvadratroten av variansen.
σ
Standardavviket (gjennomsnittlig spredning) fra middeltallet er dermed 4,3326 år, som vi avrunder til 4 år og 4 måneder.