Akkurat nå er 133 pålogget.

Standardavvik

Standardavvik er et mye brukt og nyttig begrep i deskriptiv statistikk.

Standardavvik og varians er, i likhet med middelverdi og median, statistiske mål som sier noe om fordelingen av observasjoner i et datamateriale.

Hva er standardavvik

Standardavvik er et mål for spredningen av verdiene i et datasett, og gir informasjon om hvor langt de enkelte observasjonene i gjennomsnitt befinner seg fra gjennomsnittsverdien.

I denne artikkelen skal vi først se på spredning for ugrupperte observasjoner. Deretter skal vi forklare hvordan man beregner spredning for grupperte observasjoner, hvor observasjonene er inndelt i intervaller.

Hvordan beregne standardavvik

Man kan ikke lese av standardavvik direkte, slik man kan med for eksempel typetall, median og variasjonsbredde. Man må beregne dem. Det gjør man ved først å regne ut hver verdis avstand fra gjennomsnittsverdien. Deretter kvadreres hver avstand, og så summeres alle kvadratene. Summen deles på antall verdier. Det tallet vi da får, kalles varians. Standardavviket er kvadratroten av variansen.

Standardavvik formel

Symbolet for standardavvik er den greske bokstaven sigma, σ, som er en liten gresk s.

Standardavviket er definert som kvadratroten av variansen.

I en formel ser det slik ut:

              \(σ = \sqrt{V}\)

\(σ\) er standardavvik

\(V\) er varians

Gjennomsnittet er viktig for standardavviket. Gjennomsnittet inngår i formelen for varians, og har derfor også betydning for spredningen.

La oss se på et par eksempler for å komme nærmere betydningen av standardavvik.

Eksempel 1: Beregning av standardavvik for ugruppert data

To elever har følgende fordeling av poeng i 20 prøver angitt i frekvens:

poeng, x

Elev 1

Elev 2

4

f(x) = 10 %

f(x) = 40 %

7

f(x) = 40 %

f(x) = 10 %

10

f(x) = 40 %

f(x) = 10 %

12

f(x) = 10 %

f(x) = 40 %

Standardavvik er definert som kvadratroten av varians, som er beregnet på bakgrunn av gjennomsnittet. Se også artiklene Gjennomsnitt og Varians for en mer utførlig beskrivelse.

Varians for elev 1 og elev 2 er beregnet til følgende:

\(V_{elev 1} = 5,04\)

\(V_{elev 2} = 13,37\)

Heretter kan spredning lett beregnes.

\(σ_{elev 1} = \sqrt{ V_{elev 1}} = \sqrt{5,04} = 2,24\)

\(σ_ {elev 2} = \sqrt{ V_{elev 2}} = \sqrt{13,37} = 3,66\)

Spredningen gir et bilde av forskjellen på de to elevenes poengfordeling. Det virker logisk at spredningen er større for elev 2 enn for elev 1, siden elev 1 har flere resultat nær gjennomsnittet enn elev 2.

Eksempel 2: Beregning av spredning ugruppert datamateriale

En person reiser ofte frem og tilbake mellom Oslo og København.

Pris i kr., x

Hyppighet, h(x)

Frekvens, f(x)

160

5

0,50 = 50 %

250

2

0,20 = 20 %

404

3

0,30 = 30 %

Se også artikkelen Gjennomsnitt for en mer utførlig beskrivelse.

Gjennomsnittsprisen for hver reise er beregnet til: \bar{x} = \(251,20\)

Når man kjenner frekvens og gjennomsnitt, kan man finne varians. Se artikkelen Varians for utregning.

Varians er beregnet til: \(V = 11163,36\)

På bakgrunn av dette kan man beregne spredning.

\(σ = \sqrt{ V} = \sqrt{11163,36} = 105,66\)

Dermed er spredningen for prisen på reiser mellom Oslo og København = \(105,66\) kr.

Standardavvik for grupperte observasjoner

Standardavvik for grupperte observasjoner er definert litt annerledes enn for ugrupperte observasjoner.

Formelen er den samme, nemlig at standardavviket er: \(σ = \sqrt V\).

Men fordi gjennomsnitt og varians, som utgjør grunnlaget for standardavvik, beregnes på en litt annen måte for grupperte observasjoner, er selve ’innmaten’ i formelen ovenfor annerledes for grupperte observasjoner.

For grupperte observasjoner antar man at de enkelte observasjonene ligger jevnt fordelt i hvert enkelte intervall, og fastsetter et intervallmidtpunkt basert på dette for å beregne gjennomsnittet:  \(x_ {midt}\)

Samtidig er \(x_ {midt}\) og \(f(I)\) satt inn i formelen for varians, som man skal ta kvadratroten av for å beregne spredningen, σ.

Formelen for standardavvik for grupperte observasjoner ser slik ut:

\sigma = \sqrt{ \sum (x_{midt} - \bar{x})^2 \cdot f(I)} \Leftrightarrow \sigma = \sqrt{V}

σ er standardavvik

\(x_{midt}\) er det fastsatte intervallmidtpunkt

\bar{x} er gjennomsnittet

\(f(I)\) er intervallfrekvensen

\(V\) er variansen

Eksempel 3: Beregning av standardavvik for grupperte data

Følgende datamateriale viser aldersfordelingen av 25 barn i alderen 0 - 15 år. Eksempelet inngår i eksempel 3 i artikkelen Varians.

Aldersintervall

år

Intervallhyppighet

h(I)

Intervallfrekvens

f(I)

Intervallmidtpunkt

\(x_{midt}\)

0 - 3

4

0,16 = 16 %

1,5

4 - 6

5

0,20 = 20 %

5

7 - 10

10

0,40 = 40 %

8,5

11 - 15

6

0,24 = 24 %

13

Middeltallet er beregnet til: \bar{x} = \(7,76\)

Varians er beregnet til: \(V = 18,7712\)

På bakgrunn av dette kan man beregne standardavviket, fordi det er definert som kvadratroten av variansen.

\(σ = \sqrt{V} = \sqrt{18,7712} = 4,3326\)

Standardavviket (gjennomsnittlig spredning) fra middeltallet er dermed \(4,3326\) år, som vi avrunder til 4 år og 4 måneder.