Gjennomsnitt, også kalt aritmetisk middelverdi eller middeltall, er et viktig matematisk begrep innen deskriptiv statistikk. Det er et vanlig sentralmål som gir oss informasjon om resultatet for et datamateriale som helhet.
Gjennomsnitt, median og typetall er sentralmål som sier noe om hvor tyngdepunktet av observasjonene ligger.
Gjennomsnittet er, som det ligger i ordet, gjennomsnittet av flere data. Det regnes ut ved å summere alle observasjonene og så dele totalsummen på antall observasjoner.
Medianen er det midterste tallet i et sett med observasjoner etter at alle tallene er blitt sortert i stigende rekkefølge.
Typetallet er det tallet som har høyest frekvens, dvs. forekommer flest ganger.
I denne artikkelen skal vi se på hvordan man beregner gjennomsnitt for ugrupperte observasjoner, median, og gjennomsnitt for grupperte observasjoner.
Gjennomsnittet av flere målinger finner man ved å legge sammen alle målingene og deretter dividere på antall målinger.
Hvis vi for eksempel har to personer og den ene har 1 krone og den andre har 3 kroner, vil de til sammen ha 4 kroner.
1 + 3 = 4.
Vi har altså 4 kroner som vi skal dele på 2 personer.
4 / 2 = 2. I gjennomsnitt har de 2 kroner hver.
I dette eksempelet med 1 og 3 er gjennomsnittet dermed = 2.
I en formel ser det slik ut:
Gjennomsnitt = +
+ ...
+
/ n
til
er de enkelte observasjonene
n er antallet observasjoner
h(x) er hyppighet
eller:
La oss anta at vi ønsker å beregne middelverdien av følgende seks tall:
7, 3, 16, 2, 8, 6
For å finne gjennomsnittet, skal observasjonene legges sammen og deretter skal summen divideres på antall observasjoner.
7 + 3 + 16 + 2 + 8 + 6 = 42
Summen av observasjonene = 42. Antall observasjoner = 6. Middeltallet = 42 / 6 = 7.
Gjennomsnitt =
Et annet ugruppert datamateriale med 7 observasjoner ser ut som eksempelet nedenfor. La oss si at dette er prisen i kroner for å reise fra Oslo til Kristiansand med forskjellige transportmidler.
100, 150, 165, 200, 250, 405, 499
La oss først regne ut gjennomsnittsprisen for denne reisen.
Gjennomsnitt =
Dette gir en gjennomsnittspris, eller middelverdi, for en reise mellom Oslo og Kristiansand på 252,71 kr.
Både gjennomsnitt og median sier noe om middeltendensen i et datamateriale. Gjennomsnittet er middelverdien av alle observasjonene i et datamateriale. Medianen er det midterste tallet i et datamateriale etter at alle tallene er blitt sortert i stigende rekkefølge. Median er et sentralmål som defineres som verdien til tallet som deler et utvalg i to deler slik at hver del har like mange elementer.
Vi stiller opp alle observasjonene fra eksempelet ovenfor i stigende rekkefølge og finner tallet som ligger i midten:
100, 150, 165, 200, 250, 405, 499
Som det fremgår, er det 3 tall før 200 og 3 tall etter 200 i det rangerte observasjonsmaterialet. Tallet i midten er 200, og derfor er median = 200 kr.
To elever får følgende fordeling av poeng i 20 prøver, angitt med hyppighet og frekvens (link):
Poeng Elev 1 Elev 2
4: 2 = 10 % 8 = 40 %
7: 8 = 40 % 2 = 10 %
10: 8 = 40 % 2 = 10 %
12: 2 = 10 % 8 = 40 %
Sum: N = 20 N = 20
Gjennomsnittet beregnes som følger:
Gjennomsnitt elev 1:
Gjennomsnitt elev \(2\):
I et gruppert datamateriale er observasjonene inndelt i intervaller, og vi vet ikke nøyaktig verdi på observasjonene. Dette gjør at beregning av gjennomsnittet for grupperte observasjoner er definert litt annerledes enn for ugrupperte observasjoner.
Fordi man ikke kjenner verdiene på de enkelte observasjonene, kan man ikke beregne et vektet gjennomsnitt. I stedet antar man at de enkelte observasjonene ligger jevnt fordelt i intervallet. Man fastsetter et midtpunkt i intervallet, , som en felles verdi for alle observasjonene i det intervallet.
Formelen for beregning av gjennomsnittet for grupperte observasjoner er nesten den samme som for ugrupperte observasjoner. Man setter bare inn og f(I) for intervallene man vil regne med. Formelen for middelverdien av grupperte data ser slik ut:
er Gjennomsnittlet
er det fastsatte midtpunktet i intervallet
f(I) er intervallfrekvensen
Gjennomsnittet for grupperte observasjoner finner man altså ved å fastsette et intervallmidtpunkt, og beregne intervallfrekvensen f(I) for hvert intervall. Nedenfor blir formelen brukt i et eksempel.
I et borettslag skal det arrangeres sommerfest. Derfor er barna blitt oppdelt i aldersintervaller for å finne ut hvilke aktiviteter man skal arrangere på festen. Der er i alt 25 barn, så N = 25. Barna deles inn i 4 aldersintervaller, og intervallhyppigheten og intervallfrekvensen ser slik ut:
Aldersintervaller i år |
Intervallhyppighet, h(I) |
Intervallfrekvens, f(I) |
0 - 3 |
4 |
0,16 = 16 % |
4 - 6 |
5 |
0,20 = 20 % |
7 - 10 |
10 |
0,40 = 40 % |
11 - 15 |
6 |
0,24 = 24 % |
Sum |
N = 25 |
1,00 = 100 % |
Deretter fastsetter man intervallmidtpunkt, som er en alder midt i intervallet:
0 - 3 år:
4 - 6 år:
7 - 10 år:
11 - 15 år:
Deretter kan man beregne gjennomsnittet:
Det vil si at gjennomsnittet for barna i borettslaget er 7,76 år, som vi kan runde av til 7 år og 9 måneder. Gjennomsnittet er som beskrevet et uttrykk for middelverdien, og dermed er barnas gjennomsnittsalder i dette eksempelet 7 år og 9 måneder.