www.matematikk.org
LærerstudenterLærerstudenter

Statistisk sannsynlighet

Statistiske sannsynlighetsmodeller settes opp på grunnlag av mange forsøk, gjerne mange tusen. Deretter regner vi med at den relative frekvensen for utfallene representerer virkeligheten, og vi bruker dette som en statistisk sannsynlighet for de mulige utfallene.

For en vanlig, symmetrisk spilleterning er sannsynligheten for hvert av utfallene 1, 2, 3, 4, 5 og 6 lik 1616,7 %. Men så viser det seg at noen har laget en jukseterning ved å feste en liten ekstra vekt på siden med verdien 1. Da er det større sannsynlighet for å få verdien på den motsatte siden, nemlig 6, siden terningen oftere vil lande med verdien 1 mot underlaget. Og det er mindre sannsynlighet for å få verdien 1. Av 10 000 kast med jukseterningen ble resultatene:

 

Verdi Antall tilfeller
1 31
2 1009
3 1631
4 1369
5 1008
6 4952



For ideelle terninger er altså sannsynligheten for å hver av verdiene 1, 2, 3, 4, 5, 6 lik 16. For jukseterningen er sannsynlighetene forandret. Men vi har dessverre ikke lenger mulighet til å forutsi disse sannsynlighetene teoretisk. Terningen har ikke lenger en homogen vektfordeling. I slike tilfeller må vi nøye oss med å bruke den relative frekvensen for terningverdiene ved mange kast som et mål for sannsynlighetsfordelingen for den vektede terningen:

  

Verdi Relativ frekvens
1 3110000=0,0031=0,31 %
2 100910000=0,1009=10,09 %
3 163110000=0,1631=16,31 %
4 136910000=0,1369=13,69 %
5 100810000=0,1008=10,08 %
6 495210000=0,4952=49,52 %



Ideen er: Vi kaster terningen svært mange ganger og regner med at resultatene vi har funnet vil representere et utvalg av terningkast.

Men her er det en viktig forutsetning. Dersom vi istedenfor 10 000 terningkast hadde valgt 10 terningkast, kunne fordelingen blitt, for eksempel, som denne:

 

Verdi Antall Relativ frekvens
1 0 010=0 %
2 1 110=0,1=10 %
3 2 210=0,2=20 %
4 1 110=0,1=10 %
5 0 010=0 %
6 6 610=0,6=60 %



Hvis vi brukte disse relative frekvensene som et mål for sannsynlighet, skulle det vært umulig å få terningkastene 1 og 5. Dette er opplagt urimelig. Statistiske sannsynlighetsmodeller settes opp på grunnlag av mange forsøk, gjerne mange tusen. Deretter regner vi med at den relative frekvensen for utfallene representerer virkeligheten, og vi bruker dette som en statistisk sannsynlighet for de mulige utfallene.

I de tilfellene hvor vi kan beregne sannsynligheter ut fra en teoretisk modell, for eksempel som uniform sannsynlighet, kan vi få en sjekk på om forutsetningene i modellen er oppfylt ved å gjøre mange forsøk og beregne den relative frekvensen for disse. Med en rettferdig terning som kastes 10 000 ganger, bør for eksempel utfallene 1, 2, 3, 4, 5 og 6 oppnås omtrent det samme antall ganger, cirka 10 000 : 6, det vil si 1 650 til 1700 ganger.

Publisert: 31.03.2008

Skrevet av

Knut Vedeld
Rolf Venheim

Institusjon

Universitetet i Agder
Universitetet i Oslo

Begrep

  • Relativ frekvens

    Antall observasjoner av en spesiell hendelse dividert på antall observasjoner.

    Eksempel: Dersom du kaster en terning 40 ganger og får 4 seksere, er den relative frekvensen av seksere 4/40 = 0,1.

  • Sannsynlighet

    Sannsynligheten for noe forteller hvor sikkert eller usikkert det er at en ting skal hende.
    En sannsynlighet er minst 0 og maks 1.

    Sannsynlighet 0 betyr at en ting helt sikkert ikke skjer.
    Sannsynlighet 1 betyr at en ting helt sikkert skjer.

    Når du kaster mynt og kron, er sannsynligheten for å få mynt 0,5 og kron 0,5.

    Sannsynligheten for å få mynt eller kron er 1.

  • Statistikk

    Statistikk dreier seg om innsamling og bearbeiding av data eller informasjon.

  • Utfall

    Mulig resultat av en hendelse.

    Eksempel: Du kaster en terning og får seks øyne. Utfallet er seks.