Sannsynsfordeling

Frå Wikipedia – det frie oppslagsverket
Gå til: navigering, søk

Sannsynsfordeling blir nytta innan sannsynsteori og statistikk for å skildre korleis stokastiske variable, til dømes tilfeldige utval, fordeler seg. Dei einskilde utfalla av ein tilfeldig variabel kan ikkje føreseiast, men sannsynsfordelinga vil skildre sannsynet for at kvart moglege utfall vil inntre, og korleis verdiane i eit større utval normalt vil fordele seg.

Desse tilhøva er ulike avhengig av den underliggande fysiske prosessen eller logiske mekanismen; Utfallet av eit terningkast, ein lotteritrekning, radioaktiv nedbryting, ein intelligenstest eller ventetider i ferjekø vil difor ha ulike sannsynsfordelingar.

Formell definisjon[endre | endre wikiteksten]

Ei sannsynsfordeling tildeler eit sannsyn til kvart intervall [a, b] av moglege reelle tal \mathbb{R} slik at føresetnadene for den aktuelle fordelinga er ivaretatt.

Alle stokastiske variablar har ei sannsynsfordeling som inneheld den essensielle informasjonen om denne variabelen. Viss X er ein stokastisk variabel, vil sannsynfordelinga tildele ein sannsyn P[aXb] til intervallet [a, b] som er sannsynet for at X har ein verdi i dette intervallet. Sannsynsfordelinga til X kan eintydig skildrast av den (kumulative) fordelingsfunksjonen F(x) som er definert som:

 F(x) = P\left[ X \le x \right]
for alle x i \mathbb{R}.

Verdiane vil vere i området 0 (ingen sannsyn) til 1. Den deriverte til denne  f(x) vert kalla sannsynstettleiken til X. Kontinuerlege sannsynsfordelingar er fordelingar der sumfunksjonen òg er kontinuerleg; Dette tyder òg at P[ X = x ] = 0 for alle verdiar x i \mathbb{R}; Frå ein grenseverdibetraktning: når mengda moglege verd for X går mot uendeleg må sannsynet for enkeltutfall X gå mot null. Sannsynet for at X er i intervallet [a,b] er:

 P(a \le x \le b) = \int_a^b f(x)\,dx

Ein fordeling blir kalla diskret viss sumfunksjonen består av ei rekkje endelege sprang, som tyder at variabelen X er ein diskret stokastisk variabel; X kan berre ha verdiar frå eit endeleg, høgst numererbart sett. Diskrete fordelingar blir skildra ved summen av sannsynene for enkeltutfall:

 F(x) = P (X \le x ) = \sum_{x_i \le x} p(x_i)
for i = 1, 2, ....
  • Støtta for ein fordeling er det minste lukka settet som har sannsyn 1. Ein fordeling har endeleg støtte der sannsyn 1 oppnåast med eit endeleg, høgst numererbart sett for X.
  • Sannsynsfordelinga for summen av to uavhengige stokastiske variable er konvolusjonen av deira fordelingar.
  • Sannsynsfordelinga for differansen mellom to uavhengige stokastiske variable er krysskorrelasjonen av deira fordelingar.

Viktige sannsynsfordelingar[endre | endre wikiteksten]

Diskrete fordelingar[endre | endre wikiteksten]

Endeleg støytte[endre | endre wikiteksten]

  • Bernoullis fordeling, som har verd 1 med sannsyn p og verd 0 med sannsyn q = 1 − p.
  • Rademachers fordeling, som har verd 1 med sannsyn 1/2 og verd −1 sannsyn 1/2.
  • Binomisk fordeling som gjev mengder treff i ei rekkje uavhengige Ja/Nei testar.
  • Uniform fordeling der alle elementa i eit endeleg sett har same sannsyn. Tilnærma riktig for mynt og terningkast o.l.
  • Hypergeometrisk fordeling, skildrar sannsynet for treff i dei første m testar på ein serie n dersom vi veit at totalt mengde treff i m er n. Blir til dømes brukt for å vurdere test av produkt ved utval frå vareparti.

Uendeleg støytte[endre | endre wikiteksten]

  • Boltzmann fordeling, som blir brukt innan fysikk for å skildre diskrete energinivå i system i termisk likevekt.
  • Geometrisk fordeling er ein diskret stokastisk sannsynsfordeling kor han stokastiske variable skildrar mengder forsøk til første gongen eit gjeve treff skjer.
  • Poissonfordeling skildrar mengder treff i ein fast tidsperiode dersom treffa skjer med ein kjend gjennomsnittsverdi og er uavhengig av tida sidan siste hendinga. Kan til dømes nytta for brukt radioaktiv nedbryting, fødselssstatistikk og køberekningar.
  • Logaritmisk fordeling

Kontinuerlege fordelingar[endre | endre wikiteksten]

Støtte på eit ikkje-uendeleg intervall[endre | endre wikiteksten]

Støytte på halvt uendeleg intervall, vanlegvis [0,∞)[endre | endre wikiteksten]

  • Kjikvadratfordeling, som er summen av kvadrat av n uavhengige Gaussiske stokastiske variable. Er ein bestemt variant av gammafordelinga som blir til brukt å mæle godheit i tilpassing til dømes ved minste kvadrats metode
  • Eksponentialfordeling skildrar tid mellom uavhengige på kvarandre følgjande stokstiske hendingar, til dømes driftsavbrot.
  • Gammafordelinga, skildre tid til n uavhengige på kvarandre følgjande stokastiske hendingar har inntreft.
  • log-normal fordeling skildrar variable som er sett saman av produktet av mange uavhengige positive variablar.
  • Weibull fordeling, der eksponentialfordeling er eit spesialtilfelle brukast for levetidsforventningsberekningar for utstyr (en: MTBF Mean time Between Failure).

Støytte for alle intervall[endre | endre wikiteksten]

  • Cauchy fordeling, er ein funksjon som ikkje har ein forventingsverdi eller varians; blir forbunde med system som energifordeling ved resonans.
  • Laplace fordeling Som er spissare ved forveningsverdien og har breiare skuldrer enn normalfordelinga.
  • Normalfordeling kallast òg Gaussfordeling. Gjeld for ei rekkje naturlege variasjonar rom fordeler seg rundt ein middelverdi i ein populasjon, til dømes høgd, intelligens naturleg variasjon i toleranse osb Modellert som ein sum av mange uavhengig variable og gjev ein velkjent klokkeforma kurve (eng. bell curve).

Sjå òg[endre | endre wikiteksten]

Kjelder[endre | endre wikiteksten]