Normalfordeling

Normalfordeling eller ei gausskurve, er i matematikken (hovudsakleg i sannsynsteori og statistikk) den desidert viktigaste fordelinga. Ein normalfordelt variabel antek ofte verdien som ligg nær middelverdien, og sjeldan verdien som har stort avvik. Difor ser normalfordelinga ut som ei klokke (bjølle), og internasjonalt nyttar ein ofte nemninga bell curve.

Normalfordelinga er den desidert viktigaste fordelinga i statistikken. Dette hengjer saman med eit matematisk resultat som blir kalla sentralgrenseteoremet. Resultatet inneber at summen av ei stor mengd uavhengige tilfeldige variablar er tilnærma normalfordelt under visse allmenne føresetnader, uavhengig av kva for ei fordeling desse variablane hadde i utgangspunktet. Dette resulterer i at normalfordelingen dukkar opp fleire stader i naturen og samfunnet, og fleire hendingar kan med stor nøysemd skildrast av normalfordelinga.

Førekomst

Årsaka til at normalfordelinga nyttast så mykje er sentralgrenseteoremet. I mellom anna naturvitskap, sosiologi og økonomi er det normalt at ein ikkje forstår korleis ein viss mekanisme fungerer, men ein kan teoretisk sett motivere til bruk av normalfordelingar sidan det ofte er slik at fenomen oppstår gjennom mange små, uavhengige, tilfeldige variasjonar.

IQ-testar lagast ofte med førehandstru om at intelligensen er normalfordelt. Ein IQ-test vil gje resultat som er normalfordelte med ein forventningsverdi på 100, ved å omskalere testresultata til ei normalfordeling. I kva grad intelligens verkeleg er normalfordelt er uvisst.

Døme – kaste mynt

Dersom ein kastar ein mynt 100 gonger og kallar summen for X, så vil X vere binomisk fordelt. Men sidan kvart myntkast er uavhengig av alle dei øvrige kasta, vil X vere tilnærma normalfordelt med ein forventningsverdi på 50. Ofte er det mykje enklare å tenkje seg ei tilnærma verdi på ein tilfeldig variabel med ei normalfordeling enn å berekne eksakte sannsyn, og sidan mange tilfeldige fenomen er summar av veldig mange små, tilfeldige forskyvingar, fungerer det bra. Historisk sett var høvet til å tenkje seg tilnærma verdi på store binomiske fordelingar det første bruksområdet for normalfordelinga.

Definisjon

Normalfordelinga har tettleiksfunksjonen:

f(x)={1 \over \sigma {\sqrt {2\pi }}}\,e^{-{(x-\mu )^{2} \over 2\sigma ^{2}}}

,

der μ og σ er dei karakteristiske konstantane til normalfordelinga: μ er forventningsverdien, og σ er standardavviket til fordelinga. Denne normalfordelinga vert skriven som $N(\mu ,\sigma )\,$ .

Tettleiksfunksjonen til normalfordelinga kan ikkje integrerast med vanlege eindimensjonale metodar, sidan han ikkje har nokon antiderivert funksjon som kan uttrykkast analytisk. Området under kurven kan derimot ha ein verdi på 1 ved bruk av andre metodar, noko han må vere for å vere ordentleg sannsynsfordeling.

Ei standardisert normalfordeling har μ = 0 og σ = 1.

Fordelingsfunksjonen for ein standardisert normalfordeling vert vanlegvis skriven med $\Phi \,$ og samanhengen mellom fordelingsfunksjonen og tettleiksfunksjonen seier at:

\Phi (x)=\int _{-\infty }^{x}f(x)dx

.

Fordelingsfunksjonen gjev sannsynet for at ein normalfordelt variabel Y er mindre eller lik eit visst tal x:

P(Y<x)=\Phi (x)\,

.

Sannsynet for at ein normalfordelt variabel hamnar i eit intervall $[a,b]$ er:

P(a<X<b)=\Phi (b)-\Phi (a)\,

.

Eigenskapar

Følgjande eigenskapar gjeld for normalfordelingar:

Fordelingsfunksjon

Fordelingsfunksjonen for ein vilkårleg normalfordelt variabel $X\in N(\mu ,\sigma )$ kan lett utleiast frå fordelingsfunksjonen for ein standard-normalfordelt variabel:

P(X<a)=\Phi \left({\frac {a-\mu }{\sigma }}\right)

.

Denne eigenskapen gjer at tabellar for normalfordelingar berre gjev oss fordelingsfunksjonen $\Phi \,$ , sidan alle andre normalfordelingar på denne måten kan gjerast om til ein med forventningsverdi på 0 og standardavvik på 1.

Symmetri

\Phi (x)=1-\Phi (-x)\,

.

Denne symmetrien gjer at alle tabellar berre gjev oss $\Phi (x)\,$ for positive tal x.

Lineær forandring

Dersom $X\in N(\mu ,\sigma )$ og $a,b\,$ er konstantar, er den lineære forma

aX+b\in N(a\mu +b,a\sigma )

,

det vil sei at forventningsverdien vert endra på same lineære måte, og standardavviket aukar med faktoren a.

Summen av to normalfordelte variablar

Dersom $X\in N(\mu _{X},\sigma _{X})$ og $Y\in N(\mu _{Y},\sigma _{Y})$ så vil summen vere

X+Y\in N\left(\mu _{X}+\mu _{Y},{\sqrt {\sigma _{X}^{2}+\sigma _{Y}^{2}}}\right)

.

Differansar av normalfordelte variablar fungerer analogt.

Sentralgrenseteoremet

For meir om dette emnet, sjå sentralgrenseteoremet.

Sentralgrenseteoremet seier at summen av mange uavhengige, likt fordelte, stokastiske variablar med endeleg varians er tilnærma normalfordelt. Med matematisk notasjon: Dersom $X_{1}\ldots X_{n}\,$ er uavhengige stokastiske variablar med same forventningsverdi og varians, og $Y=\sum X_{k}$ så er $Y\,$ normalfordelt med forventningsverdi $n\cdot E(X)$ og varians $n\cdot V(X)$

Sjå òg

Kjelder

Denne artikkelen bygger på «Normalfordeling» frå Wikipedia på bokmål, den 16. september 2011.