Normalfordeling

Frå Wikipedia – det frie oppslagsverket
Gå til: navigering, søk
Normalfordeling

Normalfordeling eller ei gausskurve, er i matematikken (hovudsakleg i sannsynsteori og statistikk) den desidert viktigaste fordelinga. Ein normalfordelt variabel antek ofte verdien som ligg nær middelverdien, og sjeldan verdien som har stort avvik. Difor ser normalfordelinga ut som ei klokke (bjølle), og internasjonalt nyttar ein ofte nemninga bell curve.

Normalfordelinga er den desidert viktigaste fordelinga i statistikken. Dette hengjer saman med eit matematisk resultat som blir kalla sentralgrenseteoremet. Resultatet inneber at summen av ei stor mengd uavhengige tilfeldige variablar er tilnærma normalfordelt under visse allmenne føresetnader, uavhengig av kva for ei fordeling desse variablane hadde i utgangspunktet. Dette resulterer i at normalfordelingen dukkar opp fleire stader i naturen og samfunnet, og fleire hendingar kan med stor nøysemd skildrast av normalfordelinga.

Førekomst[endre | endre wikiteksten]

Årsaka til at normalfordelinga nyttast så mykje er sentralgrenseteoremet. I mellom anna naturvitskap, sosiologi og økonomi er det normalt at ein ikkje forstår korleis ein viss mekanisme fungerer, men ein kan teoretisk sett motivere til bruk av normalfordelingar sidan det ofte er slik at fenomen oppstår gjennom mange små, uavhengige, tilfeldige variasjonar.

IQ-testar lagast ofte med førehandstru om at intelligensen er normalfordelt. Ein IQ-test vil gje resultat som er normalfordelte med ein forventningsverdi på 100, ved å omskalere testresultata til ei normalfordeling. I kva grad intelligens verkeleg er normalfordelt er uvisst.

Døme – kaste mynt[endre | endre wikiteksten]

Dersom ein kastar ein mynt 100 gonger og kallar summen for X, så vil X vere binomisk fordelt. Men sidan kvart myntkast er uavhengig av alle dei øvrige kasta, vil X vere tilnærma normalfordelt med ein forventningsverdi på 50. Ofte er det mykje enklare å tenkje seg ei tilnærma verdi på ein tilfeldig variabel med ei normalfordeling enn å berekne eksakte sannsyn, og sidan mange tilfeldige fenomen er summar av veldig mange små, tilfeldige forskyvingar, fungerer det bra. Historisk sett var høvet til å tenkje seg tilnærma verdi på store binomiske fordelingar det første bruksområdet for normalfordelinga.

Definisjon[endre | endre wikiteksten]

Normalfordelinga har tettleiksfunksjonen:

Normalfordelinga for ulike verdiar av μ og σ²
f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{-{(x-\mu )^2 \over 2\sigma^2}},

der μ og σ er dei karakteristiske konstantane til normalfordelinga: μ er forventningsverdien, og σ er standardavviket til fordelinga. Denne normalfordelinga vert skriven som N(\mu,\sigma)\,.

Tettleiksfunksjonen til normalfordelinga kan ikkje integrerast med vanlege eindimensjonale metodar, sidan han ikkje har nokon antiderivert funksjon som kan uttrykkast analytisk. Området under kurven kan derimot ha ein verdi på 1 ved bruk av andre metodar, noko han må vere for å vere ordentleg sannsynsfordeling.

Ei standardisert normalfordeling har μ = 0 og σ = 1.

Fordelingsfunksjon for normalfordeling

Fordelingsfunksjonen for ein standardisert normalfordeling vert vanlegvis skriven med \Phi\, og samanhengen mellom fordelingsfunksjonen og tettleiksfunksjonen seier at:

\Phi(x) = \int_{-\infty}^x f(x) dx.

Fordelingsfunksjonen gjev sannsynet for at ein normalfordelt variabel Y er mindre eller lik eit visst tal x:

P(Y < x) = \Phi(x)\,.

Sannsynet for at ein normalfordelt variabel hamnar i eit intervall [a,b] er:

P(a < X < b) = \Phi(b) - \Phi(a)\,.

Eigenskapar[endre | endre wikiteksten]

Følgjande eigenskapar gjeld for normalfordelingar:

Fordelingsfunksjon[endre | endre wikiteksten]

Fordelingsfunksjonen for ein vilkårleg normalfordelt variabel X\in N(\mu,\sigma) kan lett utleiast frå fordelingsfunksjonen for ein standard-normalfordelt variabel:

P(X<a)=\Phi\left(\frac{a-\mu}{\sigma}\right).

Denne eigenskapen gjer at tabellar for normalfordelingar berre gjev oss fordelingsfunksjonen \Phi\,, sidan alle andre normalfordelingar på denne måten kan gjerast om til ein med forventningsverdi på 0 og standardavvik på 1.

Symmetri[endre | endre wikiteksten]

\Phi(x) = 1 - \Phi(-x)\,.

Denne symmetrien gjer at alle tabellar berre gjev oss \Phi(x)\, for positive tal x.

Lineær forandring[endre | endre wikiteksten]

Dersom X\in N(\mu,\sigma) og a,b\, er konstantar, er den lineære forma

aX + b \in N(a\mu+b,a\sigma),

det vil sei at forventningsverdien vert endra på same lineære måte, og standardavviket aukar med faktoren a.

Summen av to normalfordelte variablar[endre | endre wikiteksten]

Dersom X \in N(\mu_X, \sigma_X) og Y \in N(\mu_Y, \sigma_Y) så vil summen vere

X+Y \in N\left(\mu_X+\mu_Y, \sqrt{\sigma^2_X + \sigma^2_Y}\right).

Differansar av normalfordelte variablar fungerer analogt.

Sentralgrenseteoremet[endre | endre wikiteksten]

For meir om dette emnet, sjå sentralgrenseteoremet.

Sentralgrenseteoremet seier at summen av mange uavhengige, likt fordelte, stokastiske variablar med endeleg varians er tilnærma normalfordelt. Med matematisk notasjon: Dersom X_1\ldots X_n \, er uavhengige stokastiske variablar med same forventningsverdi og varians, og Y = \sum X_k så er Y\, normalfordelt med forventningsverdi n\cdot E(X) og varians n\cdot V(X)

Sjå òg[endre | endre wikiteksten]

Kjelder[endre | endre wikiteksten]