Variansanalyse
Variansanalyse (ANOVA, frå det engelske «analysis of variance») er eit fellesomgrep for ei rekkje statistiske metodar for å teste likskap mellom to eller fleire utval, der éin eller fleire faktorar gjer seg gjeldande. Variansanalyse er i dei enkle tilfella eit alternativ til Z/t-testane for å samanlikne gjennomsnitt i populasjonar.
Dei to grunnleggjande formene for variansanalyse skildrast gjerne som 'einvegs' og 'tovegs' variansanalyse. I einvegs tilfellet undersøkingar ein berre éin eigenskap som varierer mellom gruppene, i tovegstilfellet undersøkjer ein òg variasjonar innover i gruppene.
Innhaldsliste |
Variansanalyse med éin faktor [endre]
Det enklaste tilfellet for variansanalyse er tilfellet der ein har
grupper med like storleikar
, og ønskjer å samanlikne gjennomsnitta til gruppene. Han nyttar gjerne der ein ønskjer å samanlikne skilnader i respons på forskjellige handsamingar (treatments) i forskjellige grupper.
Hypotesen ein testar er for ei mengd populasjonar[1] 

minst to av gruppene er forskjellige.
Føresetnadene for testen er at alle observasjonane er uavhengige normalfordelte tilfeldige variable med lik varians.
Kvadratavvik og varians [endre]
Dei fundamentale storleikane i variansanalysen er kvadratavvik totalt (SST), mellom individ og gruppe (SSE) og mellom gruppe og totalt gjennomsnitt (SSTr). Desse er definert ved[2]



Samanhengen mellom desse gjev opphav til den fundamentale ANOVA-identiteten SST = SSTr + SSE.[3] Videre har vi at[4]


Dette gjev opphavet til det ein kallar ein ANOVA-tabell:[5]
| Variasjonskjelde | Fridomsgrader | Kvadratavvik | Varians | f-verdi |
|---|---|---|---|---|
| Grupper | I - 1 | SSTr | MSTr = SSTr/(I - 1) | MSTr/MSE |
| Feil | I(J - 1) | SSE | MSE = SSE/[I(J - 1)] | |
| Total | IJ - 1 | SST |
Test av nullhypotesen [endre]
For å teste nullhypotesen, brukar ein ofte ein f-test. Testobservatoren er gjeven ved[4]

som ein reknar har ein
-fordeling. Forkastingsområdet for
er
for ønska signifikansnivå 
Tukeys prosedyre [endre]
F-testen er eit godt utgangspunkt for å samanlikne gjennomsnitta i fleire populasjonar, men han gjev ikkje svar på kva av populasjonane som er signifikant ulike kvarandre. Tukeys prosedyre nyttar ei Q-fordeling til å rekne ut kva intervall gjennomsnitta i populasjonen kan ligge i for å vere signifikant like kvarandre. For eit signifikansnivå
definerer vi
som

Dei gjennomsnitta som har større differanse enn
vert rekna å vere signifikant ulike, med signifikansnivå
[6]
Relasjon til t-testen [endre]
For tilfellet med to populasjonar, vil variansanalyse og ein alminneleg t-test gje same resultat for hypotesen
mot
. T-testen er meir fleksibel, då ein og kan teste om eit gjennomsnitt er større enn, eller mindre enn eit anna.
For
kan ein i prinsippet òg utføre t-testar for alle kombinasjonar av grupper, men dette vil gje større sannsyn for type 1-feil.[7]
Kjelder [endre]
- Denne artikkelen bygger på «Variansanalyse» frå Wikipedia på bokmål, den 12. september 2011.
- Wikipedia på bokmål oppgav desse kjeldene:
- Jay L. Devore and Kenneth N. Berk: Modern Mathematical Statistics with Applications. Thomson 2007.

minst to av gruppene er forskjellige.