Korrelasjon

Frå Wikipedia – det frie oppslagsverket
Gå til: navigering, søk

Korrelasjon er i statistikk og sannsynsrekning eit mål på styrken og retninga på den lineære samvariasjonen mellom to variablar. Empirisk observert samvariasjon er ein naudsynt, men ikkje tilstrekkeleg, føresetnad for å avdekkje om det er kausalitet, det vil seie at ein variabel er årsak til ein annan.

Fire datasett som alle har korrelasjonen 0,81. (Dømet er henta frå Francis Anscombe)

Pearsons produkt-moment-korrelasjon[endre | endre wikiteksten]

Pearsons korrelasjonskoeffisient for produkt-moment (ofte referert til som korrelasjonskoeffisienten eller berre korrelasjonen) er eit mål på den linære korrelasjonen mellom to stokastiske variablar. Korrelasjonen mellom X og Y har ofte notasjonen \rho_{XY}. For to stokastiske variablar X og Y er korrelasjonen definert som

\operatorname{Corr}[X, Y] = \frac{\operatorname{Cov}[X, Y]}{\sqrt{\operatorname{Var}[X]\operatorname{Var}[Y]}}


der \operatorname{Cov}[\cdot] er kovarians og \operatorname{Var}[\cdot] er varians.


Denne korrelasjonskoeffisienten har alltid verdi mellom og ein og minus ein per definisjon. Dersom korrelasjonen mellom X og Y er lik 1, så er det ein perfekt, lineær korrelasjon mellom dei to. Med andre ord finst det to konstantar a og b slik at:


\operatorname{Corr}[X, Y] = 1 \quad \Leftrightarrow \quad Y = aX + b


Sjå òg[endre | endre wikiteksten]