Korrelationen mellan två variabler beskriver sannolikheten för att en förändring i en variabel kommer att orsaka en proportionell förändring i den andra variabeln. En hög korrelation mellan två variabler antyder att de delar en vanlig orsak eller att en förändring i en av variablerna är direkt ansvarig för en förändring i den andra variabeln. Pearsons r-värde används för att kvantifiera korrelationen mellan två diskreta variabler.
Märk den variabel som du tror orsakar förändringen av den andra variabeln som x (den oberoende variabeln) och den andra variabeln y (den beroende variabeln).
Konstruera en tabell med fem kolumner och så många rader som det finns datapunkter för x och y. Märk kolumnerna A till E från vänster till höger.
Fyll i varje rad med följande värden för varje (x, y) datapunkt i den första kolumnen - värdet på x i kolumn A, värdet på x kvadrat i kolumn B, värdet på y i kolumn C, värdet av y kvadrat i kolumn D och värdet x gånger y i kolumn E.
Gör en sista rad längst ner i tabellen och lägg summan av alla värden för varje kolumn i motsvarande cell.
Beräkna produkten från de slutliga cellerna i kolumn A och C.
Multiplicera den slutliga cellen i kolumn E med antalet datapunkter.
Dra bort det värde som erhållits i steg 5 från det värde som erhölls i steg 6 och understryka svaret.
Multiplicera den slutliga cellen i kolumn B med antalet datapunkter. Dra bort från detta värde kvadratet med värdet för den slutliga cellen i kolumn A.
Multiplicera den slutliga cellen i kolumn D med antalet datapunkter och subtrahera kvadratet med värdet på den slutliga cellen i kolumn C.
Multiplicera värdena som finns i steg 8 och 9 tillsammans och ta sedan kvadratroten till resultatet.
Dela upp det värde som erhölls i steg 7 (det bör betonas) med det värde som erhölls i steg 10. Detta är Pearsons r, även känd som korrelationskoefficienten. Om r är nära 1 finns det en stark positiv korrelation. Om r är nära -1 finns det en stark negativ korrelation. Om r är nära 0 finns det en svag korrelation.