Innehåll
Att hitta styrkan i sambandet mellan två variabler är en viktig färdighet för forskare av alla slag. Om två variabler är korrelerade med varandra, visar det att det finns en länk mellan dem. En positiv korrelation innebär att när en variabel ökar, den andra gör också, och en negativ korrelation betyder att när en variabel ökar minskar den andra. Korrelationer bevisar inte orsakssamband, även om det är möjligt att ytterligare test bevisar ett orsakssamband mellan variablerna. Korrelationskoefficienten R visar styrkan i förhållandet mellan de två variablerna och om det är en positiv eller negativ korrelation.
TL; DR (för lång; läste inte)
Ring en variabel x och en variabel y. Beräkna värdet på R med formeln:
R = ÷ √ {}
Var n är din provstorlek.
Gör en tabell över dina data. Detta bör innehålla en kolumn för deltagarnumret, en kolumn för den första variabeln (märkt x) och en kolumn för den andra variabeln (märkt y). Om du till exempel vill se om det finns ett samband mellan höjd och skostorlek, skulle en kolumn identifiera varje person du mäter, en kolumn skulle visa varje persons höjd och en annan skulle visa sin skostorlek. Skapa ytterligare tre kolumner, en för xy, en för x2 och en för y2.
Använd dina data för att fylla i de tre ytterligare kolumnerna. Föreställ dig till exempel att din första person är 75 tum lång och har storlek 12 fot. De x (höjd) kolumnen skulle visa 75, och y (skostorlek) kolumnen skulle visa 12. Du måste hitta xy, x2 och y2. Så med hjälp av detta exempel:
xy = 75 × 12 = 900
x2 = 752 = 5,625
y2 = 122 = 144
Slutför dessa beräkningar för varje person som du har data för.
Skapa en ny rad längst ner i tabellen för summan av varje kolumn. Lägg till alla x värden, alla y värden, alla xy värden, alla x2 värden och alla y2 värden och lägg sedan resultaten längst ner i motsvarande kolumn i din nya rad. Du kan märka din nya rad "summa" eller använda en sigma (Σ) symbol.
Du hittar R från dina data med formeln:
R = ÷ √ {}
Det här ser lite skrämmande ut, så att du kan dela upp det i två delar, som vi kommer att kalla s och t.
s = n (Σxy) - (Σx) (Σy)
t = √ {}
I dessa ekvationer n är antalet deltagare du har (din provstorlek). Resten av ekvationsdelarna är de summor du beräknade i det sista steget. Så för smultiplicera storleken på ditt prov med summan av xy kolumnen och dra sedan summan av x kolumn multiplicerad med summan av y kolumn från detta.
För t, det finns fyra huvudsteg. Beräkna först n multiplicerat med summan av din x2 kolumnen och dra sedan summan av din x kolumn kvadrat (multiplicerat med sig själv) från detta värde. För det andra, gör exakt samma sak men med summan av y2 kolumnen och summan av y kolumn kvadrat i stället för x delar (dvs n × Σy2 -). För det tredje multiplicerar du dessa två resultat (för xs och ys) tillsammans. För det fjärde, ta kvadratroten av detta svar.
Om du har arbetat i delar kan du beräkna R så enkelt R = s ÷ t. Du får ett svar mellan −1 och 1. Ett positivt svar visar en positiv korrelation, där allt över 0,7 i allmänhet betraktas som en stark relation. Ett negativt svar visar en negativ korrelation, med allt över -0,7 som en stark negativ relation. På liknande sätt betraktas ± 0,5 som ett måttligt förhållande och ± 0,3 betraktas som ett svagt förhållande. Allt nära 0 visar brist på korrelation.