Innehåll
- TL; DR (för lång; läste inte)
- Standardavvikelse kontra provavvikelse
- Hitta provets standardavvikelse
- Medelavvikelse jämfört med standardavvikelse
Statistiska tester som t-test är i sin tur beroende av begreppet standardavvikelse. Varje student i statistik eller naturvetenskap kommer att använda standardavvikelser regelbundet och måste förstå vad det betyder och hur man hittar det från en uppsättning data. Tack och lov är det enda du behöver originaldata, och även om beräkningarna kan vara tråkiga när du har mycket data, bör du i dessa fall använda funktioner eller kalkylbladdata för att göra det automatiskt. Men allt du behöver göra för att förstå nyckelbegreppet är att se ett grundläggande exempel som du enkelt kan träna ut för hand. I kärnan mäter provavvikelsen hur mycket mängden du har valt varierar mellan hela befolkningen baserat på ditt prov.
TL; DR (för lång; läste inte)
Använder sig av n att betyda provstorlek, μ för genomsnittet av uppgifterna, xjag för varje enskild datapunkt (från jag = 1 till jag = n) och Σ som ett summeringstecken, provvariansen (s2) är:
s2 = (Σ xjag – μ)2 / (n − 1)
Och standardavvikelsen är:
s = √s2
Standardavvikelse kontra provavvikelse
Statistik kretsar kring att göra uppskattningar för hela populationer baserade på mindre prover från befolkningen och redovisa eventuell osäkerhet i uppskattningen i processen. Standardavvikelser kvantifierar mängden variation i befolkningen du studerar. Om du försöker hitta medelhöjden får du ett resultatkluster runt medelvärdet (medelvärdet), och standardavvikelsen beskriver bredden på klustret och fördelningen av höjder över hela befolkningen.
Standardavvikelsen ”urvalet” uppskattar den verkliga standardavvikelsen för hela befolkningen baserat på ett litet urval från befolkningen. Merparten av tiden kommer du inte att kunna ta prov på hela befolkningen i fråga, så standardavvikelsen är ofta rätt version att använda.
Hitta provets standardavvikelse
Du behöver dina resultat och antalet (n) av personer i ditt prov. Beräkna först genomsnittet av resultaten (μ) genom att lägga till alla individuella resultat och sedan dela detta med antalet mätningar.
Som exempel är hjärtfrekvensen (i slag per minut) för fem män och fem kvinnor:
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
Vilket leder till ett medelvärde av:
μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10
= 702 ÷ 10 = 70.2
Nästa steg är att subtrahera medelvärdet från varje enskild mätning och sedan kvadratera resultatet. Som ett exempel för den första datapunkten:
(71 – 70.2)2 = 0.82 = 0.64
Och för det andra:
(83 – 70.2)2 = 12.82 = 163.84
Du fortsätter på detta sätt genom data och lägger sedan till dessa resultat. Så för exempeldata är summan av dessa värden:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
Nästa steg skiljer mellan provstandardavvikelsen och befolkningsstandardavvikelsen. För provavvikelsen delar du detta resultat med provstorleken minus ett (n -1). I vårt exempel, n = 10, så n – 1 = 9.
Detta resultat ger provvariansen, betecknad med s2, som för exemplet är:
s2 = 353.6 ÷ 9 = 39.289
Provets standardavvikelse (s) är bara den positiva kvadratroten för detta nummer:
s = √39.289 = 6.268
Om du beräknade befolkningsstandardavvikelsen (σ) den enda skillnaden är att du delar med n hellre än n −1.
Hela formeln för provstandardavvikelse kan uttryckas med summeringssymbolen Σ, med summan över hela provet, och xjag representerar i_th resultatet av _n. Provvariansen är:
s2 = (Σ xjag – μ)2 / (n − 1)
Och provavvikelsen är helt enkelt:
s = √s2
Medelavvikelse jämfört med standardavvikelse
Medelavvikelsen skiljer sig något från standardavvikelsen. Istället för att kvadratera skillnaderna mellan medelvärdet och varje värde tar du istället den absoluta skillnaden (ignorerar några minustecken) och hittar sedan medelvärdet för dessa. För exemplet i föregående avsnitt ger de första och andra datapunkterna (71 och 83):
x1 – μ = 71 – 70.2 = 0.8
x2 – μ = 83 – 70.2 = 12.8
Den tredje datapunkten ger ett negativt resultat
x3 – μ = 63 – 70.2 = −7.2
Men du tar bara bort minustecknet och tar det som 7.2.
Summan av alla dessa ger dividerat med n ger medelavvikelsen. I exemplet:
(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64
Detta skiljer sig väsentligt från standardavvikelsen som beräknats tidigare, eftersom det inte involverar rutor och rötter.