Innehåll
I statistik är variansanalysen (ANOVA) ett sätt att analysera olika grupper av data tillsammans för att se om de är relaterade eller liknande. Ett viktigt test inom ANOVA är root mean square error (MSE). Denna kvantitet är ett sätt att uppskatta skillnaden mellan de värden som förutses av en statistisk modell och de uppmätta värdena från det faktiska systemet. Beräkning av rot-MSE kan göras i några enkla steg.
Summan av fyrkantiga fel (SSE)
Beräkna det totala medelvärdet för varje grupp av datamängder. Till exempel, säg att det finns två datagrupper, uppsättning A och uppsättning B, där uppsättning A innehåller siffrorna 1, 2 och 3 och uppsättning B innehåller siffrorna 4, 5 och 6. Medeltalet för uppsättning A är 2 (hittas av att lägga till 1, 2 och 3 tillsammans och dela med 3) och medelvärdet för uppsättning B är 5 (hittas genom att lägga till 4, 5 och 6 tillsammans och dela med 3).
Subtrahera medelvärdet för data från de enskilda datapunkterna och kvadrera det därav följande värdet. I datauppsättningen A till exempel ger subtraktion 1 med medelvärdet 2 ett värde -1. Att kvadratera detta nummer (det vill säga att multiplicera det med sig själv) ger 1. Att upprepa denna process för resten av data från uppsättning A ger 0 och 1, och för uppsättning B är siffrorna 1, 0 och 1 också .
Sammanfatta alla kvadratiska värden. Från föregående exempel ger summan av alla kvadratnumret siffran 4.
Beräkning av rot MSE i ANOVA
Hitta graderna av frihet för fel genom att subtrahera det totala antalet datapunkter med graden av frihet för behandling (antalet datamängder). I vårt exempel finns det sex totala datapunkter och två olika datauppsättningar, vilket ger 4 som grader av frihet för fel.
Dela summan av kvadratfelet med graden av frihet för fel. Att fortsätta exemplet och dela 4 med 4 ger 1. Detta är medelkvadratfelet (MSE).
Ta kvadratroten av MSE. Avsluta exemplet, kvadratroten av 1 är 1. Därför är roten MSE för ANOVA 1 i detta exempel.