Innehåll
När du anpassar en rak linje till en uppsättning data kan du vara intresserad av att bestämma hur bra den resulterande raden passar uppgifterna. Ett sätt att göra detta är att beräkna summan av kvadratfelet (SSE). Detta värde ger ett mått på hur väl linjen med bästa passning närmar sig datamängden. SSE är ett viktigt för analys av experimentella data och bestäms endast genom några korta steg.
Hitta en rad som passar bäst för att modellera data med regression. Linjen med bästa passform har formen y = ax + b, där a och b är parametrar som du behöver bestämma. Du kan hitta dessa parametrar med hjälp av en enkel linjär regressionsanalys. Antag till exempel att linjen med bästa passform har formen y = 0,8x + 7.
Använd ekvationen för att bestämma värdet på varje y-värde som förutses av raden med bästa passning. Du kan göra detta genom att ersätta varje x-värde i ekvationen på linjen. Till exempel, om x är lika med 1, att ersätta den i ekvationen y = 0,8x + 7 ger 7,8 för y-värdet.
Bestäm medelvärdet för de värden som förutses från raden för bäst passande ekvation. Du kan göra detta genom att summera alla y-värden som förutses från ekvationerna och dela det resulterande antalet med antalet värden. Om värdena till exempel är 7,8, 8,6 och 9,4 ger summan av dessa värden 25,8 och att dela detta antal med antalet värden, 3 i detta fall ger 8,6.
Dra bort var och en av de enskilda värdena från medelvärdet och kvadrera det resulterande antalet. I vårt exempel, om vi subtraherar värdet 7,8 från medelvärdet 8,6, är det resulterande antalet 0,8. Att kvadratera detta värde ger 0,64.
Sammanfatta alla kvadratvärden från steg 4. Om du tillämpar instruktionerna i steg 4 på alla tre värden i vårt exempel hittar du värden 0,64, 0 och 0,64. Sammanfattning av dessa värden ger 1,28. Detta är summan av kvadratfelet.