Fördelarna och nackdelarna med en multipel regressionsmodell

Posted on
Författare: Laura McKinney
Skapelsedatum: 9 April 2021
Uppdatera Datum: 17 November 2024
Anonim
Fördelarna och nackdelarna med en multipel regressionsmodell - Vetenskap
Fördelarna och nackdelarna med en multipel regressionsmodell - Vetenskap

Innehåll

Multipel regression används för att undersöka förhållandet mellan flera oberoende variabler och en beroende variabel. Medan flera regressionsmodeller tillåter dig att analysera den relativa påverkan av dessa oberoende, eller förutsägare, variabler på beroende eller kriterium, variabel, kan dessa ofta komplexa datamängder leda till falska slutsatser om de inte analyseras korrekt.

Exempel på multipel regression

En fastighetsmäklare kan använda flera regressioner för att analysera värdet på hus. Till exempel kunde hon använda som oberoende variabler husens storlek, deras åldrar, antalet sovrum, det genomsnittliga hempriset i grannskapet och närheten till skolor. Plottning av dessa i en multipel regressionsmodell, hon kunde sedan använda dessa faktorer för att se deras förhållande till priserna på husen som kriteriumvariabel.

Ett annat exempel på att använda en multipel regressionsmodell kan vara någon i mänskliga resurser som bestämmer lönen för ledande befattningar - kriteriets variabel. Prediktorvariablerna kan vara varje chefs senioritet, det genomsnittliga antalet arbetade timmar, antalet personer som hanteras och chefens avdelningsbudget.

Fördelar med multipel regression

Det finns två huvudfördelar med att analysera data med hjälp av en multipel regressionsmodell. Den första är förmågan att bestämma det relativa påverkan av en eller flera prediktorvariabler till kriterievärdet. Fastighetsmäklaren kunde upptäcka att storleken på bostäderna och antalet sovrum har en stark korrelation till priset på ett hem, medan närheten till skolor inte har någon korrelation alls, eller till och med en negativ korrelation om det främst är en pension gemenskap.

Den andra fördelen är förmågan att identifiera outliers eller avvikelser. Till exempel, medan man granskade uppgifterna relaterade till ledarlöner, kunde personalchefen konstatera att antalet arbetade timmar, avdelningsstorleken och dess budget alla hade en stark korrelation till löner, medan senioriteten inte gjorde det. Alternativt kan det vara så att alla listade prediktorvärden korrelerades med var och en av de löner som undersöktes, med undantag för en chef som betalades för högt jämfört med de andra.

Nackdelar med multipel regression

Varje nackdel med att använda en multipel regressionsmodell kommer vanligtvis ner på de data som används. Två exempel på detta använder ofullständiga data och drar falskt slutsatsen att en korrelation är en orsakssamband.

När man till exempel granskar priset på bostäder, antar att fastighetsmäklaren bara tittade på 10 bostäder, varav sju köptes av unga föräldrar. I det här fallet kan förhållandet mellan skolans närhet leda till att hon tror att detta påverkade försäljningspriset för alla bostäder som säljs i samhället. Detta illustrerar fallgroparna med ofullständiga data. Hade hon använt ett större prov, kunde hon ha upptäckt att endast 100 procent av hemvärdena var relaterade till skolans närhet av 100 sålda bostäder. Om hon hade använt köparnas åldrar som ett prediktorvärde, kunde hon ha upptäckt att yngre köpare var villiga att betala mer för hem i samhället än äldre köpare.

I exemplet med ledarlöner, anta att det fanns en utökare som hade en mindre budget, mindre anställning och med färre personal att hantera men som gjorde mer än någon annan. HR-chefen kunde titta på uppgifterna och dra slutsatsen att den här personen betalas för mycket. Denna slutsats skulle emellertid vara felaktig om han inte tog hänsyn till att denna chef var ansvarig för företagets webbplats och hade en mycket eftertraktad skillset i nätverkssäkerhet.