Hur man beräknar interkvartilintervallet

Posted on
Författare: Monica Porter
Skapelsedatum: 22 Mars 2021
Uppdatera Datum: 19 November 2024
Anonim
Hur man beräknar interkvartilintervallet - Vetenskap
Hur man beräknar interkvartilintervallet - Vetenskap

Innehåll

Interkvartilintervallet, ofta förkortat som IQR, representerar intervallet från den 25: e percentilen till den 75: e percentilen, eller den mittersta 50 procenten, av en given datauppsättning. Interkvartilintervallet kan användas för att bestämma vad det genomsnittliga prestationsområdet för ett test skulle vara: du kan använda det för att se var de flesta poängsättningar på ett visst test faller eller för att avgöra hur mycket pengar den genomsnittliga anställden i ett företag tjänar varje månad . Interkvartilintervallet kan vara ett mer effektivt verktyg för dataanalys än medelvärdet eller medianen för en datauppsättning, eftersom det låter dig identifiera spridningsområdet snarare än bara ett enda nummer.

TL; DR (för lång; läste inte)

Interkvartilområdet (IQR) representerar de mittersta 50 procenten av en datamängd. För att beräkna det, beställ först dina datapunkter från minst till störst, bestäm sedan dina första och tredje kvartilpositioner med hjälp av formlerna (N + 1) / 4 och 3 * (N + 1) / 4, där N är numret av punkter i datauppsättningen. Slutligen, subtrahera den första kvartilen från den tredje kvartilen för att bestämma interkvartilområdet för datamängden.

Beställ datapoäng

Beräkning av interkvartilt intervall är en enkel uppgift, men innan du beräknar måste du ordna de olika punkterna i din datauppsättning. För att göra detta börjar du med att beställa dina datapunkter från minst till största. Om dina datapunkter till exempel var 10, 19, 8, 4, 9, 12, 15, 11 och 20, skulle du ordna dem så här: {4, 8, 9, 10, 11, 12, 15, 19, 20}. När dina datapunkter har beställts så här kan du gå vidare till nästa steg.

Bestäm den första kvartilpositionen

Därefter bestämmer du positionen för den första kvartilen med följande formel: (N + 1) / 4, där N är antalet punkter i datauppsättningen. Om den första kvartilen faller mellan två siffror, tar du genomsnittet av de två siffrorna som din första kvartil-poäng. I exemplet ovan, eftersom det finns nio datapunkter, skulle du lägga till 1 till 9 för att få 10 och sedan dela med 4 för att få 2,5. Eftersom den första kvartilen faller mellan det andra och det tredje värdet, skulle du ta genomsnittet 8 och 9 för att få en första kvartilposition på 8,5.

Bestäm tredje kvartilpositionen

När du har bestämt din första kvartil ska du bestämma positionen för den tredje kvartilen med följande formel: 3 * (N + 1) / 4 där N igen är antalet poäng i datauppsättningen. På samma sätt, om den tredje kvartilen faller mellan två siffror, tar du bara genomsnittet som du skulle göra när du beräknar den första kvartilpoängen. I exemplet ovan, eftersom det finns nio datapunkter, skulle du lägga till 1 till 9 för att få 10, multiplicera med 3 för att få 30 och sedan dela med 4 för att få 7,5. Eftersom den första kvartilen faller mellan det sjunde och åttonde värdet, skulle du ta genomsnittet 15 och 19 för att få en tredje kvartilpoäng på 17.

Beräkna Interquartile Range

När du har bestämt dina första och tredje kvartiler beräknar du interquartile-intervallet genom att subtrahera värdet på den första kvartilen från värdet på den tredje kvartilen. För att avsluta exemplet som använts under denna artikel, skulle du subtrahera 8.5 från 17 för att upptäcka att det interkvartila intervallet för datamängden är lika med 8.5.

Fördelar och nackdelar med IQR

Interkvartilområdet har en fördel med att kunna identifiera och eliminera utskott i båda ändar av en datamängd. IQR är också ett bra mått på variation i fall av skev datadistribution, och denna metod för att beräkna IQR kan fungera för grupperade datauppsättningar, så länge du använder en kumulativ frekvensfördelning för att organisera dina datapunkter. Interkvartilintervallformeln för grupperade data är densamma som för icke-grupperade data, där IQR är lika med värdet på den första kvartilen subtraheras från värdet på den tredje kvartilen. Men det har flera nackdelar jämfört med standardavvikelse: mindre känslighet för några extrema poäng och en provtagningsstabilitet som inte är lika stark som standardavvikelse.