Hur man Chi-Square Test

Posted on
Författare: Judy Howell
Skapelsedatum: 4 Juli 2021
Uppdatera Datum: 14 November 2024
Anonim
Chi Square Test
Video: Chi Square Test

Innehåll

Experiment testar förutsägelser. Dessa förutsägelser är ofta numeriska, vilket innebär att när forskare samlar in data förväntar de sig att siffrorna kommer att brytas ner på ett visst sätt. Verkliga data matchar sällan exakt de förutsägelser som forskare gör, så forskare behöver ett test för att berätta för dem om skillnaden mellan observerade och förväntade siffror beror på slumpmässig chans, eller på grund av någon oförutsedd faktor som kommer att tvinga forskaren att justera den underliggande teorin . Ett chi-square-test är ett statistiskt verktyg som forskare använder för detta ändamål.

Typ av data som krävs

Du behöver kategoriska data för att använda ett chi-square-test. Ett exempel på kategoriska data är antalet personer som svarade på en fråga "ja" jämfört med antalet personer som svarade på frågan "nej" (två kategorier) eller antalet grodor i en befolkning som är grön, gul eller grå ( tre kategorier). Du kan inte använda ett chi-square-test på kontinuerliga data, till exempel som kan samlas in från en undersökning som frågar människor hur höga de är. Från en sådan undersökning skulle du få ett brett spektrum av höjder. Men om du delade höjderna i kategorier som "under 6 fot lång" och "6 fot höga och över", kan du använda ett chi-square-test på data.

Testet av godhet

Ett godhet-av-fit-test är ett vanligt och kanske det enklaste testet som utförs med chi-square-statistiken. I ett test av god passform gör forskaren en specifik förutsägelse om de siffror hon förväntar sig att se i varje kategori av hennes data. Hon samlar sedan in verkliga data - kallade observerade data - och använder chi-square-testet för att se om de observerade data matchar hennes förväntningar.

Föreställ dig till exempel att en biolog studerar arvsmönstren hos en groda. Bland 100 avkommor till en uppsättning grodaföräldrar leder biologens genetiska modell till att hon förväntar sig 25 gula avkommor, 50 gröna avkommor och 25 gråa avkommor. Vad hon faktiskt observerar är 20 gula avkommor, 52 gröna avkommor och 28 gråa avkommor. Stöds hennes förutsägelse eller är hennes genetiska modell felaktig? Hon kan använda ett chi-square test för att ta reda på det.

Beräkning av Chi-Square-statistiken

Börja beräkna chi-kvadratstatistiken genom att subtrahera varje förväntat värde från dess motsvarande observerade värde och kvadratera varje resultat. Beräkningen för exemplet på grodafädet skulle se ut så här:

gul = (20 - 25) ^ 2 = 25 grön = (52 - 50) ^ 2 = 4 grå = (28 - 25) ^ 2 = 9

Dela nu varje resultat med motsvarande förväntat värde.

gul = 25 ÷ 25 = 1 grön = 4 ÷ 50 = 0,08 grå = 9 ÷ 25 = 0,36

Slutligen lägger du samman svaren från föregående steg.

Chi-kvadrat = 1 + 0,08 + 0,36 = 1,44

Tolkning av Chi-Square-statistiken

Chi-square-statistiken berättar hur olika dina observerade värden var från dina förutspådda värden. Ju högre antal, desto större skillnad. Du kan avgöra om ditt chi-kvadratvärde är för högt eller lågt nog för att stödja din förutsägelse genom att se om det är under ett visst kritiskt värde på ett chi-square distributionstabell. Denna tabell matchar chi-kvadratvärden med sannolikheter p-värden. I tabellen beskrivs specifikt sannolikheten för att skillnaderna mellan dina observerade och förväntade värden helt enkelt beror på slumpmässiga chanser eller om någon annan faktor är närvarande. Om ett p-värde är 0,05 eller mindre, måste du avvisa din förutsägelse för ett test av godhet.

Du måste bestämma grader av frihet (df) i dina data innan du kan slå upp det kritiska chi-kvadratvärdet i en distributionstabell. Frihetsgrader beräknas genom att subtrahera 1 från antalet kategorier i dina data. Det finns tre kategorier i det här exemplet, så det finns 2 frihetsgrader. En titt på detta chi-square distributionstabell berättar att det kritiska värdet för en 0,05-sannolikhet för 2 grader av frihet är 5,99. Detta betyder att så länge ditt beräknade chi-kvadratvärde är mindre än 5,99 är dina förväntade värden, och därmed den underliggande teorin, giltiga och stöds. Eftersom den chi-kvadratiska statistiken för grodan avkomman uppgifter var 1,44, kan biologen acceptera hennes genetiska modell.