Innehåll
Chi-kvadrat, mer korrekt känt som Pearsons chi-square test, är ett sätt att statistiskt utvärdera data. Det används när kategoriska data från ett urval jämförs med förväntade eller "riktiga" resultat. Om vi till exempel tror att 50 procent av alla gelébönor i en papperskorg är röda, bör ett prov på 100 bönor från denna bin innehålla cirka 50 som är röda. Om vårt antal skiljer sig från 50 berättar Pearsons-testet om vårt 50-procentiga antagande är misstänkt, eller om vi kan tillskriva skillnaden vi såg till normal slumpmässig variation.
Tolkning av Chi-Square-värden
Bestäm graderna av frihet för ditt chi-kvadratvärde. Om du jämför resultat för ett enda prov med flera kategorier, är frihetsgraderna antalet kategorier minus 1. Om du till exempel utvärderade fördelningen av färger i en burk med jellybeans och det fanns fyra färger, graderna av frihet skulle vara 3. Om du jämför tabelluppgifter är frihetsgraderna lika med antalet rader minus 1 multiplicerat med antalet kolumner minus 1.
Bestäm det kritiska p-värde som du kommer att använda för att utvärdera dina data. Detta är den procentuella sannolikheten (dividerad med 100) att ett specifikt chi-kvadratvärde erhölls enbart genom en slump. Ett annat sätt att tänka på p är att det är sannolikheten att dina observerade resultat avviker från de förväntade resultaten med det belopp som de gjorde enbart på grund av slumpmässig variation i samplingsprocessen.
Slå upp p-värdet som är associerat med din chi-kvadrat-teststatistik med hjälp av chi-kvadratfördelningstabellen. För att göra detta, titta längs raden som motsvarar dina beräknade grader av frihet. Hitta värdet i den här raden närmast din teststatistik. Följ kolumnen som innehåller det värdet uppåt till den översta raden och läs av p-värdet. Om din teststatistik ligger mellan två värden i den första raden, kan du avläsa ett ungefärligt p-värde mellan två p-värden i den översta raden.
Jämför p-värdet som erhållits från tabellen med det kritiska p-värde som tidigare beslutats. Om ditt tabell p-värde är över det kritiska värdet kommer du att dra slutsatsen att alla avvikelser mellan provkategorivärden och de förväntade värdena berodde på slumpmässig variation och inte var signifikant. Om du till exempel valde ett kritiskt p-värde på 0,05 (eller 5%) och hittade ett tabellvärde på 0,20, skulle du dra slutsatsen att det inte fanns någon signifikant variation.