Innehåll
- TL; DR (för lång; läste inte)
- Skillnaden mellan konfidensnivå kontra förtroendesintervall
- Beräkna konfidensintervall eller nivåer för stora prov
- Beräkna konfidensintervall för små prover
Statistik handlar om att dra slutsatser inför osäkerheten. När du tar ett prov kan du inte vara helt säker på att ditt prov verkligen återspeglar den befolkning som det har tagits från. Statistiker hanterar denna osäkerhet genom att ta de faktorer som kan påverka uppskattningen, kvantifiera deras osäkerhet och utföra statistiska test för att dra slutsatser från dessa osäkra uppgifter.
Statistiker använder konfidensintervall för att specificera ett intervall värden som sannolikt innehåller den ”sanna” befolkningsmedlet på grundval av ett urval och uttrycker deras säkerhetsnivå i detta genom konfidensnivåer. Även om det inte ofta är användbart att beräkna konfidensnivåer, är det mycket användbart att beräkna konfidensintervall för en viss konfidensnivå.
TL; DR (för lång; läste inte)
Beräkna ett konfidensintervall för en viss konfidensnivå genom att multiplicera standardfelet med Z poäng för din valda säkerhetsnivå. Subtrahera detta resultat från ditt provmedelvärde för att få nedre gränsen och lägg till det i provmedlet för att hitta den övre gränsen. (Se resurser)
Upprepa samma process men med t poäng i stället för Z poäng för mindre prover (n < 30).
Hitta en konfidensnivå för en datamängd genom att ta hälften av storleken på konfidensintervallet, multiplicera den med kvadratroten för provstorleken och sedan dela med provets standardavvikelse. Slå upp det resulterande Z eller t poäng i en tabell för att hitta nivån.
Skillnaden mellan konfidensnivå kontra förtroendesintervall
När du ser en citerad statistik finns det ibland ett intervall som ges efter det med förkortningen "CI" (för "konfidensintervall") eller helt enkelt en plus-minus-symbol följt av en siffra. Till exempel, "medelvikt för en vuxen man är 180 pund (CI: 178,14 till 181,86)" eller "medelvikt för en vuxen hane är 180 ± 1,86 pund." Dessa båda berättar samma information: baserat på provet används, faller en mans medelvikt troligen inom ett visst intervall. Området i sig kallas förtroendesintervallet.
Om du vill vara så säker som möjligt på att intervallet innehåller det verkliga värdet kan du bredda intervallet. Detta skulle öka din "konfidensnivå" i uppskattningen, men intervallet skulle täcka fler potentiella vikter. De flesta statistik (inklusive den som anges ovan) ges som 95 procent konfidensintervall, vilket innebär att det finns 95 procent chans att det verkliga medelvärdet ligger inom intervallet. Du kan också använda en konfidensnivå på 99 procent eller en konfidensnivå på 90 procent, beroende på dina behov.
Beräkna konfidensintervall eller nivåer för stora prov
När du använder en konfidensnivå i statistik behöver du den vanligtvis för att beräkna ett konfidensintervall. Detta är lite lättare att göra om du har ett stort urval, till exempel över 30 personer, eftersom du kan använda Z poäng för din uppskattning snarare än mer komplicerad t betyg.
Ta dina rådata och beräkna provmedlet (lägg bara till de enskilda resultaten och dela med antalet resultat). Beräkna standardavvikelsen genom att subtrahera medelvärdet från varje enskilt resultat för att hitta skillnaden och kvadratera sedan denna skillnad. Lägg till alla dessa skillnader och dela sedan resultatet med provstorleken minus 1. Ta kvadratroten till detta resultat för att hitta provets standardavvikelse (Se resurser).
Bestäm konfidensintervallet genom att först hitta standardfelet:
SE = s / √n
Var s är ditt provstandardavvikelse och n är din provstorlek. Om du till exempel tog ett prov på 1 000 män för att räkna en mans medelvikt och fick ett standardavvikelse på 30, skulle detta ge:
SE = 30 / √1000 = 30 / 31.62 = 0.95
För att hitta konfidensintervallet härifrån, slå upp konfidensnivån du vill beräkna intervallet för i en Z-score tabell och multiplicera detta värde med Z Göra. För en 95-procentig konfidensnivå är Z-score är 1,96. Med exemplet betyder detta:
Medel ± Z × SE= 180 pund ± 1,96 × 0,95 = 180 ± 1,86 pund
Här är 1,86 pund 95 procent konfidensintervall.
Om du istället har denna information, tillsammans med provstorleken och standardavvikelsen, kan du beräkna konfidensnivån med följande formel:
Z = 0,5 × storleken på konfidensintervallet × √n / s
Storleken på konfidensintervallet är bara två gånger ± värdet, så i exemplet ovan vet vi 0,5 gånger detta är 1,86. Detta ger:
Z = 1.86 × √1000 / 30 = 1.96
Detta ger oss ett värde för Z, som du kan slå upp i en Z-score tabell för att hitta motsvarande konfidensnivå.
Beräkna konfidensintervall för små prover
För små prover finns det en liknande process för att beräkna konfidensintervallet. Dra först 1 från din provstorlek för att hitta dina "frihetsgrader." I symboler:
df = n −1
För ett prov n = 10, detta ger df = 9.
Hitta ditt alfavärde genom att subtrahera decimalversionen av konfidensnivån (dvs. din procentuella konfidensnivå dividerad med 100) från 1 och dela resultatet med 2 eller i symboler:
α = (1 - decimal konfidensnivå) / 2
Så för en 95 procent (0,95) konfidensnivå:
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
Slå upp ditt alfavärde och frihetsgrader i en (en svans) t distributionstabell och notera resultatet. Uteslut alternativt uppdelningen med 2 ovan och använd en två-svans t värde. I detta exempel är resultatet 2.262.
Liksom i föregående steg, beräkna konfidensintervallet genom att multiplicera detta nummer med standardfelet, som bestäms med hjälp av din provstandardavvikelse och provstorlek på samma sätt. Den enda skillnaden är den i stället för Z poäng, du använder t Göra.