Innehåll
En provstorlek är en liten procentandel av en population som används för statistisk analys. Till exempel, när man räknar ut hur många som skulle rösta för en viss person i ett val, är det inte möjligt (antingen ekonomiskt eller logistiskt) att fråga varje person i USA om deras röster. Istället tas ett litet urval av befolkningen. Provstorleken kan vara lika med några hundra eller så kan den vara lika med några tusen. Det beror helt på vilka egenskaper du vill att befolkningsutvalet ska ha och hur exakt du vill att dina resultat ska vara.
Låg provtagningsfel
Varje gång du undersöker ett urval av en befolkning (i motsats till att fråga alla) kommer du att få lite statistik som skiljer sig lite från den "sanna" statistiken. Detta kallas samplingsfel och uttrycks ofta som procentenheter. En undersökning kan till exempel vara plus eller minus "tio poäng." Med andra ord, om en pollster finner att 55 procent av människorna kommer att rösta för en viss kandidat, plus eller minus tio poäng, säger de verkligen att någonstans mellan 45 och 65 procent kommer att rösta för den kandidaten. Ett bra prov har ett lågt samplingsfel (en punkt eller två).
Hög konfidensnivå
Konfidensnivån är baserad på teorin att ju oftare du provar en population, desto mer liknar data en klockkurva. Konfidensnivåer uttrycks i procent, till exempel en "90 procent konfidensnivå." Ju högre konfidensnivå, desto säkrare är en forskare att hans data ser ut som en klockkurva: en konfidensnivå på 99 procent är önskvärd och sannolikt har bättre resultat än 90 procent (eller lägre) konfidensnivå.
Variabilitetsgrad
Graden av variation beror på hur mångfaldig en befolkning är. Till exempel kommer en undersökning av alla politiska partier om hälso-och sjukvård sannolikt att leda till en mer omfattande variation i svar än en enkel enkät av ett enda parti. Ju högre den angivna andelen, desto större varierbarhetsnivå, med .5 är det högsta (och eventuellt minst önskvärda) värdet. För mindre prover vill du se en låg grad av variation (till exempel .2).