Innehåll
- Slumpmässigt urval
- Precision
- Förtroendeintervaller
- Standard fel
- Svårighet att använda större provstorlekar
Provstorlek representerar antalet observationer som gjorts för att utföra en statistisk analys. Provstorlekar kan bestå av människor, djur, matpartier, maskiner, batterier eller vilken population som helst som utvärderas.
Slumpmässigt urval
Slumpmässig provtagning är en metod genom vilken slumpmässiga prover samlas in från en population för att uppskatta information om populationen utan att vara partisk. Om du till exempel vill veta vilken typ av människor som bor i en viss stad måste du intervjua / mäta olika människor slumpmässigt. Men om du bara använde alla från biblioteket, skulle du inte ha en rättvis / obestämd uppskattning av hur den allmänna befolkningen som ockuperar staden är, bara de människor som går till biblioteket.
Precision
När provstorlekarna ökar blir uppskattningarna mer exakta. Till exempel, om vi slumpmässigt valde ut 10 manliga vuxna människor, kan vi finna att deras genomsnittliga höjd är 6 fot och 3 tum hög, kanske för att det finns en basketspelare som blåser upp vår uppskattning. Om vi emellertid mätte två miljoner vuxna manliga människor, skulle vi ha en bättre förutsägare för medelhöjden hos män eftersom extremerna skulle balansera ut och det verkliga genomsnittet skulle överskugga eventuella avvikelser från medelvärdet.
Förtroendeintervaller
När en statistiker gör en förutsägelse om ett resultat kommer han ofta att bygga ett intervall runt sin uppskattning. Om vi till exempel mätte vikten på 100 kvinnor, kan vi säga att vi är 90 procent säkra på att den verkliga, genomsnittliga vikten för kvinnor ligger i intervallet 103 till 129 pund. (Detta beror naturligtvis också på andra faktorer som variation i mätningarna.) När provstorleken ökar blir vi mer säkra på vår uppskattning och våra intervaller blir mindre. Med en miljon kvinnor kan vi till exempel säga att vi är 98 procent säkra på att den verkliga genomsnittliga vikten för kvinnor är mellan 115 och 117 pund. Med andra ord, när provstorleken ökar, ökar vårt förtroende för våra mätningar och storleken på våra konfidensintervall minskar.
Standard fel
Variation är ett mått på spridningen av data runt medelvärdet. Standardavvikelse är kvadratroten av variation och hjälper till att ungefär vilken procentandel av befolkningen som faller mellan ett intervall av värden relativt medelvärdet. När provstorleken ökar minskar standardfelet, som beror på standardavvikelsen och provstorleken. Följaktligen ökar uppskattningarna i precision och forskning som bygger på dessa uppskattningar anses vara mer pålitlig (med mindre risk för fel).
Svårighet att använda större provstorlekar
Större provstorlekar ger uppenbarligen bättre och mer exakta uppskattningar om populationer, men det finns flera problem med forskare som använder större provstorlekar. Först och främst kan det vara svårt att hitta ett slumpmässigt urval av människor som är villiga att prova ett nytt läkemedel. När du gör det blir det dyrare att tillhandahålla läkemedlet till fler människor och att övervaka fler människor över tid. Dessutom kräver det mer ansträngning att få och bibehålla en större provstorlek. Även om större provstorlekar ger mer exakt statistik behövs inte alltid extrakostnad och ansträngning eftersom mindre provstorlekar också kan ge betydande resultat.