I statistik leder slumpmässigt sampling av data från en population ofta till att en klockformad kurva produceras med medelvärdet centrerat på klockans topp. Detta är känt som en normalfördelning. Den centrala gränssatsen säger att när antalet prover ökar, tenderar det uppmätta medelvärdet att normalt fördelas runt populationsmedlet och standardavvikelsen blir smalare. Den centrala gränssatsen kan användas för att uppskatta sannolikheten för att hitta ett visst värde inom en population.
Samla prover och bestäm sedan medelvärdet. Antag till exempel att du vill beräkna sannolikheten för att en man i USA har en kolesterolnivå på 230 milligram per deciliter eller högre. Vi skulle börja med att samla in prover från 25 individer och mäta deras kolesterolnivåer. När du har samlat in data beräknar du provets medelvärde. Medlet erhålls genom att summera varje uppmätt värde och dela med det totala antalet sampel. Antag i detta exempel att medelvärdet är 211 milligram per deciliter.
Beräkna standardavvikelsen, som är ett mått på data "spridning". Detta kan göras i några enkla steg:
Antag i detta exempel att standardavvikelsen är 46 milligram per deciliter.
Beräkna standardfelet genom att dela standardavvikelsen med kvadratroten av det totala provantalet:
Standardfel = 46 / sqrt25 = 9.2
Rita en skiss av normalfördelningen och skuggan med lämplig sannolikhet. Efter exemplet vill du veta sannolikheten för att en hane har en kolesterolnivå på 230 milligram per deciliter eller högre. För att hitta sannolikheten, ta reda på hur många standardfel bort från det genomsnittliga 230 milligramet per deciliter är (Z-värde):
Z = 230 - 211 / 9,2 = 2,07
Slå upp sannolikheten för att erhålla standardvärden 2,07 över genomsnittet. Om du behöver hitta sannolikheten för att hitta ett värde inom 2,07 standardavvikelser från medelvärdet, är z positivt. Om du behöver hitta sannolikheten för att hitta ett värde utöver 2,07 standardavvikelser för medelvärdet är z negativt.
Slå upp z-värdet på en vanlig normal sannolikhetstabell. Den första kolumnen på vänster sida visar hela siffran och första decimal för z-värdet. Raden längst upp visar z-värdet tredje decimal. I enlighet med exemplet, eftersom vårt z-värde är -2,07, letar du först -2,0 i den vänstra kolumnen och skannar sedan den översta raden för posten 0,07. Den punkt där dessa kolumner och rader korsar var sannolikheten. I detta fall är värdet avläst av tabellen 0,0192 och därför är sannolikheten för att hitta en hane som har en kolesterolnivå på 230 milligram per deciliter eller högre 1,92 procent.