Innehåll
- Snabb datavisualisering
- Visualisera relativ överflöd
- Komplexa datauppsättningar kan behöva klassas i intervaller
- Frekvensstabeller kan dölja skev och kurtos
Frekvensstabeller kan vara användbara för att beskriva antalet händelser av en viss typ av datum i ett datasæt. Frekvenstabeller, även kallad frekvensfördelning, är ett av de mest grundläggande verktygen för att visa beskrivande statistik. Frekvensstabeller används i stor utsträckning som en snabböversikt i distributionen av data; de är lätta att tolka och de kan visa stora datamängder på ett ganska kortfattat sätt. Frekvensstabeller kan hjälpa till att identifiera uppenbara trender inom en datauppsättning och kan användas för att jämföra data mellan datauppsättningar av samma typ. Frekvensstabeller är dock inte lämpliga för varje applikation. De kan dölja extrema värden (mer än X eller mindre än Y), och de lämpar sig inte för analyser av dataens skev och kurtos.
Snabb datavisualisering
Frekvensstabeller kan snabbt avslöja överträdare och till och med betydande trender inom en datauppsättning med inte mycket mer än en kortvarig inspektion. Till exempel kan en lärare visa elevernas betyg för en halvperiod på ett frekvensbord för att få en snabb titt på hur hennes klass går övergripande. Siffran i frekvenskolumnen skulle representera antalet elever som får det betyget; för en klass på 25 elever kan frekvensfördelningen av mottagna brevbetyg se ut så här: Betygsfrekvens A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Visualisera relativ överflöd
Frekvensstabeller kan hjälpa forskare att undersöka det relativa överflödet av varje speciell måldata i sitt prov. Relativ överflöd representerar hur mycket av datauppsättningen som består av måldata. Relativ överflöd representeras ofta som ett frekvenshistogram, men kan enkelt visas i en frekvenstabell. Tänk på samma frekvensfördelning för halvtidsgrader. Relativ överflöd är helt enkelt andelen elever som fick ett visst betyg och kan vara till hjälp för att föreställa data utan att tänka på det. Med den tillagda kolumnen som visar procentuell förekomst av varje klass kan du till exempel enkelt se att mer än hälften av klassen fick en B utan att behöva granska uppgifterna i detalj.
Betygsfrekvens Relativ överflöd (% frekvens) A .............. 7 .............. 28% B ......... .... 13 ............ 52% C .............. 3 ............. 12% D .............. 2 .............. 8%
Komplexa datauppsättningar kan behöva klassas i intervaller
En nackdel är att det är svårt att förstå komplexa datamängder som visas på en frekvens tabell. Stora datamängder kan delas in i intervallklasser för enkel visualisering med hjälp av en frekvenstabell. Om du till exempel frågade de nästa 100 personer som du ser vad deras ålder var skulle du förmodligen få ett brett utbud av svar som sträcker sig överallt från tre till nittiotre. Istället för att inkludera rader för varje ålder i din frekvenstabell, kan du klassificera informationen i intervaller, till exempel 0 - 10 år, 11 - 20 år, 21 - 30 år och så vidare. Detta kan också kallas en grupperad frekvensfördelning.
Frekvensstabeller kan dölja skev och kurtos
Om inte visas på ett histogram, kan skevhet och kurtos av data kanske inte framgå i en frekvenstabell. Otydigheten berättar vilken riktning dina data tenderar mot. Om betyg visades över X-axeln på en graf som visar frekvensen för halvtidsbetyg för våra 25 elever ovan, skulle fördelningen skeva mot As och Bs. Kurtosis berättar om din centrala topp i dina uppgifter - huruvida det skulle falla i linje med en normalfördelning, som är en fin slät klockkurva, eller vara hög och skarp. Om du graferar medelvärderingskvaliteterna i vårt exempel hittar du en hög topp vid B med en kraftig nedgång i fördelningen av lägre betyg.