Vad är luckor, kluster och outliers i matematik?

Posted on
Författare: Louise Ward
Skapelsedatum: 11 Februari 2021
Uppdatera Datum: 22 November 2024
Anonim
Vad är luckor, kluster och outliers i matematik? - Vetenskap
Vad är luckor, kluster och outliers i matematik? - Vetenskap

Innehåll

Näringsliv, myndigheter och akademiska aktiviteter kräver nästan alltid insamling och analys av data. Ett av sätten att representera numeriska data är genom diagram, histogram och diagram. Dessa visualiseringstekniker gör det möjligt för människor att få bättre insikt i problem och utforma lösningar. Gap, kluster och outliers är egenskaper hos datauppsättningar som påverkar matematisk analys och är lätt synliga på visuella representationer.

Hål i uppgifterna

Gap refererar till saknade områden i en datauppsättning. Om till exempel ett vetenskapligt experiment samlar in temperaturdata i intervallet 50 grader Fahrenheit till 100 grader Fahrenheit, men inget mellan 70 och 80 grader, skulle det representera ett gap i datamängden. En raddiagram av denna datamängd skulle ha "x" -markeringar för temperaturer mellan 50 och 70 och igen mellan 80 och 100, men det skulle inte finnas något mellan 70 och 80. Forskare kan gräva djupare och undersöka varför vissa datapunkter inte dyker upp i ett samlat prov.

Isolerade grupper

Kluster är isolerade grupper av datapunkter. Linjeplott, som är ett av sätten att representera datauppsättningar, är linjer med "x" -markeringar placerade ovanför specifika nummer för att avbilda deras frekvens av förekomst i datamängden. Ett kluster avbildas som en samling av dessa "x" -markeringar i ett litet intervall eller datadel. Om till exempel poängpoängen för en klass på 10 studenter är 74, 75, 80, 72, 74, 75, 76, 86, 88 och 73, skulle de flesta "x" -markeringarna på en raddiagram vara i 72- poängintervall till-76. Detta skulle representera ett datakluster. Observera att frekvensen för 74 och 75 är två, men för alla andra poäng är den en.

Vid extrema

Outliers är extrema värden - datapunkter som ligger väsentligt utanför andra värden i en datamängd. En outlier måste vara betydligt mindre än eller större än majoriteten av siffrorna i en datamängd. Definitionen av "extrem" beror på omständigheten och en enighet av de analytiker som är involverade i forskningen. Outliers kan vara dåliga datapunkter, även kända som buller, eller de kan innehålla värdefull information om fenomenet som undersöks och själva datainsamlingsmetoden. Till exempel, om klassresultat mestadels ligger i intervallet 70 till 80, men ett par poäng är i de låga 50-talet, kan dessa representera outliers.

Få alltid att falla på plats

Gap, outliers och kluster i datauppsättningar kan påverka resultaten av matematisk analys. Spalter och kluster kan representera fel i metoden för datainsamling. Till exempel, om en telefonundersökning endast avgränsar vissa områdekoder, till exempel bostadskomplex med låg inkomst eller avancerade bostadsområden i förortsområdet, och inte ett brett tvärsnitt av befolkningen, är det troligt att det finns luckor och kluster i uppgifterna . Outliers kan sneda medelvärdet eller medelvärdet för en datauppsättning. Exempelvis är medel- eller medelvärdet för en datauppsättning bestående av fyra siffror - 50, 55, 65 och 90 - 65. Utan outlier 90 är dock medelvärdet cirka 57.