Innehåll
När du utför ett experiment som ger en serie observerade värden som du vill jämföra med teoretiska värden, root-mean-square deviation (RMSD) eller root-mean-square error (RMSE) låter dig kvantifiera denna jämförelse. Du beräknar RMSD genom att hitta kvadratroten för medelkvadratfelet.
RMSD-formeln
För en serie observationer beräknar du medelkvadratfel genom att hitta skillnaden mellan varje experimentellt eller observerat värde och det teoretiska eller förutspådda värdet, kvadratera varje skillnad, lägga till dem och dela dem med antalet observerade värden eller förutspådda värden som finns .
Detta gör RMSD-formeln:
{RMSD} = sqrt { frac { sum (x_e - x_o) ^ 2} {n}}för xe förväntade värden, xo observerade värden, och n totalt antal värden.
Denna metod för att hitta en skillnad (eller avvikelse), kvadratera varje skillnad, summera dem och dela med antalet datapunkter (som du skulle göra när du hittar medelvärdet för en uppsättning data) och sedan ta kvadratroten till resultatet är vad som ger kvantiteten sitt namn, "root-mean-square deviation." Du kan använda ett steg-för-steg-tillvägagångssätt som detta för att beräkna RMSD i Excel, vilket är bra för stora datamängder.
Standardavvikelse
Standardavvikelse mäter hur mycket en uppsättning data varierar inom sig själv. Du kan beräkna det med (Σ (x - μ)2 / n)1/2 för varje värde x för n värden med μ ("mu") genomsnitt. Observera att detta är samma formel för RMSD men istället för förväntade och observerade datavärden använder du själva datavärdet och genomsnittet för datauppsättningen. Med hjälp av denna beskrivning kan du jämföra root-medelkvadratfel kontra standardavvikelse.
Detta innebär att även om den har en formel med liknande struktur som RMSD, mäter standardavvikelsen ett specifikt hypotetiskt experimentellt scenario där de förväntade värdena är alla genomsnittet för datauppsättningen.
I detta hypotetiska scenario är kvantiteten inuti kvadratroten (Σ (x - μ)2 / n) kallas variation, hur informationen fördelas runt medelvärdet. Genom att bestämma variansen kan du jämföra datauppsättningen med specifika distributioner som du kan förvänta dig att uppgifterna skulle ta baserat på förkunskaper.
Vad RMSD berättar för dig
RMSD ger ett specifikt, enhetligt sätt att bestämma hur fel i hur förutsagda värden skiljer sig från observerade värden för experiment. Ju lägre RMSD, desto mer exakta är de experimentella resultaten till teoretiska förutsägelser. De låter dig kvantifiera hur olika felkällor påverkar de observerade experimentella resultaten, till exempel luftmotstånd som påverkar en pendels svängning eller ytspänning mellan en vätska och dess behållare som förhindrar att den flyter.
Du kan vidare se till att RMSD återspeglar intervallet för datauppsättningen genom att dela den med skillnaden mellan det maximala observerade experimentella värdet och det minsta för att erhålla normaliserad rot-medelkvadrat-avvikelse eller fel.
Inom området molekylär dockning, där forskare jämför den teoretiska datorgenererade strukturen för biomolekyler med de från experimentella resultat, kan RMSD mäta hur nära experimentella resultat återspeglar teoretiska modeller. Ju mer experimentella resultat kan återge vad teoretiska modeller förutspår, desto lägre är RMSD.
RMSD i praktiska inställningar
Förutom exemplet med molekylär dockning använder meteorologer RMSD för att avgöra hur nära matematiska modeller av klimat förutsäger atmosfäriska fenomen. Bioinformatiker, forskare som studerar biologi genom datorbaserade medel, bestämmer hur avståndet mellan atomära positioner för proteinmolekyler varierar från det genomsnittliga avståndet för dessa atomer i proteiner med RMSD som ett mått på noggrannhet.
Ekonomer använder RMSD för att ta reda på hur nära ekonomiska modeller passar uppmätta eller observerade resultat av ekonomisk aktivitet. Psykologer använder RMSD för att jämföra observerat beteende av psykologiska eller psykologibaserade fenomen med beräkningsmodeller.
Neurovetenskapsmän använder det för att bestämma hur konstgjorda eller biologiskt baserade system kan lära sig jämfört med modeller för inlärning. Datorforskare som studerar bildbehandling och vision jämför resultatet mellan hur väl en modell kan rekonstruera bilder till originalbilderna med olika metoder.