Περιεχόμενο
Όταν πραγματοποιείτε ένα πείραμα που δίνει μια σειρά παρατηρημένων τιμών που θέλετε να συγκρίνετε με τις θεωρητικές τιμές, το μέση τετραγωνική απόκλιση ρίζας (RMSD) ή σφάλμα ρίζας μέσου τετραγώνου (RMSE) σάς επιτρέπει να ποσοτικοποιήσετε αυτήν τη σύγκριση. Υπολογίζετε το RMSD βρίσκοντας την τετραγωνική ρίζα του μέσου τετραγωνικού σφάλματος.
Ο τύπος RMSD
Για μια σειρά παρατηρήσεων, υπολογίζετε το μέσο τετραγωνικό σφάλμα εντοπίζοντας τη διαφορά μεταξύ κάθε πειραματικής ή παρατηρημένης τιμής και της θεωρητικής ή προβλεπόμενης τιμής, τετραγωνίζοντας κάθε διαφορά, προσθέτοντάς τα και διαιρώντας τα με τον αριθμό των παρατηρούμενων τιμών ή των προβλεπόμενων τιμών. .
Αυτό κάνει τον τύπο RMSD:
{RMSD} = sqrt { frac { sum (x_e - x_o) ^ 2} {n}}Για Χμι αναμενόμενες τιμές, Χo παρατηρημένες τιμές, και n συνολικός αριθμός τιμών.
Αυτή η μέθοδος εύρεσης διαφοράς (ή απόκλισης), τετραγωνισμού κάθε διαφοράς, αθροίζοντας τα και διαιρώντας με τον αριθμό των σημείων δεδομένων (όπως θα κάνατε κατά την εύρεση του μέσου όρου ενός συνόλου δεδομένων), τότε η λήψη της τετραγωνικής ρίζας του αποτελέσματος είναι τι δίνει στην ποσότητα το όνομά της, "απόκλιση από τη ρίζα μέσου τετραγώνου". Μπορείτε να χρησιμοποιήσετε μια προσέγγιση βήμα προς βήμα έτσι ώστε να υπολογίσετε το RMSD στο Excel, το οποίο είναι ιδανικό για μεγάλα σύνολα δεδομένων.
Τυπική απόκλιση
Τυπική απόκλιση μετρά πόσο ένα σύνολο δεδομένων ποικίλλει μέσα στο ίδιο. Μπορείτε να το υπολογίσετε χρησιμοποιώντας (Σ (Χ - μ)2 / n)1/2 για κάθε τιμή Χ Για n τιμές με μ (μέσος όρος "mu"). Παρατηρήστε ότι αυτός είναι ο ίδιος τύπος για το RMSD, αλλά αντί των αναμενόμενων και παρατηρημένων τιμών δεδομένων, χρησιμοποιείτε την ίδια την τιμή δεδομένων και τον μέσο όρο του συνόλου δεδομένων, αντίστοιχα. Χρησιμοποιώντας αυτήν την περιγραφή, μπορείτε να συγκρίνετε το μέσο τετραγωνικό σφάλμα ρίζας έναντι της τυπικής απόκλισης.
Αυτό σημαίνει ότι, αν και έχει ένα τύπο με παρόμοια δομή με το RMSD, η τυπική απόκλιση μετρά ένα συγκεκριμένο υποθετικό πειραματικό σενάριο στο οποίο οι αναμενόμενες τιμές είναι όλοι οι μέσοι όροι του συνόλου δεδομένων.
Σε αυτό το υποθετικό σενάριο, η ποσότητα μέσα στην τετραγωνική ρίζα (Σ (Χ - μ)2 / n) ονομάζεται διαφορά, πώς κατανέμονται τα δεδομένα γύρω από τον μέσο όρο. Ο προσδιορισμός της διακύμανσης σας επιτρέπει να συγκρίνετε το σύνολο δεδομένων με συγκεκριμένες διανομές τις οποίες θα αναμένατε να λάβουν τα δεδομένα με βάση τις προηγούμενες γνώσεις.
Τι σας λέει το RMSD
Το RMSD δίνει έναν συγκεκριμένο, ενοποιημένο τρόπο καθορισμού του τρόπου με τον οποίο τα σφάλματα για το πώς οι προβλεπόμενες τιμές διαφέρουν από τις παρατηρούμενες τιμές για τα πειράματα. Όσο χαμηλότερο είναι το RMSD, τόσο πιο ακριβή είναι τα πειραματικά αποτελέσματα σε θεωρητικές προβλέψεις. Σας επιτρέπουν να υπολογίσετε πόσο διαφορετικές πηγές σφάλματος επηρεάζουν τα παρατηρούμενα πειραματικά αποτελέσματα, όπως η αντίσταση του αέρα που επηρεάζει την ταλάντωση του εκκρεμούς ή την επιφανειακή τάση μεταξύ ενός ρευστού και του δοχείου που εμποδίζει τη ροή του.
Μπορείτε επίσης να διασφαλίσετε ότι το RMSD αντικατοπτρίζει το εύρος του συνόλου δεδομένων, διαιρώντας το με τη διαφορά μεταξύ της μέγιστης παρατηρούμενης πειραματικής τιμής και του ελάχιστου για την απόκτηση του κανονικοποιημένη απόκλιση ρίζας μέσου τετραγώνου ή σφάλμα.
Στον τομέα της μοριακής σύνδεσης, όπου οι ερευνητές συγκρίνουν τη θεωρητική δομή βιομορίων που παράγεται από υπολογιστή με αυτά που προκύπτουν από τα πειραματικά αποτελέσματα, το RMSD μπορεί να μετρήσει πόσο στενά πειραματικά αποτελέσματα αντικατοπτρίζουν τα θεωρητικά μοντέλα. Τα πιό πειραματικά αποτελέσματα είναι σε θέση να αναπαράγουν τα θεωρητικά μοντέλα που προβλέπουν, τόσο χαμηλότερο είναι το RMSD.
RMSD σε πρακτικές ρυθμίσεις
Εκτός από το παράδειγμα της μοριακής σύνδεσης, οι μετεωρολόγοι χρησιμοποιούν το RMSD για να καθορίσουν πόσο προσεκτικά τα μαθηματικά μοντέλα του κλίματος προβλέπουν τα φαινόμενα της ατμόσφαιρας. Οι βιοπληροφορικοί, επιστήμονες που μελετούν τη βιολογία μέσω υπολογιστικών μέσων, καθορίζουν πώς οι αποστάσεις μεταξύ των ατομικών θέσεων των πρωτεϊνικών μορίων ποικίλλουν από τη μέση απόσταση αυτών των ατόμων σε πρωτεΐνες χρησιμοποιώντας το RMSD ως μέτρο ακρίβειας.
Οι οικονομολόγοι χρησιμοποιούν το RMSD για να υπολογίσουν πόσο στενά τα οικονομικά μοντέλα ταιριάζουν με τα μετρηθέντα ή παρατηρούμενα αποτελέσματα της οικονομικής δραστηριότητας. Οι ψυχολόγοι χρησιμοποιούν το RMSD για να συγκρίνουν την παρατηρούμενη συμπεριφορά των ψυχολογικών ή ψυχολογικών φαινομένων με υπολογιστικά μοντέλα.
Οι νευροεπιστήμονες το χρησιμοποιούν για να καθορίσουν πώς μπορούν να μάθουν τεχνητά ή βιολογικά συστήματα σε σύγκριση με μοντέλα μάθησης. Οι επιστήμονες υπολογιστών που μελετούν την απεικόνιση και την όραση συγκρίνουν την απόδοση του πόσο καλά ένα μοντέλο μπορεί να ανασυνθέσει τις εικόνες στις αρχικές εικόνες με διαφορετικές μεθόδους.