Περιεχόμενο
Μια απόκλιση είναι μια τιμή σε ένα σύνολο δεδομένων που απέχει πολύ από τις άλλες τιμές. Οι ακραίες τιμές μπορεί να προκληθούν από πειραματικά λάθη ή από σφάλματα μέτρησης ή από έναν πληθυσμό με μεγάλη ακρίβεια. Στις πρώτες περιπτώσεις, μπορεί να είναι επιθυμητό να εντοπιστούν τα απομεμακρυσμένα δεδομένα και να τα αφαιρεθούν από τα δεδομένα πριν από τη διεξαγωγή στατιστικής ανάλυσης, επειδή μπορούν να απορρίψουν τα αποτελέσματα έτσι ώστε να μην αντιπροσωπεύουν με ακρίβεια τον πληθυσμό του δείγματος. Ο απλούστερος τρόπος για τον εντοπισμό των αποκλίσεων είναι η μέθοδος τεταρτημόριο.
Ταξινόμηση των δεδομένων με αύξουσα σειρά. Για παράδειγμα, πάρτε το σύνολο δεδομένων {4, 5, 2, 3, 15, 3, 3, 5}. Ταξινόμηση, το παράδειγμα δεδομένων είναι {2, 3, 3, 3, 4, 5, 5, 15}.
Βρείτε το διάμεσο. Αυτός είναι ο αριθμός στον οποίο τα μισά σημεία δεδομένων είναι μεγαλύτερα και τα μισά είναι μικρότερα. Αν υπάρχει ένας άρτος αριθμός σημείων δεδομένων, οι μέσοι δύο υπολογίζονται κατά μέσον όρο. Για παράδειγμα, τα μεσαία σημεία είναι 3 και 4, οπότε ο διάμεσος είναι (3 + 4) / 2 = 3,5.
Βρείτε το ανώτερο τεταρτημόριο, Q2. αυτό είναι το σημείο δεδομένων στο οποίο το 25% των δεδομένων είναι μεγαλύτερο. Εάν το σύνολο δεδομένων είναι ομοιόμορφο, υπολογίστε κατά μέσο όρο τα 2 σημεία γύρω από το τεταρτημόριο. Για παράδειγμα, το σύνολο δεδομένων είναι (5 + 5) / 2 = 5.
Βρείτε το κατώτερο τεταρτημόριο, Q1. αυτό είναι το σημείο δεδομένων στο οποίο το 25% των δεδομένων είναι μικρότερα. Εάν το σύνολο δεδομένων είναι ομοιόμορφο, υπολογίστε κατά μέσο όρο τα 2 σημεία γύρω από το τεταρτημόριο. Για τα παραδείγματα δεδομένων, (3 + 3) / 2 = 3.
Αφαιρέστε το κατώτερο τεταρτημόριο από το υψηλότερο τεταρτημόριο για να φτάσετε στο εύρος interquartile IQ. Για παράδειγμα, το σύνολο δεδομένων Q2 - Q1 = 5 - 3 = 2.
Πολλαπλασιάστε το εύρος μεταξύ τεταρτοταγών κατά 1,5. Προσθέστε αυτό στο ανώτερο τεταρτημόριο και αφαιρέστε το από το κάτω τεταρτημόριο. Οποιοδήποτε σημείο δεδομένων εκτός αυτών των τιμών είναι ένα ήπιο περιθώριο. Για το σύνολο συνόλων, 1,5 x 2 = 3. έτσι 3 - 3 = 0 και 5 + 3 = 8. Έτσι οποιαδήποτε τιμή μικρότερη από 0 ή μεγαλύτερη από 8 θα είναι μια ήπια τιμή. Αυτό σημαίνει ότι το 15 χαρακτηρίζεται ως ήπιο άκρο.
Πολλαπλασιάστε το εύρος μεταξύ τεταρτοταγών με 3. Προσθέστε αυτό στο άνω τεταρτημόριο και αφαιρέστε το από το κάτω τεταρτημόριο. Οποιοδήποτε σημείο δεδομένων εκτός αυτών των τιμών είναι ένα ακραίο outlier. Για παράδειγμα, 3 x 2 = 6. έτσι 3 - 6 = -3 και 5 + 6 = 11. Έτσι οποιαδήποτε τιμή μικρότερη από -3 ή μεγαλύτερη από 11 θα ήταν μια ακραία απόκλιση. Αυτό σημαίνει ότι το 15 χαρακτηρίζεται ως ακραία απόκλιση.