Περιεχόμενο
Το bias είναι το σφάλμα στις εκτιμήσεις λόγω συστηματικών λαθών που οδηγούν σε σταθερά υψηλά ή χαμηλά αποτελέσματα σε σύγκριση με τις πραγματικές τιμές. Η μεμονωμένη μεροληψία μιας εκτίμησης που είναι γνωστή ως προκατειλημμένη είναι η διαφορά μεταξύ των εκτιμώμενων και των πραγματικών τιμών. Εάν η εκτίμηση δεν είναι γνωστό ότι είναι προκατειλημμένη, η διαφορά θα μπορούσε επίσης να οφείλεται σε τυχαίο σφάλμα ή άλλες ανακρίβειες. Σε αντίθεση με την προκατάληψη, η οποία ενεργεί πάντα προς μία κατεύθυνση, αυτά τα σφάλματα μπορεί να είναι θετικά ή αρνητικά.
Για να υπολογίσετε την προκατάληψη μιας μεθόδου που χρησιμοποιείται για πολλές εκτιμήσεις, βρείτε τα σφάλματα αφαιρώντας κάθε εκτίμηση από την πραγματική ή την παρατηρούμενη τιμή. Προσθέστε όλα τα λάθη και διαιρέστε με τον αριθμό των εκτιμήσεων για να πάρετε την προκατάληψη. Εάν τα σφάλματα προστίθενται μέχρι το μηδέν, οι εκτιμήσεις ήταν αμερόληπτες και η μέθοδος αποδίδει αμερόληπτα αποτελέσματα. Εάν οι εκτιμήσεις είναι προκατειλημμένες, μπορεί να είναι δυνατόν να βρεθεί η πηγή της μεροληψίας και να την εξαλείψουμε για να βελτιώσουμε τη μέθοδο.
TL · DR (Πολύ μακρύ;
Υπολογίστε μεροληψία εντοπίζοντας τη διαφορά μεταξύ μιας εκτίμησης και της πραγματικής τιμής. Για να βρείτε τη μεροληψία μιας μεθόδου, εκτελέστε πολλές εκτιμήσεις και προσθέστε τα σφάλματα σε κάθε εκτίμηση σε σύγκριση με την πραγματική τιμή. Ο διαχωρισμός βάσει του αριθμού των εκτιμήσεων δίνει τη μεροληψία της μεθόδου. Στα στατιστικά στοιχεία, μπορεί να υπάρχουν πολλές εκτιμήσεις για να βρεθεί μία μόνο τιμή. Η διαφορά είναι η διαφορά μεταξύ του μέσου όρου αυτών των εκτιμήσεων και της πραγματικής τιμής.
Πώς λειτουργεί το Bias
Όταν οι εκτιμήσεις είναι προκατειλημμένες, είναι σταθερά λανθασμένες σε μία κατεύθυνση λόγω σφαλμάτων στο σύστημα που χρησιμοποιείται για τις εκτιμήσεις. Για παράδειγμα, μια πρόγνωση καιρού μπορεί να προβλέψει με συνέπεια τις θερμοκρασίες που είναι υψηλότερες από εκείνες που παρατηρήθηκαν. Η πρόβλεψη είναι προκατειλημμένη, και κάπου στο σύστημα υπάρχει ένα λάθος που δίνει πολύ υψηλή εκτίμηση. Εάν η μέθοδος πρόβλεψης είναι αμερόληπτη, ενδέχεται να προβλέπουν ακόμα θερμοκρασίες που δεν είναι σωστές, αλλά οι λανθασμένες θερμοκρασίες θα είναι μερικές φορές υψηλότερες και μερικές φορές χαμηλότερες από τις παρατηρούμενες θερμοκρασίες.
Η στατιστική προκατάληψη λειτουργεί με τον ίδιο τρόπο, αλλά συνήθως βασίζεται σε μεγάλο αριθμό εκτιμήσεων, ερευνών ή προβλέψεων. Αυτά τα αποτελέσματα μπορούν να αναπαρασταθούν γραφικά σε μια καμπύλη κατανομής και η προκατάληψη είναι η διαφορά μεταξύ του μέσου της κατανομής και της πραγματικής τιμής. Εάν υπάρχει προκατάληψη, θα υπάρχει πάντα μια διαφορά, παρότι μερικές εκτιμήσεις μπορούν να πέσουν κάθε πλευρά της πραγματικής τιμής.
Απογοήτευση στις έρευνες
Ένα παράδειγμα μεροληψίας είναι μια εταιρεία ερευνών που διεξάγει δημοσκοπήσεις κατά τη διάρκεια προεκλογικών εκστρατειών, αλλά τα αποτελέσματα των εκλογών τους υπερεκτιμούν με συνέπεια τα αποτελέσματα για ένα πολιτικό κόμμα σε σύγκριση με τα πραγματικά αποτελέσματα των εκλογών. Η προκατάληψη μπορεί να υπολογιστεί για κάθε εκλογή, αφαιρώντας το πραγματικό αποτέλεσμα από την πρόβλεψη της δημοσκόπησης. Η μέση προκατάληψη της χρησιμοποιούμενης μεθόδου δημοσκόπησης μπορεί να υπολογιστεί με την εξεύρεση του μέσου όρου των μεμονωμένων σφαλμάτων. Εάν η προκατάληψη είναι μεγάλη και συνεπής, η εταιρεία δημοσκοπήσεων μπορεί να προσπαθήσει να μάθει γιατί η μέθοδος της είναι προκατειλημμένη.
Η προκατάληψη μπορεί να προέρχεται από δύο κύριες πηγές. Η επιλογή των συμμετεχόντων για τη δημοσκόπηση είναι προκατειλημμένη ή η προκατάληψη προκύπτει από την ερμηνεία των πληροφοριών που έλαβαν οι συμμετέχοντες. Για παράδειγμα, οι δημοσκοπήσεις στο διαδίκτυο είναι εγγενώς προκατειλημμένες επειδή οι συμμετέχοντες στη δημοσκόπηση που συμπληρώνουν τα έντυπα διαδικτύου δεν είναι αντιπροσωπευτικοί του συνόλου του πληθυσμού. Πρόκειται για επιλογή μεροληψίας.
Οι εταιρείες ψηφοφορίας έχουν επίγνωση αυτής της προκαταρκτικής επιλογής και αντισταθμίζουν την προσαρμογή των αριθμών. Εάν τα αποτελέσματα εξακολουθούν να είναι προκατειλημμένα, είναι μια προκατειλημμένη πληροφόρηση επειδή οι εταιρείες δεν ερμήνευσαν σωστά τις πληροφορίες. Σε όλες αυτές τις περιπτώσεις, ένας υπολογισμός μεροληψίας δείχνει σε ποιο βαθμό οι εκτιμώμενες τιμές είναι χρήσιμες και όταν οι μέθοδοι χρειάζονται προσαρμογή.