Στα στατιστικά δεδομένα, η τυχαία δειγματοληψία δεδομένων από έναν πληθυσμό οδηγεί συχνά στην παραγωγή καμπύλης σε σχήμα καμπάνας με τον μέσο όρο επικεντρωμένο στην κορυφή του κουδουνιού. Αυτό είναι γνωστό ως κανονική κατανομή. Το κεντρικό οριακό όριο δηλώνει ότι καθώς ο αριθμός των δειγμάτων αυξάνεται, ο μετρημένος μέσος όρος τείνει να κατανέμεται κανονικά γύρω από τον μέσον του πληθυσμού και η τυπική απόκλιση γίνεται στενότερη. Το κεντρικό οριακό όριο μπορεί να χρησιμοποιηθεί για να εκτιμηθεί η πιθανότητα εύρεσης μιας συγκεκριμένης τιμής εντός ενός πληθυσμού.
Συλλέξτε δείγματα και στη συνέχεια προσδιορίστε τον μέσο όρο. Για παράδειγμα, υποθέστε ότι θέλετε να υπολογίσετε την πιθανότητα ένα αρσενικό στις Ηνωμένες Πολιτείες να έχει επίπεδο χοληστερόλης 230 χιλιοστογραμμάρια ανά deciliter ή μεγαλύτερο. Αρχίζουμε με τη συλλογή δειγμάτων από 25 άτομα και τη μέτρηση των επιπέδων χοληστερόλης τους. Μετά τη συλλογή των δεδομένων, υπολογίστε τον μέσο όρο του δείγματος. Ο μέσος όρος επιτυγχάνεται με αθροίζοντας κάθε μετρούμενη τιμή και διαιρώντας με τον συνολικό αριθμό των δειγμάτων. Σε αυτό το παράδειγμα, υποθέστε ότι ο μέσος όρος είναι 211 χιλιοστόγραμμα ανά δεκαδικό.
Υπολογίστε την τυπική απόκλιση, η οποία είναι ένα μέτρο των δεδομένων "spread". Αυτό μπορεί να γίνει με μερικά απλά βήματα:
Σε αυτό το παράδειγμα, υποθέστε ότι η τυπική απόκλιση είναι 46 χιλιοστόγραμμα ανά δεκαδικό.
Υπολογίστε το τυπικό σφάλμα διαιρώντας την τυπική απόκλιση με την τετραγωνική ρίζα του συνολικού αριθμού δείγματος:
Πρότυπο σφάλμα = 46 / sqrt25 = 9.2
Σχεδιάστε ένα σκίτσο της κανονικής κατανομής και σκιάς στην κατάλληλη πιθανότητα. Ακολουθώντας το παράδειγμα, θέλετε να μάθετε την πιθανότητα ένα αρσενικό να έχει επίπεδο χοληστερόλης 230 χιλιοστογραμμάρια ανά deciliter ή μεγαλύτερο. Για να βρείτε την πιθανότητα, μάθετε πόσα τυπικά σφάλματα μακριά από το μέσο όρο των 230 χιλιοστογράμμων ανά deciliter είναι (τιμή Z):
Ζ = 230-211 / 9.2 = 2.07
Αναζητήστε την πιθανότητα απόκτησης μιας τιμής 2.07 τυπικών σφαλμάτων πάνω από το μέσο όρο. Εάν πρέπει να βρείτε την πιθανότητα εύρεσης μιας τιμής εντός των 2.07 τυπικών αποκλίσεων του μέσου όρου, τότε το z είναι θετικό. Εάν πρέπει να βρείτε την πιθανότητα να βρείτε μια τιμή πέραν των 2.07 τυπικών αποκλίσεων του μέσου τότε το z είναι αρνητικό.
Αναζητήστε την τιμή z σε έναν κανονικό πίνακα κανονικών πιθανοτήτων. Η πρώτη στήλη στην αριστερή πλευρά δείχνει ολόκληρο τον αριθμό και το πρώτο δεκαδικό ψηφίο της τιμής z. Η σειρά κατά μήκος της κορυφής εμφανίζει το τρίτο δεκαδικό ψηφίο της τιμής z. Ακολουθώντας το παράδειγμα, επειδή η τιμή z είναι -2.07, εντοπίστε πρώτα το -2.0 στην αριστερή στήλη και, στη συνέχεια, σαρώστε την επάνω γραμμή για την καταχώρηση 0.07. Το σημείο στο οποίο τέμνονται αυτές οι στήλες και σειρές είναι η πιθανότητα. Στην περίπτωση αυτή, η τιμή που διαβάζεται από τον πίνακα είναι 0,0192 και έτσι η πιθανότητα εύρεσης ενός αρσενικού που έχει επίπεδο χοληστερόλης 230 χιλιοστογραμμάρια ανά deciliter ή παραπάνω είναι 1,92 τοις εκατό.