Περιεχόμενο
- Ο απαιτούμενος τύπος δεδομένων
- Η δοκιμασία Goodness of Fit
- Υπολογισμός της στατιστικής Chi-Square
- Ερμηνεία της στατιστικής Chi-Square
Πρόβλεψη δοκιμών πειραμάτων. Αυτές οι προβλέψεις είναι συχνά αριθμητικές, πράγμα που σημαίνει ότι, καθώς οι επιστήμονες συγκεντρώνουν δεδομένα, αναμένουν ότι οι αριθμοί θα σπάσουν με κάποιο τρόπο. Τα δεδομένα του πραγματικού κόσμου σπάνια ταιριάζουν ακριβώς με τις προβλέψεις που κάνουν οι επιστήμονες, οπότε οι επιστήμονες χρειάζονται μια δοκιμή για να τους πει εάν η διαφορά μεταξύ παρατηρηθέντων και αναμενόμενων αριθμών οφείλεται σε τυχαία πιθανότητα ή εξαιτίας κάποιου απρόβλεπτου παράγοντα που θα αναγκάσει τον επιστήμονα να προσαρμόσει την υποκείμενη θεωρία . Μια δοκιμή chi-square είναι ένα στατιστικό εργαλείο που οι επιστήμονες χρησιμοποιούν για το σκοπό αυτό.
Ο απαιτούμενος τύπος δεδομένων
Χρειάζεστε κατηγορηματικά δεδομένα για να χρησιμοποιήσετε μια δοκιμή chi-square. Ένα παράδειγμα κατηγορηματικών δεδομένων είναι ο αριθμός των ατόμων που απάντησαν σε μια ερώτηση "ναι" σε σχέση με τον αριθμό των ατόμων που απάντησαν στην ερώτηση "όχι" (δύο κατηγορίες), ή τον αριθμό των βατράχων σε έναν πληθυσμό πράσινου, κίτρινου ή γκρίζου τρεις κατηγορίες). Δεν μπορείτε να χρησιμοποιήσετε μια δοκιμή chi-square σε συνεχή δεδομένα, όπως μπορεί να συλλεχθεί από μια έρευνα που ρωτάει τους ανθρώπους πόσο ψηλά είναι. Από μια τέτοια έρευνα, θα πάρετε ένα ευρύ φάσμα των υψών. Ωστόσο, εάν διαιρέσατε τα ύψη σε κατηγορίες όπως "κάτω από 6 πόδια ύψος" και "6 πόδια ψηλά και πάνω," θα μπορούσατε στη συνέχεια να χρησιμοποιήσετε μια chi-τετραγωνική δοκιμή στα δεδομένα.
Η δοκιμασία Goodness of Fit
Μια δοκιμασία ευελιξίας είναι μια συνηθισμένη και ίσως η απλούστερη δοκιμασία που εκτελείται χρησιμοποιώντας την chi-square στατιστική. Σε μια δοκιμασία καλοσύνης, ο επιστήμονας κάνει μια συγκεκριμένη πρόβλεψη για τους αριθμούς που αναμένει να δει σε κάθε κατηγορία των δεδομένων της. Στη συνέχεια συλλέγει δεδομένα πραγματικού κόσμου - που ονομάζονται παρατηρημένα δεδομένα - και χρησιμοποιεί τη δοκιμή chi-square για να διαπιστώσει εάν τα παρατηρούμενα δεδομένα ταιριάζουν με τις προσδοκίες της.
Για παράδειγμα, φανταστείτε ότι ένας βιολόγος μελετά τα μοτίβα κληρονομιάς σε ένα είδος βάτραχος. Μεταξύ των 100 απογόνων ενός συνόλου γονικών βάτραχος, το γενετικό μοντέλο των βιολόγων την οδηγεί να περιμένει 25 κίτρινους απογόνους, 50 πράσινους απογόνους και 25 γκρίζους απογόνους. Αυτό που παρατηρεί στην πραγματικότητα είναι 20 κίτρινοι απόγονοι, 52 πράσινοι απόγονοι και 28 γκρίζοι απόγονοι. Προβλέπεται η πρόβλεψή της ή είναι λάθος το γενετικό της μοντέλο; Μπορεί να χρησιμοποιήσει ένα chi-square τεστ για να το μάθει.
Υπολογισμός της στατιστικής Chi-Square
Ξεκινήστε τον υπολογισμό του chi-square στατιστικού στοιχείου αφαιρώντας κάθε αναμενόμενη τιμή από την αντίστοιχη παρατηρούμενη τιμή και τετραγωνίζοντας κάθε αποτέλεσμα. Ο υπολογισμός για το παράδειγμα των απογόνων βάτραχος θα έμοιαζε έτσι:
κίτρινο = (20-25) ^ 2 = 25 πράσινο = (52-50) ^ 2 = 4 γκρι = (28-25) ^ = 9
Τώρα διαιρέστε κάθε αποτέλεσμα με την αντίστοιχη αναμενόμενη τιμή του.
κίτρινο = 25 ÷ 25 = 1 πράσινο = 4 ÷ 50 = 0,08 γκρι = 9 ÷ 25 = 0,36
Τέλος, προσθέστε μαζί τις απαντήσεις από το προηγούμενο βήμα.
chi-square = 1 + 0,08 + 0,36 = 1,44
Ερμηνεία της στατιστικής Chi-Square
Η στατιστική chi-square σας δείχνει πόσο διαφορετικές οι τιμές που παρατηρήσατε ήταν από τις προβλεπόμενες τιμές σας. Όσο μεγαλύτερος είναι ο αριθμός, τόσο μεγαλύτερη είναι η διαφορά. Μπορείτε να προσδιορίσετε αν η τιμή chi-square είναι υπερβολικά υψηλή ή αρκετά χαμηλή για να υποστηρίξετε την πρόβλεψή σας εάν δείτε εάν είναι κάτω από ένα συγκεκριμένο κρίσιμη τιμή σε έναν πίνακα διανομής chi-square. Αυτός ο πίνακας αντιστοιχεί σε τιμές chi-square με πιθανότητες, που ονομάζονται p-τιμές. Συγκεκριμένα, ο πίνακας σας λέει την πιθανότητα ότι οι διαφορές μεταξύ των παρατηρούμενων και αναμενόμενων τιμών σας οφείλονται απλώς σε τυχαία πιθανότητα ή εάν υπάρχει κάποιος άλλος παράγοντας. Για μια δοκιμασία ευστάθειας, εάν η τιμή p είναι 0.05 ή λιγότερο, τότε πρέπει να απορρίψετε την πρόβλεψή σας.
Πρέπει να καθορίσετε το βαθμοί ελευθερίας (df) στα δεδομένα σας πριν μπορέσετε να αναζητήσετε την κρίσιμη τιμή chi-square σε έναν πίνακα διανομής. Οι βαθμοί ελευθερίας υπολογίζονται αφαιρώντας 1 από τον αριθμό των κατηγοριών στα δεδομένα σας. Υπάρχουν τρεις κατηγορίες σε αυτό το παράδειγμα, επομένως υπάρχουν 2 βαθμοί ελευθερίας. Μια ματιά σε αυτόν τον πίνακα διανομής chi-square σας λέει ότι για 2 βαθμούς ελευθερίας η κρίσιμη τιμή για μια πιθανότητα 0,05 είναι 5,99. Αυτό σημαίνει ότι όσο η υπολογιζόμενη τιμή chi-square είναι μικρότερη από 5.99, οι αναμενόμενες τιμές σας, και έτσι η υποκείμενη θεωρία, είναι έγκυρες και υποστηριζόμενες. Δεδομένου ότι το chi-square στατιστικό στοιχείο για τα δεδομένα των απογόνων βάτραχος ήταν 1,44, ο βιολόγος μπορεί να δεχτεί το γενετικό του μοντέλο.