Περιεχόμενο
- Σφάλμα τύπου Ι: Απόρριψη κατηγορηματικά της μηδενικής υπόθεσης
- Σφάλμα τύπου II: Απόρριψη λάθους της εναλλακτικής υπόθεσης
- Προσδιορισμός του επιπέδου σημασίας
- Επιλέγοντας μια δοκιμασία σημασίας
Η στατιστική σπουδαιότητα είναι ένας αντικειμενικός δείκτης για το αν τα αποτελέσματα μιας μελέτης είναι μαθηματικά «αληθινά» και στατιστικά υπερασπίσιμα, παρά απλά τυχαία. Συνήθως χρησιμοποιούμενες δοκιμασίες σημασίας αναζητούν διαφορές στα μέσα των συνόλων δεδομένων ή διαφορές στις διακυμάνσεις των συνόλων δεδομένων. Ο τύπος της δοκιμής που εφαρμόζεται εξαρτάται από τον τύπο των δεδομένων που αναλύονται. Εναπόκειται στους ερευνητές να καθορίσουν πόσο σημαντικά απαιτούν τα αποτελέσματα - με άλλα λόγια, πόσο μεγάλος κίνδυνος είναι διατεθειμένοι να κάνουν λάθος. Συνήθως, οι ερευνητές είναι πρόθυμοι να δεχτούν ένα επίπεδο κινδύνου 5%.
Σφάλμα τύπου Ι: Απόρριψη κατηγορηματικά της μηδενικής υπόθεσης
••• Scott Rothstein / iStock / Getty ImagesΠειράματα διεξάγονται για να δοκιμαστούν συγκεκριμένες υποθέσεις ή πειραματικές ερωτήσεις με ένα αναμενόμενο αποτέλεσμα. Μια μηδενική υπόθεση είναι αυτή που δεν ανιχνεύει καμία διαφορά μεταξύ των δύο συνόλων δεδομένων που συγκρίνονται. Σε μια ιατρική δοκιμή, για παράδειγμα, η μηδενική υπόθεση μπορεί να είναι ότι δεν υπάρχει διαφορά στη βελτίωση μεταξύ των ασθενών που λαμβάνουν το υπό μελέτη φαρμάκου και των ασθενών που λαμβάνουν το εικονικό φάρμακο. Αν ο ερευνητής απορρίψει λανθασμένα αυτήν την μηδενική υπόθεση όταν είναι στην πραγματικότητα αληθής, δηλαδή αν «ανιχνεύσει» μια διαφορά μεταξύ των δύο ομάδων ασθενών όταν δεν υπάρχει πραγματικά καμία διαφορά, τότε έχουν διαπράξει ένα σφάλμα Τύπου Ι.Οι ερευνητές καθορίζουν εν καιρώ πόσο μεγάλος κίνδυνος διαπράττει ένα σφάλμα Τύπου Ι που είναι πρόθυμοι να δεχτούν. Αυτός ο κίνδυνος βασίζεται σε μια μέγιστη τιμή p που θα δεχθούν πριν από την απόρριψη της μηδενικής υπόθεσης και ονομάζεται alpha.
Σφάλμα τύπου II: Απόρριψη λάθους της εναλλακτικής υπόθεσης
Μια εναλλακτική υπόθεση είναι αυτή που ανιχνεύει τη διαφορά μεταξύ των δύο συνόλων δεδομένων που συγκρίνονται. Στην περίπτωση της ιατρικής δοκιμής, αναμένετε να δείτε διαφορετικά επίπεδα βελτίωσης σε ασθενείς που λαμβάνουν το υπό μελέτη φάρμακο και στους ασθενείς που λαμβάνουν το εικονικό φάρμακο. Εάν οι ερευνητές δεν καταφέρουν να απορρίψουν τη μηδενική υπόθεση όταν πρέπει, με άλλα λόγια αν «δεν ανιχνεύσουν» καμία διαφορά μεταξύ των δύο ομάδων ασθενών όταν υπάρχει πραγματικά κάποια διαφορά, τότε έχουν διαπράξει σφάλμα Τύπου ΙΙ.
Προσδιορισμός του επιπέδου σημασίας
Όταν οι ερευνητές εκτελούν μια δοκιμασία στατιστικής σημασίας και η προκύπτουσα τιμή ρ είναι μικρότερη από το επίπεδο κινδύνου που θεωρείται αποδεκτό, τότε το αποτέλεσμα της εξέτασης θεωρείται στατιστικά σημαντικό. Σε αυτή την περίπτωση, η μηδενική υπόθεση - η υπόθεση ότι δεν υπάρχει διαφορά μεταξύ των δύο ομάδων - απορρίπτεται. Με άλλα λόγια, τα αποτελέσματα δείχνουν ότι υπάρχει διαφορά στη βελτίωση μεταξύ των ασθενών που λαμβάνουν το φάρμακο μελέτης και των ασθενών που ελάμβαναν το εικονικό φάρμακο.
Επιλέγοντας μια δοκιμασία σημασίας
Υπάρχουν διάφορες στατιστικές δοκιμασίες για να διαλέξετε. Ένα πρότυπο t-test συγκρίνει τα μέσα από δύο σύνολα δεδομένων, όπως τα δεδομένα φαρμάκων μελέτης και τα δεδομένα του εικονικού φαρμάκου. Χρησιμοποιείται ένα ζεύγος t-test για την ανίχνευση διαφορών στο ίδιο σύνολο δεδομένων, όπως μια μελέτη πριν και μετά. Μια μονόδρομη ανάλυση της διακύμανσης (ANOVA) μπορεί να συγκρίνει τα μέσα από τρία ή περισσότερα σύνολα δεδομένων και ένας αμφίδρομος ANOVA συγκρίνει τα μέσα δύο ή περισσότερων συνόλων δεδομένων σε απόκριση σε δύο διαφορετικές ανεξάρτητες μεταβλητές, όπως οι διαφορετικές δυνάμεις του μελέτη φαρμάκου. Μια γραμμική παλινδρόμηση συγκρίνει τα μέσα των συνόλων δεδομένων κατά μήκος μιας κλίσης των θεραπειών ή του χρόνου. Κάθε στατιστική δοκιμασία θα έχει ως αποτέλεσμα σημαντικές μετρήσεις ή άλφα, που μπορούν να χρησιμοποιηθούν για την ερμηνεία των αποτελεσμάτων των δοκιμών.