Τα μειονεκτήματα της γραμμικής παλινδρόμησης

Posted on
Συγγραφέας: Peter Berry
Ημερομηνία Δημιουργίας: 19 Αύγουστος 2021
Ημερομηνία Ενημέρωσης: 16 Νοέμβριος 2024
Anonim
Απλή Γραμμική Παλινδρόμηση Excel
Βίντεο: Απλή Γραμμική Παλινδρόμηση Excel

Περιεχόμενο

Η γραμμική παλινδρόμηση είναι μια στατιστική μέθοδος για την εξέταση της σχέσης μεταξύ μιας εξαρτημένης μεταβλητής, η οποία υποδηλώνεται ως y, και μία ή περισσότερες ανεξάρτητες μεταβλητές, που δηλώνεται ως Χ. Η εξαρτώμενη μεταβλητή πρέπει να είναι συνεχής, επειδή μπορεί να πάρει οποιαδήποτε τιμή, ή τουλάχιστον κοντά σε συνεχή. Οι ανεξάρτητες μεταβλητές μπορούν να είναι οποιουδήποτε τύπου. Αν και η γραμμική παλινδρόμηση δεν μπορεί να παρουσιάσει την αιτιώδη συνάφεια από μόνη της, η εξαρτημένη μεταβλητή επηρεάζεται συνήθως από τις ανεξάρτητες μεταβλητές.


Η γραμμική παλινδρόμηση περιορίζεται στις γραμμικές σχέσεις

Από τη φύση του, η γραμμική παλινδρόμηση εξετάζει μόνο γραμμικές σχέσεις μεταξύ εξαρτημένων και ανεξάρτητων μεταβλητών. Δηλαδή, υποθέτει ότι υπάρχει μια ευθεία σχέση μεταξύ τους. Μερικές φορές αυτό είναι λανθασμένο. Για παράδειγμα, η σχέση μεταξύ εισοδήματος και ηλικίας είναι καμπύλη, δηλ. Το εισόδημα τείνει να αυξάνεται στα αρχικά τμήματα της ενήλικης ζωής, να εξομαλυνθεί αργότερα στην ενηλικίωση και να μειωθεί μετά την αποχώρηση των ανθρώπων. Μπορείτε να διαπιστώσετε εάν αυτό είναι πρόβλημα εξετάζοντας τις γραφικές παραστάσεις των σχέσεων.

Η γραμμική παλινδρόμηση εμφανίζει μόνο τη μέση της εξαρτώμενης μεταβλητής

Η γραμμική παλινδρόμηση εξετάζει τη σχέση μεταξύ του μέσου της εξαρτώμενης μεταβλητής και των ανεξάρτητων μεταβλητών. Για παράδειγμα, αν κοιτάξετε τη σχέση μεταξύ του βάρους γέννησης των βρεφών και των μητρικών χαρακτηριστικών όπως η ηλικία, η γραμμική παλινδρόμηση θα εξετάσει το μέσο βάρος των μωρών που γεννιούνται σε μητέρες διαφορετικών ηλικιών. Ωστόσο, μερικές φορές πρέπει να εξετάσετε τα άκρα της εξαρτώμενης μεταβλητής, π.χ. τα μωρά βρίσκονται σε κίνδυνο όταν τα βάρη τους είναι χαμηλά, οπότε θα θέλατε να δείτε τα άκρα σε αυτό το παράδειγμα.


Ακριβώς όπως ο μέσος όρος δεν είναι πλήρης περιγραφή μίας μόνο μεταβλητής, η γραμμική παλινδρόμηση δεν είναι μια πλήρης περιγραφή των σχέσεων μεταξύ των μεταβλητών. Μπορείτε να αντιμετωπίσετε αυτό το πρόβλημα χρησιμοποιώντας quantile regression.

Η γραμμική παλινδρόμηση είναι ευαίσθητη στις παραμέτρους

Οι αποκλίσεις είναι δεδομένα που προκαλούν έκπληξη. Οι αποκλίσεις μπορούν να είναι μονοσήμαντες (βάσει μιας μεταβλητής) ή πολλαπλών μεταβλητών. Αν κοιτάζετε την ηλικία και το εισόδημα, τα μονοπώλια υπερβολικά υψηλά θα είναι πράγματα όπως ένα πρόσωπο που είναι 118 ετών ή κάποιος που έκανε 12 εκατομμύρια δολάρια πέρυσι. Μια πολυπαραγοντική εκτροπή θα ήταν ένας 18χρονος που έκανε $ 200.000. Σε αυτή την περίπτωση, ούτε η ηλικία ούτε το εισόδημα είναι πολύ ακραίες, αλλά πολύ λίγοι άνθρωποι ηλικίας 18 ετών κάνουν αυτά τα πολλά χρήματα.

Οι υπερβολικές τιμές μπορούν να έχουν τεράστιες επιπτώσεις στην παλινδρόμηση. Μπορείτε να αντιμετωπίσετε αυτό το πρόβλημα ζητώντας στατιστικά στοιχεία επιρροής από το στατιστικό λογισμικό σας.


Τα δεδομένα πρέπει να είναι ανεξάρτητα

Η γραμμική παλινδρόμηση υποθέτει ότι τα δεδομένα είναι ανεξάρτητα. Αυτό σημαίνει ότι τα αποτελέσματα ενός θέματος (όπως ένα άτομο) δεν έχουν καμία σχέση με αυτά ενός άλλου. Αυτό είναι συχνά, αλλά όχι πάντα, λογικό. Δύο συνηθισμένες περιπτώσεις όπου δεν έχει νόημα είναι η συσσώρευση σε χώρο και χρόνο.

Ένα κλασικό παράδειγμα συστοιχίας στο διάστημα είναι οι βαθμολογίες των μαθητών, όταν έχετε μαθητές από διάφορες τάξεις, βαθμούς, σχολεία και σχολικές περιοχές. Οι μαθητές της ίδιας τάξης τείνουν να είναι παρόμοιοι με πολλούς τρόπους, δηλ. Προέρχονται συχνά από τις ίδιες γειτονιές, έχουν τους ίδιους δασκάλους κλπ. Έτσι, δεν είναι ανεξάρτητες.

Παραδείγματα ομαδοποίησης στο χρόνο είναι οποιεσδήποτε μελέτες όπου μετράτε τα ίδια θέματα πολλές φορές. Για παράδειγμα, σε μια μελέτη διατροφής και βάρους, μπορείτε να μετρήσετε κάθε άτομο πολλές φορές. Αυτά τα δεδομένα δεν είναι ανεξάρτητα επειδή αυτό που ζυγίζει ένα άτομο σε μια περίπτωση σχετίζεται με αυτό που ζυγίζει σε άλλες περιπτώσεις. Ένας τρόπος αντιμετώπισης αυτού του προβλήματος είναι τα πολυεπίπεδα μοντέλα.