Ποια είναι τα κενά, τα clusters και τα Outliers στο μαθηματικό;

Posted on
Συγγραφέας: Louise Ward
Ημερομηνία Δημιουργίας: 11 Φεβρουάριος 2021
Ημερομηνία Ενημέρωσης: 6 Ιούλιος 2024
Anonim
Ποια είναι τα κενά, τα clusters και τα Outliers στο μαθηματικό; - Επιστήμη
Ποια είναι τα κενά, τα clusters και τα Outliers στο μαθηματικό; - Επιστήμη

Περιεχόμενο

Οι επιχειρηματικές, κυβερνητικές και ακαδημαϊκές δραστηριότητες απαιτούν σχεδόν πάντοτε τη συλλογή και ανάλυση δεδομένων. Ένας από τους τρόπους αναπαραγωγής αριθμητικών δεδομένων είναι μέσω γραφημάτων, ιστογραμμάτων και διαγραμμάτων. Αυτές οι τεχνικές απεικόνισης επιτρέπουν στους ανθρώπους να αποκτήσουν καλύτερη εικόνα για τα προβλήματα και να επινοήσουν λύσεις. Τα κενά, οι συστάδες και οι ακραίες τιμές είναι χαρακτηριστικά των συνόλων δεδομένων που επηρεάζουν τη μαθηματική ανάλυση και είναι άμεσα ορατά σε οπτικές αναπαραστάσεις.


Τρύπες στα δεδομένα

Τα κενά αναφέρονται σε περιοχές που λείπουν σε ένα σύνολο δεδομένων. Για παράδειγμα, εάν ένα επιστημονικό πείραμα συλλέγει δεδομένα θερμοκρασίας από 50 βαθμούς Fahrenheit έως 100 βαθμούς Fahrenheit, αλλά τίποτα μεταξύ 70 και 80 μοιρών, αυτό θα αποτελούσε κενό στο σύνολο δεδομένων. Ένα γράφημα γραμμής αυτού του συνόλου δεδομένων θα είχε σημάδια "x" για θερμοκρασίες μεταξύ 50 και 70 και πάλι μεταξύ 80 και 100, αλλά δεν θα υπήρχε τίποτα μεταξύ 70 και 80. Οι ερευνητές μπορούν να σκάψουν βαθύτερα και να διερευνήσουν γιατί ορισμένα σημεία δεδομένων δεν εμφανίζονται σε ένα συλλεγμένο δείγμα.

Απομονωμένες ομάδες

Οι ομάδες είναι απομονωμένες ομάδες σημείων δεδομένων. Τα γραφήματα γραμμής, τα οποία είναι ένας από τους τρόπους που αντιπροσωπεύουν τα σύνολα δεδομένων, είναι γραμμές με σημάδια "x" τοποθετημένα πάνω από συγκεκριμένους αριθμούς για να απεικονίζουν τη συχνότητα εμφάνισής τους στο σύνολο δεδομένων. Ένα σύμπλεγμα απεικονίζεται ως μια συλλογή από αυτά τα σημάδια "x" σε ένα μικρό διάστημα ή υποσύνολο δεδομένων. Για παράδειγμα, εάν οι βαθμολογίες εξετάσεων για μια τάξη 10 μαθητών είναι 74, 75, 80, 72, 74, 75, 76, 86, 88 και 73, τα πιο "x" σημάδια σε μια γραμμή γραμμής θα ήταν στο 72- έως-76. Αυτό θα αντιπροσωπεύει ένα σύμπλεγμα δεδομένων. Σημειώστε ότι η συχνότητα για το 74 και το 75 είναι δύο, αλλά για όλες τις άλλες βαθμολογίες είναι μία.


Στα Ακραία

Οι ακραίες τιμές είναι ακραίες τιμές - σημεία δεδομένων που βρίσκονται σημαντικά έξω από άλλες τιμές σε ένα σύνολο δεδομένων. Μια απόκλιση πρέπει να είναι σημαντικά μικρότερη ή μεγαλύτερη από την πλειοψηφία των αριθμών σε ένα σύνολο δεδομένων. Ο ορισμός των "ακραίων" εξαρτάται από την περίσταση και τη συναίνεση των αναλυτών που συμμετέχουν στην έρευνα. Τα αποθέματα μπορεί να είναι κακά σημεία δεδομένων, επίσης γνωστά ως θόρυβος ή ενδέχεται να περιέχουν πολύτιμες πληροφορίες σχετικά με το φαινόμενο που διερευνάται και τη μεθοδολογία συλλογής δεδομένων. Για παράδειγμα, εάν οι βαθμολογίες της τάξης είναι κατά κύριο λόγο στην περιοχή των 70 έως 80, αλλά μερικές βαθμολογίες βρίσκονται στα χαμηλά 50, αυτά μπορεί να αντιπροσωπεύουν υπερβολικά υψηλά επίπεδα.

Κάνοντας όλοι μαζί

Τα κενά, οι ακραίες τιμές και οι συστοιχίες σε σύνολα δεδομένων μπορούν να επηρεάσουν τα αποτελέσματα της μαθηματικής ανάλυσης. Τα κενά και τα σμήνη ενδέχεται να αντιπροσωπεύουν σφάλματα στη μεθοδολογία συλλογής δεδομένων. Για παράδειγμα, αν μια τηλεφωνική έρευνα κάνει δημοσκόπηση μόνο για ορισμένους κωδικούς περιοχής, όπως συγκροτήματα κατοικιών χαμηλού εισοδήματος ή προαστιακές περιοχές υψηλής κατηγορίας και όχι ευρεία διατομή του πληθυσμού, υπάρχουν πιθανότητες να υπάρξουν κενά και ομάδες στα δεδομένα . Οι υπερβάσεις μπορούν να στρέψουν τη μέση ή τη μέση τιμή ενός συνόλου δεδομένων. Για παράδειγμα, η μέση ή μέση τιμή ενός συνόλου δεδομένων που αποτελείται από τέσσερις αριθμούς - 50, 55, 65 και 90 - είναι 65. Χωρίς την απόκλιση 90, ωστόσο, ο μέσος όρος είναι περίπου 57.