Περιεχόμενο
Η ανάλυση συμπλέγματος είναι μια μέθοδος για την οργάνωση δεδομένων σε αντιπροσωπευτικές ομάδες με βάση παρόμοια χαρακτηριστικά. Κάθε μέλος του συμπλέγματος έχει περισσότερα κοινά με άλλα μέλη του ίδιου συμπλέγματος απ 'ό, τι με τα μέλη των άλλων ομάδων. Το πιο αντιπροσωπευτικό σημείο της ομάδας ονομάζεται κεντροειδές. Συνήθως, αυτός είναι ο μέσος όρος των τιμών των σημείων δεδομένων στο σύμπλεγμα.
Οργανώστε τα δεδομένα. Εάν τα δεδομένα συνίστανται από μία μόνο μεταβλητή, ίσως είναι κατάλληλο ένα ιστόγραμμα. Εάν αφορούν δύο μεταβλητές, γράψτε τα δεδομένα σε ένα επίπεδο συντεταγμένων. Για παράδειγμα, εάν εξετάζατε το ύψος και το βάρος των παιδιών σχολικής μονάδας σε μια τάξη, σχεδιάστε τα σημεία δεδομένων για κάθε παιδί σε ένα γράφημα, με το βάρος να είναι ο οριζόντιος άξονας και το ύψος να είναι ο κατακόρυφος άξονας. Εάν υπάρχουν περισσότερες από δύο μεταβλητές, μπορεί να χρειαστούν πίνακες για την εμφάνιση των δεδομένων.
Ομαδοποιήστε τα δεδομένα σε ομάδες. Κάθε σύμπλεγμα πρέπει να αποτελείται από τα σημεία δεδομένων που βρίσκονται πλησιέστερα σε αυτήν. Στο παράδειγμα ύψους και βάρους, ομαδοποιήστε τυχόν σημεία δεδομένων που φαίνεται να βρίσκονται κοντά. Ο αριθμός των συστάδων και το αν κάθε σημείο δεδομένων πρέπει να είναι σε ένα σύμπλεγμα μπορεί να εξαρτάται από τους σκοπούς της μελέτης.
Για κάθε σύμπλεγμα, προσθέστε τις τιμές όλων των μελών.Για παράδειγμα, εάν ένα σύνολο δεδομένων αποτελείται από τα σημεία (80, 56), (75, 53), (60, 50) και (68,54), το άθροισμα των τιμών θα είναι (283, 213).
Διαχωρίστε το σύνολο με τον αριθμό των μελών του συμπλέγματος. Στο παραπάνω παράδειγμα, το 283 διαιρούμενο με τέσσερα είναι 70.75 και το 213 διαιρούμενο με τέσσερα είναι 53.25, έτσι το κέντρο του συμπλέγματος είναι (70.75, 53.25).
Σχεδιάστε τα συγκεντρωτικά κεντροειδή και καθορίστε αν κάποια σημεία είναι πιο κοντά σε ένα κεντροειδές ενός άλλου συμπλέγματος απ 'ότι είναι στο κεντρομόλο του δικού τους συμπλέγματος. Αν κάποια σημεία είναι πιο κοντά σε ένα διαφορετικό κέντρο, αναδιανείμετέ τα στο σύμπλεγμα που περιέχει το κοντινό κέντρο.
Επαναλάβετε τα βήματα 3, 4 και 5 έως ότου όλα τα σημεία δεδομένων βρίσκονται στο σύμπλεγμα που περιέχει το κεντροειδές με το οποίο βρίσκονται πιο κοντά.