Μετάβαση στο περιεχόμενο

Δειγματοληψία

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
(Ανακατεύθυνση από Τυχαίο δείγμα)


Δειγματοληψία στη στατιστική είναι η τεχνική της επιλογής ενός μέρους του πληθυσμού (το οποίο ονομάζεται δείγμα). Με την ορολογία πληθυσμός εννοούμε ένα πλήθος παρατηρήσεων ή μετρήσεων ο οποίος μπορεί να αποτελεί ένα πεπερασμένο ή άπειρο πλήθος στοιχείων (ονομάζεται μέγεθος του πληθυσμού και συμβολίζεται με ). Το πλήθος των στοιχείων ενός δείγματος ονομάζεται μέγεθος του δείγματος και συμβολίζεται με . Όταν έχουμε ένα πληθυσμό μπορούμε κατά την δειγματοληψία είτε επανατοποθετώντας το στοιχείο πάλι πίσω στο πληθυσμό είτε χωρίς επανατοποθέτηση. Η πρώτη περίπτωση ονομάζεται δειγματοληψία με επανατοποθέτηση ενώ η δεύτερη περίπτωση ονομάζεται δειγματοληψία χωρίς επανατοποθέτηση. Στην δειγματοληψία χωρίς επανατοποθέτηση το κάθε στοιχείο του πληθυσμού μπορεί να επιλεγεί το πολύ μόνο μια φορά. Όταν η επιλογή του στοιχείου μέσα από το πληθυσμό γίνεται με τέτοιο τρόπο ώστε να επιλέγεται με την ίδια πιθανότητα οποιοδήποτε στοιχείο του πληθυσμού τότε το δείγμα αυτό ονομάζεται τυχαίο δείγμα. [1]

Ο όρος δειγματοληψία υποδηλώνει την στατιστική διερεύνηση του μέρους (δείγμα) ενός συνόλου (πληθυσμός), με σκοπό την διεξαγωγή συμπερασμάτων για το σύνολο αυτό.[2]

Εισαγωγικές έννοιες

[Επεξεργασία | επεξεργασία κώδικα]

Στατιστική μονάδα

[Επεξεργασία | επεξεργασία κώδικα]

Στατιστική μονάδα είναι το στοιχείο ενός συνόλου το οποίο ερευνάται ως προς μία ή περισσότερες ιδιότητες (χαρακτηριστικά). Π.χ. η οικογένεια μιας πόλης ή μιας χώρας η οποία ερευνάται ως προς τον αριθμό παιδιών ή ως προς το ύψος του εισοδήματος, ο υπάλληλος μιας επιχείρησης ο οποίος ερευνάται ως προς το μέγεθος του μισθού ή ως προς τον αριθμό ετών υπηρεσίας, κ.ο.κ. αποτελούν στατιστικές μονάδες.[3]

Στη στατιστική ο όρος «πληθυσμός» είναι το σύνολο των στατιστικών μονάδων οι οποίες ερευνώνται ως προς μία ή περισσότερες ιδιότητες (χαρακτηριστικά). Π.χ. το σύνολο των οικογενειών μιας πόλης ή μιας χώρας, οι οποίες ερευνώνται ως προς το ύψος του εισοδήματος, αποτελεί τον ερευνώμενο πληθυσμό, κ.ο.κ. [3]

Δειγματοληπτικό πλαίσιο

[Επεξεργασία | επεξεργασία κώδικα]

Στην απλούστερή του μορφή το δειγματοληπτικό πλαίσιο (frame) είναι μια λίστα από στοιχεία (elements) που καλύπτουν τον ερευνώμενο πληθυσμό (πληθυσμό στόχο). Μπορεί να αποτελείται από μια φυσική λίστα, όπως ένας κατάλογος, ένα output από υπολογιστή, μια μαγνητική ταινία, ένας τηλεφωνικός κατάλογος ή ένα σύνολο καρτών. Στις περιπτώσεις αυτές έχουμε το λεγόμενο πλαίσιο – λίστα (list frame). Μπορεί επίσης να είναι ένα οικοδομικό σχέδιο πόλεως ή αεροφωτογραφία μιας περιοχής ή γενικότερα μια γεωγραφική περιοχή, οπότε έχουμε το λεγόμενο area frame. Τέλος, μπορεί να αποτελείται από μια εννοιολογική λίστα όπως, για παράδειγμα, όλα τα αυτοκίνητα (γενικότερα, τροχοφόρα) που πάρκαραν σε κάποιο μέρος μεταξύ 8 π.μ. και 8 μ.μ. μετά τον μήνα Οκτώβριο.  

Ο προσδιορισμός του πλαισίου παίζει σημαντικό ρόλο στο σχεδιασμό μιας δειγματοληπτικής έρευνας. Καθορίζει πόσο καλά καλύπτεται ο πληθυσμός επηρεάζει τη μέθοδο συλλογής της πληροφορίας και επιδρά στην αποτελεσματικότητά με την οποία λαμβάνεται ένα δείγμα. Συνεπώς το δειγματοληπτικό πλαίσιο αποτελεί βασική προϋπόθεση για την επιτυχία οποιασδήποτε δειγματοληπτικής έρευνας. Πρέπει να περιέχει όλο το δειγματοληπτούμενο πληθυσμό έτσι ώστε κάθε δειγματοληπτική μονάδα να έχει κάποια ευκαιρία επιλογής κατά τη δειγματοληψία. Σε αντίθετη περίπτωση, τα συμπεράσματα της έρευνας δεν μπορούν αξιόπιστα να γενικευτούν επαγωγικά στο σύνολο του ερευνώμενου πληθυσμού.[4]

Δείγμα είναι μια συλλογή δειγματοληπτικών μονάδων από το πλαίσιο.[5]

Έστω η τυχαία μεταβλητή που περιγράφει το χαρακτηριστικό που ερευνούμε. Επιλέγουμε με τυχαίο τρόπο στοιχεία του πληθυσμού και συμβολίζουμε με την τιμή που παίρνει η τυχαία μεταβλητή για το στοιχείο αυτό. Το διάνυσμα ονομάζεται τυχαίο δείγμα μεγέθους . Ο όρος "τυχαίο δείγμα" χρησιμοποιείται και για την αντίστοιχη τυχαία μεταβλητή , όπου οι τυχαίες μεταβλητές θεωρούνται ανεξάρτητες και ισόνομες (έχουν δηλαδή την ίδια συνάρτηση κατανομής).

Δειγματοληπτικό σφάλμα

[Επεξεργασία | επεξεργασία κώδικα]

Δειγματοληπτικό σφάλμα (sampling error) είναι η διαφορά μεταξύ της εκτίμησης μιας παραμέτρου που προκύπτει από την τυχαία επιλογή των δειγματοληπτικών μονάδων και τις αντίστοιχες υπολογισθείσας πληθυσμιακής παραμέτρου που προκύπτει από την καθολική έρευνα (απογραφή) του πληθυσμού. Φυσικά τα δύο μέτρα (εκτίμηση παραμέτρου και υπολογισθείσα πληθυσμιακή παράμετρος) πρέπει να προκύπτουν  με την ίδια διαδικασία μέτρησης. Όσο αυξάνεται το μέγεθος του δείγματος σε μία έρευνα τόσο ελαττώνεται το δειγματοληπτικό σφάλμα. Σε μία καθολική έρευνα το δειγματοληπτικό σφάλμα είναι μηδέν (διότι έχουμε ένα μοναδικό δείγμα). [6]

Μη δειγματοληπτικό σφάλμα

[Επεξεργασία | επεξεργασία κώδικα]

Τα μη δειγματοληπτικά σφάλματα (non sampling errors) δεν οφείλονται στη δειγματοληψία, αλλά είναι σφάλματα τα οποία μπορεί να γίνουν σε κάθε είδους έρευνα, καθολική ή δειγματοληπτική. Οι σπουδαιότεροι παράγοντες οι οποίοι προκαλούν μη δειγματοληπτικά σφάλματα είναι οι εξής: [6]

Α. Ακαταλληλότητα του ερωτηματολογίου

Β. Σφάλματα ανταπόκρισης

Γ. Σφάλματα ερευνητή

Δ. Σφάλματα επεξεργασίας

Είδη δειγματοληψίας

[Επεξεργασία | επεξεργασία κώδικα]

Μια διαδικασία δειγματοληψίας θα ονομάζεται απλή τυχαία δειγματοληψία εάν σε ένα δείγμα μεγέθους n, όλοι οι δυνατοί συνδυασμοί των n στοιχειωδών μονάδων που μπορούν να σχηματιστούν από τον πληθυσμό των N στοιχειωδών μονάδων έχουν την ίδια πιθανότητα επιλογής.

Υπάρχουν δύο βασικοί λόγοι για αναλυτική μελέτη της απλής τυχαίας δειγματοληψίας:

α) Πολλές από τις βασικές αρχές της δειγματοληψίας μπορούν να ερμηνευθούν σε όρους της απλής τυχαίας δειγματοληψίας με εύκολη προσαρμογή αυτής σε περισσότερο σύνθετα σχέδια δειγματοληψίας.

Β) Η θεωρία της απλής τυχαίας δειγματοληψίας μπορεί, κάτω από ορισμένες προϋποθέσεις, να εξασφαλίσει ένα χρήσιμο οδηγό για την ακρίβεια η οποία πρέπει να αναμένεται από άλλα συγκεκριμένα σχέδια δειγματοληψίας, των οποίων οι τύποι είναι περισσότερο σύνθετοι.[7]

Στην στρωματοποιημένη δειγματοληψία ο πληθυσμός N διαιρείται σε k υποπληθυσμούς (στρώματα): N1 , N2, N3, …, Nk μονάδων, ούτως ώστε αφενός μεν να μην υπάρχει επικάλυψη μεταξύ των υποπληθυσμών (στρωμάτων) αφετέρου δε το σύνολο των μονάδων των υποπληθυσμών (στρωμάτων) να συνιστούν τον αρχικό πληθυσμό, δηλαδή:  N1 + N2+ …+Nk = Ν. Εάν λάβουμε απλό τυχαίο δείγμα από κάθε στρώμα, η διαδικασία είναι γνωστή σαν στρωματοποιημένη δειγματοληψία (ή κατά στρώματα τυχαία δειγματοληψία).[8]

Ένα σχέδιο στρωματοποιημένης απλής τυχαίας δειγματοληψίας είναι αυτό που τα στοιχεία (δειγματοληπτικές μονάδες) του πληθυσμού χωρίζονται σε ομάδες, αναφερόμενες ως στρώματα, τέτοια που κάθε στοιχείο περιλαμβάνεται σε ένα και μόνο ένα στρώμα. Το δείγμα τότε επιλέγεται χρησιμοποιώντας ένα απλό τυχαίο δείγμα στοιχείων από κάθε στρώμα. Το δειγματοληπτικό πλαίσιο μπορεί να διαφέρει από στρώμα σε στρώμα ή μπορεί να είναι ομοιόμορφο σε όλα τα στρώματα. Εάν το δειγματοληπτικό πλαίσιο είναι ομοιόμορφο, το σχέδιο της δειγματοληψίας αναφέρεται ως ανάλογη (ποσοστιαία) στρωματοποιημένη δειγματοληψία.  [9]

Για να λάβουμε ένα 10% δείγμα από έναν κατάλογο 730 καρτελλών, θα μπορούσαμε να επιλέξουμε ένα τυχαίο αριθμό μεταξύ 1 και 10, έστω 3, και να επιλέξουμε στη συνέχεια κάθε 10η καρτέλα μετά από αυτή. Δηλαδή, τις κάρτες που αριθμούνται με την σειρά 3η, 13η, 23η, κ.ο.κ. τελειώνοντας με την κάρτα που αριθμείται με σειρά 723. Ένα δείγμα αυτού του είδους είναι γνωστό σαν συστηματικό δείγμα επειδή η επιλογή της πρώτης του μονάδας [3] προσδιορίζει ολόκληρο το δείγμα. Η συστηματική δειγματοληψία έχει δύο πλεονεκτήματα σε σχέση με την απλή τυχαία δειγματοληψία. Είναι ευκολότερο να τραβήξουμε το δείγμα επειδή μόνο ένας τυχαίος αριθμός απαιτείται και κατανέμει το δείγμα, περισσότερο ομαλά επί του πλαισίου του πληθυσμού. Γι’ αυτό το λόγο η συστηματική δειγματοληψία συχνά δίνει περισσότερο ακριβή αποτελέσματα από την απλή τυχαία δειγματοληψία. Μερικές φορές η αύξηση την ακρίβεια είναι μεγάλη. Στη συνήθη δειγματοληψία (ρουτίνας), η συστηματική επιλογή του δείγματος έχει γίνει μία δημοφιλής τεχνική. [10]

Με τη μέθοδο αυτή χωρίζουμε τον πληθυσμό σε διάφορες ομάδες, τις οποίες θα καλούμε τώρα συστάδες (clusters), και στη συνέχεια η επιλογή ενός τυχαίου δείγματος (με α.τ.δ.) από συστάδες. Συνεπώς στην περίπτωση αυτή το δείγμα είναι ένα απλό τυχαίο δείγμα στο οποίο κάθε δειγματοληπτική μονάδα είναι μία συλλογή (συστάδα) στοιχείων. Ο χωρισμός του πληθυσμού σε ομάδες-συστάδες φαίνεται να μοιάζει με τη μέθοδο της στρωματοποιημένης δειγματοληψίας όπου πάλι ο πληθυσμός χωρίζεται σε ομάδες-στρώματα. Υπάρχει όμως μία σημαντική διαφορά στη στρωματοποιημένη δειγματοληψία έχουμε δει ότι για τη βέλτιστη κατασκευή των στρωμάτων πρέπει τα στρώματα να είναι όσο το δυνατόν ομοιογενή ως προς τα στοιχεία (μονάδες) που περιέχουν και να είναι όσο το δυνατόν περισσότερο ανομοιογενή μεταξύ τους (να διαφέρουν το ένα από το άλλο) ως προς το χαρακτηριστικό που μας ενδιαφέρει. Αντίθετα, στην κατά συστάδες δειγματοληψία ο χωρισμός γίνεται σε όσο το δυνατόν ομοιογενείς συστάδες με ανομοιογενή στοιχεία η καθεμία. Η κατά συστάδες δειγματοληψία είναι ένα αποτελεσματικό σχέδιο κατά το οποίο λαμβάνεται περισσότερη πληροφορία για κάποια παράμετρο του πληθυσμού στο ελάχιστο κόστος ιδίως στην περίπτωση που Α. δεν υπάρχει διαθέσιμη λίστα (frame) για τα στοιχεία του πληθυσμού ή αν υπάρχει είναι πολύ δαπανηρή να την πάρουμε. Β. Το κόστος λήψης των παρατηρήσεων αυξάνει όσο η απόσταση μεταξύ των στοιχείων του πληθυσμού αυξάνει.

Η κατά συστάδες δειγματοληψία μπορεί επίσης να εφαρμοστεί και στην περίπτωση που το πλήθος των απλών στοιχείων του πληθυσμού είναι άγνωστο, άρα η α.τ.δ. και η στρωματοποιημένη δειγματοληψία δεν μπορούν να εφαρμοστούν. Επίσης, δεν είναι απαραίτητο να γνωρίζουμε το πλήθος των στοιχείων όλων των συστάδων, αλλά μόνο αυτών που τελικά θα επιλεγούν στο δείγμα. Έτσι το κόστος δημιουργίας ή/και επίσκεψης στις συστάδες του δείγματος και το κόστος συλλογής πληροφορίας από τις μονάδες του δείγματος είναι συνήθως μικρότερο από το αντίστοιχο κόστος που έχουμε στα άλλα σχέδια δειγματοληψίας που εξετάσαμε. [11]

Τυχαία επιλογή συστάδων και τυχαία επιλογή των μελών τους .


  1. R. Spiegel, Murray (1975). Πιθανότητες και Στατιστική. Schaum's Outline Series. σελίδες 155–156. ISBN 978-960-7610-27-0. 
  2. Krishnaiah, P. R, (1988). Sampling. Amsterdam: Elsevier. σελ. 16. ISBN 0-444-70289-X. 
  3. 3,0 3,1 Χαρίσης, Κώστας Ι. (1997). Θεωρία δειματοληψίας και εφαρμογές. Αθήνα: Interbooks. σελ. 13. ISBN 960-390-013-3. 
  4. Δαμιανός, Χαράλαμπος Χ. (1999). Μεθοδολογία δειγματοληψίας: τεχνικές και εφαρμογές. Αθήνα: Αίθρα. σελ. 5. ISBN 960-7007-47-6. 
  5. Δαμιανός, Χαράλαμπος Χ. (1999). Μεθοδολογία δειγματοληψίας: τεχνικές και εφαρμογές. Αθήνα: Αίθρα. σελ. 6. ISBN 960-7007-47-6. 
  6. 6,0 6,1 Χαρίσης, Κώστας Ι. (1997). Θεωρία δειγματοληψίας και εφαρμογές. Αθήνα: Interbooks. σελ. 23. ISBN 960-390-013-3. 
  7. Μπένος, Βασίλειος Κιμ. (1991). Μέθοδοι και τεχνικές δειγματοληψίας. Πειραιάς: Σταμούλης. σελ. 218. 
  8. Μπένος, Βασίλειος Κιμ. (1991). Μέθοδοι και τεχνικές δειγματοληψίας. Πειραιάς: Σταμούλης. σελ. 343. 
  9. Hansen, Morris H. (1956). Sample Survey Methods and Theory, vol. II Theory. New York: Wiley. σελ. 121. 
  10. Μπένος, Βασίλειος Κιμ. (1991). Μέθοδοι και τεχνικές δειγματοληψίας. Πειραιάς: Σταμούλης. σελ. 334. 
  11. Δαμιανός, Χαράλαμπος Χ. (2007). Μεθοδολογία δειγματοληψίας: τεχνικές και εφαρμογές. Θεσσαλονίκη: Σοφία. σελ. 237-238. ISBN 978-960-6706-02-8. 
  • Μπένος, Βασίλειος Κιμ. (1991). Μέθοδοι και τεχνικές δειγματοληψίας. Πειραιάς: Σταμούλης. σελ. 343.