Διακύμανση
Στη θεωρία πιθανοτήτων και τη στατιστική, η διακύμανση είναι η αναμενόμενη τιμή της τετραγωνικής απόκλισης της τυχαίας μεταβλητής από τη μέση τιμή, και άτυπα μετρά πόσο μακριά ένα σύνολο (τυχαίων) αριθμών απλώνεται από τη μέση τιμή του. Η διακύμανση έχει κεντρικό ρόλο στη στατιστική. Χρησιμοποιείται στην περιγραφική στατιστική, στατιστική συμπερασματολογία, έλεγχο υποθέσεων, έλεγχο καλής προσαρμογής, Μόντε Κάρλο δειγματοληψίας, μεταξύ πολλών άλλων. Αυτό την καθιστά μία κεντρική ποσότητα σε πολλά πεδία όπως η Φυσική, Βιολογία, Χημεία, Οικονομικά, και Χρηματοοικονομικά. Η διακύμανση είναι το τετράγωνο της τυπικής απόκλισης, η δεύτερη κεντρική ροπή της κατανομής, και η συνδιασπορά της τυχαίας μεταβλητής με τον εαυτό της, και συχνά συμβολίζεται σ² ή Var(X).
Ορισμός
[Επεξεργασία | επεξεργασία κώδικα]Η διακύμανση μιας τυχαίας μεταβλητής Χ είναι η αναμενόμενη τιμή της τετραγωνικής απόκλισης από τη μέση τιμή του X, μ = E[X]:
Ο ορισμός αυτός περιλαμβάνει τυχαίες μεταβλητές που δημιουργούνται από διαδικασίες που είναι διακριτές, συνεχείς, ούτε διακριτές ούτε συνεχείς, ή μικτές. Η διακύμανση μπορεί επίσης να θεωρηθεί ως η συνδιασπορά μιας τυχαίας μεταβλητής με τον εαυτό της:
Η διακύμανση είναι επίσης ισοδύναμη με το δεύτερο αθροιστικό από μια κατανομή πιθανότητας που παράγει την X. Η διακύμανση τυπικά συμβολίζεται Var(X), ή απλά σ^2 (προφέρεται "σίγμα στο τετράγωνο"). Ο τύπος για τη διασπορά μπορεί να αναπτυχθεί:
Ένα μνημονικό για τον παραπάνω τύπο είναι το "μέσο του τετραγώνου μείον το τετράγωνο του μέσου". Στην υπολογιστική αριθμητική κινητής υποδιαστολής, η εξίσωση αυτή δεν πρέπει να χρησιμοποιείται, γιατί πάσχει από έλλειψη σημασίας αν τα δύο μέρη της εξίσωσης είναι παρόμοια σε μέγεθος. Υπάρχουν αριθμητικά σταθερές εναλλακτικές λύσεις.
Συνεχής τυχαία μεταβλητή
[Επεξεργασία | επεξεργασία κώδικα]Αν η τυχαία μεταβλητή X αντιπροσωπεύει δείγματα που παράγονται από μια συνεχή κατανομή με συνάρτηση πυκνότητας πιθανότητας f(x),τότε η διακύμανση του πληθυσμού δίνεται από
όπου είναι η αναμενόμενη τιμή,
και όπου τα ολοκληρώματα είναι ορισμένα ολοκληρώματα που λαμβάνονται για x που κυμαίνονται πάνω στο εύρος τιμών του X.
Αν μια συνεχής κατανομή δεν έχει αναμενόμενη τιμή, όπως στην περίπτωση της Κωσύ κατανομής, δεν έχει ούτε διακύμανση. Πολλές άλλες κατανομές, για τις οποίες η αναμενόμενη τιμή δεν υπάρχει, επίσης, δεν έχουν πεπερασμένη διακύμανση, επειδή το ολοκλήρωμα στον ορισμό της διακύμανσης αποκλίνει. Ένα παράδειγμα είναι μια κατανομή Παρέτο της οποίας ο δείκτης k ικανοποιεί την 1 < k ≤ 2.
Διακριτή τυχαία μεταβλητή
[Επεξεργασία | επεξεργασία κώδικα]Αν η γεννήτρια της τυχαίας μεταβλητής X είναι διακριτή με συνάρτηση μάζας πιθανότητας x1 ↦ p1, ..., xn ↦ pn, τότε
ή ισοδύναμα
όπου είναι η αναμενόμενη τιμή, δηλ.
(Όταν μια διακριτά σταθμισμένη διακύμανση καθορίζεται από βάρη των οποίων το άθροισμα δεν είναι 1, τότε ένα διαιρεί το άθροισμα των βαρών.)
Η διακύμανση ενός συνόλου n ισοπίθανων τιμών μπορεί να γραφτεί ως
όπου είναι η αναμενόμενη τιμή, δηλ.
Η διακύμανση ενός συνόλου n ισοπίθανων τιμών μπορεί να εκφράζεται ισοδύναμα, χωρίς να αναφέρεται άμεσα η μέση τιμή,με τους όρους των τετραγώνων των αποκλίσεων όλων των σημείων,του ενος απο του αλλου:[1]
Παραδείγματα
[Επεξεργασία | επεξεργασία κώδικα]Κανονική κατανομή
[Επεξεργασία | επεξεργασία κώδικα]Η κανονική κατανομή με παραμέτρους μ και σ είναι μια συνεχής κατανομή της οποίας η συνάρτηση πυκνότητας πιθανότητας δίνεται από τον τύπο:
Σε αυτή την κατανομή, E(X) = μ και διακύμανση Var(X) σχετίζεται με το σ μέσω της σχέσης
Ο ρόλος της κανονικής κατανομής στο κεντρικό οριακό θεώρημα είναι εν μέρει υπεύθυνος για την επικράτηση της διακύμανσης στις πιθανότητες και τη στατιστική.
Εκθετική κατανομή
[Επεξεργασία | επεξεργασία κώδικα]Η εκθετική κατανομή με παράμετρο λ είναι μια συνεχής κατανομή η υποστήριξη της οποίας είναι το ημι-άπειρο διάστημα [0,∞). Η συνάρτηση πυκνότητας πιθανότητας δίνεται από τον τύπο:
και έχει αναμενόμενη τιμή μ = λ−1. Η διακύμανση είναι ίση με:
Έτσι, για μία εκθετικά κατανεμημένη τυχαία μεταβλητή σ2 = μ2.
Κατανομή Πουασσόν
[Επεξεργασία | επεξεργασία κώδικα]Η κατανομή Πουασσόν με παράμετρο λ είναι μια διακριτή κατανομή για k = 0, 1, 2, ... Η συνάρτηση μάζας πιθανότητας δίνεται από τον τύπο:
και έχει αναμενόμενη τιμή μ = λ. Η διακύμανση είναι ίση με:
Έτσι, για μια Πουασσόν-κατανεμημένη τυχαία μεταβλητή σ2 = μ.
Διωνυμική κατανομή
[Επεξεργασία | επεξεργασία κώδικα]Η διωνυμική κατανομή με παραμέτρους n και p είναι μια διακριτή κατανομή για k = 0, 1, 2, ..., n. Η συνάρτηση μάζας πιθανότητας δίνεται από τον τύπο:
και έχει αναμενόμενη τιμή μ = np. Η διακύμανση είναι ίση με:
Ρίψη νομίσματος
[Επεξεργασία | επεξεργασία κώδικα]Η διωνυμική κατανομή με περιγράφει την πιθανότητα να εμφανιστούν κεφαλές σε ρίψεις. Έτσι, η αναμενόμενη τιμή του αριθμού των κεφαλών είναι και η διακύμανση είναι .
Ρίψη ζαριού
[Επεξεργασία | επεξεργασία κώδικα]Ένα εξάεδρο ζάρι μπορεί να μοντελοποιηθεί με μια διακριτή τυχαία μεταβλητή με αποτελέσματα από το 1 έως το 6, το καθένα με ίση πιθανότητα . Η αναμενόμενη τιμή είναι (1 + 2 + 3 + 4 + 5 + 6)/6 = 3.5. Ως εκ τούτου, η διακύμανση μπορεί να υπολογιστεί να είναι:
Ο γενικός τύπος για την μεταβλητή του αποτελέσματος X ενός ζαριού 6 έδρων είναι:
Ιδιότητες
[Επεξεργασία | επεξεργασία κώδικα]Βασικές ιδιότητες
[Επεξεργασία | επεξεργασία κώδικα]Η διακύμανση είναι μη-αρνητική επειδή τα τετράγωνα είναι θετικά ή μηδέν.
Η διακύμανση μιας σταθερής τυχαίας μεταβλητής είναι μηδέν,και αν η διακύμανση μιας μεταβλητής σε ένα σύνολο δεδομένων είναι 0,τότε όλα τα δεδομένα που εισάγονται έχουν την ίδια τιμή.
Η διακύμανση είναι αμετάβλητη σε σχέση με τις αλλαγές σε μία παράμετρο θέσης.Δηλαδή, αν προστεθεί μία σταθερά σε όλες τις τιμές της μεταβλητής,η διακύμανση δεν αλλάζει.
Αν όλες οι τιμές πολλαπλασιαστούν με μία σταθερά, η διακύμανση πολλαπλασιάζεται με το τετράγωνο της σταθεράς.
Η διακύμανση του αθροίσματος δύο τυχαίων μεταβλητών δίνεται από:
όπου Cov(⋅, ⋅) είναι η συνδιασπορά. Γενικά, για το άθροισμα τυχαίων μεταβλητών έχουμε:
Αυτά τα αποτελέσματα οδηγούν στη διακύμανση ενός γραμμικού συνδυασμού:
Αν οι τυχαίες μεταβλητές είναι τέτοιες ώστε
τότε λέγονται ασυσχέτιστες.Έπεται αμέσως από την έκφραση που δόθηκε πριν ότι αν οι τυχαίες μεταβλητές είναι ασυσχέτιστες, τότε η διακύμανση του αθροίσματός τους είναι ίση με το άθροισμα των διακυμάνσεών τους, ή, εκφρασμένο με σύμβολα:
Αφού οι ανεξάρτητες τυχαίες μεταβλητές είναι πάντα ασυσχέτιστες, η παραπάνω ισότητα ισχύει ιδίως όταν οι τυχαίες μεταβλητές είναι ανεξάρτητες. Έτσι η ανεξαρτησία είναι ικανή αλλά όχι αναγκαία για να είναι η διακύμανση του αθροίσματος ίση με το άθροισμα των διακυμάνσεων.
Άθροισμα ασυσχέτιστων μεταβλητών (τύπος Bienaymé)
[Επεξεργασία | επεξεργασία κώδικα]Ένας λόγος για να προτιμηθεί η χρήση της διακύμανσης από άλλα μέτρα διασποράς είναι ότι η διακύμανση του αθροίσματος (ή της διαφοράς) ασυσχέτιστων μεταβλητών είναι το άθροισμα των διακυμάνσεών τους:
Αυτή η πρόταση ονομάζεται ταυτότητα Bienaymé [2] και ανακαλύφθηκε το 1853.[citation needed] Γίνεται συχνά με τηνισχυρότερη προϋπόθεση ότι οι μεταβλητές είναι ανεξάρτητες,αλλά και να είναι ασυσχέτιστες είναι επαρκές.Έτσι, αν όλες οι μεταβλητές έχουν την ίδια διακύμανση σ2,τότε , δεδομένου ότι η διαίρεση με το n είναι ένας γραμμικός μετασχηματισμός , ο τύπος αυτός συνεπάγεται αμέσως ότι η διακύμανση της μέσης τιμής τους, είναι
Δηλαδή, η διακύμανση της μέσης τιμής μειώνεται όταν το n αυξάνεται . Αυτός ο τύπος για τη διακύμανση της μέσης τιμής χρησιμοποιείται στον ορισμό του βασικού σφάλματος της μέσης τιμής του δείγματος , το οποίο χρησιμοποιείται στο κεντρικό οριακο θεώρημα.
Άθροισμα συσχετισμένων μεταβλητών
[Επεξεργασία | επεξεργασία κώδικα]Γενικά, αν οι μεταβλητές είναι συσχετισμένες, τότε η διακύμανση του αθροίσματός τους είναι το άθροισμα των συνδιασπορών τους:
(Σημείωση : Η δεύτερη ισότητα προκύπτει από το γεγονός ότι Cov(Xi,Xi) = Var(Xi).)
Εδώ Cov(⋅, ⋅) είναι η συνδιασπορά, η οποία είναι μηδέν για ανεξάρτητες τυχαίες μεταβλητές (αν υπάρχει). Ο τύπος δηλώνει ότι η διακύμανση ενός αθροίσματος είναι ίση με το άθροισμα όλων των στοιχείων στον πίνακα συνδιασποράς των παραγόντων. Ο τύπος αυτός χρησιμοποιείται στη θεωρία του Cronbach's alpha στην κλασική ψυχομετρική θεωρία.
Έτσι, αν οι μεταβλητές έχουν την ίδια διακύμανση σ2και η μέση συσχέτιση διακριτών μεταβλητών είναι ρ, τότε η διακύμανση της μέσης τιμής τους είναι
Αυτό συνεπάγεται ότι η διακύμανση της μέσης τιμής αυξάνει με το μέσο όρο των συσχετισμών . Με άλλα λόγια , πρόσθετες συσχετιζόμενες παρατηρήσεις δεν είναι τόσο αποτελεσματικές όσο πρόσθετες ανεξάρτητες παρατηρήσεις στη μείωση της αβεβαιότητας του μέσου όρου. Επιπλέον, εάν η διακύμανση των μεταβλητών είναι μονάδα, για παράδειγμα , αν είναι σταθεροποιημένες, τότε αυτό απλοποιείται
Αυτός ο τύπος χρησιμοποιείται στον τύπο πρόβλεψης των Spearman–Brown της κλασικής ψυχομετρικής θεωρίας. Αυτό συγκλίνει στο ρ αν το n τείνει στο άπειρο, υπό την προϋπόθεση ότι ο μέσος συσχετισμός παραμένει σταθερός ή συγκλίνει . Έτσι, για τη διακύμανση της μέσης τιμής των σταθεροποιημένων μεταβλητών με τις ίδιες συσχετίσεις ή συγκλίνουσα μέση συσχέτιση έχουμε
Κατά συνέπεια, η διακύμανση της μέσης τιμής ενός μεγάλου αριθμού σταθεροποιημένων μεταβλητών είναι περίπου ίση με τη μέση συσχέτιση τους . Αυτό καθιστά σαφές ότι η μέση τιμή του δείγματος των συσχετισμένων μεταβλητών γενικά δεν συγκλίνει προς τη μέση τιμή του πληθυσμού, παρόλο που ο νόμος των μεγάλων αριθμών αναφέρει ότι η μέση τιμή του δείγματος θα συγκλίνει για ανεξάρτητες μεταβλητές.
Σημειογραφία πίνακα για τη διακύμανση ενός γραμμικού συνδυασμού
[Επεξεργασία | επεξεργασία κώδικα]Ορίζουμε το ως ένα διάνυσμα στήλης τυχαίων μεταβλητών , και ως διάνυσμα στήλης βαθμών . Επομένως, είναι ένας γραμμικός συνδυασμός αυτών των τυχαίων μεταβλητών , όπου δηλώνει το ανάστροφο του . Επίσης, έστω ο πίνακας συνδιασποράς του . Τότε η διακύμανση του δίνεται από :[3]
Σταθμισμένο άθροισμα μεταβλητών
[Επεξεργασία | επεξεργασία κώδικα]Η ιδιότητα της κλιμάκωσης και ο τύπος Bienaymé, μαζί με την ιδιότητα της συνδιασποράς Cov(aX, bY) = ab Cov(X, Y) απο κοινού συνεπάγεται ότι
Αυτό σημαίνει ότι σε ένα σταθμισμένο άθροισμα μεταβλητών, η μεταβλητή με το μεγαλύτερο βάρος θα έχει ένα δυσανάλογα μεγάλο βάρος στη διακύμανση του συνόλου. Για παράδειγμα,αν X και Y είναι ασυσχέτιστα και το βάρος του X είναι δύο φορές το βάρος του Y, τότε το βάρος της διακύμανσης του X θα είναι τέσσερις φορές το βάρος της διακύμανσης του Y.
Η παραπάνω έκφραση μπορεί να επεκταθεί σε ένα σταθμισμένο άθροισμα πολλαπλών μεταβλητών:
Γινόμενο ανεξάρτητων μεταβλητών
[Επεξεργασία | επεξεργασία κώδικα]Αν δύο μεταβλητές X και Y είναι ανεξάρτητες, η διακύμανση του γινομένου τους δίνεται από [4]
Ισοδύναμα, χρησιμοποιώντας τις βασικές ιδιότητες της προσδοκίας, δίνεται από
Γινόμενο συσχετισμένων μεταβλητών
[Επεξεργασία | επεξεργασία κώδικα]Γενικά, αν δύο μεταβλητές είναι συσχετισμένες, η διακύμανση του γινομένου τους δίνεται από:
Ανάλυση
[Επεξεργασία | επεξεργασία κώδικα]Ο γενικός τύπος για την ανάλυση διακύμανσης ή νόμος ολικής διακύμανσης είναι: Αν και είναι δύο τυχαίες μεταβλητές, και η διακύμανση της υπάρχει, τότε
όπου είναι η υπό συνθήκη αναμενόμενη τιμή του δοθέντος του , και είναι η υπό συνθήκη διακύμανση του δοθέντος του . (Μία πιο διαισθητική εξήγηση είναι ότι για μία δεδομένη τιμή του , τότε το ακολουθεί μια κατανομή με μέση τιμή και διακύμανση . Καθώς είναι μία συνάρτηση της μεταβλητής , η αναμενόμενη τιμή της διακύμανσης βρίσκεται σε σχέση με το Y. Ο παραπάνω τύπος περιγράφει το πως να βρούμε βασισμένη στις κατανομές αυτών των δύο ποσοτήτων όταν το μπορεί να αλλάζει.Ένας παρόμοιος τύπος εφαρμόζεται στην ανάλυση διασποράς, όπου ο αντίστοιχος τύπος είναι
εδώ το αναφέρεται στη Μέση τιμή των Τετραγώνων. Στην ανάλυση γραμμικής παλινδρόμησης ο αντίστοιχος τύπος είναι
Αυτό μπορεί επίσης να προέρχεται από την προσθετικότητα των διακυμάνσεων, αφού το συνολικό (παρατηρούμενο) αποτέλεσμα είναι το άθροισμα του αποτελέσματος της πρόβλεψης και του αποτελέσματος του σφάλματος, όπου τα δύο τελευταία είναι ασυσχέτιστα.
Παρόμοιες αναλύσεις είναι δυνατές για το άθροισμα των τετραγωνικών αποκλίσεων (άθροισμα των τετραγώνων, ):
Τύπος για τη διακύμανση
[Επεξεργασία | επεξεργασία κώδικα]Ένας τύπος που χρησιμοποιείται συχνά για την εύρεση της διακύμανσης από μια θεωρητική κατανομή είναι ο εξής:
Αυτό θα είναι χρήσιμο όταν είναι δυνατόν να προκύψει τύπος για την αναμενόμενη τιμή και την αναμενόμενη τιμή του τετραγώνου.
Αυτός ο τύπος χρησιμοποιείται επίσης μερικές φορές σε σχέση με την διακύμανση του δείγματος. Ενώ είναι χρήσιμος για υπολογισμούς με το χέρι, δεν συνιστάται για υπολογισμούς με τον υπολογιστή καθώς πάσχει από έλλειψη σημασίας αν τα δύο μέρη της εξίσωσης είναι παρόμοια σε μέγεθος και χρησιμοποιείται αριθμητική κινητής υποδιαστολής. Αυτό περιγράφεται στο άρθρο Αλγόριθμοι για τον υπολογισμό της διακύμανσης.
Υπολογισμός από την CDF(αθροιστική συνάρτηση κατανομής)
[Επεξεργασία | επεξεργασία κώδικα]Η διακύμανση του πληθυσμού για μια μη-αρνητική τυχαία μεταβλητή μπορεί να εκφραστεί με όρους της αθροιστικής συνάρτησης κατανομής F χρησιμοποιώντας
Η έκφραση αυτή μπορεί να χρησιμοποιηθεί για τον υπολογισμό της διακύμανσης σε περιπτώσεις όπου η CDF, αλλά όχι η πυκνότητα, μπορεί εύκολα να εκφραστεί.
Χαρακτηριστική ιδιότητα
[Επεξεργασία | επεξεργασία κώδικα]Η δεύτερη ροπή μιας τυχαίας μεταβλητής αποκτά την ελάχιστη τιμή όταν λαμβάνονται γύρω από την πρώτη ροπή (δηλαδή, μέση τιμή) της τυχαίας μεταβλητής, δηλ. . Αντίθετα, αν μια συνεχής συνάρτηση ικανοποιεί για όλες τις τυχαίες μεταβλητές X, τότε είναι αναγκαστικά της μορφής όπου a > 0. Αυτό ισχύει επίσης στην πολυδιάστατη περίπτωση.[5]
Μονάδες μέτρησης
[Επεξεργασία | επεξεργασία κώδικα]Σε αντίθεση με την αναμενόμενη απόλυτη απόκλιση, η διακύμανση μιας μεταβλητής έχει μονάδες που είναι το τετράγωνο από τις μονάδες της μεταβλητής. Για παράδειγμα, μια μεταβλητή που μετράται σε μέτρα θα έχει μια απόκλιση που μετράται σε μέτρα στο τετράγωνο. Για το λόγο αυτό, η περιγραφή των συνόλων δεδομένων μέσω της τυπικής απόκλισης ή της ρίζας μέσης τετραγωνικής απόκλισης συχνά προτιμάται σε σχέση με τη διακύμανση. Στο παράδειγμα με τα ζάρια, η τυπική απόκλιση √2.9 ≈ 1.7, ελαφρώς μεγαλύτερο από την αναμενόμενη απόλυτη απόκλιση 1.5.
Η τυπική απόκλιση και η αναμενόμενη απόλυτη απόκλιση μπορούν να χρησιμοποιηθούν ως δείκτης της "εξάπλωσης" της κατανομής. Η τυπική απόκλιση είναι πιο δεκτική στην αλγεβρική χειραγώγηση από την αναμενόμενη απόλυτη απόκλιση, και, μαζί με τη διακύμανση και τη γενίκευση συνδιακύμανση, χρησιμοποιείται συχνά στην θεωρητική στατιστική * εντούτοις, η αναμενόμενη απόλυτη απόκλιση τείνει να είναι πιο ανθεκτική, καθώς είναι λιγότερο ευαίσθητη σε έκτοπες παρατηρήσεις που προκύπτουν από τα σφάλματα μετρήσεων ή μία υπερβολικά ασύμμετρη κατανομή.
Προσέγγιση της διακύμανσης μιας συνάρτησης
[Επεξεργασία | επεξεργασία κώδικα]Η μέθοδος Δέλτα χρησιμοποιεί δεύτερης τάξης Τέιλορ σειρές για την προσέγγιση της διακύμανσης μιας συνάρτησης μιας ή περισσότερων τυχαίων μεταβλητών: δείτε σειρές Τέιλορ για τις ροπές συναρτήσεων τυχαίων μεταβλητών. Για παράδειγμα, η προσέγγιση της διακύμανσης της συνάρτησης μίας μεταβλητής δίνεται από
με την προϋπόθεση ότι η f είναι δύο φορές διαφορίσιμη και ότι η μέση τιμή και η διακύμανση της X είναι πεπερασμένη.
Διακύμανση πληθυσμού και διακύμανση δείγματος
[Επεξεργασία | επεξεργασία κώδικα]Πραγματικές παρατηρήσεις όπως οι μετρήσεις από τη χθεσινή βροχή καθ'όλη τη διάρκεια της ημέρας τυπικά δεν μπορούν να είναι πλήρη σύνολα όλων των πιθανών παρατηρήσεων που θα μπορούσαν να γίνουν. Οπότε, η διακύμανση που υπολογίζεται από το πεπερασμένο σύνολο γενικά δεν θα ταιριάζει με τη διακύμανση που θα υπολογιζόταν από το συνολικό πλήθος των πιθανών παρατηρήσεων. Αυτό σημαίνει ότι εκτιμάται η μέση τιμή και η διακύμανση που θα είχαν υπολογιστεί από ένα πλήρες σύνολο παρατηρήσεων με τη χρήση μιας εκτιμήτριας συνάρτησης. Ο εκτιμητής είναι μια συνάρτηση από το δείγμα των n παρατηρήσεων η οποία σχεδιάζεται αμερόληπτα από το σύνολο του πληθυσμού των πιθανών παρατηρήσεων. Σε αυτό το παράδειγμα,αυτό το δείγμα θα ήταν το σύνολο των πραγματικών μετρήσεων της χθεσινής βροχόπτωσης από τις διαθέσιμες μετρήσεις βροχής εντός της γεωγραφικής περιοχής που ενδιαφέρει.
Ο πιο απλός εκτιμητής για την μέση τιμή του πληθυσμού και τη διακύμανση του πληθυσμού είναι απλά η μέση τιμή και η διακύμανση του δείγματος, η μέση τιμή δείγματος και (μη διορθωμένη) διακύμανση του δείγματος – αυτά είναι συνεπείς εκτιμητές (που συγκλίνουν στη σωστή τιμή καθώς ο αριθμός των δειγμάτων αυξάνει), αλλά μπορεί να βελτιωθεί. Η εκτίμηση της διακύμανσης του πληθυσμού παίρνοντας τη διακύμανση του δείγματος είναι κοντά στην επιθυμητή, σε γενικές γραμμές, αλλά μπορεί να βελτιωθεί με δύο τρόπους. Πιο απλά, η διακύμανση του δείγματος υπολογίζεται ως μέσος όρος των τετραγωνικών αποκλίσεων σχετικά με τη μέση τιμή (του δείγματος), διαιρώντας με το π.δ. Ωστόσο, χρησιμοποιώντας τιμές διαφορετικές από το n βελτιώνεται ο εκτιμητής με διάφορους τρόπους. Τέσσερις κοινές τιμές για τον παρονομαστής είναι n, n − 1, n + 1 και n − 1.5: n είναι ο απλούστερος (διακύμανση του πληθυσμού του δείγματος), n − 1 μειώνει την μεροληψία, n + 1 ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα για την κανονική κατανομή, και n − 1.5 κυρίως μειώνει την μεροληψία σε αμερόληπτη εκτίμηση της τυπικής απόκλισης της κανονικής κατανομής.
Πρώτον, αν και η πραγματική μέση τιμή είναι άγνωστη (και υπολογίζεται ως η μέση τιμή δείγματος), τότε η διακύμανση του δείγματος είναι μεροληπτικός εκτιμητής: υποτιμά τη διακύμανση κατά ένα παράγοντα (n − 1) / n * η διόρθωση από αυτόν τον παράγοντα (διαίρεση με n − 1 αντί για n) ονομάζεται διόρθωση Bessel. Ο εκτιμητής που προκύπτει είναι αμερόληπτος, και καλείται η (διορθωμένη) διακύμανση του δείγματος ή αμερόληπτη διακύμανση του δείγματος. Για παράδειγμα, όταν n = 1 η διακύμανση της μια μόνο παρατήρηση για τη μέση τιμή του δείγματος (από μόνη της), είναι προφανώς μηδέν, ανεξάρτητα από τη διακύμανση του πληθυσμού. Αν η μέση καθορίζεται με κάποιο άλλο τρόπο από ό,τι από τα ίδια δείγματα που χρησιμοποιούνται για την εκτίμηση της διακύμανσης τότε αυτή η μεροληψία δεν τίθεται και η διακύμανση μπορεί με ασφάλεια να εκτιμηθεί όπως αυτή από τα δείγματα για την (ανεξάρτητα γνωστή) μέση τιμή.
Δεύτερον, η διακύμανση του δείγματος, γενικώς, δεν ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα μεταξύ της διακύμανσης του δείγματος και της διακύμανσης του πληθυσμού. Η διόρθωση της μεροληψίας συχνά κάνει τα πράγματα χειρότερα.: μπορείτε πάντα να επιλέξετε ένα συντελεστή κλίμακας που αποδίδει καλύτερα από τη διορθωμένη διακύμανση του δείγματος, αν και η βέλτιστη παράγοντας κλίμακας εξαρτάται από την υπερβολική κύρτωση του πληθυσμού (βλ μέσο τετραγωνικό σφάλμα: διακύμανση), και εισάγει μεροληψία. Αυτό αποτελείται από μείωση του αμερόληπτου εκτιμητή (διαιρώντας με έναν αριθμό μεγαλύτερο από n − 1), και είναι ένα απλό παράδειγμα από μια συρρίκνωση εκτιμητή: "συρρικνώνει" τον αμερόληπτο εκτιμητή προς το μηδέν. Για την κανονική κατανομή, διαιρώντας με n + 1 (αντί για n − 1 ή n) ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα. Ο εκτιμητής που προκύπτει είναι μεροληπτικός, ωστόσο, και είναι γνωστό ως μεροληπτική διακύμανση του δείγματος.
Διακύμανση του πληθυσμού
[Επεξεργασία | επεξεργασία κώδικα]Σε γενικές γραμμές, η διακύμανση του πληθυσμού,ενός πεπερασμένου πληθυσμού μεγέθους N με τιμές xi θα δίνεται από
οπού
είναι η μέση τιμή του πληθυσμού. Η διακύμανση του πληθυσμού, συνεπώς, ταιριάζει με την διακύμανση της κατανομής πιθανότητας. Με αυτή την έννοια, η έννοια του πληθυσμού μπορεί να επεκταθεί σε συνεχείς τυχαίες μεταβλητές με άπειρους πληθυσμούς.
Διακύμανση του δείγματος
[Επεξεργασία | επεξεργασία κώδικα]Σε πολλές πρακτικές περιπτώσεις, η πραγματική διακύμανση του πληθυσμού δεν είναι γνωστή εκ των προτέρων και πρέπει να υπολογιστεί με κάποιο τρόπο. Όταν έχουμε να κάνουμε με εξαιρετικά μεγάλους πληθυσμούς, δεν είναι δυνατό να μετρούν κάθε αντικείμενο στον πληθυσμό, οπότε ο υπολογισμός πρέπει να γίνεται σε ένα δείγμα του πληθυσμού.[6] Η διακύμανση του Δείγματος μπορεί επίσης να εφαρμοστεί για τον υπολογισμό της διακύμανσης μια συνεχής κατανομής από ένα δείγμα αυτής της κατανομής.
Παίρνουμε ένα δείγμα με αντικατάσταση των n τιμών y1, ..., yn από τον πληθυσμό, όπου n < N, και υπολογίζουμε τη διακύμανση με βάση αυτό το δείγμα.[7] Απευθείας παίρνοντας τη διακύμανση των δεδομένων του δείγματος δίνει το μέσο όρο των τετραγωνικών αποκλίσεων:
Εδώ, δηλώνει τη μέση τιμή δείγματος:
Αφού τα yi δεν έχουν επιλεγεί τυχαία, και το και το είναι τυχαίες μεταβλητές. Οι αναμενόμενες τιμές τους μπορούν να υπολογιστούν αθροίζοντας το σύνολο όλων των δυνατών δειγμάτων {yi } από τον πληθυσμό. Για αυτό δίνει:
Ως εκ τούτου, δίνει μια εκτίμηση της διακύμανσης του πληθυσμού, που είναι μεροληπτική από έναν παράγοντα. Για το λόγο αυτό, αναφέρεται ως μεροληπτική διακύμανση του δείγματος. Διόρθωση για αυτή την μεροληψία δίνεται από την αμερόληπτη διακύμανση του δείγματος:
Είτε ο εκτιμητής μπορεί να αναφέρεται απλά ως η διακύμανση του δείγματος, όταν η εκδοχή μπορεί να καθοριστεί από το γενικό πλαίσιο. Την ίδια απόδειξη μπορεί να εφαρμοστεί και για τα δείγματα που λαμβάνονται από μια συνεχή κατανομή πιθανότητας.
Η χρήση του όρου n − 1 ονομάζεται Bessel διόρθωση, και χρησιμοποιείται επίσης στη συνδιακύμανση του δείγματος και την τυπική απόκλιση του δείγματος (η τετραγωνική ρίζα της διακύμανσης). Η τετραγωνική ρίζα είναι μια κοίλη συνάρτηση και, συνεπώς, εισάγει μια αρνητική μεροληψία (από την ανισότητα Jensen), η οποία εξαρτάται από την κατανομή, και κατά συνέπεια η διορθωμένη τυπική απόκλιση του δείγματος (χρησιμοποιώντας Bessel διόρθωση) είναι μεροληπτική. Η αμερόληπτη εκτίμηση της τυπικής απόκλισης είναι τεχνικά πρόβλημα που περιλαμβάνεται, αν και για την κανονική κατανομή, χρησιμοποιώντας τον όρο n − 1.5 αποδίδεται σχεδόν αμερόληπτος εκτιμητής.
Η αμερόληπτη διακύμανση του δείγματος είναι μια U-statistic για τη συνάρτηση ƒ(y1, y2) = (y1 − y2)2/2, με την έννοια ότι λαμβάνεται από το μέσο όρο ενός στατιστικού 2 δειγμάτων από υποσύνολα 2-στοιχείων του πληθυσμού.
Κατανομή της διακύμανση του δείγματος
[Επεξεργασία | επεξεργασία κώδικα]Ως μια συνάρτηση των τυχαίων μεταβλητών, η διακύμανση του δείγματος είναι η ίδια μια τυχαία μεταβλητή, και είναι φυσικό να μελετήσουμε την κατανομή του. Στην περίπτωση που τα yi δεν είναι ανεξάρτητες παρατηρήσεις από μια κανονική κατανομή,το θεώρημα Cochran δείχνει ότι s2 ακολουθεί μια κλιμακωτή κατανομή Χ-τετράγωνο:[8]
Ως άμεση συνέπεια, προκύπτει ότι
και[9]
Αν το yι δεν είναι ανεξάρτητες και ισόνομα κατανεμημένες, αλλά όχι απαραίτητα κανονικά κατανεμημένες, τότε[10]
όπου κ είναι η κύρτωση της κατανομής και μ4 είναι η τέταρτη κεντρική ροπή.
Αν οι συνθήκες από το νόμο των μεγάλων αριθμών ικανοποιούνται για το τετράγωνο των παρατηρήσεων, s2 είναι συνεπής εκτιμητής του σ2. Μπορεί , πράγματι, να δει κανείς ότι η διακύμανση του εκτιμητή τείνει ασυμπτωτικά στο μηδέν.
Ανισότητα του Samuelson
[Επεξεργασία | επεξεργασία κώδικα]Η ανισότητα του Samuelson είναι ένα αποτέλεσμα που δηλώνει όρια για τις τιμές που μπορούν να πάρουν μεμονωμένες παρατηρήσεις σε ένα δείγμα, δεδομένου ότι η μέση τιμή του δείγματος και η (μεροληπτική) διακύμανση έχουν υπολογιστεί.[11] οι Τιμές πρέπει να βρίσκονται εντός των ορίων
Σχέσεις με τους αρμονικούς και τους αριθμητικούς μέσους όρους
[Επεξεργασία | επεξεργασία κώδικα]Έχει αποδειχθεί[12] ότι για ένα δείγμα {y i } των πραγματικών αριθμών,
όπου ymax είναι η μέγιστη τιμή του δείγματος, A είναι ο αριθμητικός μέσος, H είναι ο αρμονικός μέσος του δείγματος και είναι η (μεροληπτική) διακύμανση του δείγματος.
Αυτό το όριο έχει βελτιωθεί, και είναι γνωστό ότι η διακύμανση οριοθετείται από
όπου ymin είναι η ελάχιστη τιμή του δείγματος.[13]
Έλεγχος ισότητας διασπορών
[Επεξεργασία | επεξεργασία κώδικα]Ο έλεγχος για την ισότητα δύο ή περισσότερων διακυμάνσεων είναι δύσκολος. Το F τεστ και το Χ-τετράγωνο τεστ επηρεάζονται αρνητικά από τη μη-κανονικότητα και δεν συνιστώνται για το σκοπό αυτό.
Πολλοί μη παραμετρικοί έλεγχοι έχουν προταθεί: αυτά περιλαμβάνουν τα Barton–David–Ansari–Freund–Siegel–Tukey test, το τεστ Capon, Mood τεστ, Klotz τεστ και το Sukhatme τεστ. Το Sukhatme τεστ ισχύει για δύο διακυμάνσεις και απαιτεί και οι δύο μέροι όροι να είναι γνωστοί και ίσοι με το μηδέν. Τα Mood,Klotz,Capon και Barton–David–Ansari–Freund–Siegel–Tukey τεστ εφαρμόζονται επίσης για δύο διακυμάνσεις. Επιτρέπουν να είναι άγνωστη η μεση τιμή, αλλά απαιτούν να είναι ίσες οι δύο μέσες τιμές.
Το Lehmann τεστ είναι ένας παραμετρικός έλεγχος δύο διασπορών.Είναι γνωστές αρκετές παραλλαγές αυτού του τεστ. Άλλοι έλεγχοι της ισότητας των διασπορών είναι το Box τεστ, το Box–Anderson τεστ και το Moses τεστ.
Μέθοδοι αναδειγματοληψίας, οι οποίες περιλαμβάνουν το bootstrap και το jackknife, μπορούν να χρησιμοποιηθούν για να ελεγχθεί η ισότητα των διακυμάνσεων.
Ιστορία
[Επεξεργασία | επεξεργασία κώδικα]Ο όρος διακύμανση εισήχθη για πρώτη φορά από τον Ρόναλντ Φίσερ το 1918 στο άρθρο The Correlation Between Relatives on the Supposition of Mendelian Inheritance:[14]
Το σώμα των διαθέσιμων στατιστικών μας δείχνει ότι οι αποκλίσεις μιας ανθρώπινης μέτρησης από την μέση τιμή της ακολουθούν εκ του σύνεγγυς την Κανονική κατανομή, και, ως εκ τούτου, ότι η μεταβλητότητα μπορεί να μετρηθεί ομοιόμορφα από την τυπική απόκλιση που αντιστοιχεί στο τετραγωνική ρίζα του μέσου τετραγωνικού σφάλματος. Όταν υπάρχουν δύο ανεξάρτητες αιτίες μεταβλητότητας ικανές να παράγουν μια κατά τα άλλα ομοιόμορφη κατανομή του πληθυσμού με τυπικές αποκλίσεις και διαπιστώθηκε ότι η κατανομή, όταν και οι δύο αιτίες που ενεργούν από κοινού, έχει μια τυπική απόκλιση. Ως εκ τούτου, είναι επιθυμητό στην ανάλυση των αιτίων της μεταβλητότητας να ασχοληθούμε με το τετράγωνο της τυπικής απόκλισης ως μέτρο της μεταβλητότητας. Θα ονομάζουμε την ποσότητα αυτή Διακύμανση...
Ροπή αδράνειας
[Επεξεργασία | επεξεργασία κώδικα]Η διακύμανση μιας κατανομής πιθανότητας είναι ανάλογη με τη ροπή αδράνειας στην κλασική μηχανική από την αντίστοιχη κατανομή της μάζας κατά μήκος μιας γραμμής, σε σχέση με την περιστροφή γύρω από το κέντρο μάζας.[παραπομπή που απαιτείται] Λόγω αυτής της αναλογίας,έννοιες όπως η διακύμανση ονομάζονται ροπές από κατανομές πιθανοτήτων.[παραπομπή που απαιτείται] Ο πίνακας συνδιασποράς σχετίζεται με τη ροπή του τανυστή αδράνειας για πολυμεταβλητές κατανομές. Η ροπή αδράνειας ενός νέφους n σημείων με πίνακα συνδιασποράς του δίνεται από[παραπομπή που απαιτείται]
Αυτή η διαφορά μεταξύ ροπής αδράνειας στη φυσική και στις στατιστική είναι σαφείς για τα σημεία που έχουν συγκεντρωθεί κατά μήκος μιας γραμμής. Ας υποθέσουμε ότι πολλά σημεία είναι κοντά στον άξονα x και διανέμονται κατά μήκος του. Ο πίνακας συνδιασποράς θα είναι περίπου
Δηλαδή, η περισσοτερη διακύμανση θα είναι στη κατεύθυνση x. Οι φυσικοί θεωρούν αυτό χαμηλή ροπή για τον άξονα x οπότε ο τανυστής ροπής αδράνειας είναι
Ημιδιακύμανση
[Επεξεργασία | επεξεργασία κώδικα]Η ημιδιακύμανση υπολογίζεται με τον ίδιο τρόπο όπως η διακύμανση, αλλά μόνο οι παρατηρήσεις οι οποίες είναι κάτω από το μέσο όρο περιλαμβάνονται στον υπολογισμό. Είναι μερικές φορές περιγράφεται ως ένα μέτρο καθοδικού κινδύνου σε ένα πλαίσιο επενδύσεων. Για ασύμμετρες κατανομές, η ημιδιακύμανση μπορεί να παρέχει πρόσθετες πληροφορίες που η διακύμανση δεν παρέχει[παραπομπή που απαιτείται].
Γενικεύσεις
[Επεξεργασία | επεξεργασία κώδικα]Αν είναι μια βαθμωτή μιγαδική τυχαία μεταβλητή, με τιμές στο, τότε, η διακύμανση είναι πού είναι ο συζυγής μιγαδικός του. Αυτή η διακύμανση είναι βαθμωτή.
Αν είναι μία διανυσματική τυχαία μεταβλητή, με τιμές στο και θεωρώντας την ως ένα διάνυσμα στήλης,τότε η φυσική γενίκευση της διακύμανσης είναι πού και είναι ο ανάστροφος του. Το αποτέλεσμα είναι θετικά ημι-ορισμένος τετραγωνικός πίνακας, που συνήθως αναφέρεται ως ο πίνακας διακύμανσης-συνδιακύμανσης.
Αν είναι ένα διάνυσμα - και μιγαδική τυχαία μεταβλητή, με τιμές στο, τότε η γενίκευση της διακύμανσης είναι πού είναι ο συζυγής ανάστροφος του. Αυτός ο πίνακας είναι επίσης θετικά ημι-ορισμένος και τετραγωνικός.
Σημειώσεις
[Επεξεργασία | επεξεργασία κώδικα]- ↑ Yuli Zhang,Huaiyu Wu,Lei Cheng (June 2012). «Some new deformation formulas about variance and covariance». Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012), pp. 987–992.
- ↑ Loeve, M. (1977) "Probability Theory", Graduate Texts in Mathematics, Volume 45, 4th edition, Springer-Verlag, p. 12.
- ↑ Johnson, Richard· Wichern, Dean (2001). Applied Multivariate Statistical Analysis. Prentice Hall. σελ. 76. ISBN 0-13-187715-1
- ↑ Goodman, Leo A., "On the exact variance of products," Journal of the American Statistical Association, December 1960, 708–713.
- ↑ Kagan, A.; Shepp, L. A. (1998). «Why the variance?». Statistics & Probability Letters 38 (4): 329–333. doi: .
- ↑ Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.
- ↑ Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201.
- ↑ Knight K. (2000), Mathematical Statistics, Chapman and Hall, New York. (proposition 2.11)
- ↑ Casella and Berger (2002) Statistical Inference, Example 7.3.3, p. 331 [full citation needed]
- ↑ Neter, Wasserman, and Kutner (1990) Applied Linear Statistical Models, 3rd edition, pp. 622-623 [full citation needed]
- ↑ Samuelson, Paul (1968). «How Deviant Can You Be?». Journal of the American Statistical Association 63 (324): 1522–1525. doi:. https://archive.org/details/sim_journal-of-the-american-statistical-association_1968-12_63_324/page/1522.
- ↑ Mercer, A. McD. (2000). «Bounds for A–G, A–H, G–H, and a family of inequalities of Ky Fan’s type, using a general method». J. Math. Anal. Appl. 243 (1): 163–173. doi: .
- ↑ Sharma, R. (2008). «Some more inequalities for arithmetic mean, harmonic mean and variance». J. Math. Inequalities 2 (1): 109–114. doi: .
- ↑ Ronald Fisher (1918) The correlation between relatives on the supposition of Mendelian Inheritance