Ανάλυση διακύμανσης

Ανάλυση Διακύμανσης ή Ανάλυση Διασποράς (ANOVA) ονομάζεται μια στατιστική μέθοδος πειραματικού σχεδιασμού, κατά την οποία, πραγματοποιείται έλεγχος υποθέσεων με στόχο να ανιχνευθούν εάν υπάρχουν διαφορές στις μέσες τιμές περισσότερων από δύο πληθυσμών. Για να δοθεί απάντηση στο συγκεκριμένο ερώτημα, κατασκευάζουμε έναν έλεγχο υποθέσεων με μηδενική υπόθεση H₀ ότι όλα τα δείγματα προέρχονται από πληθυσμούς με την ίδια μέση τιμή έναντι μιας εναλλακτικής υπόθεσης ότι τουλάχιστον δύο μέσες τιμές είναι διαφορετικές. Ουσιαστικά πρόκειται για μια γενίκευση του T-test που εφαρμόζεται σε δύο πληθυσμούς. Θεωρητικά, θα μπορούσαν να εφαρμοστούν πολλαπλοί ανεξάρτητοι έλεγχοι, αλλά η συγκεκριμένη μεθοδολογία δεν ενδείκνυται καθότι με αυτό τον τρόπο αυξάνεται η πιθανότητα να οδηγηθούμε σε σφάλμα τύπου Ι. Συνεπώς, η ANOVA είναι η κατάλληλη μεθοδολογία διότι, πρόκειται για συντομότερη διαδικασία ανάλυσης ενώ έχει και ακρίβεια διάγνωσης

Ιστορία[Επεξεργασία | επεξεργασία κώδικα]

Η ανάλυση διακύμανσης εισήχθη για πρώτη φορά από τον Sir Ronald A. Fisher το 1918 στο άρθρο του The Correlation Between Relatives on the Supposition of Mendelian Inheritance.^[1] Η ανάλυση διασποράς όμως, έγινε ευρέως γνωστή μετά το 1925 όταν εκδόθηκε το βιβλίο του R. A. Fisher, Statistical Methods for Research Workers, στο οποίο την είχε συμπεριλάβει.

Η ανάλυση της διακυμάνσης προέκυψε από τον Fisher, κατά την προσπάθεια επίλυσης πολύπλοκων προβλημάτων γεωργικού πειραματισμού.^[2] Η προσέγγιση της λύσης τέτοιου είδους προβλημάτων που πρότεινε, βασίζεται στην τυχαιοποίηση και στην επανάληψη του πειράματος.

Προϋποθέσεις[Επεξεργασία | επεξεργασία κώδικα]

Οι προϋποθέσεις που θα χρειαστεί να ισχύουν για να μπορέσουμε να εφαρμόσουμε την ανάλυση διακύμανσης, είναι ^[3] :

η κατανομή των τιμών να είναι κανονική
τα δείγματα να είναι αντιπροσωπευτικά και οι παρατηρήσεις ανεξάρτητες μεταξύ τους
οι πληθυσμοί από τους οποίους επελέγησαν τα δείγματα να έχουν την ίδια διακύμανση

Ανάλυση Διακύμανσης κατά ένα παράγοντα (one-way ANOVA)[Επεξεργασία | επεξεργασία κώδικα]

Το πιο απλό πειραματικό σχέδιο είναι ο πλήρως τυχαιοποιημένος σχεδιασμός (Completely Randomized Design) σύμφωνα με τον οποίο, εργαζόμαστε με k ανεξάρτητα τυχαία δείγματα, ένα από κάθε πληθυσμό (η διαφορετικά έναν από κάθε στάθμη του παράγοντα (factor) και το οποίο αποτελεί γενίκευση του ελέγχου των μέσων τιμών μ1 και μ 2 , δύο κανονικών πληθυσμών με δύο ανεξάρτητα τυχαία δείγματα.

Έστω, ότι από καθέναν από k>2 κανονικούς πληθυσμούς με κοινή διασπορά, σ², και μέσες τιμές αντίστοιχα μ₁, μ₂,....., μ_k παίρνουμε ένα τυχαίο δείγμα μεγέθους, αντίστοιχα, n₁, n₂,....., n_k για να κάνουμε, με βάση τα k δείγματα, τον έλεγχο:

Η₀: μ₁ = μ₂ =.....= μ_k
Η₁: μ_i ≠ μ_j (για ένα τουλάχιστον ζεύγος i,j)

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

↑ The Correlation Between Relatives on the Supposition of Mendelian Inheritance. Ronald A. Fisher. Philosophical Transactions of the Royal Society of Edinburgh. 1918. (volume 52, pages 399–433)
↑ http://www.aua.gr/gpapadopoulos/files/anova12-13a.p^{[νεκρός σύνδεσμος]}df. (pages 192-193)
↑ http://www.actuar.aegean.gr/notes/ANALUSH%20DIAKUMANSHS%203.pdf Αρχειοθετήθηκε 2016-09-10 στο Wayback Machine. (pages 15/41)

Βιβλιογραφία[Επεξεργασία | επεξεργασία κώδικα]

[1] The Correlation Between Relatives on the Supposition of Mendelian Inheritance. Ronald A. Fisher. Philosophical Transactions of the Royal Society of Edinburgh. 1918. (volume 52, pages 399–433)

[2] http://www.aua.gr/gpapadopoulos/files/anova12-13a.p^{[νεκρός σύνδεσμος]}df. (pages 192-193)

[3] http://www.actuar.aegean.gr/notes/ANALUSH%20DIAKUMANSHS%203.pdf Αρχειοθετήθηκε 2016-09-10 στο Wayback Machine. (pages 15/41)

[1]

[2]

[3]