Θεώρημα Μπέυζ

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Πήδηση στην πλοήγηση Πήδηση στην αναζήτηση

Στη θεωρία πιθανοτήτων και στη στατιστική, το θεώρημα Μπέυζ (αγγλικά: Bayes) ή νόμος Μπέυζ ή κανόνας Μπέυζ, σχετίζει την τρέχουσα πιθανότητα με την αρχική πιθανότητα. Είναι σημαντικό στο μαθηματικό χειρισμό της υπό συνθήκη πιθανότητας.

Όταν εφαρμόζεται, οι πιθανότητες που χρησιμοποιούνται στο θεώρημα Μπέυζ μπορεί να έχουν διαφορετικές ερμηνείες. Σε μία από αυτές τις ερμηνείες, το θεώρημα χρησιμοποιείται άμεσα ως μέρος μιας συγκεκριμένης προσέγγισης της στατιστικής συμπερασματολογίας. Ειδικότερα, με την Μπεϋζιανή πιθανότητα, το θεώρημα εκφράζει το πως μια υποκειμενική άποψη θα πρέπει αναλογικά να αλλάξει οδηγώντας στην απόδειξη: αυτή είναι η συμπερασματολογία κατά Μπέυζ, η οποία είναι θεμελιώδους σημασίας στη στατιστική κατά Μπέυζ. Ωστόσο, το θεώρημα κατά Μπέυζ έχει εφαρμογές σε ένα ευρύ φάσμα υπολογισμών που αφορούν πιθανότητες, όχι μόνο στην κατά Μπέυζ συμπερασματολογία.

Το θεώρημα Μπέυζ πήρε το όνομα του έτσι από τον βρετανό κληρικό Τόμας Μπέυζ (1701–1761), ο οποίος πρώτος έδειξε τον τρόπο που χρησιμοποιούνται τα νέα στοιχεία για την ανανέωση των εκάστοτε πεποιθήσεων. Αυτό αναπτύχθηκε περαιτέρω από τον Πιερ Σιμόν Λαπλάς, ο οποίος πρώτος δημοσίευσε τη μοντέρνα διατύπωση το 1812 στο βιβλίο του Théorie analytique des probabilités. Ο Χάρολντ Τζέφρις (Harold Jeffreys) έθεσε τον αλγόριθμο του Μπέυζ και την διατύπωση του Λαπλάς σε αξιωματική βάση. Ο Τζέφρις έγραψε πως το θεώρημα Μπέυζ "είναι στη θεωρία πιθανοτήτων όπως αντίστοιχα το Πυθαγόρειο θεώρημα στη Γεωμετρία ".[1]

Ορισμός θεωρήματος[Επεξεργασία | επεξεργασία κώδικα]

Το θεώρημα Μπέυζ ορίστηκε μαθηματικά ως η ακόλουθη εξίσωση:[2]

όπου A και B είναι γεγονότα.

  • P(A) και P(B) είναι οι πιθανότητες των A και B που είναι ανεξάρτητα μεταξύ τους.
  • P(A | B), η υπό συνθήκη πιθανότητα, είναι η πιθανότητα του A δεδομένου του B να είναι αληθής.
  • P(B | A), είναι η πιθανότητα του B δεδομένου του A να είναι αληθής.

Εισαγωγικό παράδειγμα[Επεξεργασία | επεξεργασία κώδικα]

Το σύνολο της παραγωγής ενός εργοστασίου παράγεται από τρεις μηχανές. Οι τρεις μηχανές ευθύνονται για το 20%, 30%, και 50% της παραγωγής, αντίστοιχα. Το όριο των ελαττωματικών αντικειμένων που παράγεται είναι: για την πρώτη μηχανή, 5%; για τη δεύτερη μηχανή, 3%; για την τρίτη μηχανή, 1%. Αν ένα αντικείμενο επιλέγεται τυχαία από το σύνολο της παραγωγής και βρεθεί να είναι ελαττωματικό, ποια είναι η πιθανότητα να έχει παραχθεί από την τρίτη μηχανή?

Η λύση είναι η ακόλουθη. Έστω Ai δηλώνουμε το γεγονός ότι το αντικείμενο που επιλέχθηκε τυχαία είχε παραχθεί από την i μηχανή (για i = 1,2,3). Έστω B δηλώνουμε το γεγονός ότι το αντικείμενο που επιλέχθηκε τυχαία είναι ελαττωματικό. Τότε γνωρίζουμε τα ακόλουθα:

P(A1) = 0.2,    P(A2) = 0.3,    P(A3) = 0.5.

Αν το αντικείμενο παράχθηκε από τη μηχανή A1, τότε η πιθανότητα να είναι ελαττωματικό είναι 0.05 δηλαδή, P(B | A1) = 0.05. Συνεπώς, έχουμε

P(B | A1) = 0.05,    P(B | A2) = 0.03,    P(B | A3) = 0.01.

Για να απαντήσουμε το ερώτημα, πρέπει πρώτα να βρούμε P(B). Αυτό μπορεί να γίνει με τον ακόλουθο τρόπο:

P(B) = Σi P(B | Ai) P(Ai) = (0.05)(0.2) + (0.03)(0.3) + (0.01)(0.5) = 0.024.

Ως εκ τούτου 2.4% από τη συνολική παραγωγή του εργοστασίου είναι ελαττωματική.

Δηλώσαμε το B πως προέκυψε, και θέλουμε να υπολογίσουμε τη δεσμευμένη πιθανότητα του A3. Από το θεώρημα του Μπέυζ,

P(A3 | B) = P(B | A3) P(A3)/P(B) = (0.01)(0.50)/(0.024) = 5/24.

Δεδομένου ότι το αντικείμενο είναι ελαττωματικό, η πιθανότητα να παράχθηκε από την τρίτη μηχανή είναι μόνο 5/24. Αν και η τρίτη μηχανή παράγει το μισό από τη συνολική παραγωγή, παράγει ένα πολύ μικρότερο ποσοστό από τα ελαττωματικά αντικείμενα. Ως εκ τούτου, το ότι γνωρίζουμε πως το αντικείμενο που επιλέχθηκε ήταν ελαττωματικό μας δίνει τη δυνατότητα να αντικαταστήσουμε την αρχική πιθανότητα P(A3) = 1/2 με τη μικρότερη δεσμευμένη πιθανότητα P(A3 | B) = 5/24.

Ερμηνείες[Επεξεργασία | επεξεργασία κώδικα]

Παρόμοια συλλογιστική μπορεί να χρησιμοποιηθεί για να δείξουμε ότι κλπ.

Η ερμηνεία του θεωρήματος Μπέυζ εξαρτάται από την ερμηνεία της πιθανότητας αποδίδεται με τους όρους. Οι δύο κύριες ερμηνείες περιγράφονται παρακάτω.

Ερμηνεία κατά Μπέυζ[Επεξεργασία | επεξεργασία κώδικα]

Στην ερμηνεία κατά Μπέυζ, η πιθανότητα μετρά τον βαθμό αλήθειας. Το θεώρημα του Bayes τότε συνδέει το βαθμό αλήθειας σε μια πρόταση πριν και μετά τον υπολογισμό των δεδομένων. Για παράδειγμα, ας υποθέσουμε ότι πιστεύεται με 50% βεβαιότητα ότι ένα νόμισμα είναι δύο φορές πιο πιθανόν να προσγειωθεί η πλευρά της κεφαλής απ' ό,τι η πλευρά των γραμμάτων. Αν το νόμισμα ριχθεί πολλές φορές και παρατηρηθεί, ότι ο βαθμός αλήθειας μπορεί να αυξηθεί, μειωθεί ή παραμείνει ίδιος εξαρτάται από τα αποτελέσματα.

Για πρόταση A και δεδομένα B,

  • P(A), η αρχική, είναι ο αρχικός βαθμός αλήθειας στο A.
  • P(A | B), η δεσμευμένη, είναι ο βαθμός αλήθειας έχοντας υπολογίσει προηγουμένως για το B.
  • το πηλίκο P(B | A)/P(B) παρουσιάζει την υποστήριξη B προβλέποντας το A.

Για περισσότερες πληροφορίες για την εφαρμογή του θεωρήματος Μπέυζ ως προς την ερμηνεία της πιθανότητας κατά Μπέυζ, κοίταξε συμπερασματολογία κατά Μπέυζ.

Ερμηνεία με συχνότητα[Επεξεργασία | επεξεργασία κώδικα]

Εικονογράφηση της ερμηνείας συχνοτήτων με δενδροδιαγράμματα. Το θεώρημα Μπέυζ συνδέει τις δεσμευμένες πιθανότητες και αντίστροφα.

Στη ερμηνεία με συχνότητα, η πιθανότητα μετρά τo ποσοστό αποτελεσμάτων. Για παράδειγμα, ας υποθέσουμε πως ένα πείραμα εκτελείται πολλές φορές. P(A) το ποσοστό των αποτελεσμάτων με ιδιότητα A, και P(B) αυτό με ιδιότητα B. P(B | A) είναι το ποσοστό των αποτελεσμάτων με ιδιότητα B εκτός των αποτελεσμάτων με ιδιότητα A, και P(A | B) το ποσοστό αυτών με A εκτός από αυτών με B.

Ο ρόλος του θεωρήματος Μπέυζ είναι η καλύτερα ορατή με δενδροδιαγράμματα, όπως φαίνεται στα δεξιά. Τα δύο δενδροδιαγράμματα ποσοστών με τα ίδια αποτελέσματα από A και B σε αντίθεση, για να ληφθούν οι πιθανότητες αντίστροφα. Το θεώρημα του Μπέυζ χρησιμεύει ως σύνδεσμος μεταξύ αυτών των διαφορετικών ποσοστών.

Μορφές[Επεξεργασία | επεξεργασία κώδικα]

Γεγονότα[Επεξεργασία | επεξεργασία κώδικα]

Απλή Μορφή[Επεξεργασία | επεξεργασία κώδικα]

Για γεγονότα A και B, υπό την προϋπόθεση P(B) ≠ 0,

Σε πολλές εφαρμογές, για παράδειγμα Μπεϋζιανή συμπερασματολογία, το γεγονός B ορίζεται στη συζήτηση, και θέλουμε να εξετάσουμε το αντίκτυπο του να έχει παρατηρηθεί στην πραγματικότητα στα διάφορα πιθανά γεγονότα A. Σε αυτή την περίπτωση ο παρονομαστής της τελευταίας έκφρασης, η πιθανότητα του να δώσει απόδειξη B είναι σταθερό, αυτό που θέλουμε να υπολογίσουμε είναι το A. Το θεώρημα Μπέυζ μας δείχνει ότι οι δεσμευμένες πιθανότητες είναι ανάλογες του αριθμητή:

(αναλογικότητα Α για δεδομένο Β).

Σύμφωνα με τα λεγόμενα: δεσμευμένη πιθανότητα είναι ανάλογη της αρχικής πιθανότητας.[3]

Αν τα γεγονότα A1, A2, ..., είναι ξένα και ανεξάρτητα π.χ., ένα από αυτά είναι βέβαιο ότι θα συμβεί, αλλά δεν μπορούν δύο να συμβούν ταυτόχρονα, και γνωρίζουμε τις πιθανότητες τους μέχρι την αναλογία, τότε μπορούμε να καθορίζουμε την σταθερά αναλογίας χρησιμοποιώντας το γεγονός ότι οι πιθανότητες τους πρέπει να αθροίζουν στο ένα. Για παράδειγμα, για δοσμένο γεγονός A, το γεγονός A το ίδιο και το συμπληρωματικό του ¬A είναι ξένα και ανεξάρτητα. Για να βρεθεί η σταθερά της αναλογίας c έχουμε

και

Προσθέτοντας τους δύο αυτούς τύπους συμπεραίνουμε ότι

Εναλλακτικός τύπος[Επεξεργασία | επεξεργασία κώδικα]

Μια άλλη μορφή του θεωρήματος Μπέυζ είναι γενικά υπολογίσιμη όταν εξετάζουμε δύο διαγωνίσιμες καταστάσεις ή υποθέσεις είναι:

Για μια επιστημολογική ερμηνεία:

Για "αιτία" A και "αποτέλεσμα" B,[4]

  • P(A), η αρχική πιθανότητα, είναι να πραγματοποιηθεί το A.
  • P(−A), είναι η αντίστοιχη πιθανότητα του να μην πραγματοποιηθεί το A: 1 − P(A) = P(−A)
  • P(B | A), η δεσμευμένη πιθανότητα ή πιθανότητα, είναι να πραγματοποιηθεί το γεγονός B ("αποτέλεσμα"), δοσμένου ότι έχει συμβεί το A ("αιτία") είναι αληθής.
  • P(B | -A), η δεσμευμένη πιθανότητα ή πιθανότητα, είναι να πραγματοποιηθεί το γεγονός B ("αποτέλεσμα"), δοσμένου ότι δεν έχει συμβεί το γεγονός A ("αιτία").
  • P(A | B), η δεσμευμένη πιθανότητα, είναι η πιθανότητα του A αφού ληφθεί υπόψη το B για το ίδιο και το αντίθετο του A.

Εκτεταμένη μορφή[Επεξεργασία | επεξεργασία κώδικα]

Συχνά, σε μια διαμέριση {Aj} για το χώρο γεγονότος, ο χώρος του γεγονότος δίνεται ή γίνεται αντιληπτός σε ότι αφορά για P(Aj) και P(B | Aj). Είναι τότε χρήσιμο να υπολογίσουμε P(B) χρησιμοποιώντας το νόμο της ολικής πιθανότητας:

Στην ειδική περίπτωση όπου το A είναι μια δυαδική μεταβλητή:

Τυχαίες μεταβλητές[Επεξεργασία | επεξεργασία κώδικα]

Διάγραμμα που απεικονίζει την έννοια του θεωρήματος Μπέυζ όπως εφαρμόζεται σε ένα χώρο γεγονότων που παράγονται από συνεχείς τυχαίες μεταβλητές X και Y. Σημειώστε ότι υπάρχει ένα παράδειγμα του θεωρήματος Μπέυζ για κάθε σημείο στο χώρο. Στην πράξη, αυτές οι περιπτώσεις μπορούν να παραμετροποιηθούν γράφοντας τις καθορισμένες πυκνότητες πιθανότητες ως μια συνάρτηση των x και y.

Σκεφτείτε ένα χώρο δείγματος Ω που παράγεται από δύο τυχαίες μεταβλητές X και Y. Κατ' αρχήν, το θεώρημα του Μπέυζ εφαρμόζεται για τα γεγονότα A = {X = x} και B = {Y = y}. Ωστόσο, οι όροι γίνονται 0 στα σημεία που μια μεταβλητή έχει πεπερασμένη πυκνότητα πιθανότητα. Για να παραμείνει χρήσιμο, το θεώρημα Μπέυζ μπορεί να διατυπώνονται ως προς τις σχετικές πυκνότητες (βλέπε Προέλευση).

Απλή μορφή[Επεξεργασία | επεξεργασία κώδικα]

Αν X είναι συνεχές και Y είναι απαριθμητή (διακριτή),

Αν X είναι διακριτή και Y είναι συνεχές,

Αν και οι δύο 'X και Y είναι συνεχείς,

Εκτεταμένη μορφή[Επεξεργασία | επεξεργασία κώδικα]

Διάγραμμα που απεικονίζει το πως ένας χώρος ενός γεγονότος που παράγεται από συνεχείς τυχαίες μεταβλητές X και Y είναι συχνά αντιληπτός.

Ένας συνεχής χώρος γεγονότος είναι συχνά αντιληπτός από την άποψη των όρων του αριθμητή. Είναι τότε χρήσιμο για την εξάλειψη του παρονομαστή να χρησιμοποιηθεί ο νόμος της ολικής πιθανότητας. Για fY(y), αυτό γίνεται ολοκλήρωμα:

Κανόνας του Μπέυζ[Επεξεργασία | επεξεργασία κώδικα]

Κύριο λήμμα: Κανόνας του Μπέυζ

Ο κανόνας του Μπέυζ είναι το θεώρημα Μπέυζ σε αποδόσεις.

όπου

καλείται ο παράγοντας Μπέυζ ή ο λόγος πιθανότητας και οι αποδόσεις μεταξύ των δύο γεγονότων είναι απλά ο λόγος των πιθανοτήτων των δύο γεγονότων. Έτσι

Έτσι ο κανόνας λέει ότι οι δεσμευμένες αποδόσεις είναι οι αρχικές αποδόσεις του παράγοντα Μπέυζ, ή με άλλα λόγια, δεσμευμένη είναι ανάλογη της αρχικής πιθανότητας.

Καταγωγή[Επεξεργασία | επεξεργασία κώδικα]

Για γεγονότα[Επεξεργασία | επεξεργασία κώδικα]

Το θεώρημα του Μπέυζ μπορεί να προέρχεται από τον ορισμό της δεσμευμένης πιθανότητας:

Για τυχαίες μεταβλητές[Επεξεργασία | επεξεργασία κώδικα]

Για δύο συνεχείς τυχαίες μεταβλητές X και Y, το θεώρημα του Μπέυζ μπορεί να προέρχεται αναλόγως από τον ορισμό της υπό όρους πυκνότητας:

Ιστορία[Επεξεργασία | επεξεργασία κώδικα]

Το θεώρημα του Bayes ονομάστηκε μετά από την Reverend Thomas Bayes (1701-1761), ο οποίος μελέτησε το πώς να υπολογιστεί μια κατανομή για την πιθανότητα παραμέτρου διωνυμικής κατανομής (σε σύγχρονη ορολογία). Αδημοσίευτο χειρόγραφο του Bayes επιμελήθηκε από τον Richard Price προτού διαβαστεί στο Royal Society μετά τον θανατό του.O Price βοήθησε να εκδοθεί ένα δοκίμιο για το τεράστιο έργο του Bayes για την επίλυση ενός προβλήματος στο δόγμα των πιθανοτήτων (1763), το οποίο εμφανίστηκε στο Philosophical Transactions, και περιέχει το Θεώρημα Bayes .Επίσης ο Price έγραψε μια εισαγωγή για το έγγραφο το οποίο προσφέρει μερικές από τις φιλοσοφικές βάσεις της Bayesian στατιστικής. Το 1765 εξελέγη Μέλος της Βασιλικής Εταιρείας, σε αναγνώριση του έργου του για την κληρονομιά που άφησε πίσω του .

Ο Γάλλος μαθηματικός Πιέρ Σιμόν Λαπλάς αναπαρήγαγε και να επέκτεινε τα αποτελέσματα του Bayes το 1774, προφανώς μη γνωρίζοντας το έργο του Bayes. Ο Stephen Stigler το 1983 εισηγήθηκε ότι το θεώρημα του Bayes ανακαλύφθηκε από τον Nicholas Saunderson κάποιο χρονικό διάστημα πριν από Bayes αλλά η ερμηνεία αυτή αμφισβητήθηκε .

Ο Martyn Hooper και ο Σαρόν McGrayne υποστήριξαν ότι η συνεισφορά του Richard-Price ήταν σημαντική.

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]