Διωνυμική κατανομή

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση
Διωνυμική κατανομή

Η διωνυμική κατανομή είναι μια διακριτή συνάρτηση κατανομής τυχαίας μεταβλητής. Περιγράφει ένα τυχαίο πείραμα με δυο πιθανά αποτελέσματα (επιτυχία - αποτυχία) και πιθανότητα επιτυχίας p που επαναλαμβάνεται n φορές.

Θεωρούμε την τυχαία μεταβλητή Χ που εκφράζει τον αριθμό των επιτυχιών. Η πιθανότητα να έχουμε k επιτυχίες σε n ανεξάρτητα πειράματα με πιθανότητα επιτυχίας p κάθε φορά είναι:

\operatorname P(X = k) = \binom nk p^k (1-p)^{n-k}.
συνάρτηση πιθανότητας παράμετροι μέση τιμή διακύμανση
\,{n \choose k} p^k(1-p)^{n-k} \,p\in (0,1), n\in\N \,np \,np(1-p)

Μοντέλο με κάλπη[Επεξεργασία | επεξεργασία κώδικα]

Θεωρούμε μια κάλπη με Κ λευκές μπάλες και Ν-Κ μαύρες. Η πιθανότητα να τραβήξουμε μια λευκή μπάλα είναι p=Κ/N. Τραβάμε μια μια μπάλες από την κάλπη επανατοποθετώντας τις κάθε φορά πίσω στην κάλπη (δειγματοληψία με επαναφορά) μέχρι να τραβήξουμε n μπάλες. Ζητάμε την πιθανότητα οι k από αυτές να είναι λευκές.

Σύμφωνα με τον κλασικό ορισμό της πιθανότητας αυτή ορίζεται ως το πηλίκο του πλήθους των ευνοϊκών αποτελεσμάτων ως προς το πλήθος των δυνατών αποτελεσμάτων.

Για κάθε λήψη έχουμε Ν δυνατά αποτελέσματα. Στο σύνολο των n λήψεων τα δυνατά αποτελέσματα ειναι N^n. Ευνοϊκά αποτελέσματα είναι αυτά κατα τα οποία έχουμε k λευκές μπάλες. Για τη λήψη μιας λευκής μπάλας έχουμε Κ πιθανά αποτελέσματα και για την λήψη μιας μαύρης Ν-Κ. Τα δυνατά αποτελέσματα στις n λήψεις οι k να είναι λευκές για μια συγκεκριμένη σειρά, π.χ. να τραβήξουμε πρώτα όλες τις λευκές μπάλες και μετά τις μαύρες, είναι K^k(N-K)^{n-k}. Όλες οι πιθανές διατάξεις k λευκών και n-k μαύρων μπαλών είναι \scriptstyle\binom nk.

Συνολικά η ζητούμενη πιθανότητα, σύμφωνα με τον παραπάνω ορισμό, είναι:

\begin{align}
\operatorname P(X = k) &= \binom nk \frac{K^k(N-K)^{n-k}}{N^n}\\
    &= \binom nk \left(\frac KN\right)^k\left(\frac{N-K}N\right)^{n-k}\\
    &= \binom nk p^k (1-p)^{n-k}.
\end{align}

Σχέσεις με άλλες κατανομές[Επεξεργασία | επεξεργασία κώδικα]

Αν πραγματοποιήσουμε μόνο μια λήψη, τότε η τυχαία μεταβλητή που δηλώνει η μπάλα να είναι λευκή ακολουθεί την κατανομή Bernoulli.

Αν η δειγματοληψία γίνει χωρίς επαναφορά, η τυχαία μεταβλητή που δηλώνει τον αριθμό των λευκών μπαλών ακολουθεί την υπεργεωμετρική κατανομή.

Ασυμπτωτική συμπεριφορά[Επεξεργασία | επεξεργασία κώδικα]

Κανονική κατανομή[Επεξεργασία | επεξεργασία κώδικα]

Διωνυμική σππ σε σύγκριση με την κανονική κατανομή n = 6 and p = 0.5

Για μεγάλο n η διωνυμική κατανομή συγκλίνει σύμφωνα με το θεώρημα de Moivre–Laplace στην κανονική κατανομή με μέση τιμή np και διασπορά np(1-p)

 \mathcal{N}(np,\, np(1-p))..

Κατανομή Poisson[Επεξεργασία | επεξεργασία κώδικα]

Για \scriptstyle n\rightarrow\infty και \scriptstyle p\rightarrow 0 έτσι ώστε np σταθερό η διωνυμική κατανομή συγκλίνει στην κατανομή Poisson με παράμετρο np=λ.

\begin{align}
\lim_{n\to\infty}P(X=k) & =\lim_{n\to\infty}\frac{n!}{k!\,(n-k)!}\left(\frac{\lambda}{n}\right)^{k}\left(1-\frac{\lambda}{n}\right)^{n-k}\\
 & =\lim_{n\to\infty}\left(\frac{\lambda^{k}}{k!}\right)\left(\frac{n(n-1)(n-2)\cdots(n-k+1)}{n^{k}}\right)\left(1-\frac{\lambda}{n}\right)^{n}\left(1-\frac{\lambda}{n}\right)^{-k}\\
 & =\frac{\lambda^{k}}{k!}\cdot\lim_{n\to\infty}\underbrace{\left(\frac{n}{n}\cdot\frac{n-1}{n}\cdot\frac{n-2}{n}\cdots\frac{n-k+1}{n}\right)}_{\to1}\underbrace{\left(1-\frac{\lambda}{n}\right)^{n}}_{\to e^{-\lambda}}\underbrace{\left(1-\frac{\lambda}{n}\right)^{-k}}_{\to1}\\
 & =\frac{\lambda^{k}\mathrm{e}^{-\lambda}}{k!}
\end{align}

Δείτε επίσης[Επεξεργασία | επεξεργασία κώδικα]