Χρήστης:Germanid/πρόχειρο

Στην Θεωρία Πιθανοτήτων και στην Στατιστική, η Κατανομή t-Student (ή απλά t-Κατανομή) είναι ένα μέλος της συνεχούς οικογενείας Κατανομή πιθανότητας το οποίο προκύπτει κατά την εκτίμηση της τιμήs ενός κανονικά κατανεμημένου πληθυσμού, σε περιπτώσεις όπου το μέγεθος του δείγματος είναι μικρό και η τυπική απόκλιση του πληθυσμού είναι άγνωστη.Λαμβάνοντας υπόψη ότι μια κανονική κατανομή περιγράφει ένα πλήρες πληθυσμό, t-κατανομές περιγράφουν δείγματα που λαμβάνονται από έναν πλήρη πληθυσμό. Κατά συνέπεια, η κατανομή-t για κάθε μέγεθος δείγματος είναι διαφορετική, και όσο μεγαλύτερο είναι το δείγμα, τόσο περισσότερο μοιάζει η κατανομή με την κανονική κατανομή.

Η t-κατανομή παίζει σημαντικό ρόλο σε μια σειρά από ευρέως διαδεδομένες στατιστικές αναλύσεις, συμπεριλαμβανομένης του Student t-τεστ για την αξιολόγηση της στατιστική σημαντικότητας της διαφοράς μεταξύ των δύο δειγματικών τιμών, η κατασκευή του διαστήματος εμπιστοσύνης για τη διαφορά μεταξύ δύο τιμών πληθυσμού, και στην γραμμική ανάλυση παλινδρόμησης. Η κατανομή t -Student προκύπτει, επίσης στην Bayes ανάλυση δεδομένων μιας κανονικής οικογένειας.

Αν πάρουμε ένα δείγμα n παρατηρήσεων με κανονική κατανομή, τότε η t-κατανομή με ν = n−1 βαθμούς ελευθερίας μπορεί να οριστεί ως η κατανομή της θέσης της πραγματικής τιμής, σε σχέση με το δειγματική τιμή διαιρεμένη με την τυπική απόκλιση, αφού την πολλαπλασιάσω με τον κανονικοποιημένο όρο ${\sqrt {n}}$ . Με τον τρόπο αυτό, η t-κατανομή μπορεί να χρησιμοποιηθεί για να εκτιμηθεί πόσο πιθανό είναι η πραγματική τιμή να βρίσκεται σε μια δεδομένη περιοχή.

Η t-κατανομή είναι συμμετρική και έχει σχήμα καμπάνας, όπως στην κανονική κατανομή, αλλά έχει βαρύτερες ουρές, που σημαίνει ότι είναι πιο επιρρεπείς στο να παράγει αξίες οι οποίες απέχουν πολύ από το μέσο όρο. Αυτό την καθιστά χρήσιμη για την κατανόηση της στατιστικής συμπεριφοράς ορισμένων τύπων αναλογίων τυχαίων ποσοτήτων,η οποία μεταβολή ενισχύεται στον παρονομαστή και μπορεί να παράγει απομακρυσμένες τιμές όταν ο παρονομαστής του λόγου τείνει στο μηδέν. Η κατανομή t-Student είναι μια ειδική περίπτωση της γενικευμένης υπερβολικής κατανομής.

Ιστορία και ετυμολογία

Στη στατιστική, η t-κατανομή αρχικά προήλθε από την εκ των υστέρων κατανομή το 1876 από τον Helmert^[1]^[2]^[3] και Lüroth.^[4]^[5]^[6]

Στην αγγλική λογοτεχνία πήρε το όνομά του από την εργασία του William Sealy Gosset το 1908 πάνω στην Biometrika με το ψευδώνυμο "Student".^[7]^[8] Ο Gosset εργάστηκε στο Guinness Brewery στο Δουβλίνο, Ιρλανδία, και ενδιαφέρονταν για τα προβλήματα των μικρών δειγμάτων, για παράδειγμα, οι χημικές ιδιότητες του κριθαριού, όπου το μέγεθος των δειγμάτων μπορεί να είναι τόσο χαμηλό όσο 3. Μία εκδοχή για την προέλευση του ψευδωνύμου είναι ότι ο εργοδότης του Gosset προτιμούσε το προσωπικό να χρησιμοποιεί τα ονόματα των στυλό κατά τη δημοσίευση επιστημονικών εργασιών αντί για τα πραγματικά τους ονόματα, έτσι χρησιμοποιείσαι το όνομα "Student" για να κρύψει την ταυτότητα του. Μια άλλη εκδοχή είναι ότι το Guinness δεν ήθελε οι ανταγωνιστές του να ξέρουν ότι χρησιμοποιούσαν το t - τεστ για τον έλεγχο της ποιότητας των πρώτων ύλων.^[9]

Η εργασία του Gosset αναφέρεται στη κατανομή ως «κατανομή συχνότητας των τυπικών αποκλίσεων των δειγμάτων που προέρχονται από ένα κανονικό πληθυσμό». Έγινε γνωστή μέσα από το την δουλειά του Ronald A. Fisher, που ονόμασε την κατανομή "Student's κατανομή" (που δεν πρέπει να συγχέεται με τον Φοιτητή την κυριολεκτική έννοια της λέξης student) και αναφέρεται στην τιμή της t.^[10]^[11]

Ορισμός

Συνάρτηση πυκνότητας πιθανότητας

Στην κατανομή t-Student η συνάρτηση πυκνότητας πιθανότητας δίνεται από

f(t)={\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}\left(1+{\frac {t^{2}}{\nu }}\right)^{-{\frac {\nu +1}{2}}},\!

όπου $\nu$ είναι ο αριθμός του βαθμού ελευθερίας και $\Gamma$ είναι η Συνάρτηση γάμμα. Αυτό μπορεί επίσης να γραφεί ως

f(t)={\frac {1}{{\sqrt {\nu }}\,B\left({\frac {1}{2}},{\frac {\nu }{2}}\right)}}\left(1+{\frac {t^{2}}{\nu }}\right)^{-{\frac {\nu +1}{2}}}\!,

όπου B είναι η Συνάρτηση βήτα. Στο σημείο αυτό, δείτε το σχόλιο σελίδα συζήτησης σχετικά με τη Συνάρτηση Πυκνότητας Πιθανότητας.

For $\nu$ even,

{\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}={\frac {(\nu -1)(\nu -3)\cdots 5\cdot 3}{2{\sqrt {\nu }}(\nu -2)(\nu -4)\cdots 4\cdot 2\,}}.

For $\nu$ odd,

{\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}={\frac {(\nu -1)(\nu -3)\cdots 4\cdot 2}{\pi {\sqrt {\nu }}(\nu -2)(\nu -4)\cdots 5\cdot 3\,}}.\!

Η συνάρτηση πυκνότητας πιθανότητας έχει συμμετρική κατανομή, και το συνολικό σχήμα της μοιάζει με το σχήμα καμπάνας της κανονικής κατανομής με μέσο όρο 0 και διακύμανση 1, εκτός από το ότι είναι λίγο χαμηλότερη και ευρύτερη . Καθώς ο αριθμός των βαθμών ελευθερίας μεγαλώνει, η t -κατανομή προσεγγίζει την κανονική κατανομή με μέση τιμή 0 και διακύμανση 1.

Οι παρακάτω εικόνες δείχνουν την πυκνότητα της t-κατανομής για αυξανόμενες τιμές $\nu$ . Η κανονική κατανομή διαγράφεται με μια μπλε γραμμή για σύγκριση. Σημειώνουμε ότι η t-κατανομή (κόκκινη γραμμή) έρχεται πιο κοντά στην κανονική κατανομή καθώς $\nu$ αυξάνεται.

Πυκνότητα της t -κατανομής (κόκκινο) για 1, 2, 3, 5, 10, και 30 βαθμούς ελευθερίας σε σχέση με την τυπική κανονική κατανομή (μπλε)
Προηγούμενα σχεδία φαίνονται με πράσινο.
1 degree of freedom	2 degrees of freedom	3 degrees of freedom
5 degrees of freedom	10 degrees of freedom	30 degrees of freedom

Αθροιστική συνάρτηση κατανομής

Η Αθροιστική συνάρτηση κατανομής μπορεί να γραφτεί ως I, η ορισμένη ελλιπής βήτα συνάρτηση. Για t > 0,^[12]

F(t)=\int _{-\infty }^{t}f(u)\,du=1-{\tfrac {1}{2}}I_{x(t)}\left({\tfrac {\nu }{2}},{\tfrac {1}{2}}\right),

με

x(t)={\frac {\nu }{t^{2}+\nu }}.

Άλλες τιμές που θα επιτυγχανόταν με τη συμμετρία. Μια εναλλακτική φόρμουλα, που ισχύει για t² < ν, is^[12]

\int _{-\infty }^{t}f(u)\,du={\tfrac {1}{2}}+t{\frac {\Gamma \left({\tfrac {1}{2}}(\nu +1)\right)}{{\sqrt {\pi \nu }}\,\Gamma \left({\tfrac {\nu }{2}}\right)}}{}_{2}F_{1}\left({\tfrac {1}{2}},{\tfrac {1}{2}}(\nu +1);{\tfrac {3}{2}};-{\tfrac {t^{2}}{\nu }}\right)

όπου ₂F₁ είναι μια ειδική περίπτωση της Υπεργεωμετρικής συνάρτησης.

Ειδικές περιπτώσεις

Ορισμένες τιμές του ν δίνουν μια ιδιαίτερα απλή μορφή.

ν = 1

Συνάρτηση κατανομής:

F(x)={\tfrac {1}{2}}+{\tfrac {1}{\pi }}\arctan(x).

Συνάρτηση πυκνότητας:

f(x)={\frac {1}{\pi (1+x^{2})}}.

Δες κατανομή Cauchy

ν = 2

Συνάρτηση κατανομής:

F(x)={\tfrac {1}{2}}+{\frac {x}{2{\sqrt {2+x^{2}}}}}.

Συνάρτηση πυκνότητας:

f(x)={\frac {1}{\left(2+x^{2}\right)^{\frac {3}{2}}}}.

ν = 3

Συνάρτηση πυκνότητας:

f(x)={\frac {6{\sqrt {3}}}{\pi \left(3+x^{2}\right)^{2}}}.

ν = ∞

Συνάρτηση πυκνότητας:

f(x)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {x^{2}}{2}}}.

Δες Κανονική κατανομή

Πώς προκύπτει η t -κατανομή

Δειγματοληπτική κατανομή

Ας είναι x₁, ..., x_n οι αριθμοί που παρατηρήθηκαν σε ένα δείγμα από ένα συνεχές κατανεμημένο πληθυσμό με την αναμενόμενη τιμή μ. Η μέση τιμή δείγματος και η Διακύμανση δίνονται από:

${\begin{aligned}{\bar {x}}&={\frac {x_{1}+\cdots +x_{n}}{n}}\\s^{2}&={\frac {1}{n-1}}\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}\end{aligned}}$

Η προκύπτουσα t-τιμή είναι

t={\frac {{\bar {x}}-\mu }{s/{\sqrt {n}}}}.

Η t-κατανομή με n − 1 βαθμούς ελευθερίας είναι η κατανομή της t-τιμής όταν τα δείγματα αποτελούνται από ανεξάρτητες ταυτόσημες κατανεμημένες παρατηρήσεις με κανονική κατανομή του πληθυσμού. Έτσι, με σκοπό την εξαγωγή συμπερασμάτων 't' 'είναι μια χρήσιμη «κεντρική ποσότητα" στην περίπτωση που η μέση τιμή και διακύμανση (μ, σ²) είναι άγνωστες παράμετροι του πληθυσμού, με την έννοια ότι η «'t'-τιμή έχει τότε μια κατανομή πιθανοτήτων που δεν εξαρτάται ούτε από το μ ούτε από το σ².

Bayesian συμπερασματολογία

Στην Bayesian στατιστική, μια (κλίμακα, μετατόπιση) της t-κατανομής προκύπτει ως η οριακή κατανομή της άγνωστης μέσης τιμής για την κανονική κατανομή, όταν η εξάρτηση από μια άγνωστη διακύμανση έχει περιθωριοποιηθεί από:^[13]

{\begin{aligned}p(\mu \mid D,I)=&\int p(\mu ,\sigma ^{2}\mid D,I)\;d\sigma ^{2}\\=&\int p(\mu \mid D,\sigma ^{2},I)\;p(\sigma ^{2}\mid D,I)\;d\sigma ^{2}\end{aligned}}

όπου D αντιπροσωπεύει τα δεδομένα {x_i} και I αντιπροσωπεύει οποιαδήποτε άλλη πληροφορία που μπορεί να έχει χρησιμοποιηθεί για να δημιουργηθεί το μοντέλο. Η κατανομή αυτή είναι η ένωση της δεσμευμένης κατανομής μ με γνωστά δεδομένα και σ² με την οριακή κατανομή της σ² δεδομένη.
Με n σημεία δεδομένων,εάν η θέση είναι άγνωστη και η κλίμακα prior $\scriptstyle {p(\mu \mid \sigma ^{2},I)={\mbox{const}}}$ και $\scriptstyle {p(\sigma ^{2}\mid I)\;\propto \;1/\sigma ^{2}}$ μπορούν να θεωρηθούν ως μ και σ², τότε από το Θεώρημα Bayes έχουμε

{\begin{aligned}p(\mu \mid D,\sigma ^{2},I)\sim &N({\bar {x}},\sigma ^{2}/n)\\p(\sigma ^{2}\mid D,I)\sim &\operatorname {Scale-inv-} \chi ^{2}(\nu ,s^{2})\end{aligned}}

μια κανονική κατανομή και κλίμακα αντίστροφη χ-τετράγωνο κατανομή , αντίστοιχα, όπου ν = n − 1 και

s^{2}=\sum {\frac {(x_{i}-{\bar {x}})^{2}}{n-1}}

.

Το περιθωριακό ολοκλήρωμα επομένως γίνεται

{\begin{aligned}p(\mu |D,I)&\propto \int _{0}^{\infty }{\frac {1}{\sqrt {\sigma ^{2}}}}\exp \left(-{\frac {1}{2\sigma ^{2}}}n(\mu -{\bar {x}})^{2}\right)\;\cdot \;\sigma ^{-\nu -2}\exp(-\nu s^{2}/2\sigma ^{2})\;d\sigma ^{2}\\&\propto \int _{0}^{\infty }\sigma ^{-\nu -3}\exp \left(-{\frac {1}{2\sigma ^{2}}}\left(n(\mu -{\bar {x}})^{2}+\nu s^{2}\right)\right)\;d\sigma ^{2}\end{aligned}}

Αυτό μπορεί να υπολογιστεί με αντικατάσταση $\scriptstyle {z=A/2\sigma ^{2}}$ , όπου $\scriptstyle {A=n(\mu -{\bar {x}})^{2}+\nu s^{2}}$ , δεδομένου

dz=-{\frac {A}{2\sigma ^{4}}}d\sigma ^{2},

έτσι

p(\mu |D,I)\propto \;A^{-{\frac {\nu +1}{2}}}\int _{0}^{\infty }z^{(\nu -1)/2}\exp(-z)\,dz

Αλλά το z ολοκλήρωμα είναι τώρα το κλασικό Γάμμα ολοκλήρωμα, το οποίο υπολογίζει το a σταθερά, αφήνοντας

{\begin{aligned}p(\mu \mid D,I)\propto &\;A^{-{\frac {\nu +1}{2}}}\\\propto &\left(1+{\frac {n(\mu -{\bar {x}})^{2}}{\nu s^{2}}}\right)^{-{\frac {\nu +1}{2}}}\end{aligned}}

Αυτή είναι μια μορφή της tκατανομής με ρητή κλιμάκωση και μετατόπιση που θα διερευνήσουμε με περισσότερες λεπτομέρειες παρακάτω. Μπορεί να σχετίζεται με την τυποποιημένη 't'-κατανομή από την υποκατάσταση

t={\frac {\mu -{\bar {x}}}{s/{\sqrt {n}}}}

Η παραγωγή παραπάνω έχει παρουσιαστεί για την περίπτωση της μη κατατοπιστικής priors για μ και σ²; αλλά είναι προφανές ότι για οποιαδήποτε priors που οδηγούν σε μια κανονική κατανομή που συνδυάζονται με μια κλίμακα αντίστροφη χ-τετράγωνο κατανομή θα οδηγήσει σε μία t κατανομή με κλιμάκωση και μετατόπιση για Ρ(μ|D,I), αν και η παράμετρος κλιμάκωσης που αντιστοιχεί στο s²/n παραπάνω θα επηρεαστεί τόσο από την προηγούμενη ενημέρωση και τα δεδομένα, μάλλον όχι μόνο από τα στοιχεία όπως παραπάνω.

Χαρακτηρισμός

Ως την κατανομή ενός τεστ στατιστικής

Η κατανομή t-Student με ν βαθμούς ελευθερίας μπορεί να οριστεί ως κατανομή της τυχαίας μεταβλητής T με ^[12]^[14]

T={\frac {Z}{\sqrt {V/\nu }}}=Z{\sqrt {\frac {\nu }{V}}},

όπου

Z είναι μια standart normal με αναμενόμενη τιμή 0 και διακύμανση 1;
V έχει κατανομή χ-τετράγωνο με ν βαθμούς ελευθερίας;
Z και V είναι ανεξάρτητες.

Μια διαφορετική κατανομή ορίζεται ως εκείνη της τυχαίας μεταβλητής που ορίζεται για μια δεδομένη σταθερά μ, από

(Z+\mu ){\sqrt {\frac {\nu }{V}}}.

Αυτή η τυχαία μεταβλητή έχει μη κεντρική 't'-κατανομή με με κεντρική παράμετρο μ. Η κατανομή αυτή είναι σημαντική στις μελέτες της στατιστικής ισχύς του t-Student τεστ.

Προέλευση

Υποθέτουμε X₁, ..., X_n είναι ανεξάρτητες πραγματοποιήσεις της κανονικά κατανεμημένης, τυχαίας μεταβλητής Χ, με αναμενόμενη τιμή μ και διακύμανση σ². Ας είναι

{\overline {X}}_{n}={\frac {1}{n}}(X_{1}+\cdots +X_{n})

είναι η μέση τιμή δείγματος, και

S_{n}^{\;2}={\frac {1}{n-1}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}_{n}\right)^{2}

είναι μια αμερόληπτη εκτίμηση της διακύμανσης από το δείγμα. Μπορεί να αποδειχθεί ότι η τυχαία μεταβλητή

V=(n-1){\frac {S_{n}^{2}}{\sigma ^{2}}}

έχει κατανομή χ-τετράγωνο με v=n−1 βαθμούς ελευθερίας (συμφωνά με το Θεώρημα Cochran ).^[15] Φαίνεται εύκολα ότι η ποσότητα

Z=\left({\overline {X}}_{n}-\mu \right){\frac {\sqrt {n}}{\sigma }}

έχει κανονική κατανομή με μέση τιμή 0 και διακύμανση 1, δεδομένου ότι η μέση τιμή δείγματος ${\overline {X}}_{n}$ έχει κανονική κατανομή με μέση τιμή μ και διακύμανση σ²/n. Επιπλέον, είναι δυνατόν να δείξουμε ότι αυτές οι δύο τυχαίες μεταβλητές ( η Z κανονική κατανομή και η V κατανομή χ-τετράγωνο) είναι ανεξάρτητες. Συνεπώς η κεντρική ποσότητα είναι,

T\equiv {\frac {Z}{\sqrt {V/v}}}=\left({\overline {X}}_{n}-\mu \right){\frac {\sqrt {n}}{S_{n}}},

η οποία διαφέρει από το Z στο ότι η ακριβής τυπική απόκλιση σ αντικαθίσταται από την τυχαία μεταβλητή S_n, και έχει κατανομή t-Student όπως ορίστηκε παραπάνω. Παρατηρήστε ότι η άγνωστη διακύμανση του πληθυσμού σ² δεν εμφανίζετε στην T, δεδομένου ότι ήταν τόσο στον αριθμητή και όσο και στον παρονομαστή, έτσι ακυρώθηκε. Η Gosset διαισθητικά λαμβάνεται την συνάρτηση πυκνότητας πιθανότητας που προαναφέρθηκε , με ν ίσο με το n − 1, και το απέδειξε ο Fisher το 1925.^[10]

Η κατανομή του στατιστικού αποτελέσματος της δοκιμής, T, εξαρτάται από το ν, άλλα όχι από το μ ή το σ; η έλλειψη της εξάρτησης από τα μ και σ είναι αυτό που κάνει τη t-κατανομή σημαντική τόσο στη θεωρία όσο και την πράξη.

Ως μέγιστη κατανομή εντροπίας

Η κατανομή t-Student είναι η μέγιστη της κατανομής πιθανότητας εντροπία για μια τυχαία μεταβλητή X για την οποία $E(\ln(\nu +X^{2}))$ είναι σταθερή.^[16]

Ιδιότητες

Στιγμές

Για ν > 1, οι raw moment της t-κατανομής είναι

E(T^{k})={\begin{cases}0&k{\text{ odd}},\quad 0<k<\nu \\{\frac {1}{{\sqrt {\pi }}\Gamma \left({\frac {\nu }{2}}\right)}}\left[\Gamma \left({\frac {k+1}{2}}\right)\Gamma \left({\frac {\nu -k}{2}}\right)\nu ^{\frac {k}{2}}\right]&k{\text{ even}},\quad 0<k<\nu .\\\end{cases}}

Στιγμές της τάξης ν ή μεγαλύτερες δεν υπάρχουν.^[17]

Ο όρος για 0 < k < ν, k άρτιος, μπορεί να απλοποιηθεί χρησιμοποιώντας τις ιδιότητες της Γάμμα συνάρτησης

E(T^{k})=\nu ^{\frac {k}{2}}\,\prod _{i=1}^{\frac {k}{2}}{\frac {2i-1}{\nu -2i}}\qquad k{\text{ even}},\quad 0<k<\nu .

Για μια t-κατανομή με ν βαθμούς ελευθερίας, η αναμενόμενη τιμή είναι 0, και η διακύμανση είναι ν/(ν − 2) αν ν > 2. Η λοξότητα είναι 0 για ν > 3 και η υπερβολική κύρτωση είναι 6/(ν − 4) για ν > 4.

Σχέση με την F-κατανομή

$Y\sim \mathrm {F} (\nu _{1}=1,\nu _{2}=\nu )$ έχει F-κατανομή αν Y = X² και η X ~ t(ν) έχει κατανομή t-Student.

Monte Carlo δειγματοληψία

Υπάρχουν διάφορες προσεγγίσεις για την κατασκευή τυχαίων δειγμάτων από την κατανομή t-Student. Το θέμα εξαρτάται από το αν τα δείγματα απαιτούνται σε αυτόνομη βάση,ή πρόκειται να κατασκευασθούν με την εφαρμογή ενός quantile function σε uniform δείγματα; π.χ., στην πολυδιάστατη εφαρμογές βάση copula-dependency. Στην περίπτωση της stand-alone δειγματοληψίας, με την επέκταση της μέθοδου Box–Muller και την πολική μορφή Box–Muller είναι εύκολο να αναπτυχθεί.^[18] Έχει το πλεονέκτημα ότι ισχύει εξίσου καλά σε όλες τους πραγματικούς θετικούς βαθμούς ελευθερίας, ν, ενώ πολλές άλλες υποψήφιες μέθοδοι αποτυχαίνουν, εάν το ν τείνει στο μηδέν.^[18]

Ολοκλήρωμα της συνάρτησης πυκνότητας πιθανότητας και p-value της Student-t κατανομής

Η συνάρτηση A(t|ν) είναι το ολοκλήρωμα της συνάρτησης πυκνότητας πιθανότητας της Student, f(t) μεταξύ −t και t, για t ≥ 0. Έτσι δίνει την πιθανότητα ότι μία τιμή t μικρότερη από εκείνη που υπολογίζεται από τις παρατηρούμενες τιμές δεδομένων θα συμβεί κατά τύχη. Ως εκ τούτου, η συνάρτηση A(t|ν) μπορεί να χρησιμοποιηθεί για να εξετάσουμε αν η διαφορά μεταξύ των μέσων τιμών δύο συνόλων δεδομένων είναι στατιστικά σημαντική, υπολογίζοντας την αντίστοιχη τιμή του t και την πιθανότητα εμφάνισής του αν τα δύο σύνολα δεδομένων προέρχονται από τον ίδιο πληθυσμό. Αυτό χρησιμοποιείται σε μια ποικιλία καταστάσεων, ιδιαίτερα σε t-τεστς. Για το στατιστικό t, με ν βαθμούς ελευθερίας, A(t|ν) είναι η πιθανότητα ότι το t θα είναι μικρότερο από την παρατηρούμενη τιμή αν οι δύο μέσες τιμές ήταν ίσες (υπό την προϋπόθεση ότι η μικρότερη μέση τιμή αφαιρείται από τη μεγαλύτερη, έτσι ώστε t ≥ 0). Μπορεί εύκολα να υπολογιστεί από τη αθροιστική συνάρτηση κατανομής F_ν(t) της t-κατανομής:

A(t|\nu )=F_{\nu }(t)-F_{\nu }(-t)=1-I_{\frac {\nu }{\nu +t^{2}}}\left({\frac {\nu }{2}},{\frac {1}{2}}\right),

όπου I_x είναι η κανονικοποιημένη incomplete Βήτα συνάρτηση (a, b).

Στον έλεγχο στατιστικών υποθέσεων αυτή η συνάρτηση χρησιμοποιείται για την κατασκευή της p-τιμή.

Διαφορική εξίσωση

The pdf της t-κατανομής είναι μία λύση της ακόλουθης διαφορικής εξίσωσης:

\left\{{\begin{array}{l}\left(\nu +x^{2}\right)f'(x)+(\nu +1)xf(x)=0,\\f(1)={\frac {\nu ^{\nu /2}(\nu +1)^{-{\frac {\nu }{2}}-{\frac {1}{2}}}}{B\left({\frac {\nu }{2}},{\frac {1}{2}}\right)}}\end{array}}\right\}

Μη τυποποιημένη Student's t-κατανομή

Σχετικά με τις παραμέτρους διασποράς σ, και σ²

Η Student's t κατανομή μπορεί να γενικευθεί σε τρεις παραμέτρους location-scale family, εισάγωντας μία Location parameter $\mu$ και μία scale parameter $\sigma$ , μ'εσω της σχέσης

X=\mu +\sigma T

ή

T={\frac {X-\mu }{\sigma }}

Αυτό σημαίνει ότι η ${\frac {x-\mu }{\sigma }}$ ακολουθεί κλασσική Student's t κατανομή με $\nu$ βαθμούς ελευθερίας.

Η μη τυποποιημένη Student's t-κατανομή έχει πυκνότητα που ορίζεται από τη σχέση^[19]

p(x\mid \nu ,\mu ,\sigma )={\frac {\Gamma ({\frac {\nu +1}{2}})}{\Gamma ({\frac {\nu }{2}}){\sqrt {\pi \nu }}\sigma }}\left(1+{\frac {1}{\nu }}\left({\frac {x-\mu }{\sigma }}\right)^{2}\right)^{-{\frac {\nu +1}{2}}}

Εδώ, $\sigma$ δεν αντιστοιχεί σε μια τυπική απόκλιση: δεν είναι η τυπική απόκλιση της κλιμακωτής t κατανομής, που μπορεί να μην υπάρχει καν; ούτε είναι η τυπική απόκλιση της υποκείμενης κανονικής κατανομής, η οποία είναι άγνωστη.Το $\sigma$ ορίζει απλώς τη συνολική κλιμάκωση της κατανομής. Στην πιο πάνω Bayesian derivation της οριακής κατανομής μιας άγνωστης κανονικής μέσης τιμής $\mu$ , το $\sigma$ όπως χρησιμοποιείται αντιστοιχεί στην ποσότητα $\scriptstyle {s/{\sqrt {n}}}$ , όπου

s^{2}=\sum {\frac {(x_{i}-{\bar {x}})^{2}}{n-1}}.

Αντίστοιχα, η κατανομή μπορεί να γραφεί σε σχέση με το $\sigma ^{2}$ , το τετράγωνο αυτής της παραμέτρου κλίμακας:

p(x\mid \nu ,\mu ,\sigma ^{2})={\frac {\Gamma ({\frac {\nu +1}{2}})}{\Gamma ({\frac {\nu }{2}}){\sqrt {\pi \nu \sigma ^{2}}}}}\left(1+{\frac {1}{\nu }}{\frac {(x-\mu )^{2}}{\sigma ^{2}}}\right)^{-{\frac {\nu +1}{2}}}

Άλλες ιδιότητες αυτής της εκδοχής της κατανομής είναι:^[19]

{\begin{aligned}\operatorname {E} (X)&=\mu \quad \quad \quad {\text{for }}\,\nu >1,\\{\text{var}}(X)&=\sigma ^{2}{\frac {\nu }{\nu -2}}\,\quad {\text{for }}\,\nu >2,\\{\text{mode}}(X)&=\mu .\end{aligned}}

Αυτή η κατανομή προκύπτει compound distribution μια Gaussian κατανομή (Κανονική κατανομή) με τιμή $\mu$ και άγνωστη διακύμανση, με αντίστροφη γάμμα κατανομή τοποθετημένη πάνω στη διακύμανση με παραμέτρους $a=\nu /2$ και $b=\nu \sigma ^{2}/2$ . Με άλλα λόγια, η τυχαία μεταβλητή X θεωρείται ότι ακολουθεί Γκαουσιανή κατανομή με άγνωστη διακύμανση η οποία με τη σειρά της ακολουθεί αντίστροφη γάμμα κατανομή, και τότε η διακύμανση marginalized out (integrated out). Ο λόγος της χρησιμότητας αυτού του χαρακτηρισμού είναι ότι η αντίστροφη γάμμα κατανομή είναι η conjugate prior κατανομή της διακύμανσης μιας Γκαουσιανής κατανομής. Σαν αποτέλεσμα, η μη τυποποιημένη Student's t-κατανομή προκύπτει φυσικά σε πολλά Bayesian προβλήματα. Δείτε παρακάτω.

Αντίστοιχα, αυτή η κατανομή προκύπτει συνδυάζοντας μία Γκαουσιανή κατανομή με μία κλίμακωτή-αντίστροφη-χ-τετράγωνο κατανομή με παραμέτρους $\nu$ και $\sigma ^{2}$ . Η κλιμακωτή-αντίστροφη-χ-τετράγωνο κατανομή είναι ακριβώς η ίδια κατανομή με την αντίστροφη γάμμα κατανομή, αλλά με διαφορετική παραμετροποίηση, π.χ. $\nu =2a,\sigma ^{2}=b/a$ .

Σε σχέση με την αντίστροφη κλιμακωτή παράμετρο λ

Μία εναλλακτική παραμετροποίηση σε σχέση με μία αντίστροφη κλιμακωτή παράμετρο $\lambda$ (ανάλογη με τον τρόπο με τον οποίο η ακρίβεια είναι το αντίστροφο της διακύμανσης), ορίζεται από τη σχέση $\lambda ={\frac {1}{\sigma ^{2}}}$ . Τότε η πυκνότητα ορίζεται από την^[20]

p(x|\nu ,\mu ,\lambda )={\frac {\Gamma ({\frac {\nu +1}{2}})}{\Gamma ({\frac {\nu }{2}})}}\left({\frac {\lambda }{\pi \nu }}\right)^{\frac {1}{2}}\left(1+{\frac {\lambda (x-\mu )^{2}}{\nu }}\right)^{-{\frac {\nu +1}{2}}}.

Άλλες ιδιότητες αυτής της εκδοχής της κατανομής είναι:^[20]

{\begin{aligned}\operatorname {E} (X)&=\mu \quad \quad \quad {\text{for }}\,\nu >1,\\{\text{var}}(X)&={\frac {1}{\lambda }}{\frac {\nu }{\nu -2}}\,\quad {\text{for }}\,\nu >2,\\{\text{mode}}(X)&=\mu .\end{aligned}}

Αυτή η κατανομή προκύπτει από την ένωση μιας Γκαουσιανής κατανομης με μέση τιμή $\mu$ και άγνωστη ακρίβεια (το αντίστροφο της διακύμανσης), με μία Γάμμα κατανομή που τοποθετείται πάνω στην ακρίβεια με παραμέτρους $a=\nu /2$ και $b=\nu /(2\lambda )$ . Με άλλα λόγια, η τυχαία μεταβλητή X θεωρείται ότι ακολουθεί Κανονική κατανομή με άγνωστη ακρίβεια η οποία ακολουθεί γάμμα κατανομή, και στη συνέχεια αυτό περιθωριοποιείται πάνω από τη γάμμα κατανομή.

Σχετικές κατανομές

Μη κεντραρισμένη t-κατανομή

Η μη κεντραρισμένη 't'-κατανομή είναι ένας διαφορετικός τρόπος γενίκευσης της κατανομής t για να συμπεριλάβει μια παράμετρο θέσης. Σε αντίθεση με τις μη τυποποιημένες t-κατανομές, οι μη κεντραρισμένες κατανομές δεν είναι συμμετρικές (η διάμεσος δεν είναι ίση με την επικρατούσα τιμή).

Διακριτή Student's t-κατανομή

Η διακριτή Student's t-κατανομή καθορίζεται από τη συνάρτηση μάζας πιθανότητας της με το r να είναι ανάλογο με το^[21]

\prod _{j=1}^{k}{\frac {1}{(r+j+a)^{2}+b^{2}}}\quad \quad r=\ldots ,-1,0,1,\ldots .

Εδώ τα a, b, και k είναι παράμετροι. Αυτή η κατανομή προκύπτει από την κατασκευή ενός συστήματος διακριτών κατανομών παρόμοιο μ' εκείνο της Pearson κατανομής για συνεχείς κατανομές.^[22]

Περαιτέρω γενικεύσεις

Μπορούμε να δημιουργήσουμε Student-t δείγματα με λήψη της αναλογίας των μεταβλητών από την κανονική κατανομή και της τετραγωνικής ρίζας από τη x-τετράγωνο κατανομή. Αν χρησιμοποιήσουμε αντί για την κανονική κατανομή π.χ. την Irwin-Hall, παίρνουμε πάνω απ' όλα μια συμμετρική 4-παραμετρική κατανομή, η οποία περιλαμβάνει την κανονική, την ομοιόμορφη, την τριγωνική, τη Student-t και την Cauchy κατανομή. με αυτόν τον τρόπο είναι π.χ. επίσης πιο ευέλικτη απ΄ ότι κάποιες άλλες συμμετρικές γενικεύσεις της Γκαουσιανής κατανομής.

Χρήσεις

Στην πιθανολογική στατιστική συμπερασματολογία

Η Student's t-κατανομή προκύπτει σε μια ποικιλία από προβλήματα στατιστικών εκτιμήσεων όπου σκοπός είναι να εκτιμηθεί μια άγνωστη παράμετρος, όπως μια μέση τιμή, σ΄ένα περιβάλλον όπου στα παρατηρούμενα δεδομένα υπάρχουν επιπρόσθετα σφάλματα. Αν (όπως σε σχεδόν κάθε πρακτική στατιστική εργασία) η τυπική απόκλιση του πληθυσμού αυτών των σφαλμάτων είναι άγνωστη και πρέπει να εκτιμηθεί από τα δεδομένα, η t-κατανομή χρησιμοποιείται συχνά για να ληφθεί υπόψη η επιπλέον αβεβαιότητα που προκύπτει από αυτή την εκτίμηση. Στα περισσότερα προβλήματα τέτοιου είδους, αν η τυπική απόκλιση των σφαλμάτων είναι γνωστή, η Κανονική κατανομή θα χρησιμοποιηθεί αντί για την t-κατανομή.

Το Διάστημα εμπιστοσύνης και ο έλεγχος υποθέσεων είναι δύο στατιστικές διαδικασίες στις οποίες απαιτούνται τα ποσοστημόρια της κατανομής του δείγματος μιας συγκεκριμένης στατιστικής (π.χ. το standard score). κάθε φορά που αυτό το στατιστικό είναι μια γραμμική συνάρτηση των δεδομένων, διαιρείται με τη συνήθη εκτίμηση της τυπικής απόκλισης, η προκύπτουσα ποσότητα μπορεί να ανακλιμακωθεί και να κεντραριστεί για ν΄ακολουθήσει Student's t-κατανομή. Οι στατιστικές αναλύσεις που αφορούν μέσες τιμές, σταθμευμένο μέσο, και συντελεστές παλινδρόμησης όλες οδηγούν στη στατιστική να έχει αυτή τη μορφή.

Αρκετά συχνά, textbook problems θ΄ αντιμετωπίσουν την τυπική απόκλιση του πληθυσμού σαν να ήταν γνωστή και ως εκ τούτου θ΄αποφύγουν την ανάγκη να χρησιμοποιήσουν τη t-κατανομή. Αυτά τα προβλήματα είναι γενικά δύο ειδών: (1) εκείνα στα οποία το μέγεθος του δείγματος είναι τόσο μεγάλο που κάποιος μπορεί ν΄αντιμετωπίσει μια εκτίμηση της διακύμανσης βασισμένη στα δεδομένα ως βεβαιότητα, και (2) εκείνα που επεξηγούν μια μαθηματική συλλογιστική, στην οποία το πρόβλημα της εκτίμησης της τυπικής απόκλισης προσωρινά αγνοείται διότι δεν είναι αυτό το σημείο που ο συγγραφέας ή ο δάσκαλος στη συνέχεια εξηγεί.

Έλεγχος υποθέσεων

Ένας αριθμός των στατιστικών στοιχείων μπορεί ν΄αποδειχθεί ότι έχουν t-κατανομές για δείγματα μετρίου μεγέθους κάτω από μηδενική υπόθεση που μας ενδιαφέρουν, έτσι ώστε η t-κατανομή αποτελεί τη βάση για τεστ σημαντικότητας. Για παράδειγμα, η κατανομή του συντελεστή συσχέτισης spearman ρ, σε μηδενική υπόθεση (μηδενική συσχέτιση) προσεγγίζεται καλά από την t κατανομή για δείγματα μεγέθους άνω των 20.^{[εκκρεμεί παραπομπή]}

Διαστήματα εμπιστοσύνης

Ας υποθέσουμε ότι ο αριθμός A επιλέγεται έτσι ώστε να

\Pr(-A<T<A)=0.9,

όταν το T έχει t-κατανομή με n − 1 βαθμούς ελευθερίας. Λόγω συμμετρίας, αυτό είναι το ίδιο με το να πούμε ότι ο A ικανοποιεί την

\Pr(T<A)=0.95,

οπότε ο A είναι το "95ο εκατοστημόριο" αυτής της κατανομής πιθανοτήτων, ή $A=t_{(0.05,n-1)}$ . Τότε

\Pr \left(-A<{\frac {{\overline {X}}_{n}-\mu }{\frac {S_{n}}{\sqrt {n}}}}<A\right)=0.9,

κι αυτή είναι ισοδύναμη με την

\Pr \left({\overline {X}}_{n}-A{\frac {S_{n}}{\sqrt {n}}}<\mu <{\overline {X}}_{n}+A{\frac {S_{n}}{\sqrt {n}}}\right)=0.9.

Ως εκ τούτου, το διάστημα του οποίου τα άκρα είναι

{\overline {X}}_{n}\pm A{\frac {S_{n}}{\sqrt {n}}}

είναι το 90% confidence interval για το μ. Κατά συνέπεια, αν βρούμε τη μέση τιμή ενός συνόλου παρατηρήσεων για το οποίο μπορούμε λογικά να περιμένουμε ότι θα έχουμε κανονική κατανομή, μπορούμε να χρησιμοποιήσουμε την t-κατανομή για να εξετάσουμε κατά πόσον στα όρια εμπιστοσύνης στην εν λόγω μέση τιμή συμπεριλαμβάνεται κάποια θεωρητικά προβλεπόμενη τιμή – όπως την τιμή που προβλέψαμε στη null hypothesis.

Αυτό το αποτέλεσμα είναι που χρησιμοποιείται στα Student's t-tests: από τη στιγμή που η διαφορά μεταξύ των μέσων τιμών των δειγμάτων από δύο κανονικές κατανομές ακολουθεί και η ίδια κανονική κατανομή, η t-κατανομή μπορεί να χρησιμοποιηθεί για να εξετάσουμε κατά πόσον αυτή η διαφορά μπορεί λογικά να υποτεθεί ίση με μηδέν.

Αν τα δεδομένα είναι κανονικά κατανεμημένα, η μονόπλευρη (1 − a)-άνω όριο εμπιστοσύνης (UCL) της μέσης τιμής, μπορεί να υπολογιστεί χρησιμοποιώντας την ακόλουθη εξίσωση:

\mathrm {UCL} _{1-a}={\overline {X}}_{n}+t_{a,n-1}{\frac {S_{n}}{\sqrt {n}}}.

Το παραγόμενο UCL είναι η μεγαλύτερη μέση τιμή που θα προκύψει για ένα συγκεκριμένο διάστημα εμπιστοσύνης και μέγεθος πληθυσμού. Με άλλα λόγια, αν ${\overline {X}}_{n}$ είναι ο μέσος όρος του συνόλου των παρατηρήσεων, η πιθανότητα ότι η μέση τιμή της κατανομής είναι κατώτερη του UCL_1−a είναι ίση με το επίπεδο εμπιστοσύνης 1 − a.

Διαστήματα πρόβλεψης

Η t-κατανομή μπορεί να χρησιμοποιηθεί για να κατασκευάσουμε το διάστημα πρόβλεψης για ένα απαρατήρητο δείγμα από μία κανονική κατανομή με άγνωστη μέση τιμή και διακύμανση.

Μπεϋζιανή στατιστική

Η Student's t-κατανομή, ιδιαίτερα στην τριών παραμέτρων (θέση-κλίμακα) εκδοχή της, ανακύπτει συχνά στη Bayesian statistics ως αποτέλεσμα της σχέσης της με την normal distribution. Όποτε η variance μιας κανονικώς κατανεμημένης random variable είναι άγνωστη κι ένα conjugate prior που ακολουθεί inverse gamma distribution τοποθετείται πάνω της, η προκύπτουσα marginal distribution της μεταβλητής θ΄ ακολουθεί Student's t-κατανομή. Ισοδύναμες κατασκευές με τα ίδια αποτελέσματα περιλαμβάνουν μια συζηγή scaled-inverse-chi-squared distribution της διακύμανσης, ή μία συζηγή gamma distribution της precision. Αν ένα improper prior ανάλογο στο σ⁻² τοποθετειθεί πάνω στη διακύμανση, προκύπτει επίσης t-κατανομή. Αυτό συμβαίνει άσχετα με το εάν η μέση τιμή της κανονικώς κατανεμημένης μεταβλητής είναι γνωστή, είναι άγνωστα κατανεμημένη σύμφωνα με μία conjugate κανονικώς κατανεμημένη prior, ή είναι άγνωστα κατανεμημένη σύμφωνα με an improper constant prior.

Σχετικές καταστάσεις που παράγουν επίσης μία t-κατανομή είναι:

Η marginal posterior distribution της άγνωστης μέσης τιμής μίας κανονικώς κατανεμημένης διακύμανσης, με άγνωστη prior μέση τιμή και διακύμανση που ακολουθεί το παραπάνω μοντέλο.
Η prior predictive distribution και η posterior predictive distribution ενός νέου κανονικώς κατανεμημένου σημείου δεδομένων όταν μια σειρά από independent identically distributed κανονικώς κατανεμημένα σημεία δεδομένων έχουν παρατηρηθεί, με προηγούμενη μέση τιμή και διακύμανση όπως το παραπάνω μοντέλο.

Ισχυρή παραμετρική μοντελοποίηση

Η t-κατανομή χρησιμοποιείται συχνά ως εναλλακτική της κανονικής κατανομής ως μοντέλο για τα δεδομένα.^[23] Είναι συχνή περίπτωση τα πραγματικά δεδομένα να έχουν βαρύτερες ουρές απ΄ότι η κανονική κατανομή επιτρέπει. η κλασική προσέγγιση ήταν να προσδιοριστούν οι ακραίες τιμές και να τις αποκλίσει ή να τις μειώσει κάπως. Ωστόσο, δεν είναι πάντα εύκολο να προσδιοριστούν ακραίες τιμές (ιδιαίτερα σε high dimensions), και η t-κατανομή είναι η φυσική επιλογή του μοντέλου γι΄αυτά τα δεδομένα και παρέχει μια παραμετρική προσέγγιση στην robust statistics.

Ο Lange et al. ερεύνησε τη χρήση της t-κατανομής στην ισχυρή μοντελοποίηση για δεδομένα με βαριές ουρές σε μια ποικιλία από περιβάλλοντα. Ένας Μπεϋζιανός λογαριασμός μπορεί να βρεθεί στον Gelman et al. Οι βαθμοί ελευθερίας ελέγχουν την κύρτωση της κατανομής και σχετίζονται με την παράμετρο κλιμάκωσης. Η πιθανότητα μπορεί να έχει πολλά τοπικά μέγιστα και, ως εκ τούτου, είναι συχνά απαραίτητο να σταθεροποιήσουμε τους βαθμούς ελευθερίας σε αρκετά χαμηλές τιμές και να εκτιμήσουμε τις άλλες παραμέτρους θεωρώντας αυτό ως δεδομένο. Μερικοί συγγραφείς αναφέρουν ότι οι τιμές μεταξύ 3 και 9 είναι συχνά καλές επιλογές. Οι Venables and Ripley η τιμή 5 είναι συχνά καλή επιλογή.

Πίνακας επιλεγμένων τιμών

Τα περισσότερα στατιστικά βιβλία έχουν καταγεγραμμένους πίνακες της t κατανομής. Σήμερα, ο καλύτερος τρόπος για μια εντελώς ακριβή κρίσιμη τιμή t ή μία αθροιστική πιθανότητα είναι η στατιστική λειτουργία να εφαρμόζεται σε υπολογιστικά φύλλα (Office Excel, OpenOffice Calc, etc.), η μία διαδραστική υπολογιστική σελίδα στο διαδύκτιο. Οι σχετικές λειτουργίες στα υπολογιστικά φύλλα είναι TDIST και TINV, ενώ οι διαδυκτιακές υπολογιστικές σελίδες μας γλυτώνουν απ΄τον κόπο να υπολογίσουμε για παράδειγμα θέσεις παραμέτρων ή ονόματα συναρτήσεων. Για παράδειγμα, η σελίδα MediaWiki που υποστηρίζεται από την επέκταση R μπορεί εύκολα να δώσει το διαδραστικό αποτέλεσμα κρίσιμων τιμών ή αθροιστικής πιθανότητας, ακόμα και για μη κεντραρισμένες t-κατανομές.

Ο ακόλουθος πίνακας παρουσιάζει μερικές επιλεγμένες τιμές για t-κατανομές με ν βαθμούς ελευθερίας για μία σειρά από μονόπλευρες ή δίπλευρες κρίσιμες περιοχές. Ένα παράδειγμα για το πώς να διαβάσετε αυτόν τον πίνακα, πάρτε την τέταρτη σειρά, που ξεκινάει με 4; αυτό σημαίνει ότι το ν, ο αριθμός των βαθμών ελευθερίας, είναι 4 (κι αν έχουμε να κάνουμε, όπως παραπάνω, με n τιμές με σταθερό άθροισμα, n = 5). Πάρτε την πέμπτη εισαγωγή, στη στήλη με τίτλο 95% για τη μονόπλευρη (90% για τη δίπλευρη). Η τιμή αυτής της εισαγωγής είναι "2.132". Έπειτα η πιθανότητα ότι το T είναι μικρότερο από 2.132 είναι 95% ή Pr(−∞ < T < 2.132) = 0.95; αυτό συνεπάγεται ότι Pr(−2.132 < T < 2.132) = 0.9.

Αυτό μπορεί να υπολογιστεί από τη συμμετρία της κατανομής,

Pr(T < −2.132) = 1 − Pr(T > −2.132) = 1 − 0.95 = 0.05,

κι έτσι

Pr(−2.132 < T < 2.132) = 1 − 2(0.05) = 0.9.

Σημειώνεται ότι η τελευταία σειρά δίνει επίσης κρίσιμα σημεία: μια t-κατανομή με απείρως πολλούς βαθμούς ελευθερίας είναι μία κανονική κατανομή. (Δείτε τις Σχετικές κατανομές παραπάνω).

Η πρώτη στήλη είναι ο αριθμός των βαθμών ελευθερίας.

Μονόπλευρη	75%	80%	85%	90%	95%	97.5%	99%	99.5%	99.75%	99.9%	99.95%
Δίπλευρη	50%	60%	70%	80%	90%	95%	98%	99%	99.5%	99.8%	99.9%
1	1.000	1.376	1.963	3.078	6.314	12.71	31.82	63.66	127.3	318.3	636.6
2	0.816	1.080	1.386	1.886	2.920	4.303	6.965	9.925	14.09	22.33	31.60
3	0.765	0.978	1.250	1.638	2.353	3.182	4.541	5.841	7.453	10.21	12.92
4	0.741	0.941	1.190	1.533	2.132	2.776	3.747	4.604	5.598	7.173	8.610
5	0.727	0.920	1.156	1.476	2.015	2.571	3.365	4.032	4.773	5.893	6.869
6	0.718	0.906	1.134	1.440	1.943	2.447	3.143	3.707	4.317	5.208	5.959
7	0.711	0.896	1.119	1.415	1.895	2.365	2.998	3.499	4.029	4.785	5.408
8	0.706	0.889	1.108	1.397	1.860	2.306	2.896	3.355	3.833	4.501	5.041
9	0.703	0.883	1.100	1.383	1.833	2.262	2.821	3.250	3.690	4.297	4.781
10	0.700	0.879	1.093	1.372	1.812	2.228	2.764	3.169	3.581	4.144	4.587
11	0.697	0.876	1.088	1.363	1.796	2.201	2.718	3.106	3.497	4.025	4.437
12	0.695	0.873	1.083	1.356	1.782	2.179	2.681	3.055	3.428	3.930	4.318
13	0.694	0.870	1.079	1.350	1.771	2.160	2.650	3.012	3.372	3.852	4.221
14	0.692	0.868	1.076	1.345	1.761	2.145	2.624	2.977	3.326	3.787	4.140
15	0.691	0.866	1.074	1.341	1.753	2.131	2.602	2.947	3.286	3.733	4.073
16	0.690	0.865	1.071	1.337	1.746	2.120	2.583	2.921	3.252	3.686	4.015
17	0.689	0.863	1.069	1.333	1.740	2.110	2.567	2.898	3.222	3.646	3.965
18	0.688	0.862	1.067	1.330	1.734	2.101	2.552	2.878	3.197	3.610	3.922
19	0.688	0.861	1.066	1.328	1.729	2.093	2.539	2.861	3.174	3.579	3.883
20	0.687	0.860	1.064	1.325	1.725	2.086	2.528	2.845	3.153	3.552	3.850
21	0.686	0.859	1.063	1.323	1.721	2.080	2.518	2.831	3.135	3.527	3.819
22	0.686	0.858	1.061	1.321	1.717	2.074	2.508	2.819	3.119	3.505	3.792
23	0.685	0.858	1.060	1.319	1.714	2.069	2.500	2.807	3.104	3.485	3.767
24	0.685	0.857	1.059	1.318	1.711	2.064	2.492	2.797	3.091	3.467	3.745
25	0.684	0.856	1.058	1.316	1.708	2.060	2.485	2.787	3.078	3.450	3.725
26	0.684	0.856	1.058	1.315	1.706	2.056	2.479	2.779	3.067	3.435	3.707
27	0.684	0.855	1.057	1.314	1.703	2.052	2.473	2.771	3.057	3.421	3.690
28	0.683	0.855	1.056	1.313	1.701	2.048	2.467	2.763	3.047	3.408	3.674
29	0.683	0.854	1.055	1.311	1.699	2.045	2.462	2.756	3.038	3.396	3.659
30	0.683	0.854	1.055	1.310	1.697	2.042	2.457	2.750	3.030	3.385	3.646
40	0.681	0.851	1.050	1.303	1.684	2.021	2.423	2.704	2.971	3.307	3.551
50	0.679	0.849	1.047	1.299	1.676	2.009	2.403	2.678	2.937	3.261	3.496
60	0.679	0.848	1.045	1.296	1.671	2.000	2.390	2.660	2.915	3.232	3.460
80	0.678	0.846	1.043	1.292	1.664	1.990	2.374	2.639	2.887	3.195	3.416
100	0.677	0.845	1.042	1.290	1.660	1.984	2.364	2.626	2.871	3.174	3.390
120	0.677	0.845	1.041	1.289	1.658	1.980	2.358	2.617	2.860	3.160	3.373
$\infty$	0.674	0.842	1.036	1.282	1.645	1.960	2.326	2.576	2.807	3.090	3.291

Ο αριθμός στην αρχή κάθε σειράς του παραπάνω πίνακα είναι ο ν που έχει οριστεί παραπάνω ως n − 1. Το ποσοστό κατά μήκος της κορυφής είναι 100%(1 − α). Οι αριθμοί στο κυρίως μέρος του πίνακα είναι οι t_{α, ν}. Αν η ποσότητα T κατανέμεται ως Student-t κατανομή με ν βαθμούς ελευθερίας, τότε υπάρχει πιθανότητα 1 − α ότι η T θα είναι μικρότερη από τους t_{α, ν}. (Που υπολογίζεται ως μία μονόπλευρη δοκιμή, σε αντίθεση με μία δίπλευρη δοκιμή.)

Για παράδειγμα, για δοθέν δείγμα με διακύμανση 2 και μέση τιμή 10, που λαμβάνεται από ένα σύνολο δειγμάτων των 11 (10 βαθμοί ελευθερίας), χρησιμοποιώντας τον τύπο

{\overline {X}}_{n}\pm A{\frac {S_{n}}{\sqrt {n}}}.

Μπορούμε να προσδιορίσουμε έχοντας εμπιστοσύνη κατά 90%, ότι θα έχουμε μια πραγματική μέση τιμή κάτω από

10+1.37218{\frac {\sqrt {2}}{\sqrt {11}}}=10.58510.

(Με άλλα λόγια, κατά μέσο όρο, το 90% των περιπτώσεων που ένα ανώτερο όριο υπολογίζεται με αυτόν τον τρόπο, αυτό το ανώτερο όριο υπερβαίνει την πραγματική μέση τιμή.) Και, πάλι με 90% εμπιστοσύνη στο αποτέλεσμα, έχουμε την πραγματική μέση τιμή πάνω από

10-1.37218{\frac {\sqrt {2}}{\sqrt {11}}}=9.41490.

(Με άλλα λόγια, κατά μέσο όρο, το 90% των περιπτώσεων που ένα κατώτερο όριο υπολογίζεται με αυτόν τον τρόπο, το κατώτερο αυτό όριο βρίσκεται κάτω απ΄την πραγματική μέση τιμή.) Έτσι έχοντας 80% εμπιστοσύνη (που υπολογίζεται από 1 − 2 × (1 − 90%) = 80%), έχουμε την πραγματική μέση τιμή να βρίσκεται μέσα στο διάστημα

\left(10-1.37218{\frac {\sqrt {2}}{\sqrt {11}}},10+1.37218{\frac {\sqrt {2}}{\sqrt {11}}}\right)=\left(9.41490,10.58510\right).

(Με άλλα λόγια, κατά μέσο όρο, το 80% των περιπτώσεων που τα άνω και κάτω όρια υπολογίζονται μ΄αυτόν τον τρόπο, η πραγματική μέση τιμή είναι ταυτόχρονα κάτω απ΄το πάνω όριο και πάνω απ΄το κάτω όριο. Αυτό δεν είναι το ίδιο με το να πούμε ότι υπάρχει μία 80% πιθανότητα ότι η πραγματική μέση τιμή βρίσκεται μεταξύ ενός συγκεκριμένου ζεύγους άνω και κάτω ορίων που έχουν υπολογιστεί μ΄αυτόν τον τρόπο—δείτε confidence interval και prosecutor's fallacy.)

Για πληροφορίες σχετικά με την αντίστροφη συνάρτηση αθροιστικής κατανομής δείτε quantile function.

Notes

↑ Helmert, F. R. (1875). "Über die Bestimmung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler". Z. Math. Phys., 20, 300–3.
↑ Helmert, F. R. (1876a). "Über die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit in Zusammenhang stehende Fragen". Z. Math. Phys., 21, 192–218.
↑ Helmert, F. R. (1876b). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit", Astron. Nachr., 88, 113–32.
↑ Lüroth, J (1876). «Vergleichung von zwei Werten des wahrscheinlichen Fehlers». Astron. Nachr. 87 (14): 209–20. doi:10.1002/asna.18760871402. Bibcode: 1876AN.....87..209L.
↑ Pfanzagl, J.; Sheynin, O. (1996). «A forerunner of the t-distribution (Studies in the history of probability and statistics XLIV)». Biometrika 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR 1766040.
↑ Sheynin, O. (1995). «Helmert's work in the theory of errors». Arch. Hist. Ex. Sci. 49: 73–104. doi:10.1007/BF00374700.
↑ "Student" [William Sealy Gosset] (March 1908). «The probable error of a mean». Biometrika 6 (1): 1–25. doi:10.1093/biomet/6.1.1. http://www.york.ac.uk/depts/maths/histstat/student.pdf.
↑ "Student" (William Sealy Gosset), original Biometrika paper as a scan
↑ Mortimer, Robert G. (2005) Mathematics for Physical Chemistry, Academic Press. 3 edition. ISBN 0-12-508347-5 (page 326)
↑ ^10,0 ^10,1 Fisher, R. A. (1925). «Applications of "Student's" distribution». Metron 5: 90–104. http://www.sothis.ro/user/content/4ef6e90670749a86-student_distribution_1925.pdf.
↑ Walpole, Ronald; Myers, Raymond; Myers, Sharon; Ye, Keying. (2002) Probability and Statistics for Engineers and Scientists. Pearson Education, 7th edition, pg. 237 ISBN 81-7758-404-9
↑ ^12,0 ^12,1 ^12,2 Johnson, N.L., Kotz, S., Balakrishnan, N. (1995) Continuous Univariate Distributions, Volume 2, 2nd Edition. Wiley, ISBN 0-471-58494-0 (Chapter 28)
↑ A. Gelman et al (1995), Bayesian Data Analysis, Chapman & Hall. ISBN 0-412-03991-5. p. 68
↑ Hogg & Craig (1978, Sections 4.4 and 4.8.)
↑ Cochran, W. G. (April 1934). «The distribution of quadratic forms in a normal system, with applications to the analysis of covariance». Mathematical Proceedings of the Cambridge Philosophical Society 30 (2): 178–191. doi:10.1017/S0305004100016595. Bibcode: 1934PCPS...30..178C.
↑ Park, Sung Y.; Bera, Anil K. (2009). «Maximum entropy autoregressive conditional heteroskedasticity model». Journal of Econometrics (Elsevier): 219–230. http://www.wise.xmu.edu.cn/Master/Download/..%5C..%5CUploadFiles%5Cpaper-masterdownload%5C2009519932327055475115776.pdf. Ανακτήθηκε στις 2011-06-02.
↑ See, for example, page 56 of Casella and Berger, Statistical Inference, 1990 Duxbury.
↑ ^18,0 ^18,1 Bailey, R. W. (1994). «Polar Generation of Random Variates with the t-Distribution». Mathematics of Computation 62 (206): 779–781. doi:10.2307/2153537.
↑ ^19,0 ^19,1 Jackman, Simon (2009). Bayesian Analysis for the Social Sciences. Wiley. σελ. 507.
↑ ^20,0 ^20,1 Bishop, C.M. (2006). Pattern recognition and machine learning. Springer.
↑ Ord, J.K. (1972) Families of Frequency Distributions, Griffin. ISBN 0-85264-137-0 (Table 5.1)
↑ Ord, J.K. (1972) Families of Frequency Distributions, Griffin. ISBN 0-85264-137-0 (Chapter 5)
↑ Lange, Kenneth L.; Little, Roderick J.A.; Taylor, Jeremy M.G. (1989). «Robust statistical modeling using the t-distribution». JASA 84 (408): 881–896. doi:10.1080/01621459.1989.10478852.

References

Senn, S.; Richardson, W. (1994). «The first t-test». Statistics in Medicine 13 (8): 785–803. doi:10.1002/sim.4780130802. PMID 8047737.
Hogg, R. V.· Craig, A. T. (1978). Introduction to Mathematical Statistics. New York: Macmillan.
Venables, W. N.· Ripley, B. D. (2002). Modern Applied Statistics with S (Fourth έκδοση). Springer.
Gelman, Andrew· John B. Carlin· Hal S. Stern· Donald B. Rubin (2003). Bayesian Data Analysis (Second Edition). CRC/Chapman & Hall. ISBN 1-58488-388-X.

Εξωτερικοί σύνδεσμοι

Hazewinkel, Michiel, επιμ.. (2001), «Student distribution», Encyclopedia of Mathematics, Springer, ISBN 978-1-55608-010-4, http://www.encyclopediaofmath.org/index.php?title=p/s090710
Calculator for the pdf, cdf and critical values of the Student's t-distribution
Earliest Known Uses of Some of the Words of Mathematics (S) (Remarks on the history of the term "Student's distribution")

{{ProbDistributions|continuous-infinite}} {{Common univariate probability distributions|state=collapsed}} {{Statistics|state=collapsed}}

Category:Συνεχείς κατανομές Category:Special functions Category:Normal distribution Category:Probability distributions with non-finite variance Category:Infinitely divisible probability distributions Category:Probability distributions Category:Location-scale family probability distributions

[HFR1-1] Helmert, F. R. (1875). "Über die Bestimmung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler". Z. Math. Phys., 20, 300–3.

[HFR2-2] Helmert, F. R. (1876a). "Über die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit in Zusammenhang stehende Fragen". Z. Math. Phys., 21, 192–218.

[HFR3-3] Helmert, F. R. (1876b). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit", Astron. Nachr., 88, 113–32.

[L1876-4] Lüroth, J (1876). «Vergleichung von zwei Werten des wahrscheinlichen Fehlers». Astron. Nachr. 87 (14): 209–20. doi:10.1002/asna.18760871402. Bibcode: 1876AN.....87..209L.

[5] Pfanzagl, J.; Sheynin, O. (1996). «A forerunner of the t-distribution (Studies in the history of probability and statistics XLIV)». Biometrika 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR 1766040.

[6] Sheynin, O. (1995). «Helmert's work in the theory of errors». Arch. Hist. Ex. Sci. 49: 73–104. doi:10.1007/BF00374700.

[7] "Student" [William Sealy Gosset] (March 1908). «The probable error of a mean». Biometrika 6 (1): 1–25. doi:10.1093/biomet/6.1.1. http://www.york.ac.uk/depts/maths/histstat/student.pdf.

[8] "Student" (William Sealy Gosset), original Biometrika paper as a scan

[9] Mortimer, Robert G. (2005) Mathematics for Physical Chemistry, Academic Press. 3 edition. ISBN 0-12-508347-5 (page 326)

[Fisher_1925_90–104-10] 10,0 ^10,1 Fisher, R. A. (1925). «Applications of "Student's" distribution». Metron 5: 90–104. http://www.sothis.ro/user/content/4ef6e90670749a86-student_distribution_1925.pdf.

[11] Walpole, Ronald; Myers, Raymond; Myers, Sharon; Ye, Keying. (2002) Probability and Statistics for Engineers and Scientists. Pearson Education, 7th edition, pg. 237 ISBN 81-7758-404-9

[JKB-12] 12,0 ^12,1 ^12,2 Johnson, N.L., Kotz, S., Balakrishnan, N. (1995) Continuous Univariate Distributions, Volume 2, 2nd Edition. Wiley, ISBN 0-471-58494-0 (Chapter 28)

[13] A. Gelman et al (1995), Bayesian Data Analysis, Chapman & Hall. ISBN 0-412-03991-5. p. 68

[Hogg-14] Hogg & Craig (1978, Sections 4.4 and 4.8.)

[15] Cochran, W. G. (April 1934). «The distribution of quadratic forms in a normal system, with applications to the analysis of covariance». Mathematical Proceedings of the Cambridge Philosophical Society 30 (2): 178–191. doi:10.1017/S0305004100016595. Bibcode: 1934PCPS...30..178C.

[16] Park, Sung Y.; Bera, Anil K. (2009). «Maximum entropy autoregressive conditional heteroskedasticity model». Journal of Econometrics (Elsevier): 219–230. http://www.wise.xmu.edu.cn/Master/Download/..%5C..%5CUploadFiles%5Cpaper-masterdownload%5C2009519932327055475115776.pdf. Ανακτήθηκε στις 2011-06-02.

[17] See, for example, page 56 of Casella and Berger, Statistical Inference, 1990 Duxbury.

[Bailey-18] 18,0 ^18,1 Bailey, R. W. (1994). «Polar Generation of Random Variates with the t-Distribution». Mathematics of Computation 62 (206): 779–781. doi:10.2307/2153537.

[Jackman-19] 19,0 ^19,1 Jackman, Simon (2009). Bayesian Analysis for the Social Sciences. Wiley. σελ. 507.

[Bishop2006-20] 20,0 ^20,1 Bishop, C.M. (2006). Pattern recognition and machine learning. Springer.

[21] Ord, J.K. (1972) Families of Frequency Distributions, Griffin. ISBN 0-85264-137-0 (Table 5.1)

[22] Ord, J.K. (1972) Families of Frequency Distributions, Griffin. ISBN 0-85264-137-0 (Chapter 5)

[23] Lange, Kenneth L.; Little, Roderick J.A.; Taylor, Jeremy M.G. (1989). «Robust statistical modeling using the t-distribution». JASA 84 (408): 881–896. doi:10.1080/01621459.1989.10478852.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

Ιστορία και ετυμολογία

Ορισμός

Συνάρτηση πυκνότητας πιθανότητας

Αθροιστική συνάρτηση κατανομής

Ειδικές περιπτώσεις

Πώς προκύπτει η t -κατανομή

Δειγματοληπτική κατανομή

Bayesian συμπερασματολογία

Χαρακτηρισμός

Ως την κατανομή ενός τεστ στατιστικής

Προέλευση

Ως μέγιστη κατανομή εντροπίας

Ιδιότητες

Στιγμές

Σχέση με την F-κατανομή

Monte Carlo δειγματοληψία

Ολοκλήρωμα της συνάρτησης πυκνότητας πιθανότητας και p-value της Student-t κατανομής

Διαφορική εξίσωση

Μη τυποποιημένη Student's t-κατανομή

Σχετικά με τις παραμέτρους διασποράς σ, και σ2

Σε σχέση με την αντίστροφη κλιμακωτή παράμετρο λ

Σχετικές κατανομές

Μη κεντραρισμένη t-κατανομή

Διακριτή Student's t-κατανομή

Περαιτέρω γενικεύσεις

Χρήσεις

Στην πιθανολογική στατιστική συμπερασματολογία

Έλεγχος υποθέσεων

Διαστήματα εμπιστοσύνης

Διαστήματα πρόβλεψης

Μπεϋζιανή στατιστική

Ισχυρή παραμετρική μοντελοποίηση

Πίνακας επιλεγμένων τιμών

See also

Notes

References

Εξωτερικοί σύνδεσμοι

Σχετικά με τις παραμέτρους διασποράς σ, και σ²