Μετάβαση στο περιεχόμενο

Κατανομή Παρέτο

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Συναρτήσεις πυκνότητας πιθανότητας Παρέτο τύπου Ι για διάφορες α Συναρτήσεις πυκνότητας πιθανότητας Παρέτο τύπου Ι για διάφορες με Καθώς η κατανομή πλησιάζει την όπου είναι η συνάρτηση δέλτα Ντιράκ.

Η κατανομή Παρέτο, που πήρε το όνομά της από τον Ιταλό πολιτικό μηχανικό, οικονομολόγο και κοινωνιολόγο Βιλφρέντο Παρέτο[1], είναι μια κατανομή πιθανοτήτων με νόμο δύναμης που χρησιμοποιείται στην περιγραφή κοινωνικών, ποιοτικού ελέγχου, επιστημονικών, γεωφυσικών, αναλογιστικών και πολλών άλλων τύπων παρατηρήσιμων φαινομένων.Η αρχή εφαρμόστηκε αρχικά για την περιγραφή της κατανομής του πλούτου σε μια κοινωνία, ταιριάζοντας στην τάση ότι ένα μεγάλο μέρος του πλούτου κατέχεται από ένα μικρό μέρος του πληθυσμού.[2]

Η αρχή του Παρέτο ή ο «κανόνας 80:20» που δηλώνει ότι το 80% των αποτελεσμάτων οφείλεται στο 20% των αιτιών πήρε το όνομά της προς τιμήν του Παρέτο, αλλά οι έννοιες είναι διαφορετικές και μόνο οι κατανομές Παρέτο με τιμή σχήματος (α) of   log 4 5 ≈ 1.16 την αντικατοπτρίζουν με ακρίβεια. Η εμπειρική παρατήρηση έχει δείξει ότι αυτή η κατανομή 80:20 ταιριάζει σε ένα ευρύ φάσμα περιπτώσεων, συμπεριλαμβανομένων των φυσικών φαινομένων[3] και των ανθρώπινων δραστηριοτήτων.[4][5]

Συναρτήσεις αθροιστικής κατανομής τύπου Παρέτο για διάφορα με

Εάν η Χ είναι μια τυχαία μεταβλητή με κατανομή Παρέτο (τύπου Ι),[6] τότε η πιθανότητα η Χ να είναι μεγαλύτερη από κάποιον αριθμό x, δηλαδή η συνάρτηση επιβίωσης (που ονομάζεται επίσης συνάρτηση ουράς), δίνεται από τη σχέση

όπου xm είναι η (αναγκαστικά θετική) ελάχιστη δυνατή τιμή του Χ και α είναι μια θετική παράμετρος. Η κατανομή Παρέτο τύπου Ι χαρακτηρίζεται από μια παράμετρο κλίμακας xm και μια παράμετρο σχήματος α, η οποία είναι γνωστή ως δείκτης ουράς. Εάν αυτή η κατανομή χρησιμοποιείται για τη μοντελοποίηση της κατανομής του πλούτου, τότε η παράμετρος α ονομάζεται δείκτης Παρέτο.

Αθροιστική συνάρτηση κατανομής

[Επεξεργασία | επεξεργασία κώδικα]

Από τον ορισμό, η αθροιστική συνάρτηση κατανομής μιας τυχαίας μεταβλητής Παρέτο με παραμέτρους α και xm είναι

Συνάρτηση πυκνότητας πιθανότητας

[Επεξεργασία | επεξεργασία κώδικα]

Προκύπτει (με διαφοροποίηση) ότι η συνάρτηση πυκνότητας πιθανότητας είναι

Όταν απεικονίζεται σε γραμμικούς άξονες, η κατανομή παίρνει τη γνωστή καμπύλη σχήματος J, η οποία προσεγγίζει ασυμπτωτικά κάθε έναν από τους ορθογώνιους άξονες. Όλα τα τµήµατα της καµπύλης είναι αυτοοµοιόµορφα (µε την επιφύλαξη κατάλληλων συντελεστών κλιµάκωσης). Όταν απεικονίζεται σε λογαριθμογράφημα, η κατανομή παριστάνεται με μια ευθεία γραμμή.

Ροπές και χαρακτηριστική συνάρτηση

[Επεξεργασία | επεξεργασία κώδικα]
  • Η αναμενόμενη τιμή μιας τυχαίας μεταβλητής που ακολουθεί την κατανομή Παρέτο είναι
  • Η διακύμανση μιας τυχαίας μεταβλητής που ακολουθεί την κατανομή Παρέτο είναι
(αν α ≤ 2, η διακύμανση δεν υπάρχει.)
  • Οι μη κεντρικές ροπές είναι
  • Η συνάρτηση δημιουργίας ροπής ορίζεται μόνο για μη θετικές τιμές t ≤ 0 ως εξής

Έτσι, εφόσον η προσδοκία δεν συγκλίνει σε ένα ανοικτό διάστημα που περιέχει λέμε ότι η συνάρτηση που δημιουργεί τη ροπή δεν υπάρχει.

  • Η χαρακτηριστική συνάρτηση δίνεται από τη σχέση
όπου Γ(ax) είναι η ατελής συνάρτηση γάμμα.

Οι παράμετροι μπορούν να επιλυθούν με τη μέθοδο των ροπών.[7]

Κατανομή υπό όρους

[Επεξεργασία | επεξεργασία κώδικα]

Η υπό συνθήκη κατανομή πιθανότητας μιας τυχαίας μεταβλητής με κατανομή Παρέτο, δεδομένης της περίπτωσης ότι είναι μεγαλύτερη ή ίση από έναν συγκεκριμένο αριθμό&nbsp, που υπερβαίνει το , είναι μια κατανομή Παρέτο με τον ίδιο δείκτη Παρέτο  αλλά με ελάχιστο  αντί του  :

Αυτό σημαίνει ότι η υπό συνθήκη αναμενόμενη αξία (εάν είναι πεπερασμένη, δηλαδή ) είναι ανάλογη του :

Στην περίπτωση τυχαίων μεταβλητών που περιγράφουν τη διάρκεια ζωής ενός αντικειμένου, αυτό σημαίνει ότι το προσδόκιμο ζωής είναι ανάλογο της ηλικίας και ονομάζεται φαινόμενο Λίντι ή νόμος του Λίντι.[8]

Γεωμετρικός μέσος όρος

[Επεξεργασία | επεξεργασία κώδικα]

Ο γεωμετρικός μέσος (G) είναι[9]

Γεωμετρικός μέσος όρος

[Επεξεργασία | επεξεργασία κώδικα]

Ο γεωμετρικός μέσος (G) είναι [9]

Ο αρμονικός μέσος (H) είναι [9]

Γραφική αναπαράσταση

[Επεξεργασία | επεξεργασία κώδικα]

Η χαρακτηριστική καμπυλωτή κατανομή «μακριά ουρά», όταν απεικονίζεται σε γραμμική κλίμακα, καλύπτει την υποκείμενη απλότητα της συνάρτησης όταν απεικονίζεται σε λογαριθμογράφημα, το οποίο τότε παίρνει τη μορφή ευθείας γραμμής με αρνητική κλίση: Από τον τύπο της συνάρτησης πυκνότητας πιθανότητας προκύπτει ότι για xxm,

Εφόσον το α είναι θετικό, η κλίση -(α + 1) είναι αρνητική.

Σχετικές διανομές

[Επεξεργασία | επεξεργασία κώδικα]

Γενικευμένες κατανομές Παρέτο

[Επεξεργασία | επεξεργασία κώδικα]

Υπάρχει μια ιεραρχία [6][10] των κατανομών Παρέτο που είναι γνωστές ως κατανομές Παρέτο τύπου Ι, ΙΙ, ΙΙΙ, IV και Φέλερ-Παρέτο.[6][10][11] Ο τύπος Παρέτο IV περιέχει τους τύπους Παρέτο Ι-ΙΙΙΙ ως ειδικές περιπτώσεις. Η κατανομή Φέλερ - Παρέτο[10][12] γενικεύει την κατανομή τύπου Παρέτο IV.

Η ιεραρχία της κατανομής Pareto συνοψίζεται στον επόμενο πίνακα που συγκρίνει τις συναρτήσεις επιβίωσης (συμπληρωματική CDF).

Όταν μ = 0, η κατανομή Pareto τύπου II είναι επίσης γνωστή ως κατανομή Λόμαξ.[13]

Σε αυτό το τμήμα, το σύμβολο xm, που χρησιμοποιήθηκε προηγουμένως για να υποδηλώσει την ελάχιστη τιμή του x, αντικαθίσταται από το εξής με σ.

Κατανομές Παρέτο
Υποστήριξη Παράμετροι
Τύπος I
Τύπος II
Λόμαξ
Τύπος III
Τύπος IV

Η παράμετρος σχήματος α είναι ο δείκτης ουράς, μ είναι η θέση, σ είναι η κλίμακα, γ είναι μια παράμετρος ανισότητας. Ορισμένες ειδικές περιπτώσεις του τύπου Pareto (IV) είναι

Το πεπερασμένο του μέσου και η ύπαρξη και το πεπερασμένο της διακύμανσης εξαρτώνται από τον δείκτη ουράς α (δείκτης ανισότητας γ). Ειδικότερα, τα κλασματικά δ'-μεγέθη είναι πεπερασμένα για κάποιο δ > 0, όπως φαίνεται στον παρακάτω πίνακα, όπου το δ δεν είναι απαραίτητα ακέραιος αριθμός.

Ροπές των κατανομών Παρέτο I-IV (περίπτωση μ = 0)
Κατάσταση Κατάσταση
Τύπος I
Τύπος II
Τύπος III
Τύπος IV

Κατανομή Φέλερ-Παρέτο

[Επεξεργασία | επεξεργασία κώδικα]

Ο Φέλερ[10][12] ορίζει μια μεταβλητή Παρέτο με το μετασχηματισμό U = Y−1 − 1 μιας τυχαίας μεταβλητής βήτα ,Y, της οποίας η συνάρτηση πυκνότητας πιθανότητας είναι

όπου B( ) είναι η συνάρτηση βήτα. Εάν

τότε το W έχει κατανομή Φέλερ-Παρέτο FP(μ, σ, γ, γ1, γ2).[6]

Αν και είναι ανεξάρτητες μεταβλητές Γάμμα, μια άλλη κατασκευή μιας μεταβλητής Φέλερ-Παρέτο (FP) είναι η εξής [14]

και γράφουμε W ~ FP(μ, σ, γ, δ1, δ2). Ειδικές περιπτώσεις της κατανομής Φέλερ - Παρέτο είναι οι εξής

Αντίστροφη κατανομή Παρέτο / Κατανομή ισχύος

[Επεξεργασία | επεξεργασία κώδικα]

Όταν μια τυχαία μεταβλητή ακολουθεί μια κατανομή Παρέτο, τότε η αντίστροφη ακολουθεί μια αντίστροφη κατανομή Παρέτο. Η αντίστροφη κατανομή Παρέτο είναι ισοδύναμη με την κατανομή ισχύος[15]

Σχέση με την εκθετική κατανομή

[Επεξεργασία | επεξεργασία κώδικα]

Η κατανομή Παρέτο σχετίζεται με την εκθετική κατανομή ως εξής. Εάν η X είναι κατανεμημένη κατά Παρέτο με ελάχιστο xm και δείκτη α, τότε

κατανέμεται εκθετικά με παράμετρο ρυθμού α. Ισοδύναμα, εάν η Y κατανέμεται εκθετικά με ρυθμό α, τότε

έχει κατανομή Παρέτο με ελάχιστο xm και δείκτη α.

Αυτό μπορεί να αποδειχθεί χρησιμοποιώντας τις συνήθεις τεχνικές αλλαγής των μεταβλητών:

Η τελευταία έκφραση είναι η αθροιστική συνάρτηση κατανομής μιας εκθετικής κατανομής με ρυθμό α.

Η κατανομή Παρέτο μπορεί να κατασκευαστεί από ιεραρχικές εκθετικές κατανομές.[16] Έστω και . Τότε έχουμε και, ως εκ τούτου,.

Γενικότερα, εάν (παραμετροποίηση σχήματος-ρυθμού) και , τότε .

Ισοδύναμα, εάν και , τότε .

Σχέση με τη λογαριθμοκανονική κατανομή

[Επεξεργασία | επεξεργασία κώδικα]

Η κατανομή Παρέτο και η λογαριθμοκανονική κατανομή είναι εναλλακτικές κατανομές για την περιγραφή των ίδιων τύπων ποσοτήτων. Μία από τις συνδέσεις μεταξύ των δύο είναι ότι και οι δύο είναι οι κατανομές της εκθετικής των τυχαίων μεταβλητών που κατανέμονται σύμφωνα με άλλες κοινές κατανομές, αντίστοιχα την εκθετική κατανομή και την κανονική κατανομή. (Βλέπε την προηγούμενη ενότητα).

Σχέση με τη γενικευμένη κατανομή Παρέτο

[Επεξεργασία | επεξεργασία κώδικα]

Η κατανομή Παρέτο αποτελεί ειδική περίπτωση της γενικευμένης κατανομής Παρέτο, η οποία είναι μια οικογένεια κατανομών παρόμοιας μορφής, αλλά που περιέχουν μια επιπλέον παράμετρο με τέτοιο τρόπο ώστε η υποστήριξη της κατανομής να είναι είτε περιορισμένη από κάτω (σε ένα μεταβλητό σημείο), είτε περιορισμένη τόσο από πάνω όσο και από κάτω (όπου και τα δύο είναι μεταβλητά), με ειδική περίπτωση την κατανομή Λόμαξ. Η οικογένεια αυτή περιλαμβάνει επίσης τόσο την μη μετατοπισμένη όσο και τη μετατοπισμένη εκθετική κατανομή.

Η κατανομή Παρέτο με κλίμακα και σχήμα είναι ισοδύναμη με τη γενικευμένη κατανομή Παρέτο με θέση , κλίμακα και σχήμα και, αντίστροφα, μπορεί κανείς να πάρει την κατανομή Παρέτο από την GPD λαμβάνοντας και αν .

Φραγμένη κατανομή Παρέτο

[Επεξεργασία | επεξεργασία κώδικα]

Η φραγμένη (ή περικομμένη) κατανομή Παρέτο έχει τρεις παραμέτρους: α, L και H. Όπως και στην τυπική κατανομή Παρέτο, το α καθορίζει το σχήμα. Το L υποδηλώνει την ελάχιστη τιμή και το H υποδηλώνει τη μέγιστη τιμή.

Η συνάρτηση πυκνότητας πιθανότητας είναι

,

όπου L ≤ x ≤ H, και α > 0.

Παραγωγή φραγμένων τυχαίων μεταβλητών Παρέτο

[Επεξεργασία | επεξεργασία κώδικα]

Εάν το U είναι ομοιόμορφα κατανεμημένο στο (0, 1), τότε η εφαρμογή της μεθόδου αντίστροφου μετασχηματισμού.[17]

είναι μια φραγμένη κατανομή Παρέτο.

Συμμετρική κατανομή Παρέτο

[Επεξεργασία | επεξεργασία κώδικα]

Ο σκοπός των συμμετρικών και μηδενικών συμμετρικών κατανομών Παρέτο είναι να αποτυπώσουν κάποια ειδική στατιστική κατανομή με αιχμηρή κορυφή πιθανότητας και συμμετρικές μακριές ουρές πιθανότητας. Οι δύο αυτές κατανομές προέρχονται από την κατανομή Παρέτο. Οι μακριές ουρές πιθανότητας συνήθως σημαίνουν ότι η πιθανότητα φθίνει αργά και μπορούν να χρησιμοποιηθούν για την προσαρμογή διαφόρων συνόλων δεδομένων. Αλλά αν η κατανομή έχει συμμετρική δομή με δύο αργά φθίνουσες ουρές, η Παρέτο δεν θα μπορούσε να το κάνει. Τότε εφαρμόζεται αντ' αυτού η συμμετρική κατανομή Παρέτο ή η μηδενική συμμετρική κατανομή Παρέτο.[18]

Η αθροιστική συνάρτηση κατανομής (CDF) της συμμετρικής κατανομής Παρέτο ορίζεται ως εξής:[18]

Η αντίστοιχη συνάρτηση πυκνότητας πιθανότητας (PDF) είναι:[18]

Η κατανομή αυτή έχει δύο παραμέτρους: a και b. Είναι συμμετρική ως προς το b. Τότε η μαθηματική προσδοκία είναι b. Όταν, έχει διακύμανση ως εξής:

Η CDF της μηδενικής συμμετρικής κατανομής Παρέτο (ZSP) ορίζεται ως εξής:

Η αντίστοιχη PDF είναι:

Η κατανομή αυτή είναι συμμετρική ως προς το μηδέν. Η παράμετρος a σχετίζεται με τον ρυθμό αποσύνθεσης της πιθανότητας και η (a/2b) αντιπροσωπεύει το μέγιστο μέγεθος της πιθανότητας.[18]

Πολυμεταβλητή κατανομή Παρέτο

[Επεξεργασία | επεξεργασία κώδικα]

Η μονομεταβλητή κατανομή Παρέτο έχει επεκταθεί σε μια πολυμεταβλητή κατανομή Παρέτο.[19]

Στατιστική συμπερασματολογία

[Επεξεργασία | επεξεργασία κώδικα]

Εκτίμηση των παραμέτρων

[Επεξεργασία | επεξεργασία κώδικα]

Η συνάρτηση πιθανότητας για τις παραμέτρους α και xm της κατανομής Παρέτο, δεδομένου ενός ανεξάρτητου δείγματος x = (x1x2, ..., xn), είναι

Επομένως, η λογαριθμική συνάρτηση πιθανότητας είναι

Γίνεται αντιληπτό ότι η είναι μονότονα αυξανόμενη με το xm, δηλαδή όσο μεγαλύτερη είναι η τιμή του xm, τόσο μεγαλύτερη είναι η τιμή της συνάρτησης πιθανότητας. Συνεπώς, εφόσον xxm, συμπεραίνουμε ότι

Για να βρούμε τον εκτιμητή για το α, υπολογίζουμε την αντίστοιχη μερική παράγωγο και προσδιορίζουμε πού είναι μηδέν:

Έτσι, ο εκτιμητής μέγιστης πιθανοφάνειας για το α είναι:

Το προσδοκώμενο στατιστικό σφάλμα είναι:[20]

Ο Μαλίκ (1970)[21] δίνει την ακριβή κοινή κατανομή των . Ειδικότερα, και είναι ανεξάρτητα και είναι Παρέτο με παράμετρο κλίμακας xm και παράμετρο σχήματος , ενώ έχει κατανομή αντίστροφης γάμμα με παραμέτρους σχήματος και κλίμακας n − 1 και , αντίστοιχα.

Εμφάνιση και εφαρμογές

[Επεξεργασία | επεξεργασία κώδικα]

Ο Βιλφρέντο Παρέτο χρησιμοποίησε αρχικά αυτή την κατανομή για να περιγράψει την κατανομή του πλούτου μεταξύ των ατόμων, καθώς φαινόταν να δείχνει αρκετά καλά τον τρόπο με τον οποίο ένα μεγαλύτερο μέρος του πλούτου κάθε κοινωνίας ανήκει σε ένα μικρότερο ποσοστό των ατόμων της κοινωνίας αυτής. Το χρησιμοποίησε επίσης για να περιγράψει την κατανομή του εισοδήματος[4]. Η ιδέα αυτή εκφράζεται μερικές φορές πιο απλά ως η αρχή Παρέτο ή ο «κανόνας 80-20», ο οποίος δηλώνει ότι το 20% του πληθυσμού ελέγχει το 80% του πλούτου[24]. Όπως επισημαίνει ο Μάικλ Χάντσον («Η κατάρρευση της αρχαιότητας» [2023] σ. 85 & σημ. 7) «ένα μαθηματικό επακόλουθο [είναι] ότι το 10% θα είχε το 65% του πλούτου και το 5% θα είχε το μισό εθνικό πλούτο». Ωστόσο, ο κανόνας 80-20 αντιστοιχεί σε μια συγκεκριμένη τιμή του α, και στην πραγματικότητα, τα στοιχεία του Παρέτο για τους βρετανικούς φόρους εισοδήματος στο μάθημα πολιτικής οικονομίας δείχνουν ότι περίπου το 30% του πληθυσμού είχε περίπου το 70% του εισοδήματος. το γράφημα της συνάρτησης πυκνότητας πιθανότητας (PDF) στην αρχή αυτού του άρθρου δείχνει ότι η "πιθανότητα" ή το κλάσμα του πληθυσμού που κατέχει ένα μικρό ποσό πλούτου ανά άτομο είναι μάλλον υψηλό, και στη συνέχεια μειώνεται σταθερά καθώς αυξάνεται ο πλούτος. (Ωστόσο, η κατανομή Παρέτο δεν είναι ρεαλιστική για τον πλούτο για το κατώτερο άκρο. Στην πραγματικότητα, η καθαρή περιουσία μπορεί να είναι ακόμη και αρνητική). Αυτή η κατανομή δεν περιορίζεται στην περιγραφή του πλούτου ή του εισοδήματος, αλλά σε πολλές καταστάσεις στις οποίες εντοπίζεται ισορροπία στην κατανομή του "μικρού" προς το "μεγάλο". Τα ακόλουθα παραδείγματα θεωρούνται μερικές φορές ως προσεγγιστικά κατανεμημένα κατά Παρέτο:[22][23]

  • Και οι τέσσερις μεταβλητές του δημοσιονομικού περιορισμού του νοικοκυριού: κατανάλωση, εισόδημα εργασίας, εισόδημα κεφαλαίου και πλούτος.[24]
  • Τα μεγέθη των ανθρώπινων οικισμών (λίγες πόλεις, πολλά χωριουδάκια/χωριά).[25][26]
  • Η κατανομή του μεγέθους των αρχείων της κίνησης στο Διαδίκτυο που χρησιμοποιεί το πρωτόκολλο TCP (πολλά μικρότερα αρχεία, λίγα μεγαλύτερα).[25]
  • Ποσοστά σφαλμάτων μονάδων σκληρού δίσκου[27]
  • Συστάδες συμπυκνωμάτων Μπόζε-Αϊνστάιν κοντά στο απόλυτο μηδέν[28]
Προσαρμογή της αθροιστικής κατανομής Παρέτο (Lomax) στις μέγιστες βροχοπτώσεις μιας ημέρας με χρήση του CumFreq, βλέπε επίσης προσαρμογή κατανομής
  • Οι αξίες των αποθεμάτων πετρελαίου σε κοιτάσματα πετρελαίου (λίγα μεγάλα κοιτάσματα, πολλά μικρά κοιτάσματα).[25]
  • Η κατανομή του μήκους των εργασιών που ανατίθενται σε υπερυπολογιστές (λίγες μεγάλες, πολλές μικρές).[29]
  • Οι τυποποιημένες αποδόσεις των τιμών των μεμονωμένων μετοχών [25]
  • Τα μεγέθη των σωματιδίων της άμμου [25]
  • Το μέγεθος των μετεωριτών
  • Σοβαρότητα των μεγάλων ζημιών από ατυχήματα για ορισμένους επιχειρηματικούς κλάδους, όπως η γενική αστική ευθύνη, το επαγγελματικό αυτοκίνητο και η αποζημίωση των εργαζομένων.[30][31]
  • Ο χρόνος που ένας χρήστης στο Steam θα περάσει παίζοντας διάφορα παιχνίδια. (Μερικά παιχνίδια παίζονται πολύ, αλλά τα περισσότερα δεν παίζονται σχεδόν ποτέ).[32]
  • Στην υδρολογία η κατανομή Παρέτο εφαρμόζεται σε ακραία γεγονότα, όπως οι ετήσιες μέγιστες βροχοπτώσεις μιας ημέρας και οι εκφορτίσεις ποταμών.[33] Η μπλε εικόνα απεικονίζει ένα παράδειγμα προσαρμογής της κατανομής Παρέτο στην κατάταξη των ετήσιων μέγιστων βροχοπτώσεων μίας ημέρας, όπου φαίνεται επίσης η ζώνη εμπιστοσύνης 90% με βάση τη διωνυμική κατανομή. Τα δεδομένα βροχόπτωσης αναπαρίστανται με τη χάραξη θέσεων ως μέρος της ανάλυσης αθροιστικής συχνότητας.
  • Στην αξιοπιστία της διανομής ηλεκτρικής ενέργειας (το 80% των διακοπτόμενων λεπτών του Πελάτη συμβαίνει περίπου στο 20% των ημερών ενός έτους).

Σχέση με το νόμο του Ζιπφ

[Επεξεργασία | επεξεργασία κώδικα]

Η κατανομή Παρέτο είναι μια συνεχής κατανομή πιθανοτήτων. Ο νόμος του Ζιπφ, που μερικές φορές ονομάζεται επίσης κατανομή Ζήτα, είναι μια διακριτή κατανομή, που διαχωρίζει τις τιμές σε μια απλή κατάταξη. Και οι δύο είναι ένας απλός νόμος δύναμης με αρνητικό εκθέτη, που κλιμακώνεται έτσι ώστε οι αθροιστικές κατανομές τους να ισούνται με 1. Η κατανομή Ζιπφ μπορεί να προκύψει από την κατανομή Παρέτο αν οι τιμές (εισοδήματα) κατανεμηθούν σε τάξεις, έτσι ώστε ο αριθμός των ατόμων σε κάθε θέση να ακολουθεί ένα μοτίβο 1/τάξη. Η κατανομή κανονικοποιείται ορίζοντας έτσι ώστε όπου είναι ο γενικός αρμονικός αριθμός. Αυτό καθιστά τη συνάρτηση πυκνότητας πιθανότητας του Zipf παραγωγίσιμη από τη συνάρτηση του Παρέτο.

όπου και είναι ένας ακέραιος αριθμός που αντιπροσωπεύει την τάξη από το 1 έως το Ν, όπου Ν είναι η υψηλότερη εισοδηματική τάξη. Έτσι, ένα τυχαία επιλεγμένο άτομο (ή λέξη, σύνδεσμος ιστοσελίδας ή πόλη) από έναν πληθυσμό (ή γλώσσα, διαδίκτυο ή χώρα) έχει πιθανότητα κατάταξης .

Σχέση με την «αρχή Παρέτο»

[Επεξεργασία | επεξεργασία κώδικα]

Ο «νόμος 80-20», σύμφωνα με τον οποίο το 20% του συνόλου των ανθρώπων λαμβάνει το 80% του συνολικού εισοδήματος και το 20% του πιο εύπορου 20% λαμβάνει το 80% αυτού του 80% κ.ο.κ., ισχύει ακριβώς όταν ο δείκτης Παρέτο είναι . Το αποτέλεσμα αυτό μπορεί να προκύψει από τον τύπο της καμπύλης Λόρεντζ που δίνεται παρακάτω. Επιπλέον, έχει αποδειχθεί[34] ότι τα ακόλουθα είναι μαθηματικά ισοδύναμα:

  • Το εισόδημα κατανέμεται σύμφωνα με την κατανομή Παρέτο με δείκτη α > 1.
  • Υπάρχει κάποιος αριθμός 0 ≤ p ≤ 1/2 τέτοιος ώστε το 100p % όλων των ανθρώπων να λαμβάνει το 100(1 − p)% του συνολικού εισοδήματος, και ομοίως για κάθε πραγματικό (όχι απαραίτητα ακέραιο) n > 0, 100pn % όλων των ανθρώπων λαμβάνει το 100(1 − p)n ποσοστό του συνολικού εισοδήματος. Το α α και το p συνδέονται ως εξής

Αυτό δεν ισχύει μόνο για το εισόδημα, αλλά και για τον πλούτο, ή για οτιδήποτε άλλο μπορεί να μοντελοποιηθεί με αυτή την κατανομή.

Αυτό αποκλείει τις κατανομές Παρέτο στις οποίες 0 < α ≤ 1, οι οποίες, όπως σημειώθηκε παραπάνω, έχουν άπειρη αναμενόμενη αξία και επομένως δεν μπορούν να μοντελοποιήσουν λογικά την κατανομή του εισοδήματος.

Σχέση με το νόμο του Πράις

[Επεξεργασία | επεξεργασία κώδικα]

Ο νόμος της τετραγωνικής ρίζας του Πράις προσφέρεται μερικές φορές ως ιδιότητα της κατανομής Παρέτο ή ως παρόμοια με αυτήν. Ωστόσο, ο νόμος ισχύει μόνο στην περίπτωση που . Σημειώστε ότι σε αυτή την περίπτωση, το συνολικό και το αναμενόμενο ποσό πλούτου δεν ορίζονται και ο κανόνας ισχύει ασυμπτωτικά μόνο για τυχαία δείγματα. Η εκτεταμένη αρχή Παρέτο που αναφέρθηκε παραπάνω είναι ένας πολύ πιο γενικός κανόνας.

Καμπύλη Λόρενζ και συντελεστής Γκίνι

[Επεξεργασία | επεξεργασία κώδικα]
Καμπύλες Λόρεντζ για ορισμένες κατανομές Παρέτο. Η περίπτωση α = ∞ αντιστοιχεί σε απόλυτα ίση κατανομή (G = 0) και η γραμμή α = 1 αντιστοιχεί σε πλήρη ανισότητα (G = 1)

Η καμπύλη Λόρενζ χρησιμοποιείται συχνά για να χαρακτηρίσει τις κατανομές εισοδήματος και πλούτου. Για οποιαδήποτε κατανομή, η καμπύλη Lorenz L(F) γράφεται ως προς το PDF f ή το CDF F ως εξής

όπου x(F) είναι το αντίστροφο της CDF. Για την κατανομή Παρέτο,

και η καμπύλη Λόρεντζ υπολογίζεται ως εξής

Για ο παρονομαστής είναι άπειρος, οπότε L=0. Παραδείγματα της καμπύλης Lorenz για διάφορες κατανομές Pareto παρουσιάζονται στο γράφημα στα δεξιά.

Σύμφωνα με την Oxfam (2016) οι 62 πλουσιότεροι άνθρωποι έχουν τόσο πλούτο όσο και το φτωχότερο μισό του παγκόσμιου πληθυσμού.[35] Μπορούμε να υπολογίσουμε τον δείκτη Παρέτο που θα ίσχυε σε αυτή την κατάσταση. Αφήνοντας το ε ίσο με έχουμε:

ή

Η λύση είναι ότι το α ισούται με περίπου 1,15 και ότι περίπου 9% του πλούτου ανήκει σε κάθε μία από τις δύο ομάδες. Αλλά στην πραγματικότητα το φτωχότερο 69% του παγκόσμιου ενήλικου πληθυσμού κατέχει μόνο περίπου το 3% του πλούτου.[36]

Ο συντελεστής Γκίνι είναι ένα μέτρο της απόκλισης της καμπύλης Λόρεντζ από τη γραμμή ισοκατανομής, η οποία είναι μια γραμμή που συνδέει τις τιμές [0, 0] και [1, 1], η οποία εμφανίζεται με μαύρο χρώμα (α = ∞) στο διάγραμμα Λόρεντζ στα δεξιά. Συγκεκριμένα, ο συντελεστής Γκίνι είναι το διπλάσιο του εμβαδού μεταξύ της καμπύλης Λόρεντζ και της γραμμής ισοκατανομής. Ο συντελεστής Γκίνι για την κατανομή Παρέτο υπολογίζεται (για ) ως εξής

Δημιουργία τυχαίων μεταβλητών

[Επεξεργασία | επεξεργασία κώδικα]

Τυχαία δείγματα μπορούν να παραχθούν με τη χρήση δειγματοληψίας αντίστροφου μετασχηματισμού. Δεδομένης μιας τυχαίας μεταβλητής U που αντλείται από την ομοιόμορφη κατανομή στο μοναδιαίο διάστημα [0, 1], η μεταβλητή T που δίνεται από τη σχέση

είναι κατανεμημένη κατά Παρέτο.[37]

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]
  1. Amoroso, Luigi (January 1938). «Vilfredo Pareto». Econometrica (Pre-1986) 6 (1). 
  2. Pareto, Vilfredo (1898). «Cours d'economie politique». Journal of Political Economy 6. doi:10.1086/250536. https://zenodo.org/record/2144014. 
  3. van Montfort, M.A.J. (1986). «The generalized Pareto distribution applied to rainfall depths». Hydrological Sciences Journal 31 (2): 151–162. doi:10.1080/02626668609491037. Bibcode1986HydSJ..31..151V. 
  4. Oancea, Bogdan (2017). «Income inequality in Romania: The exponential-Pareto distribution». Physica A: Statistical Mechanics and Its Applications 469: 486–498. doi:10.1016/j.physa.2016.11.094. Bibcode2017PhyA..469..486O. 
  5. Morella, Matteo. «Pareto distribution». academia.edu. 
  6. 6,0 6,1 6,2 6,3 Arnold, Barry C. (1983). Pareto Distributions. International Co-operative Publishing House. ISBN 978-0-89974-012-6. 
  7. S. Hussain, S.H. Bhatti (2018). Parameter estimation of Pareto distribution: Some modified moment estimators. Maejo International Journal of Science and Technology 12(1):11-27.
  8. Eliazar, Iddo (November 2017). «Lindy's Law». Physica A: Statistical Mechanics and Its Applications 486: 797–805. doi:10.1016/j.physa.2017.05.077. Bibcode2017PhyA..486..797E. 
  9. 9,0 9,1 9,2 Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
  10. 10,0 10,1 10,2 10,3 Johnson, Kotz, and Balakrishnan (1994), (20.4).
  11. Christian Kleiber· Samuel Kotz (2003). Statistical Size Distributions in Economics and Actuarial Sciences. Wiley. ISBN 978-0-471-15064-0. 
  12. 12,0 12,1 Feller, W. (1971). An Introduction to Probability Theory and its Applications. II (2nd έκδοση). New York: Wiley. σελ. 50.  "The densities (4.3) are sometimes called after the economist Pareto. It was thought (rather naïvely from a modern statistical standpoint) that income distributions should have a tail with a density ~ Axα as x → ∞".
  13. Lomax, K. S. (1954). «Business failures. Another example of the analysis of failure data». Journal of the American Statistical Association 49 (268): 847–52. doi:10.1080/01621459.1954.10501239. https://archive.org/details/sim_journal-of-the-american-statistical-association_1954-12_49_268/page/n169. 
  14. Chotikapanich, Duangkamon (16 Σεπτεμβρίου 2008). «Chapter 7: Pareto and Generalized Pareto Distributions». Modeling Income Distributions and Lorenz Curves. Springer. σελίδες 121–22. ISBN 9780387727967. 
  15. Dallas, A. C. "Characterizing the Pareto and power distributions." Annals of the Institute of Statistical Mathematics 28.1 (1976): 491-497.
  16. White, Gentry (2006). Bayesian semiparametric spatial and joint spatio-temporal modeling (Διδακτορική διατριβή). University of Missouri--Columbia.  section 5.3.1.
  17. «Inverse Transform Method». Αρχειοθετήθηκε από το πρωτότυπο στις 17 Ιανουαρίου 2012. Ανακτήθηκε στις 27 Αυγούστου 2012. 
  18. 18,0 18,1 18,2 18,3 Huang, Xiao-dong (2004). «A Multiscale Model for MPEG-4 Varied Bit Rate Video Traffic». IEEE Transactions on Broadcasting 50 (3): 323–334. doi:10.1109/TBC.2004.834013. 
  19. Rootzén, Holger; Tajvidi, Nader (2006). «Multivariate generalized Pareto distributions». Bernoulli 12 (5): 917–30. doi:10.3150/bj/1161614952. 
  20. M. E. J. Newman (2005). «Power laws, Pareto distributions and Zipf's law». en:Contemporary Physics 46 (5): 323–51. doi:10.1080/00107510500052444. Bibcode2005ConPh..46..323N. 
  21. H. J. Malik (1970). «Estimation of the Parameters of the Pareto Distribution». Metrika 15: 126–132. doi:10.1007/BF02613565. 
  22. «Risk Solver - Fit Distributions to Data». solver (στα Αγγλικά). 23 Φεβρουαρίου 2011. Ανακτήθηκε στις 14 Φεβρουαρίου 2025. 
  23. «Distribution Fitting Tutorials, Articles, Software, FAQ, Goodness Of Fit Tests, Graphs». web.archive.org. 23 Φεβρουαρίου 2018. Αρχειοθετήθηκε από το πρωτότυπο στις 23 Φεβρουαρίου 2018. Ανακτήθηκε στις 14 Φεβρουαρίου 2025. 
  24. Gaillard, Alexandre· Hellwig, Christian· Wangner, Philipp· Werquin, Nicolas (2023). «Consumption, Wealth, and Income Inequality: A Tale of Tails». 
  25. 25,0 25,1 25,2 25,3 25,4 Reed, William J. (2004). «The Double Pareto-Lognormal Distribution – A New Parametric Model for Size Distributions». Communications in Statistics – Theory and Methods 33 (8): 1733–53. doi:10.1081/sta-120037438. 
  26. Reed, William J. (2002). «On the rank-size distribution for human settlements». Journal of Regional Science 42 (1): 1–17. doi:10.1111/1467-9787.00247. Bibcode2002JRegS..42....1R. 
  27. Schroeder, Bianca; Damouras, Sotirios; Gill, Phillipa (2010-02-24). «Understanding latent sector error and how to protect against them». 8th Usenix Conference on File and Storage Technologies (FAST 2010). http://www.usenix.org/event/fast10/tech/full_papers/schroeder.pdf. Ανακτήθηκε στις 2010-09-10. «We experimented with 5 different distributions (Geometric, Weibull, Rayleigh, Pareto, and Lognormal), that are commonly used in the context of system reliability, and evaluated their fit through the total squared differences between the actual and hypothesized frequencies (χ2 statistic). We found consistently across all models that the geometric distribution is a poor fit, while the Pareto distribution provides the best fit.». 
  28. Yuji Ijiri; Simon, Herbert A. (May 1975). «Some Distributions Associated with Bose–Einstein Statistics». Proc. Natl. Acad. Sci. USA 72 (5): 1654–57. doi:10.1073/pnas.72.5.1654. PMID 16578724. Bibcode1975PNAS...72.1654I. 
  29. Harchol-Balter, Mor; Downey, Allen (August 1997). «Exploiting Process Lifetime Distributions for Dynamic Load Balancing». ACM Transactions on Computer Systems 15 (3): 253–258. doi:10.1145/263326.263344. https://users.soe.ucsc.edu/~scott/courses/Fall11/221/Papers/Sync/harcholbalter-tocs97.pdf. 
  30. Kleiber and Kotz (2003): p. 94.
  31. Seal, H. (1980). «Survival probabilities based on Pareto claim distributions». ASTIN Bulletin 11: 61–71. doi:10.1017/S0515036100006620. 
  32. Original research inline - December 2020
  33. CumFreq, software for cumulative frequency analysis and probability distribution fitting [1]
  34. Hardy, Michael (2010). «Pareto's Law». Mathematical Intelligencer 32 (3): 38–43. doi:10.1007/s00283-010-9159-2. https://archive.org/details/sim_mathematical-intelligencer_fall-2010_32_3/page/n42. 
  35. «62 people own the same as half the world, reveals Oxfam Davos report». Oxfam. Ιαν. 2016. 
  36. «Global Wealth Report 2013». Credit Suisse. Οκτ 2013. σελ. 22. Αρχειοθετήθηκε από το πρωτότυπο στις 14 Φεβρουαρίου 2015. Ανακτήθηκε στις 24 Ιανουαρίου 2016. 
  37. Tanizaki, Hisashi (2004). Computational Methods in Statistics and Econometrics. CRC Press. σελ. 133. ISBN 9780824750886.