Απόσταση Hamming

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση
Δυαδικός κύβος 3-bit για την εύρεση της απόστασης Hamming
Δύο παραδείγματα αποστάσεων: 100->011 έχει απόσταση (κόκκινο μονοπάτι), 010->111 έχει απόσταση 2 (μπλε μονοπάτι)
Δυαδικός υπερκύβος 4-bit για την εύρεση της απόστασης Hamming
Δύο παραδείγματα αποστάσεων: 0100->1001 έχει απόσταση (κόκκινο μονοπάτι), 0110->1110έχει απόσταση 1 (μπλε μονοπάτι)

Στην θεωρία πληροφορίας, ως απόσταση Hamming μεταξύ δύο συμβολοσειρών ίσου μήκους ορίζεται ο αριθμός θέσεων στις οποίες τα αντίστοιχα σύμβολα είναι διαφορετικά. Η απόσταση Hamming, μετρά τον ελάχιστο αριθμό αντικαταστάσεων που χρειάζονται ώστε να μετατραπεί η μία συμβολοσειρά στην άλλη, ή αλλιώς, τον αριθμό των λαθών που μετέτρεψαν την μία συμβολοσειρά στην άλλη.

Παραδείγματα[Επεξεργασία | επεξεργασία κώδικα]

Η απόσταση Hamming μεταξύ:

  • "τόνος" και "πόθοι" είναι 3.
  • 1011101 και 1001001 είναι 2.
  • 2173896 και 2233796 είναι 3.

Ειδικές ιδιότητες[Επεξεργασία | επεξεργασία κώδικα]

Για δεδομένο μήκος n, η απόσταση Hamming είναι μετρική στον διανυσματικό χώρο των λέξεων αυτού του μήκους, καθώς εμφανώς ικανοποιεί τις προϋποθέσεις της μη αρνητικότητας, της ταυτότητας των μη διακρισίμων και της συμμετρίας, και μπορεί να δειχθεί εύκολα με πλήρη επαγωγή ότι ικανοποιεί και την τριγωνική ανισότητα. Η απόσταση Hamming μεταξύ δύο λέξεων a και b μπορεί επίσης να ειδωθεί ως το βάρος Hamming του ab για κατάλληλη του τελεστή −.

Για δυαδικές συμβολοσειρές a και b η απόσταση Hamming είναι ίση με τον αριθμό των μονάδων στο a XOR b. Ο μετρικός χώρος δυαδικών συμβολοσειρών μήκους n, με την απόσταση Hamming είναι γνωστός ως κύβος Hamming. Είναι ισοδύναμος ως μετρικός χώρος με το σύνολο των αποστάσεων μεταξύ κορυφών σε ένα γράφημα υπερκύβου. Αν η δυαδική συμβολοσειρά μήκους n θεωρηθεί ως διάνυσμα στο R^n μεταχειρίζοντας κάθε σύμβολο της ως πραγματική συντεταγμένη, οι συμβολοσειρές σχηματίζουν τις κορυφές ενός n-διάστατου υπερκύβου, και η απόσταση Hamming των συμβολοσειρών είναι ισοδύναμη με την απόσταση Manhattan των κορυφών.

Ιστορία και εφαρμογές[Επεξεργασία | επεξεργασία κώδικα]

Η απόσταση Hamming πήρε το όνομά της από τον Ρίτσαρντ Χάμινγκ (Richard Hamming), ο οποίος την εισήγαγε στην θεμελιώδη εργασία του για τους κώδικες Hamming, Error detecting and error correcting codes (Κώδικες εντοπισμού και διόρθωσης σφαλμάτων, 1950).[1] Χρησιμοποιείται στην τηλεπικοινωνία για την μέτρηση των ανεστραμμένων bit σε μία σταθερού μήκους ψηφιακή λέξη ως εκτίμηση σφάλματος, και συνεπώς μερικές φορές αποκαλείται και απόσταση σήματος. Η ανάλυση βάρους Hamming χρησιμοποιείται σε αρκετούς τομείς, όπως η θεωρία πληροφορίας, θεωρία κωδικοποίησης και κρυπτογραφία. Ωστόσο για την σύγκριση συμβολοσειρών διαφορετικού μήκους, ή συμβολοσειρών όπου δεν έχουν γίνει μόνο αντικαταστάσεις αλλά αναμένονται και εισαγωγές ή διαγραφές είναι καταλληλότερες πιο πολύπλοκες μέθοδοι όπως η απόσταση Levenshtein. Για q-δικές συμβολοσειρές επί ενός αλφάβητου μεγέθους q ≥ 2 η απόσταση Hamming εφαρμόζεται στην περίπτωση της ορθογωνικής διαμόρφωσης, ενώ η απόσταση Lee χρησιμοποιείται για την φασική διαμόρφωση. Αν q = 2 ή q = 3 οι αποστάσεις συμπίπτουν.

Η απόσταση Hamming χρησιμοποιείται επίσης στη συστηματική ως μέτρο της γενετικής απόστασης.[2]

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

Πηγές[Επεξεργασία | επεξεργασία κώδικα]

Στο λήμμα αυτό έχει ενσωματωθεί κείμενο από το λήμμα Hamming distance της Αγγλικής Βικιπαίδειας, η οποία διανέμεται υπό την GNU FDL και την CC-BY-SA 3.0. (ιστορικό/συντάκτες).