Μετάβαση στο περιεχόμενο

Πίνακας Ευκλείδειας απόστασης

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Στα μαθηματικά, ένας Πίνακας ευκλείδειας απόστασης είναι ένας πίνακας n×n που αναπαριστά την απόσταση ενός συνόλου n σημείων στον ευκλείδειο χώρο. Για τα σημεία στον k-διάστατο χώρο k, τα στοιχεία του πίνακα ευκλείδειων αποστάσεων A τους δίνονται από τα τετράγωνα των αποστάσεων μεταξύ τους. Δηλαδή

όπου συμβολίζει την ευκλείδεια νόρμα στο k.

Στο πλαίσιο των πινάκων (όχι απαραίτητα ευκλείδειων) αποστάσεων, οι καταχωρήσεις ορίζονται συνήθως απευθείας ως αποστάσεις και όχι ως τα τετράγωνά τους. Ωστόσο, στην ευκλείδεια περίπτωση, τα τετράγωνα των αποστάσεων χρησιμοποιούνται για την αποφυγή υπολογισμού τετραγωνικών ριζών και για την απλοποίηση σχετικών θεωρημάτων και αλγορίθμων.

Οι πίνακες ευκλείδειας απόστασης είναι στενά συνδεδεμένοι με τους πίνακες Γκραμ (πίνακες τετραγωνικών γινομένων, που περιγράφουν τις νόρμες των διανυσμάτων και τις γωνίες μεταξύ τους). Οι τελευταίοι αναλύονται εύκολα με μεθόδους της γραμμικής άλγεβρας. Αυτό επιτρέπει τον χαρακτηρισμό των πινάκων ευκλείδειας απόστασης και την ανάκτηση των σημείων που τον υλοποιούν. Μια υλοποίηση, αν υπάρχει, είναι μοναδική μέχρι άκαμπτους μετασχηματισμούς, δηλαδή μετασχηματισμούς του Ευκλείδειου χώρου που διατηρούν την απόσταση (περιστροφές, ανακλάσεις, μεταφορές).

Στις πρακτικές εφαρμογές, οι αποστάσεις είναι θορυβώδεις μετρήσεις ή προέρχονται από αυθαίρετες εκτιμήσεις ανομοιότητας (όχι απαραίτητα μετρικές). Ο στόχος μπορεί να είναι η οπτικοποίηση τέτοιων δεδομένων με σημεία στον ευκλείδειο χώρο, των οποίων ο πίνακας αποστάσεων προσεγγίζει όσο το δυνατόν καλύτερα έναν δεδομένο πίνακα ανομοιότητας - αυτό είναι γνωστό ως πολυδιάστατη κλιμάκωση. Εναλλακτικά, δεδομένου ότι δύο σύνολα δεδομένων έχουν ήδη αναπαρασταθεί με σημεία στον ευκλείδειο χώρο, μπορεί να τεθεί το ερώτημα πόσο παρόμοια είναι στο σχήμα τους, δηλαδή πόσο στενά μπορούν να συσχετιστούν με έναν μετασχηματισμό που διατηρεί την απόσταση - αυτό είναι η ανάλυση Προκρούστη. Ορισμένες από τις αποστάσεις μπορεί επίσης να λείπουν ή να έρχονται χωρίς ετικέτα (ως μη ταξινομημένο σύνολο ή πολυσύνολο αντί για πίνακα), οδηγώντας σε πιο σύνθετες αλγοριθμικές εργασίες, όπως το πρόβλημα της υλοποίησης γραφημάτων ή το πρόβλημα της στροφής (για σημεία σε μια γραμμή)[1][2].

Από το γεγονός ότι η Ευκλείδεια απόσταση είναι μια μετρική, ο πίνακας A έχει τις ακόλουθες ιδιότητες.

  • Όλα τα στοιχεία στη διαγώνιο του A είναι μηδενικά (δηλαδή είναι ένας κοίλος πίνακας)- συνεπώς το ίχνος του A είναι μηδέν.
  • A είναι συμμετρικός (δηλαδή ).
  • (από την τριγωνική ανισότητα)

Στη διάσταση k, ένας πίνακας ευκλείδειας απόστασης έχει βαθμό μικρότερο ή ίσο με k+2. Αν τα σημεία βρίσκονται σε γενική θέση, ο βαθμός είναι ακριβώς min(n, k + 2).

Οι αποστάσεις μπορούν να συρρικνωθούν με οποιαδήποτε δύναμη για να προκύψει ένας άλλος πίνακας ευκλείδειας απόστασης. Δηλαδή, αν είναι ένας πίνακας ευκλείδειας απόστασης, τότε είναι ένας πίνακας ευκλείδειας απόστασης για κάθε 0<s<1.[3]

Σχέση με τον πίνακα Γκραμ

[Επεξεργασία | επεξεργασία κώδικα]

Ο πίνακας Γκραμ μιας ακολουθίας σημείων στον k-διάστατο χώρο k είναι ο n×n πίνακας των τετραγωνικών γινομένων τους (εδώ ένα σημείο θεωρείται ως ένα διάνυσμα από το 0 στο σημείο αυτό):

, όπου είναι η γωνία μεταξύ του διανύσματος και .

Ειδικότερα

είναι το τετράγωνο της απόστασης of από το 0.

Έτσι, ο πίνακας Γκραμ περιγράφει τις νόρμες και τις γωνίες των διανυσμάτων (από 0 έως) .

Έστω ο k×n πίνακας που περιέχει ως στήλες. Τότε

, διότι (βλέποντας ως διάνυσμα στήλης).

Οι πίνακες που μπορούν να αναλυθούν ως , δηλαδή πίνακες Γκραμ κάποιας ακολουθίας διανυσμάτων (στήλες του ), είναι ευρέως γνωστοί- συγκεκριμένα πρόκειται για θετικούς ημιορισμένους πίνακες[4].


Για να συσχετίσουμε τον πίνακα ευκλείδειας απόστασης με τον πίνακα Γκραμ, παρατηρούμε ότι

Δηλαδή, οι νόρμες και οι γωνίες καθορίζουν τις αποστάσεις. Ας σημειωθεί ότι ο πίνακας Γκραμ περιέχει πρόσθετες πληροφορίες: αποστάσεις από το 0.

Αντίστροφα, οι αποστάσεις μεταξύ ζευγών σημείων n+1 καθορίζουν τα γινόμενα τελείας μεταξύ των διανυσμάτων n (1≤in):

(αυτό είναι γνωστό ως ταυτότητα πόλωσης).

Για έναν n×n πίνακα A, μια ακολουθία σημείων στον k-διάστατο ευκλείδειο χώρο k ονομάζεται υλοποίηση του A στον k αν A είναι ο πίνακας ευκλείδειας απόστασής τους. Μπορούμε να υποθέσουμε χωρίς απώλεια γενικότητας ότι (επειδή η μετατόπιση κατά διατηρεί τις αποστάσεις).

Μαθηματικό θεώρημα [5]

Κριτήριο Σένμπεργκ,[6] ανεξάρτητα από τον Γιανγκ &Χάουζχολντερ [7]

Ένας συμμετρικός κοίλος n×n πίνακας A με πραγματικές εισόδους δέχεται μια υλοποίηση στο k αν και μόνο αν ο (n-1)×(n-1) πίνακας ορίζεται από

είναι θετικά ημιορισμένος και έχει βαθμό το πολύ k.

Αυτό προκύπτει από την προηγούμενη συζήτηση επειδή ο G είναι θετικά ημιορισμένος με βαθμό το πολύ k αν και μόνο αν μπορεί να αναλυθεί ως όπου X είναι ένας πίνακας k×n matrix.[8]. Επιπλέον, οι στήλες του X δίνουν μια υλοποίηση στο k. Επομένως, οποιαδήποτε μέθοδος αποσύνθεσης του G επιτρέπει την εύρεση μιας υλοποίησης. Οι δύο κύριες προσεγγίσεις είναι παραλλαγές της αποσύνθεσης Τσολέσκι ή η χρήση φασματικών αναλύσεων για την εύρεση της κύριας τετραγωνικής ρίζας του G, βλέπε Ορισμένος πίνακας#Ανάλυση[9].

Η πρόταση του θεωρήματος διακρίνει το πρώτο σημείο . Μια πιο συμμετρική παραλλαγή του ίδιου θεωρήματος είναι η ακόλουθη:

'Επακόλουθο [10]

Ένας συμμετρικός κοίλος n×n πίνακας A με πραγματικές καταχωρήσεις δέχεται μια υλοποίηση εάν και μόνο εάν οA είναι αρνητικά ημιορισμένος στο υπερεπίπεδο , that is

για κάθε έτσι ώστε .

Άλλοι χαρακτηρισμοί αφορούν τις ορίζουσες Κέιλι - Μένγκερ. Συγκεκριμένα, αυτές επιτρέπουν να δείξουμε ότι ένας συμμετρικός κοίλος πίνακας n×n είναι υλοποιήσιμος στο k αν και μόνο αν κάθε (k+3)×(k+3) κύριος υποπίνακας είναι. Με άλλα λόγια, ένα ημιμετρικό σε πεπερασμένα πολλά σημεία είναι ενσωματώσιμο ισομετρικά στο k αν και μόνο αν κάθε k+3 σημεία είναι[11].

Στην πράξη, οι συνθήκες οριστικότητας ή κατάταξης μπορεί να αποτύχουν λόγω αριθμητικών σφαλμάτων, θορύβου στις μετρήσεις ή λόγω του ότι τα δεδομένα δεν προέρχονται από πραγματικές ευκλείδειες αποστάσεις. Τα σημεία που υλοποιούν βέλτιστα παρόμοιες αποστάσεις μπορούν στη συνέχεια να βρεθούν με ημιοριστική προσέγγιση (και προσέγγιση χαμηλής τάξης, εάν είναι επιθυμητό) χρησιμοποιώντας εργαλεία γραμμικής άλγεβρας, όπως η ανάλυση σε ιδιάζουσες τιμές ή ο ημιοριστικός προγραμματισμός. Αυτό είναι γνωστό ως πολυδιάστατη κλιμάκωση. Παραλλαγές αυτών των μεθόδων μπορούν επίσης να αντιμετωπίσουν ελλιπή δεδομένα αποστάσεων.

Τα μη επισημειωμένα δεδομένα, δηλαδή ένα σύνολο ή ένα πολυσύνολο αποστάσεων που δεν αντιστοιχούν σε συγκεκριμένα ζεύγη, είναι πολύ πιο δύσκολο να αντιμετωπιστούν. Τέτοια δεδομένα προκύπτουν, παραδείγματος χάριν, στην αλληλούχιση DNA (συγκεκριμένα, ανάκτηση γονιδιώματος από μερική πέψη) ή στην ανάκτηση φάσεων. Δύο σύνολα σημείων ονομάζονται ομομετρικά εάν έχουν το ίδιο πολυσύνολο αποστάσεων (αλλά δεν συνδέονται απαραίτητα με άκαμπτο μετασχηματισμό). Η απόφαση για το αν ένα δεδομένο πολυσύνολο n(n-1)/2 αποστάσεων μπορεί να πραγματοποιηθεί σε μια δεδομένη διάσταση k είναι έντονα NP-δύσκολη[12]. Σε μία διάσταση αυτό είναι γνωστό ως το πρόβλημα της στροφής- είναι ένα ανοικτό ερώτημα αν μπορεί να επιλυθεί σε πολυωνυμικό χρόνο. Όταν το πολυσύνολο των αποστάσεων δίνεται με ράβδους σφάλματος, ακόμη και η περίπτωση της μίας διάστασης είναι NP-δύσκολη. Παρ' όλα αυτά, υπάρχουν πρακτικοί αλγόριθμοι για πολλές περιπτώσεις, π.χ. για τυχαία σημεία[13][14][15].

Μοναδικότητα των αναπαραστάσεων

[Επεξεργασία | επεξεργασία κώδικα]

Δεδομένου ενός πίνακα ευκλείδειας απόστασης, η ακολουθία των σημείων που τον υλοποιούν είναι μοναδική μέχρι άκαμπτων μετασχηματισμών - πρόκειται για ισομετρίες του ευκλείδειου χώρου: περιστροφές, ανακλάσεις, μεταφορές και οι συνθέσεις τους.[1]

Θεώρημα

Έστω και δύο ακολουθίες σημείων στον k-διάστατο Ευκλείδειο χώρο k.

Οι αποστάσεις and είναι ίσες (για όλα τα 1≤i,jn) αν και μόνο αν υπάρχει ένας άκαμπτος μετασχηματισμός του k που απεικονίζει το στο (για όλα τα 1≤in).


Σε εφαρμογές, όταν οι αποστάσεις δεν ταιριάζουν ακριβώς, η ανάλυση Προκρούστη[16] αποσκοπεί στο να συσχετίσει δύο σύνολα σημείων όσο το δυνατόν πιο κοντά μέσω άκαμπτων μετασχηματισμών, συνήθως με τη χρήση της αποσύνθεσης μοναδιαίων τιμών. Η συνήθης ευκλείδεια περίπτωση είναι γνωστή ως το ορθογώνιο πρόβλημα Προκρούστη ή το πρόβλημα του Γουάμπα (όταν οι παρατηρήσεις σταθμίζονται για να ληφθούν υπόψη ποικίλες αβεβαιότητες). Παραδείγματα εφαρμογών περιλαμβάνουν τον προσδιορισμό του προσανατολισμού δορυφόρων, τη σύγκριση της δομής μορίων (στη χημειοπληροφορική), τη δομή πρωτεϊνών (δομική ευθυγράμμιση στη βιοπληροφορική) ή τη δομή οστών (στατιστική ανάλυση σχήματος στη βιολογία).

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]
  1. 1,0 1,1 Dokmanic και άλλοι (2015)
  2. So (2007)
  3. Maehara, Hiroshi (2013). «Euclidean embeddings of finite metric spaces» (στα αγγλικά). Discrete Mathematics 313 (23): 2848–2856. doi:10.1016/j.disc.2013.08.029. ISSN 0012-365X.  Theorem 2.6
  4. «Positive-definite form - Encyclopedia of Mathematics». encyclopediaofmath.org. Ανακτήθηκε στις 28 Αυγούστου 2024. 
  5. So (2007), Theorem 3.3.1, p. 40
  6. Schoenberg, I. J. (1935). «Remarks to Maurice Fréchet's Article "Sur La Definition Axiomatique D'Une Classe D'Espace Distances Vectoriellement Applicable Sur L'Espace De Hilbert"». Annals of Mathematics 36 (3): 724–732. doi:10.2307/1968654. ISSN 0003-486X. https://archive.org/details/sim_annals-of-mathematics_1935-07_36_3/page/724. 
  7. Young, Gale; Householder, A. S. (1938-03-01). «Discussion of a set of points in terms of their mutual distances» (στα αγγλικά). Psychometrika 3 (1): 19–22. doi:10.1007/BF02287916. ISSN 1860-0980. https://archive.org/details/sim_psychometrika_1938-03_3_1/page/19. 
  8. So (2007), Theorem 2.2.1, p. 10
  9. «Positive Definite Matrices - University of Chicago Department of Statistics» (PDF). 
  10. So (2007), Corollary 3.3.3, p. 42
  11. Menger, Karl (1931). «New Foundation of Euclidean Geometry». American Journal of Mathematics 53 (4): 721–745. doi:10.2307/2371222. https://archive.org/details/sim_american-journal-of-mathematics_1931-10_53_4/page/721. 
  12. «Is undecidable(complement of R) a subset of NP-hard?». Computer Science Stack Exchange (στα Αγγλικά). Ανακτήθηκε στις 29 Αυγούστου 2024. 
  13. Lemke, Paul· Skiena, Steven S.· Smith, Warren D. (2003). «Reconstructing Sets From Interpoint Distances». Στο: Aronov, Boris· Basu, Saugata· Pach, János· Sharir, Micha. Discrete and Computational Geometry. 25. Berlin, Heidelberg: Springer Berlin Heidelberg. σελίδες 597–631. doi:10.1007/978-3-642-55566-4_27. ISBN 978-3-642-62442-1. 
  14. Huang, Shuai; Dokmanić, Ivan (2021). «Reconstructing Point Sets from Distance Distributions». IEEE Transactions on Signal Processing 69: 1811–1827. doi:10.1109/TSP.2021.3063458. 
  15. Jaganathan, Kishore; Hassibi, Babak (2012). «Reconstruction of Integers from Pairwise Distances».
     [cs.DM]
    .
     

  16. " The process is called "Procrustean superimposition." ("Procrustes is from Greek mythology," Goodall explains. "He was an innkeeper who had only one bed.