Ανάλυση ανεξάρτητων συνιστωσών: Διαφορά μεταξύ των αναθεωρήσεων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Xaris333 (συζήτηση | συνεισφορές)
μ →‎Πηγές: clean up, αντικατέστησε: {{Reflist}} → {{παραπομπές}} με τη χρήση AWB
Paren8esis (συζήτηση | συνεισφορές)
Χωρίς σύνοψη επεξεργασίας
Γραμμή 5: Γραμμή 5:
}}
}}


H '''Aνάλυση ανεξάρτητων συνιστωσών''' (''Independent Component Analysis'') είναι μια υπολογίσιμη μέθοδος για τον διαχωρισμό ενός πολυμετάβλητου σήματος σε προσθετικές υποσυνιστώσες υποθέτοντας την κοινή [[στατιστική ανεξαρτησία]] της μη-Γκαουσιανής πηγής σημάτων. Είναι μια ειδική περίπτωση [[τυφλού χωρισμού πηγής]] (blind source separation).
H '''Aνάλυση ανεξάρτητων συνιστωσών''' (''Independent Component Analysis'') είναι μια υπολογιστική μέθοδος για το διαχωρισμό ενός πολυμεταβλητού σήματος σε προσθετικές υποσυνιστώσες υποθέτοντας την κοινή [[στατιστική ανεξαρτησία]] της μη-Γκαουσιανής πηγής σημάτων. Είναι μια ειδική περίπτωση [[τυφλού χωρισμού πηγής]] (blind source separation).


== Εισαγωγή ==
== Εισαγωγή ==


Όταν η υπόθεση ανεξαρτησίας είναι σωστή, ο τυφλός χωρισμός (με την Ανάλυση Ανεξάρτητων Συνιστωσών) ενός σύνθετου σήματος δίνει πολύ καλά αποτελέσματα. Επίσης χρησιμοποιείται για σήματα τα οποία υποτίθεται ότι δεν παράγονται από μίξη κάποιων σημάτων για τον σκοπό της Ανάλυσης Ανεξάρτητων Συνιστωσών. Μια απλή εφαρμογή Ανάλυσης Ανεξάρτητων Συνιστωσών είναι το [[πρόβλημα κοκτέιλ πάρτυ]], όπου τα υποβόσκον σήματα ομιλίας είναι χωρισμένα από τα δείγματα δεδομένων που αποτελούνται από ανθρώπους που μιλάνε ταυτόχρονα σε ένα δωμάτιο. Συνήθως το πρόβλημα απλοποιείται υποθέτοντας μη χρονικές καθυστερήσεις ή ηχώ. Μια σημαντική παρατήρηση για σκέψη είναι όταν ''Ν'' πηγές είναι παρούσες, τουλάχιστον ''Ν'' παρατηρήσεις (π.χ. μικρόφωνα) χρειάζονται για να πάρουμε τα πραγματικά σήματα. Αυτά αποτελούν τετράγωνη υπόθεση (''J''&nbsp;=&nbsp;''D'', οπού ''D'' είναι η εισερχόμενη διάσταση δεδομένων και ''J'' είναι η διάσταση του μοντέλου). Άλλες υποθέσεις που υποκαθορίζονται (''J''&nbsp;<&nbsp; ''D'') και υπερκαθορίζονται (''J''&nbsp;>&nbsp;''D'') ερευνούνται.
Όταν η υπόθεση ανεξαρτησίας είναι σωστή, ο τυφλός χωρισμός (με την Ανάλυση Ανεξάρτητων Συνιστωσών) ενός σύνθετου σήματος δίνει πολύ καλά αποτελέσματα. Επίσης χρησιμοποιείται για σήματα τα οποία υποτίθεται ότι δεν παράγονται από μίξη κάποιων σημάτων για τον σκοπό της Ανάλυσης Ανεξάρτητων Συνιστωσών. Μια απλή εφαρμογή Ανάλυσης Ανεξάρτητων Συνιστωσών είναι το [[πρόβλημα κοκτέιλ πάρτυ]], όπου τα υποβόσκοντα σήματα ομιλίας διαχωρίζονται από δείγματα δεδομένων που αποτελούνται από ανθρώπους που μιλάνε ταυτόχρονα σε ένα δωμάτιο. Συνήθως το πρόβλημα απλοποιείται υποθέτοντας μη χρονικές καθυστερήσεις ή ηχώ. Μια σημαντική παρατήρηση για σκέψη είναι όταν ''Ν'' πηγές είναι παρούσες, χρειάζονται τουλάχιστον ''Ν'' παρατηρητές (π.χ. μικρόφωνα) για να πάρουμε τα πραγματικά σήματα. Αυτό αποτελεί την τετράγωνη περίπτωση (''J''&nbsp;=&nbsp;''D'', οπού ''D'' είναι η εισερχόμενη διάσταση δεδομένων και ''J'' η διάσταση του μοντέλου). Έχουν επίσης ερευνηθεί και περιπτώσεις όπου έχουμε υποκαθορισμό (''J''&nbsp;<&nbsp; ''D'') ή υπερκαθορισμό (''J''&nbsp;>&nbsp;''D'').


== Καθορίζοντας την συνιστώσα ανεξαρτησίας ==
== Καθορίζοντας την συνιστώσα ανεξαρτησίας ==


Η ανάλυση ανεξάρτητων συνιστωσών βρίσκει τις ανεξάρτητες συνιστώσες (όπως παράγοντες, λανθάνουσες μεταβλητές, πηγές) μεγιστοποιώντας την στατιστική ανεξαρτησία των εκτιμώμενων συνιστωσών . Μπορούμε να επιλέξουμε μεταξύ πολλών τρόπων καθορισμού της ανεξαρτησίας, και αυτή η επιλογή διέπει τη μορφή του ICA αλγόριθμου. Οι δύο πιο γνωστοί καθορισμοί της ανεξαρτησίας για το ICA είναι
Η ανάλυση ανεξάρτητων συνιστωσών βρίσκει τις ανεξάρτητες συνιστώσες (όπως παράγοντες, λανθάνουσες μεταβλητές, πηγές) μεγιστοποιώντας τη στατιστική ανεξαρτησία των εκτιμώμενων συνιστωσών. Μπορούμε να επιλέξουμε μεταξύ πολλών τρόπων καθορισμού της ανεξαρτησίας, και αυτή η επιλογή διέπει τη μορφή του ICA αλγόριθμου. Οι δύο πιο γνωστοί καθορισμοί της ανεξαρτησίας για το ICA είναι


1) Ελαχιστοποίηση της [[Κοινής Πληροφορίας]]
1) Ελαχιστοποίηση της [[Κοινής Πληροφορίας]]
2) Μεγιστοποίηση της μη-Γκαουσιανής


2) Μεγιστοποίηση της μη-Κανονικότητας
Η ελαχιστοποίηση των -Mη κοινών Πληροφοριών (MMI) οικογένεια του ICA αλγόριθμου χρησιμοποιεί μετρήσεις σαν τις μετρήσεις [[Κουλμπακ-Λάιμπερ]] (Kullback-Leibler) απόκλιση και μέγιστη εντροπία. Η Μη-Γκαουσιανη του ICA αλγόριθμου, έχοντας παρακινηθεί από το [[κεντρικό οριακό θεώρημα]], χρησιμοποιεί [[κύρτωση]] και [[αρνητική εντροπία]].


Η ελαχιστοποίηση των Mη κοινών Πληροφοριών (Minimization of Mutual Information, MMI) αποτελεί μια οικογένεια του ICA αλγόριθμου ποι χρησιμοποιεί μετρήσεις όπως η [[Απόκλιση Κουλμπακ-Λάιμπερ]] (Kullback-Leibler) και η [[Αρχή της μέγιστης εντροπίας|μέγιστη εντροπία]]. Η οικογένεια της Μη-Κανονικότητας (non-Gaussianity) του ICA αλγόριθμου, έχοντας παρακινηθεί από το [[κεντρικό οριακό θεώρημα]], χρησιμοποιεί [[κύρτωση]] και [[αρνητική εντροπία]].
Τυπική αλγόριθμοι για την ανάλυση ανεξάρτητων συνιστωσών χρησιμοποιεί κεντροποίηση, [[θορυβοποίηση]] (συνήθως με την [[αποσύνθεση ιδιοτιμών]] (eigenvalue decomposition)), και [[μείωση διάστασης]] (dimensionality reduction) σαν βήματα προεπεξεργασίας με σκοπό να απλουστευτεί και να μειωθεί η πολυπλοκότητα του προβλήματος για πραγματικούς επαναληπτικούς αλγορίθμους. Η θορυβοποίηση και η μείωση διάστασης μπορούν να επιτευχθούν με την [[ανάλυση βασικών συνιστωσών]] (principal component analysis) ή με την [[Αποσύνθεση μοναδικής τιμής]] (singular value decomposition). Η θορυβοποίηση καθίστα ότι όλες οι διαστάσεις χειρίζονται ίσα 'a priori' πριν τρέξει ο αλγόριθμος. Αλγόριθμοι για την ανάλυση ανεξάρτητων συνιστωσών συμπεριλαμβάνουν τους infomax, FastICA, και JADE, αλλά υπάρχουν και άλλοι επίσης.
Γενικά, η ανάλυση ανεξάρτητων συνιστωσών δεν μπορεί να βρεθεί από τον πραγματικό αριθμό των πηγών σημάτων, μια μοναδική σωστή σειρά των πηγών σημάτων, ούτε από την σωστή διαβάθμιση (συμπεριλαμβανόμενου του σήματος) των πηγών σημάτων.


Τυπικοί αλγόριθμοι για την ανάλυση ανεξάρτητων συνιστωσών χρησιμοποιούν κεντροποίηση, [[θορυβοποίηση]] (συνήθως με την [[αποσύνθεση ιδιοτιμών]] (eigenvalue decomposition)), και [[μείωση διάστασης]] (dimensionality reduction) ως βήματα προεπεξεργασίας με σκοπό να απλουστευτεί και να μειωθεί η πολυπλοκότητα του προβλήματος για πραγματικούς επαναληπτικούς αλγορίθμους. Η θορυβοποίηση και η μείωση διάστασης μπορούν να επιτευχθούν με την [[ανάλυση βασικών συνιστωσών]] (principal component analysis) ή με την [[Αποσύνθεση μοναδικής τιμής]] (singular value decomposition). Η θορυβοποίηση εξασφαλίζει την 'a priori' ίση μεταχείριση όλων των διαστάσεων πριν την εκτέλεση του αλγορίθμου. Στους αλγορίθμους ανάλυσης ανεξάρτητων συνιστωσών συμπεριλαμβάνονται οι infomax, FastICA και JADE, αλλά υπάρχουν κι άλλοι. Γενικά, η ανάλυση ανεξάρτητων συνιστωσών δεν μπορεί να εντοπίσει τον πραγματικό αριθμό των πηγαίων σημάτων, τη μοναδική σωστή σειρά των πηγαίων σημάτων, ούτε τη σωστή κλιμάκωση (συμπεριλαμβανόμενου του προσήμου) των πηγαίων σημάτων.
Η ανάλυση ανεξάρτητων συνιστωσών, είναι σημαντική για τον [[τυφλό διαχωρισμό σήματος]] και έχει πολλές πρακτικές εφαρμογές. Είναι στενά συνδεμένη με ακόμη με μια ειδική περίπτωση) την ερεύνα για ένα [[παραγοντικό κώδικα]] (factorial code) δεδομένων π.χ, μια καινούρια αναπαράστασης της διανυσματικής εκτίμησης των κάθε διανυσμάτων δεδομένων έτσι ώστε να κωδικοποιείται μοναδικά από το αποτέλεσμα του κώδικα διανύσματος (code vector) (loss-free coding), αλλά οι συνιστώσες του κώδικα να είναι στατιστικά ανεξάρτητες.

Η ανάλυση ανεξάρτητων συνιστωσών είναι σημαντική για τον [[τυφλό διαχωρισμό σήματος]] και έχει πολλές πρακτικές εφαρμογές. Είναι στενά συνδεδεμένη με την έρευνα για την παραγωγή ενός [[παραγοντικό κώδικα|παραγοντικού κώδικα]] (factorial code) των δεδομένων, δηλ. μια καινούρια διανυσματική αναπαράσταση κάθε διανύσματος δεδομένων έτσι ώστε αυτό να κωδικοποιείται μοναδικά από το αντίστοιχο διάνυσμα κώδικα (code vector) (loss-free coding), αλλά οι συνιστώσες του κώδικα να είναι στατιστικά ανεξάρτητες.


== Μαθηματικοί ορισμοί ==
== Μαθηματικοί ορισμοί ==
Γραμμική ανεξαρτησία ανάλυση συνιστωσών μπορεί να διαιρεθεί σε αθόρυβες και θορυβώδεις περιπτώσεις, οπού αθόρυβες ICA είναι ειδικές περιπτώσεις των θόρυβων ICA. Μη γραμμικές ICA θεωρείται ξεχωριστή υπόθεση.
Η γραμμική ανάλυση ανεξάρτητων συνιστωσών μπορεί να διαιρεθεί σε αθόρυβες και θορυβώδεις περιπτώσεις, όπου οι αθόρυβες ICA είναι ειδικές περιπτώσεις των θορυβωδών ICA. Η μη γραμμική ICA θα πρέπει να θεωρείται ξεχωριστή περίπτωση.


== Γενικοί ορισμοί ==
=== Γενικοί ορισμοί ===
Τα δεδομένα αναπαριστώνται από το [[τυχαίο διάνυσμα]] (random vector) <math>x=(x_1,\ldots,x_m)</math> και οι συνιστώσες από τον τυχαίο διάνυσμα <math>s=(s_1,\ldots,s_n)</math> . Ο σκοπός είναι ο μετασχηματισμός των παρατηρούμενων δεδομένων <math>x</math>, χρησιμοποιώντας ένα γραμμικό στατικό μετασχηματισμό ''W'' σαν
Τα δεδομένα αναπαριστώνται από το [[τυχαίο διάνυσμα]] (random vector) <math>x=(x_1,\ldots,x_m)^T</math> και οι συνιστώσες από το τυχαίο διάνυσμα <math>s=(s_1,\ldots,s_n)^T</math> . Ο σκοπός είναι ο μετασχηματισμός των παρατηρούμενων δεδομένων <math>x</math>, χρησιμοποιώντας ένα γραμμικό στατικό μετασχηματισμό ''W'' της μορφής


:<math>
:<math>
s = W x
s = W x
\,</math>,
\,</math>
με μεγιστοποίηση των ανεξάρτητων συνιστωσών <math>s</math> μετρουμένων από κάποια συνάρτηση <math>F(s_1,\ldots,s_n)</math> ανεξαρτησίας.
για τη μεγιστοποίηση των ανεξάρτητων συνιστωσών <math>s</math> μετρουμένων από κάποια συνάρτηση ανεξαρτησίας <math>F(s_1,\ldots,s_n)</math>.


=== Γενετήριο μοντέλο ===
=== Γενετήριο μοντέλο ===
Γραμμή 40: Γραμμή 40:
==== Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών χωρίς θόρυβο ====
==== Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών χωρίς θόρυβο ====


Οι συνιστώσες <math>x_i</math> του παρατηρουμένου τυχαίου διανύσματος <math>x=(x_1,\ldots,x_m)^T</math> παράγονται σαν άθροισμα των ανεξάρτητων συνιστωσών <math>s_k</math>, <math>k=1,\ldots,n</math>:
Οι συνιστώσες <math>x_i</math> του παρατηρουμένου τυχαίου διανύσματος <math>x=(x_1,\ldots,x_m)^T</math> παράγονται ως άθροισμα των ανεξάρτητων συνιστωσών <math>s_k</math>, <math>k=1,\ldots,n</math>:


<math>x_i = a_{i,1} s_1 + \ldots + a_{i,k} s_k + \ldots + a_{i,n} s_n</math>
<math>x_i = a_{i,1} s_1 + \ldots + a_{i,k} s_k + \ldots + a_{i,n} s_n</math>


σταθμισμένων από την μίξη βαρών <math>a_{i,k}</math>.
σταθμισμένων από τα βάρη μίξης <math>a_{i,k}</math>.

Το ίδιο μοντέλο παραγωγής μπορεί να γραφεί σε διανυσματική μορφή ως <math>x=\sum_{k=1}^{n} s_k a_k</math>, οπού το παρατηρούμενο τυχαίο διάνυσμα <math>x</math> παρίσταται από τα διανύσματα βάσης <math>a_k=(a_{1,k},\ldots,a_{m,k})^T</math>. Η βάση διανυσμάτων <math>a_k</math> σχηματίζει τις στήλες του πίνακα μίξης <math>A=(a_1,\ldots,a_n)</math> και η γενετήρια φόρμουλα μπορεί να γραφτεί ως <math>x=As</math>, όπου <math>s=(s_1,\ldots,s_n)^T</math>.


Δοθέντων του μοντέλου και των συσχετισμών (δείγματα) <math>x_1,\ldots,x_N</math> του τυχαίου διανύσματος <math>x</math>, ο στόχος είναι να εκτιμηθούν ο πίνακας μίξης <math>A</math> και οι πηγές <math>s</math>. Αυτό γίνεται με προσαρμοστικό υπολογισμό των διανυσμάτων <math>w</math> και θέτοντας μια συνάρτηση κόστους η οποία είτε θα μεγιστοποιεί τη μη κανονικότητα (non-gaussianity) του υπολογισθέντος <math>s_k = (w^T*x)</math> ή θα ελαχιστοποιεί την κοινή πληροφορία. Σε μερικές περιπτώσεις μια 'a priori' γνώση της κατανομής πιθανοτήτων των πηγών μπορούν να χρησιμοποιηθούν στη συνάρτηση κόστους.
το ίδιο μοντέλο παραγωγής μπορεί να γραφεί σε διανυσματική μορφή σαν
<math>x=\sum_{k=1}^{n} s_k a_k</math>,
οπού το παρατηρούμενο τυχαίο διάνυσμα <math>x</math> παρίσταται από τα διανύσματα βάσης
<math>a_k=(a_{1,k},\ldots,a_{m,k})^T</math>.Η βάση διανυσμάτων <math>a_k</math> σχηματίζεται από τις στήλες των συμπτυγμένων πινάκων <math>A=(a_1,\ldots,a_n)</math> και η γενετήρια φόρμουλα μπορεί να γραφτεί σαν <math>x=As</math>, όπου <math>s=(s_1,\ldots,s_n)^T</math>.


Οι αρχικές πηγές μπορούν να ανακτηθούν πολλαπλασιάζοντας τα παρατηρούμενα σήματα <math>x</math> με τον αντίστροφο πίνακα μίξης <math>W=A^{-1}</math>. Εδώ θεωρείται ότι ο συμπτυγμένος πίνακας είναι τετράγωνος (<math>n=m</math>). Αν ο αριθμός των διανυσμάτων βάσης είναι μεγαλύτερος από τη διάσταση των παρατηρούμενων διανυσμάτων, <math>n>m</math>, ο σκοπός υπερκαλύπτεται άλλα και πάλι το πρόβλημα είναι επιλύσιμο με ψευδοαντιστροφή.
Δοθέντων του μοντέλου και των συσχετισμών (δείγματα) <math>x_1,\ldots,x_N</math> του τυχαίου διανύσματος <math>x</math>, ο στόχος είναι να εκτιμηθούν, ο συμπτυγμένος πινάκας <math>A</math> και οι πηγές <math>s</math>. Αυτό γίνεται προσαρμόζοντας υπολογιστικά τα <math>w</math> διανύσματα και θέτοντας μια συνάρτηση κόστους η οποία είτε θα μεγιστοποιεί την μη γκαουσινότητα (nongaussianity) του υπολογισθέντος <math>s_k = (w^T*x)</math> η ελαχιστοποιώντας την κοινή πληροφορία. Σε μερικές περιπτώσεις μια 'a priori' γνώση της κατανομής πιθανοτήτων των πηγών μπορούν να χρησιμοποιηθούν στην συνάρτηση κόστους.
Οι αρχικές πηγές μπορούν να ανακτηθούν πολλαπλασιάζοντας τα παρατηρούμενα σήματα <math>x</math> με τον ανάστροφο συμπτυγμένο πινάκα <math>W=A^{-1}</math>, γνωστό επίσης και σαν μη αναμιγμένο (unmixing ) πίνακα. Εδώ θεωρείται ότι ο συμπτυγμένος πινάκας είναι τετράγωνος (<math>n=m</math>). Αν ο αριθμός των διανυσμάτων βάσης είναι μεγαλύτερος από την διάσταση των παρατηρούμενων διανυσμάτων, <math>n>m</math>, ο σκοπός υπερκαλύπτεται άλλα και πάλι είναι επιλύσιμο με την ψευδοαντιστροφή.


==== Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών με θόρυβο ====
==== Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών με θόρυβο ====


Με την προστιθέμενη υπόθεση του μηδενικού μέσου και τον ασυσχετιστικο Γκαουσιανό θόρυβο <math>n\sim N(0,\operatorname{diag}(\Sigma))</math>, η Ανάλυση Ανεξάρτητων Συνιστωσών παίρνει τη μορφή <math>x=As+n</math>.
Με την επιπρόσθετη υπόθεση του μηδενικού μέσου και τον ασυσχετιστικο Γκαουσιανό θόρυβο <math>n\sim N(0,\operatorname{diag}(\Sigma))</math>, η Ανάλυση Ανεξάρτητων Συνιστωσών παίρνει τη μορφή <math>x=As+n</math>.


==== Μη Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών ====
==== Μη Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών ====


Η σύμπτυξη των πηγών δεν χρειάζεται να είναι γραμμική. Χρησιμοποιώντας μια μη γραμμική συμπτυγμένη συνάρτηση <math>f(\cdot|\theta)</math> με παραμέτρους <math>\theta</math> το μη γραμμικό ICA μοντέλο είναι
Η μίξη των πηγών δε χρειάζεται να είναι γραμμική. Χρησιμοποιώντας μια μη γραμμική συμπτυγμένη συνάρτηση <math>f(\cdot|\theta)</math> με παραμέτρους <math>\theta</math> το μη γραμμικό ICA μοντέλο είναι <math>x=f(s|\theta)+n</math>.
<math>x=f(s|\theta)+n</math>.


=== Ταυτοποίηση ===
=== Ταυτοποίηση ===


Οι ανεξάρτητες συνιστώσες είναι αναγνωρίσιμες σε μια μετάθεση και κλίμακα των πηγών. Αυτή η αναγνώριση απαιτεί:
Οι ανεξάρτητες συνιστώσες είναι αναγνωρίσιμες σε μια μετάθεση και κλίμακα των πηγών. Αυτή η αναγνώριση απαιτεί:
*Το πολύ μια πηγή <math>s_k</math> να είναι Γκαουσιανη.
*Το πολύ μια πηγή <math>s_k</math> να είναι Γκαουσιανή.
*Ο αριθμός των παρατηρούμενων μίξεων,<math>m</math>, πρέπει να είναι τουλάχιστον τόσο μεγάλος όσο το πλήθος των εκτιμώμενων συνιστωσών <math>n</math>: <math>m \ge n</math>. Είναι το ίδιο να λέμε ότι ο συμπτυγμένος πινάκας <math>A</math> πρέπει να είναι πλήρης τάξεως, ώστε να υπάρχει ο αντίστροφος.
*Ο αριθμός των παρατηρούμενων μίξεων, <math>m</math>, πρέπει να είναι τουλάχιστον τόσο μεγάλος όσο το πλήθος των εκτιμώμενων συνιστωσών <math>n</math>: <math>m \ge n</math>. Ισοδύναμα, θα πρέπει ο πίνακας μίξης <math>A</math> να έχει πλήρη βαθμό (rank), ώστε να υπάρχει ο αντίστροφος.


== Δυαδική ανεξαρτησία ανάλυση συνιστωσών ==
== Δυαδική ανάλυση ανεξάρτητων συνιστωσών ==


Μια ειδική μεταβλητή της Ανάλυση Ανεξάρτητων Συνιστωσών είναι η Δυαδική Ανάλυση Ανεξάρτητων Συνιστωσών, στην οποία και οι δυο πηγές σημάτων από τις οθόνες είναι δυαδικής μορφής και οι παρατηρήσεις από τις οθόνες είναι διαζευκτικά μείγματα των δυαδικών ανεξάρτητων πηγών. Το πρόβλημα έδειξε να μην έχει εφαρμογές σε πολλούς τομείς συμπεριλαμβανόμενων των κλινικών διαγνώσεων, των πολυ-δεσμων εκχωρησεων (multi-cluster assignment), των [[δικτυακών τομογράφων]] και της [[διαχείριση πόρων διαδικτύου|διαχείρισης πόρων διαδικτύου]].
Μια ειδική παραλλαγή της Ανάλυσης Ανεξάρτητων Συνιστωσών είναι η Δυαδική Ανάλυση Ανεξάρτητων Συνιστωσών, στην οποία τόσο οι πηγές σημάτων όσο και οι παρατηρητές είναι δυαδικής μορφής, ενώ παράλληλα οι παρατηρητές είναι διαζευκτικές μίξεις ανεξάρτητων δυαδικών πηγών. Το πρόβλημα αυτό αποδείχτηκε ότι έχει εφαρμογή σε πολλούς τομείς, συμπεριλαμβανομένων των κλινικών διαγνώσεων, της πολυ-συσταδικής ανάθεσης (multi-cluster assignment), των [[δικτυακών τομογράφων]] και της [[διαχείριση πόρων διαδικτύου|διαχείρισης πόρων διαδικτύου]].


Αφήνουμε <math>{x_1, x_2, \ldots, x_m}</math> να τεθούν δυαδικές μεταβλητές από <math>m</math> οθόνες και <math>{y_1, y_2, \ldots, y_n}</math> να τεθούν από δυαδικές μεταβλητές από <math>n</math> πηγές.Οι Πηγές-οθόνες συνδέσεις παρίστανται από τον (άγνωστο) συμπτυγμένο πινάκα <math>G</math>, οπού <math>g_{ij} = 1</math> δείχνει ότι το σήμα από την ''i''-στη πηγή μπορεί να παρατηρηθεί από την ''j''-στη οθόνη. Το σύστημα δουλεύει όπως ακολούθως: οποιαδήποτε στιγμή, αν μια πηγή <math>i</math> είναι ενεργή (<math>y_i=1</math>) και συνδεθεί σε μια οθόνη <math>j</math> (<math>g_{ij}=1</math>) τοτε η οθόνη <math>j</math> θα δώσει κάποια δραστηριότητα (<math>x_j=1</math>). Τυπικά έχουμε:
Έστω <math>{x_1, x_2, \ldots, x_m}</math> το σύνολο των δυαδικών μεταβλητών από <math>m</math> παρατηρητές και <math>{y_1, y_2, \ldots, y_n}</math> το σύνολο των δυαδικών μεταβλητών από <math>n</math> πηγές. Οι συνδέσεις μεταξύ πηγών και παρατηρητών παρίστανται από τον (άγνωστο) πίνακα μίξης <math>G</math>, όπου <math>g_{ij} = 1</math> και δείχνει ότι το σήμα από την ''i''-στή πηγή μπορεί να παρατηρηθεί από τον ''j''-στό παρατηρητή. Το σύστημα δουλεύει ως ακολούθως: οποιαδήποτε στιγμή, αν μια πηγή <math>i</math> είναι ενεργή (<math>y_i=1</math>) και συνδεθεί σε έναν παρατηρητή <math>j</math> (<math>g_{ij}=1</math>) τοτε ο παρατηρητής <math>j</math> θα δώσει κάποια δραστηριότητα (<math>x_j=1</math>). Τυπικά έχουμε:


:<math>
:<math>
Γραμμή 79: Γραμμή 76:
</math>
</math>


οπού <math>\wedge</math> είναι το λογικό AND και <math>\vee</math> είναι το λογικό OR. Σημειώστε ότι ο θόρυβος δεν μοντελοποιείται ρητά ενώ μπορεί να χειριστεί σαν ανεξαρτησία πηγή.
οπού <math>\wedge</math> είναι το λογικό AND και <math>\vee</math> είναι το λογικό OR. Σημειώστε ότι ο θόρυβος δεν μοντελοποιείται ρητά ενώ μπορεί κάλλιστα να αντιμετωπιστεί σαν ανεξάρτητες πηγές.


Το παραπάνω πρόβλημα μπορεί εμπειρικά να λυθεί <ref name="Hyvärinen">[[Johan Himberg and Aapo Hyvärinen]], ''[http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.11.8895 Independent Component Analysis For Binary Data: An Experimental Study]'', Proc. Int. Workshop on Independent Component Analysis and Blind Signal Separation (ICA2001), San Diego, California, 2001.</ref> υποθέτοντας ότι οι μεταβλητές είναι συνεχόμενες και τρέχοντας τον αλγόριθμο FastICA σε δυαδικά παρατηρούμενα δεδομένα, να πάρουμε τον συμπτυγμένο πινάκα <math>G</math> (πραγματικές τιμές ), τότε εφαρμόζουμε round number τεχνικές στο <math>G</math> να συμπεριλάβουμε δυαδικές τιμές. Αυτή η προσέγγιση έδειξε ότι δίνει πολύ ανακριβή αποτελέσματα.
Το παραπάνω πρόβλημα μπορεί να λυθεί με ευριστικό τρόπο <ref name="Hyvärinen">[[Johan Himberg and Aapo Hyvärinen]], ''[http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.11.8895 Independent Component Analysis For Binary Data: An Experimental Study]'', Proc. Int. Workshop on Independent Component Analysis and Blind Signal Separation (ICA2001), San Diego, California, 2001.</ref> υποθέτοντας ότι οι μεταβλητές είναι συνεχείς και τρέχοντας τον αλγόριθμο FastICA σε δυαδικά δεδομένα παρατήρησης ώστε να πάρουμε τον πίνακα μίξης <math>G</math> (πραγματικές τιμές) και εφαρμόζοντας έπειτα round number τεχνικές στο <math>G</math> ώστε να λάβουμε τις δυαδικές τιμές. Αυτή η προσέγγιση έδειξε ότι δίνει πολύ ανακριβή αποτελέσματα.


Μια άλλη μέθοδος είναι να χρησιμοποιήσουμε δυναμικό προγραμματισμό: αναδρομικά σπάζοντας τον παρατηρούμενο πινάκα <math>X</math> σε υποπινακες και να τρέξουμε ένα συμπερασματικό αλγόριθμο σε αυτούς τους υποπινακες. Η βασική παρατήρηση η οποία οδηγεί σε αυτό τον αλγόριθμο είναι ο <math>X^0</math> του <math>X</math> όπου <math>x_{ij} = 0, \forall j</math> αντιστοιχεί στον χωρίς βάρυ παρατηρούμενο πινάκα των κρυμμένων συστατικών τα οποία δεν έχουν σύνδεση με την i-στη οθόνη. Πειραματικά αποτελέσματα από το <ref name="Huyna">[[Huy Nguyen and Rong Zheng]], ''[http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5753957 Binary Independent Component Analysis With or Mixtures]'', IEEE [[Transactions of Signal Processing]], Vol. 59, Issue 7. (July 2011), pp. 3168&ndash;3181.</ref> δείχνουν ότι αυτή η προσέγγιση είναι ακριβής κάτω από μέτρια επίπεδα θορύβου.
Μια άλλη μέθοδος είναι να χρησιμοποιήσουμε δυναμικό προγραμματισμό: σπάμε αναδρομικά τον παρατηρούμενο πίνακα <math>X</math> σε υποπίνακες και τρέχουμε ένα συμπερασματικό αλγόριθμο σε αυτούς τους υποπινακες. Η βασική παρατήρηση η οποία οδηγεί σε αυτό τον αλγόριθμο είναι ο <math>X^0</math> του <math>X</math> όπου <math>x_{ij} = 0, \forall j</math> αντιστοιχεί στον χωρίς βάρυ παρατηρούμενο πινάκα των κρυμμένων συστατικών τα οποία δεν έχουν σύνδεση με την i-στη οθόνη. Πειραματικά αποτελέσματα από το <ref name="Huyna">[[Huy Nguyen and Rong Zheng]], ''[http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=5753957 Binary Independent Component Analysis With or Mixtures]'', IEEE [[Transactions of Signal Processing]], Vol. 59, Issue 7. (July 2011), pp. 3168&ndash;3181.</ref> δείχνουν ότι αυτή η προσέγγιση είναι ακριβής κάτω από μέτρια επίπεδα θορύβου.


== Εφαρμογές ==
== Εφαρμογές ==

Έκδοση από την 19:40, 5 Μαΐου 2016

Πρότυπο:Επιστημονικό πεδίο

H Aνάλυση ανεξάρτητων συνιστωσών (Independent Component Analysis) είναι μια υπολογιστική μέθοδος για το διαχωρισμό ενός πολυμεταβλητού σήματος σε προσθετικές υποσυνιστώσες υποθέτοντας την κοινή στατιστική ανεξαρτησία της μη-Γκαουσιανής πηγής σημάτων. Είναι μια ειδική περίπτωση τυφλού χωρισμού πηγής (blind source separation).

Εισαγωγή

Όταν η υπόθεση ανεξαρτησίας είναι σωστή, ο τυφλός χωρισμός (με την Ανάλυση Ανεξάρτητων Συνιστωσών) ενός σύνθετου σήματος δίνει πολύ καλά αποτελέσματα. Επίσης χρησιμοποιείται για σήματα τα οποία υποτίθεται ότι δεν παράγονται από μίξη κάποιων σημάτων για τον σκοπό της Ανάλυσης Ανεξάρτητων Συνιστωσών. Μια απλή εφαρμογή Ανάλυσης Ανεξάρτητων Συνιστωσών είναι το πρόβλημα κοκτέιλ πάρτυ, όπου τα υποβόσκοντα σήματα ομιλίας διαχωρίζονται από δείγματα δεδομένων που αποτελούνται από ανθρώπους που μιλάνε ταυτόχρονα σε ένα δωμάτιο. Συνήθως το πρόβλημα απλοποιείται υποθέτοντας μη χρονικές καθυστερήσεις ή ηχώ. Μια σημαντική παρατήρηση για σκέψη είναι όταν Ν πηγές είναι παρούσες, χρειάζονται τουλάχιστον Ν παρατηρητές (π.χ. μικρόφωνα) για να πάρουμε τα πραγματικά σήματα. Αυτό αποτελεί την τετράγωνη περίπτωση (J = D, οπού D είναι η εισερχόμενη διάσταση δεδομένων και J η διάσταση του μοντέλου). Έχουν επίσης ερευνηθεί και περιπτώσεις όπου έχουμε υποκαθορισμό (J <  D) ή υπερκαθορισμό (J > D).

Καθορίζοντας την συνιστώσα ανεξαρτησίας

Η ανάλυση ανεξάρτητων συνιστωσών βρίσκει τις ανεξάρτητες συνιστώσες (όπως παράγοντες, λανθάνουσες μεταβλητές, πηγές) μεγιστοποιώντας τη στατιστική ανεξαρτησία των εκτιμώμενων συνιστωσών. Μπορούμε να επιλέξουμε μεταξύ πολλών τρόπων καθορισμού της ανεξαρτησίας, και αυτή η επιλογή διέπει τη μορφή του ICA αλγόριθμου. Οι δύο πιο γνωστοί καθορισμοί της ανεξαρτησίας για το ICA είναι

1) Ελαχιστοποίηση της Κοινής Πληροφορίας

2) Μεγιστοποίηση της μη-Κανονικότητας

Η ελαχιστοποίηση των Mη κοινών Πληροφοριών (Minimization of Mutual Information, MMI) αποτελεί μια οικογένεια του ICA αλγόριθμου ποι χρησιμοποιεί μετρήσεις όπως η Απόκλιση Κουλμπακ-Λάιμπερ (Kullback-Leibler) και η μέγιστη εντροπία. Η οικογένεια της Μη-Κανονικότητας (non-Gaussianity) του ICA αλγόριθμου, έχοντας παρακινηθεί από το κεντρικό οριακό θεώρημα, χρησιμοποιεί κύρτωση και αρνητική εντροπία.

Τυπικοί αλγόριθμοι για την ανάλυση ανεξάρτητων συνιστωσών χρησιμοποιούν κεντροποίηση, θορυβοποίηση (συνήθως με την αποσύνθεση ιδιοτιμών (eigenvalue decomposition)), και μείωση διάστασης (dimensionality reduction) ως βήματα προεπεξεργασίας με σκοπό να απλουστευτεί και να μειωθεί η πολυπλοκότητα του προβλήματος για πραγματικούς επαναληπτικούς αλγορίθμους. Η θορυβοποίηση και η μείωση διάστασης μπορούν να επιτευχθούν με την ανάλυση βασικών συνιστωσών (principal component analysis) ή με την Αποσύνθεση μοναδικής τιμής (singular value decomposition). Η θορυβοποίηση εξασφαλίζει την 'a priori' ίση μεταχείριση όλων των διαστάσεων πριν την εκτέλεση του αλγορίθμου. Στους αλγορίθμους ανάλυσης ανεξάρτητων συνιστωσών συμπεριλαμβάνονται οι infomax, FastICA και JADE, αλλά υπάρχουν κι άλλοι. Γενικά, η ανάλυση ανεξάρτητων συνιστωσών δεν μπορεί να εντοπίσει τον πραγματικό αριθμό των πηγαίων σημάτων, τη μοναδική σωστή σειρά των πηγαίων σημάτων, ούτε τη σωστή κλιμάκωση (συμπεριλαμβανόμενου του προσήμου) των πηγαίων σημάτων.

Η ανάλυση ανεξάρτητων συνιστωσών είναι σημαντική για τον τυφλό διαχωρισμό σήματος και έχει πολλές πρακτικές εφαρμογές. Είναι στενά συνδεδεμένη με την έρευνα για την παραγωγή ενός παραγοντικού κώδικα (factorial code) των δεδομένων, δηλ. μια καινούρια διανυσματική αναπαράσταση κάθε διανύσματος δεδομένων έτσι ώστε αυτό να κωδικοποιείται μοναδικά από το αντίστοιχο διάνυσμα κώδικα (code vector) (loss-free coding), αλλά οι συνιστώσες του κώδικα να είναι στατιστικά ανεξάρτητες.

Μαθηματικοί ορισμοί

Η γραμμική ανάλυση ανεξάρτητων συνιστωσών μπορεί να διαιρεθεί σε αθόρυβες και θορυβώδεις περιπτώσεις, όπου οι αθόρυβες ICA είναι ειδικές περιπτώσεις των θορυβωδών ICA. Η μη γραμμική ICA θα πρέπει να θεωρείται ξεχωριστή περίπτωση.

Γενικοί ορισμοί

Τα δεδομένα αναπαριστώνται από το τυχαίο διάνυσμα (random vector) και οι συνιστώσες από το τυχαίο διάνυσμα . Ο σκοπός είναι ο μετασχηματισμός των παρατηρούμενων δεδομένων , χρησιμοποιώντας ένα γραμμικό στατικό μετασχηματισμό W της μορφής

για τη μεγιστοποίηση των ανεξάρτητων συνιστωσών μετρουμένων από κάποια συνάρτηση ανεξαρτησίας .

Γενετήριο μοντέλο

Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών χωρίς θόρυβο

Οι συνιστώσες του παρατηρουμένου τυχαίου διανύσματος παράγονται ως άθροισμα των ανεξάρτητων συνιστωσών , :

σταθμισμένων από τα βάρη μίξης .

Το ίδιο μοντέλο παραγωγής μπορεί να γραφεί σε διανυσματική μορφή ως , οπού το παρατηρούμενο τυχαίο διάνυσμα παρίσταται από τα διανύσματα βάσης . Η βάση διανυσμάτων σχηματίζει τις στήλες του πίνακα μίξης και η γενετήρια φόρμουλα μπορεί να γραφτεί ως , όπου .

Δοθέντων του μοντέλου και των συσχετισμών (δείγματα) του τυχαίου διανύσματος , ο στόχος είναι να εκτιμηθούν ο πίνακας μίξης και οι πηγές . Αυτό γίνεται με προσαρμοστικό υπολογισμό των διανυσμάτων και θέτοντας μια συνάρτηση κόστους η οποία είτε θα μεγιστοποιεί τη μη κανονικότητα (non-gaussianity) του υπολογισθέντος ή θα ελαχιστοποιεί την κοινή πληροφορία. Σε μερικές περιπτώσεις μια 'a priori' γνώση της κατανομής πιθανοτήτων των πηγών μπορούν να χρησιμοποιηθούν στη συνάρτηση κόστους.

Οι αρχικές πηγές μπορούν να ανακτηθούν πολλαπλασιάζοντας τα παρατηρούμενα σήματα με τον αντίστροφο πίνακα μίξης . Εδώ θεωρείται ότι ο συμπτυγμένος πίνακας είναι τετράγωνος (). Αν ο αριθμός των διανυσμάτων βάσης είναι μεγαλύτερος από τη διάσταση των παρατηρούμενων διανυσμάτων, , ο σκοπός υπερκαλύπτεται άλλα και πάλι το πρόβλημα είναι επιλύσιμο με ψευδοαντιστροφή.

Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών με θόρυβο

Με την επιπρόσθετη υπόθεση του μηδενικού μέσου και τον ασυσχετιστικο Γκαουσιανό θόρυβο , η Ανάλυση Ανεξάρτητων Συνιστωσών παίρνει τη μορφή .

Μη Γραμμική Ανάλυση Ανεξάρτητων Συνιστωσών

Η μίξη των πηγών δε χρειάζεται να είναι γραμμική. Χρησιμοποιώντας μια μη γραμμική συμπτυγμένη συνάρτηση με παραμέτρους το μη γραμμικό ICA μοντέλο είναι .

Ταυτοποίηση

Οι ανεξάρτητες συνιστώσες είναι αναγνωρίσιμες σε μια μετάθεση και κλίμακα των πηγών. Αυτή η αναγνώριση απαιτεί:

  • Το πολύ μια πηγή να είναι Γκαουσιανή.
  • Ο αριθμός των παρατηρούμενων μίξεων, , πρέπει να είναι τουλάχιστον τόσο μεγάλος όσο το πλήθος των εκτιμώμενων συνιστωσών : . Ισοδύναμα, θα πρέπει ο πίνακας μίξης να έχει πλήρη βαθμό (rank), ώστε να υπάρχει ο αντίστροφος.

Δυαδική ανάλυση ανεξάρτητων συνιστωσών

Μια ειδική παραλλαγή της Ανάλυσης Ανεξάρτητων Συνιστωσών είναι η Δυαδική Ανάλυση Ανεξάρτητων Συνιστωσών, στην οποία τόσο οι πηγές σημάτων όσο και οι παρατηρητές είναι δυαδικής μορφής, ενώ παράλληλα οι παρατηρητές είναι διαζευκτικές μίξεις ανεξάρτητων δυαδικών πηγών. Το πρόβλημα αυτό αποδείχτηκε ότι έχει εφαρμογή σε πολλούς τομείς, συμπεριλαμβανομένων των κλινικών διαγνώσεων, της πολυ-συσταδικής ανάθεσης (multi-cluster assignment), των δικτυακών τομογράφων και της διαχείρισης πόρων διαδικτύου.

Έστω το σύνολο των δυαδικών μεταβλητών από παρατηρητές και το σύνολο των δυαδικών μεταβλητών από πηγές. Οι συνδέσεις μεταξύ πηγών και παρατηρητών παρίστανται από τον (άγνωστο) πίνακα μίξης , όπου και δείχνει ότι το σήμα από την i-στή πηγή μπορεί να παρατηρηθεί από τον j-στό παρατηρητή. Το σύστημα δουλεύει ως ακολούθως: οποιαδήποτε στιγμή, αν μια πηγή είναι ενεργή () και συνδεθεί σε έναν παρατηρητή () τοτε ο παρατηρητής θα δώσει κάποια δραστηριότητα (). Τυπικά έχουμε:

οπού είναι το λογικό AND και είναι το λογικό OR. Σημειώστε ότι ο θόρυβος δεν μοντελοποιείται ρητά ενώ μπορεί κάλλιστα να αντιμετωπιστεί σαν ανεξάρτητες πηγές.

Το παραπάνω πρόβλημα μπορεί να λυθεί με ευριστικό τρόπο [1] υποθέτοντας ότι οι μεταβλητές είναι συνεχείς και τρέχοντας τον αλγόριθμο FastICA σε δυαδικά δεδομένα παρατήρησης ώστε να πάρουμε τον πίνακα μίξης (πραγματικές τιμές) και εφαρμόζοντας έπειτα round number τεχνικές στο ώστε να λάβουμε τις δυαδικές τιμές. Αυτή η προσέγγιση έδειξε ότι δίνει πολύ ανακριβή αποτελέσματα.

Μια άλλη μέθοδος είναι να χρησιμοποιήσουμε δυναμικό προγραμματισμό: σπάμε αναδρομικά τον παρατηρούμενο πίνακα σε υποπίνακες και τρέχουμε ένα συμπερασματικό αλγόριθμο σε αυτούς τους υποπινακες. Η βασική παρατήρηση η οποία οδηγεί σε αυτό τον αλγόριθμο είναι ο του όπου αντιστοιχεί στον χωρίς βάρυ παρατηρούμενο πινάκα των κρυμμένων συστατικών τα οποία δεν έχουν σύνδεση με την i-στη οθόνη. Πειραματικά αποτελέσματα από το [2] δείχνουν ότι αυτή η προσέγγιση είναι ακριβής κάτω από μέτρια επίπεδα θορύβου.

Εφαρμογές

Η ανάλυση ανεξάρτητων συνιστωσών μπορεί να επεκταθεί στην ανάλυση μη φυσικών σημάτων (non-physical signals). Για παράδειγμα η ανάλυση ανεξάρτητων συνιστωσών, έχει εφαρμοστεί να ανακαλύψει τα θέματα συζητήσεων σε μια λίστα φακέλων.

Δείτε επίσης

Πηγές

  1. Johan Himberg and Aapo Hyvärinen, Independent Component Analysis For Binary Data: An Experimental Study, Proc. Int. Workshop on Independent Component Analysis and Blind Signal Separation (ICA2001), San Diego, California, 2001.
  2. Huy Nguyen and Rong Zheng, Binary Independent Component Analysis With or Mixtures, IEEE Transactions of Signal Processing, Vol. 59, Issue 7. (July 2011), pp. 3168–3181.

Αναφορές

Εξωτερικοί σύνδεσμοι