Αναγνώριση προτύπων
| Ταξινόμηση | |
|---|---|
| Dewey | 004 |
| MSC2010 | 68Txx |
Η Αναγνώριση Προτύπων (Pattern Recognition) είναι μία επιστημονική περιοχή που έχει στόχο την απόδοση κάποιας τιμής ή διακριτικού στοιχείου σε εισαγόμενα δεδομένα.
Οι άνθρωποι και τα άλλα όντα έχουν την ικανότητα να ταυτοποιούν πραγματικά δεδομένα χρησιμοποιώντας τις αισθήσεις τους και την αντιληπτική τους ικανότητα (cognition) προκειμένου να λάβουν τις κατάλληλες αποφάσεις ώστε να επιβιώσουν στο περιβάλλον τους.
Μία μηχανή, όπως ένας ηλεκτρονικός υπολογιστής, πρέπει να εκπαιδευθεί κατάλληλα ώστε να αναγνωρίζει πρότυπα (patterns) και να τα κατηγοριοποιεί αυτόματα σε κατηγορίες.
Ανάλογα με την εφαρμογή γίνεται κατάταξη των αντικειμένων σε κλάσεις με τη βοήθεια αλγορίθμων ταξινόμησης.
Το ερευνητικό ενδιαφέρον για αυτά τα ζητήματα ξεκίνησε από τη δεκαετία του 1960, κατά την πρώτη περίοδο της ανάπτυξης της επιστήμης των υπολογιστών. Βασιζόμενη στο θεωρητικό υπόβαθρο που παρείχε η επιστήμη της Στατιστικής, η πρώιμη έρευνα επικεντρώθηκε στην ανάπτυξη θεωρητικών μεθόδων. Ήδη από το 1970 γίνονταν προσπάθειες για την καλύτερη κατεύθυνση των προσπαθειών και το 1976 ιδρύεται η Παγκόσμια Ένωση για την Αναγνώριση Προτύπων (IARP).
Σε πολλά επιστημονικά πεδία αξιοποιούνται εφαρμογές της αναγνώρισης προτύπων, όπως στην Ιατρική (υποβοηθούμενη από Η/Υ διάγνωση, ανάλυση δεδομένων DNA και άλλες εφαρμογές της βιοπληροφορικής) και την επιστήμη υπολογιστών (υπολογιστική όραση, αναγνώριση χαρακτήρων ή φωνής, νευρωνικά δίκτυα, εξόρυξη δεδομένων και ανάκτηση γνώσης, τεχνητή νοημοσύνη και μηχανική μάθηση, συστήματα υποστήριξης αποφάσεων). Στον σύγχρονο κόσμο, πολλές βιομηχανικές εφαρμογές ενσωματώνουν ανάλογα συστήματα για την αποδοτική και αυτόματη επεξεργασία πληροφοριών.
Σύστημα Μηχανικής Μάθησης [Επεξεργασία]
- δείτε επίσης: Μηχανική μάθηση
Η μηχανική μάθηση (machine learning) αναφέρεται στον σχεδιασμό αλγορίθμων για τη δημιουργία ενός αυτόματου συστήματος που θα αποκτά γνώση βασιζόμενο σε εμπειρικά δεδομένα.
Η έννοια της επιβλεπόμενης μάθησης έχει ιδιαίτερη σημασία. Δεδομένης μίας υπάρχουσας συλλογής αντικειμένων για τα οποία είναι γνωστή κλάση (ή κατηγορία) στόχος είναι να βρεθεί μία συνάρτηση μεταβλητών που θα περιγράφει το μοντέλο της κλάσης. Η επιτυχία πρόβλεψης αξιολογείται με ένα νέο σύνολο δεδομένων.
Βασική Ορολογία [Επεξεργασία]
- Σώμα ή Σύνολο Εκπαίδευσης (training set): Σύνολο εισαγόμενων δεδομένων στο οποίο έχουν εκχωρηθεί εκ των προτέρων ετικέτες (labels).
- Στιγμιότυπο (instance): Εισαγόμενο αντικείμενο στο οποίο αναμένουμε να αποδοθεί μία τιμή από το σύστημα.
- Χαρακτηριστικό ή Ιδιότητα (attribute): Γνώρισμα του στιγμιότυπου βάσει του οποίου θα γίνει η ταξινόμηση των νέων αντικειμένων.
Τυπική Διαδικασία [Επεξεργασία]
- Kαθορισμός τύπου δεδομένων.
- Δημιουργία σώματος εκπαίδευσης.
Το σώμα εκπαίδευσης πρέπει να είναι αντιπροσωπευτικό της πραγματικής φύσης του προβλήματος. Από μετρήσεις ή εξωτερική ανθρώπινη παρέμβαση αναθέτουμε στα δεδομένα του σώματος τις ετικέτες. - Επιλογή κατάλληλων χαρακτηριστικών.
Μετατρέπουμε κάθε νέο αντικείμενο σε διάνυσμα χαρακτηριστικών(input vector) προκείμενου να ακολουθήσει η ταξινόμησή του. Είναι σημαντικό να επιλεγούν τα γνωρίσματα εκείνα που περιέχουν την απαραίτητη πληροφορία για την σωστή ανάθεση κλάσης ενώ παράλληλα ο αριθμός τους πρέπει να είναι διαχειρίσιμος υπολογιστικά. Επίσης πρέπει να γνωρίζουμε τον τύπο τιμής κάθε ιδιότητας (ονομαστικής (nominal), τακτικής (ordinal), αναλογικής (ratio)). - Επιλογή αλγορίθμου εκπαίδευσης.
Υπάρχει πληθώρα αλγορίθμων και η επιλογή πρέπει να γίνει ανάλογα με το ποιος κρίνεται πιο αποδοτικός για τη συγκεκριμένη κατηγορία προβλημάτων. - Αξιολόγηση της διαδικασίας.
Mετά την ολοκλήρωση της εκπαίδευσης η ακρίβεια της παραγόμενης σχέσης θα πρέπει να αξιολογηθεί με ένα σύνολο αξιολόγησης (evaluation set).
Αλγόριθμοι [Επεξεργασία]
Οι αλγόριθμοι για την αναγνώριση προτύπων εξαρτώνται από τον τύπο της εξόδου, σχετικά με το εάν η μάθηση υπό επίβλεψη ή χωρίς και με το εάν ο αλγόριθμος είναι στατιστικά ή μη στη φύση. Οι στατιστικοί αλγόριθμοι μπορούν να κατηγοριοποιηθούν περαιτέρω ως παραγωγικοί ή διακριτικοί.
Κατηγοριοποίησης (classification) [Επεξεργασία]
Αντιμετωπίζουν το πρόβλημα κατάταξης νέων αντικειμένων ή παρατηρήσεων (labeling) σε ήδη υπάρχουσες υποομάδες ενός δεδομένου συνόλου αντικειμένων (επιβλεπόμενη μάθηση).
- Ταξινομητής μέγιστης εντροπίας: Σημειώστε ότι η λογιστική παλινδρόμηση είναι ένας αλγόριθμος για ταξινόμηση παρά την ονομασία του. (Το όνομα προέρχεται από το γεγονός ότι η λογιστική παλινδρόμηση χρησιμοποιεί μια επέκταση ενός γραμμικκού μοντέλου παλινδρόμησης για να μοντελοποιήσει την πιθανότητα μιας εισόδου να ανήκει σε μια συγκεκριμένη κλάση.)
- Ταξινομητής Naive Bayes
- Δέντρα αποφάσεων, λίστες αποφάσεων
- Διάνυσμα υποστήριξης μηχανής (Support Vector Machines - SVM)
- Αλγόριθμοι εκτίμησης πυρήνα και K-κοντινότερου γείτονα
- Perceptron
- Νευρωνικά δίκτυα (perceptron πολλών επιπέδων)
Συσταδοποίησης (clustering) [Επεξεργασία]
Αντιμετωπίζουν το πρόβλημα διαχωρισμού ενός υπάρχοντος συνόλου αντικειμένου σε κατηγορίες (clusters) με βάση κριτήρια ομοιότητας (μη επιβλεπόμενη μάθηση).
- Κατηγορηματικά ανάμικτα μοντέλα
- K-μέσων συσταδοποίηση
- Ιεραρχική συσταδοποίηση
- Ανάλυση κύριου συστατικού του πυρήνα (Kernel PCA)
Παλινδρόμησης [Επεξεργασία]
Προβλέπουν την τιμή μίας μεταβλητής συνεχών τιμών συναρτήσει άλλων μεταβλητών.
Επιβλεπόμενη:
Μη επιβλεπόμενη:
- Ανάλυση κύριων συνιστωσών (Principal component analysis - PCA)
- Ανάλυση ανεξάρτητων συνιστωσών (Independent component analysis - ICA)
Κατηγορηματικοί αλγόριθμοι επισήμανσης ακολουθίας [Επεξεργασία]
Επιβλεπόμενοι:
- Κρυμμένα μοντέλα Markov (Hidden Markov models - HMMs)
- [[Μοντέλα μέγιστης εντροπίας Markov (Maximum entropy Markov models - MEMMs)
- [[Τυχαία υπό συνθήκη (Conditional random fields - CRFs)
Μη επιβλεπόμενοι: Κρυμμένα μοντέλα Markov (Hidden Markov models - HMMs)
Αλγόριθμοι Συντακτικής ανάλυσης (προβλέπουν ετικέτες δενδρικής δομής) [Επεξεργασία]
Επιβλεπόμενοι και μη επιβλεπόμενοι:
Γενικοί αλγόριθμοι για την πρόβλεψη αυθαίρετα δομημένων ετικετών [Επεξεργασία]
Αλγόριθμοι συλλογικής μάθησης [Επεξεργασία]
- Bootstrap aggregating ("bagging")
- Ενίσχυση (Boosting)
- Ensemble averaging
Δείτε επίσης [Επεξεργασία]
Αναφορές [Επεξεργασία]
This article is based on material taken from the Free On-line Dictionary of Computing prior to 1 November 2008 and incorporated under the "relicensing" terms of the GFDL, version 1.3 or later.
Βιβλιογραφία [Επεξεργασία]
- Fukunaga, Keinosuke (1990). Introduction to Statistical Pattern Recognition (2nd έκδοση). Boston: Academic Press. ISBN 0-12-269851-7.
- Bishop, Christopher (2006). Pattern Recognition and Machine Learning. Berlin: Springer. ISBN 0-387-31073-8.
- Koutroumbas, Konstantinos; Theodoridis, Sergios (2008). Pattern Recognition (4th έκδοση). Boston: Academic Press. ISBN 1-59749-272-8.
- Hornegger, Joachim; Paulus, Dietrich W. R. (1999). Applied Pattern Recognition: A Practical Introduction to Image and Speech Processing in C++ (2nd έκδοση). San Francisco: Morgan Kaufmann Publishers. ISBN 3-528-15558-2.
- Schuermann, Juergen (1996). Pattern Classification: A Unified View of Statistical and Neural Approaches. New York: Wiley. ISBN 0-471-13534-8.
- Godfried T. Toussaint, επιμ. (1988). Computational Morphology. Amsterdam: North-Holland Publishing Company.
- Kulikowski, Casimir A.; Weiss, Sholom M. (1991). Computer Systems That Learn: Classification and Prediction Methods from Statistics, Neural Nets, Machine Learning, and Expert Systems. Machine Learning. San Francisco: Morgan Kaufmann Publishers. ISBN 1-55860-065-5.