Αναγνώριση προτύπων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση
Αναγνώριση Προτύπων
Ταξινόμηση
Dewey 004
MSC2010 68Txx

Η αναγνώριση προτύπων (Pattern Recognition) είναι ένα επιστημονικό πεδίο με στόχο την ανάπτυξη αλγορίθμων για την αυτοματοποιημένη απόδοση κάποιας τιμής ή διακριτικού στοιχείου σε εισαγόμενα δεδομένα, συνήθως κωδικοποιημένα ως αλληλουχίες αριθμών. Κατ' αυτόν τον τρόπο, ενδεικτικά, τα δεδομένα αυτόματα ταξινομούνται σε κατηγορίες ή διαχωρίζονται σε ομάδες με βάση κάποια κριτήρια, ακόμα και υπό την παρουσία θορύβου ο οποίος δυσκολεύει την αναγνώριση, ωθώντας συνήθως τα δεδομένα να μοιάζουν περισσότερο τυχαία απ' όσο πραγματικά είναι. Το ερευνητικό ενδιαφέρον για την αναγνώριση προτύπων έχει τις ρίζες του στη δεκαετία του 1960, κατά την πρώτη περίοδο ανάπτυξης της πληροφορικής και, ειδικότερα, της τεχνητής νοημοσύνης.

Οι άνθρωποι και οι ευφυείς οργανισμοί έχουν την ικανότητα να ταυτοποιούν πραγματικά δεδομένα χρησιμοποιώντας τις αισθήσεις τους και την αντιληπτική τους ικανότητα προκειμένου να λάβουν τις κατάλληλες αποφάσεις ώστε να επιβιώσουν στο περιβάλλον τους. Μία μηχανή, όπως ένας ηλεκτρονικός υπολογιστής, πρέπει να εκπαιδευθεί κατάλληλα ώστε να αναγνωρίζει πρότυπα (patterns) και να τα κατηγοριοποιεί αυτόματα σε κατηγορίες. Ανάλογα με την εφαρμογή, γίνεται κατάταξη των αντικειμένων σε κλάσεις με τη βοήθεια αλγορίθμων ταξινόμησης.

Με βάση το θεωρητικό υπόβαθρο που παρείχε η επιστήμη της στατιστικής, η πρώιμη έρευνα επί της αναγνώρισης προτύπων επικεντρώθηκε στην ανάπτυξη θεωρητικών μεθόδων. Μετά το 1970 έγιναν προσπάθειες για την ταχύτερη εξέλιξη του τομέα, ενώ το 1976 ιδρύθηκε η Διεθνής Ένωση Αναγνώρισης Προτύπων (IARP). Σήμερα, αλγόριθμοι αναγνώρισης προτύπων εφαρμόζονται σε αρκετές επιστήμες, όπως π.χ. στην ιατρική (βιοϊατρική τεχνολογία, ανάλυση δεδομένων DNA και άλλες εφαρμογές της βιοπληροφορικής), ή σε άλλα πεδία της πληροφορικής και της επιστήμης ηλεκτρονικού μηχανικού, όπως η μηχανική όραση και η ρομποτική. Η ίδια η αναγνώριση προτύπων επικαλύπτεται σημαντικά με συγγενή, επιμέρους πεδία της τεχνητής νοημοσύνης όπως η μηχανική μάθηση και η εξόρυξη δεδομένων.

Σύστημα μηχανικής μάθησης[Επεξεργασία | επεξεργασία κώδικα]

δείτε επίσης: Μηχανική μάθηση

Η μηχανική μάθηση αναφέρεται στον σχεδιασμό αλγορίθμων για τη δημιουργία ενός αυτόματου συστήματος που θα αποκτά γνώση βασιζόμενο σε εμπειρικά δεδομένα. Η έννοια της επιβλεπόμενης μάθησης έχει ιδιαίτερη σημασία. Δεδομένης μίας υπάρχουσας συλλογής αντικειμένων για τα οποία είναι γνωστή κλάση (ή κατηγορία) στόχος είναι να βρεθεί μία συνάρτηση μεταβλητών που θα περιγράφει το μοντέλο της κλάσης. Η επιτυχία πρόβλεψης αξιολογείται με ένα νέο σύνολο δεδομένων.

Βασική ορολογία[Επεξεργασία | επεξεργασία κώδικα]

  • Σύνολο Εκπαίδευσης: Σύνολο εισαγόμενων δεδομένων στο οποίο έχουν εκχωρηθεί εκ των προτέρων ετικέτες.
  • Στιγμιότυπο: Εισαγόμενο αντικείμενο στο οποίο αναμένουμε να αποδοθεί μία τιμή από το σύστημα.
  • Γνώρισμα: Χαρακτηριστικό του στιγμιότυπου βάσει του οποίου θα γίνει η ταξινόμηση των νέων αντικειμένων.

Τυπική Διαδικασία[Επεξεργασία | επεξεργασία κώδικα]

  1. Kαθορισμός τύπου δεδομένων.
  2. Δημιουργία συνόλου εκπαίδευσης.
    Το σύνολο εκπαίδευσης πρέπει να είναι αντιπροσωπευτικό της πραγματικής φύσης του προβλήματος. Από μετρήσεις ή εξωτερική ανθρώπινη παρέμβαση αναθέτουμε στα δεδομένα του σώματος τις ετικέτες.
  3. Επιλογή κατάλληλων γνωρισμάτων.
    Μετατρέπουμε κάθε νέο αντικείμενο σε διάνυσμα γνωρισμάτων προκείμενου να ακολουθήσει η ταξινόμησή του. Είναι σημαντικό να επιλεγούν τα γνωρίσματα εκείνα που περιέχουν την απαραίτητη πληροφορία για την σωστή ανάθεση κλάσης ενώ παράλληλα ο αριθμός τους πρέπει να είναι διαχειρίσιμος υπολογιστικά. Επίσης πρέπει να γνωρίζουμε τον τύπο τιμής κάθε ιδιότητας (ονομαστικής (nominal), τακτικής (ordinal), αναλογικής (ratio)).
  4. Επιλογή αλγορίθμου εκπαίδευσης.
    Υπάρχει πληθώρα αλγορίθμων και η επιλογή πρέπει να γίνει ανάλογα με το ποιος κρίνεται πιο αποδοτικός για τη συγκεκριμένη κατηγορία προβλημάτων.
  5. Αξιολόγηση της διαδικασίας.
    Mετά την ολοκλήρωση της εκπαίδευσης η ακρίβεια της παραγόμενης σχέσης θα πρέπει να αξιολογηθεί με ένα σύνολο αξιολόγησης.

Αλγόριθμοι[Επεξεργασία | επεξεργασία κώδικα]

Οι αλγόριθμοι για την αναγνώριση προτύπων εξαρτώνται από τον τύπο της εξόδου, σχετικά με το εάν η μάθηση υπό επίβλεψη ή χωρίς και με το εάν ο αλγόριθμος είναι στατιστικά ή μη στη φύση. Οι στατιστικοί αλγόριθμοι μπορούν να κατηγοριοποιηθούν περαιτέρω ως παραγωγικοί ή διακριτικοί.

Ταξινόμησης[Επεξεργασία | επεξεργασία κώδικα]

Αντιμετωπίζουν το πρόβλημα κατάταξης νέων αντικειμένων ή παρατηρήσεων (labeling) σε ήδη υπάρχουσες υποομάδες ενός δεδομένου συνόλου αντικειμένων (επιβλεπόμενη μάθηση).

Ομαδοποίησης[Επεξεργασία | επεξεργασία κώδικα]

Αντιμετωπίζουν το πρόβλημα διαχωρισμού ενός υπάρχοντος συνόλου αντικειμένου σε κατηγορίες (clusters) με βάση κριτήρια ομοιότητας (ανεπίβλεπτη μάθηση).

Παλινδρόμησης[Επεξεργασία | επεξεργασία κώδικα]

Προβλέπουν την τιμή μίας μεταβλητής συνεχών τιμών συναρτήσει άλλων μεταβλητών.

Επιβλεπόμενη:

Μη επιβλεπόμενη:

Κατηγορηματικοί αλγόριθμοι επισήμανσης ακολουθίας[Επεξεργασία | επεξεργασία κώδικα]

Επιβλεπόμενοι:

Ανεπίβλεπτοι:

  • Μαρκοβιανά Μοντέλα

Αλγόριθμοι Συντακτικής ανάλυσης (προβλέπουν ετικέτες δενδρικής δομής)[Επεξεργασία | επεξεργασία κώδικα]

Επιβλεπόμενοι και μη επιβλεπόμενοι:

Γενικοί αλγόριθμοι για την πρόβλεψη αυθαίρετα δομημένων ετικετών[Επεξεργασία | επεξεργασία κώδικα]

Αλγόριθμοι συλλογικής μάθησης[Επεξεργασία | επεξεργασία κώδικα]

Δείτε επίσης[Επεξεργασία | επεξεργασία κώδικα]

Αναφορές[Επεξεργασία | επεξεργασία κώδικα]

This article is based on material taken from the Free On-line Dictionary of Computing prior to 1 November 2008 and incorporated under the "relicensing" terms of the GFDL, version 1.3 or later.

Βιβλιογραφία[Επεξεργασία | επεξεργασία κώδικα]

  • Fukunaga, Keinosuke (1990). Introduction to Statistical Pattern Recognition (2nd έκδοση). Boston: Academic Press. ISBN 0-12-269851-7. 
  • Bishop, Christopher (2006). Pattern Recognition and Machine Learning. Berlin: Springer. ISBN 0-387-31073-8. 
  • Koutroumbas, Konstantinos; Theodoridis, Sergios (2008). Pattern Recognition (4th έκδοση). Boston: Academic Press. ISBN 1-59749-272-8. 
  • Hornegger, Joachim; Paulus, Dietrich W. R. (1999). Applied Pattern Recognition: A Practical Introduction to Image and Speech Processing in C++ (2nd έκδοση). San Francisco: Morgan Kaufmann Publishers. ISBN 3-528-15558-2. 
  • Schuermann, Juergen (1996). Pattern Classification: A Unified View of Statistical and Neural Approaches. New York: Wiley. ISBN 0-471-13534-8. 
  • Godfried T. Toussaint, επιμ. (1988). Computational Morphology. Amsterdam: North-Holland Publishing Company. 
  • Kulikowski, Casimir A.; Weiss, Sholom M. (1991). Computer Systems That Learn: Classification and Prediction Methods from Statistics, Neural Nets, Machine Learning, and Expert Systems. Machine Learning. San Francisco: Morgan Kaufmann Publishers. ISBN 1-55860-065-5. 

Εξωτερικοί Σύνδεσμοι[Επεξεργασία | επεξεργασία κώδικα]