Εξαγωγή χαρακτηριστικών

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Στη μηχανική μάθηση, την αναγνώριση προτύπων και την επεξεργασία εικόνας, η εξαγωγή χαρακτηριστικών ξεκινά από ένα αρχικό σύνολο δεδομένων και δημιουργεί παράγωγες τιμές (χαρακτηριστικά) που προορίζονται να είναι ενημερωτικές και μη περιττές, διευκολύνοντας τα επόμενα βήματα εκμάθησης και γενίκευσης -σε ορισμένες περιπτώσεις μάλιστα, οδηγεί στην καλύτερη ανθρώπινη ερμηνεία των δεδομένων. Η εξαγωγή χαρακτηριστικών σχετίζεται με τη διαδικασία μείωσης διαστάσεων .[1]

Όταν τα δεδομένα εισόδου προς επεξεργασία σε έναν αλγόριθμο είναι πολύ μεγάλα τω πλήθος και υπάρχει υποψία ότι είναι περιττά (π.χ. η ίδια μέτρηση σε πόδια και σε μέτρα ή η επαναλαμβανόμενη εικόνα που παρουσιάζεται ως εικονοστοιχεία), τότε μπορεί να μετατραπεί σε ένα σύνολο το οποίο αποτελείται από μειωμένα χαρακτηριστικά (ονομάζεται επίσης διάνυσμα χαρακτηριστικών). Ο προσδιορισμός ενός υποσυνόλου των αρχικών χαρακτηριστικών ονομάζεται επιλογή χαρακτηριστικών .[2] Τα επιλεγμένα χαρακτηριστικά αναμένεται να περιέχουν το απαραίτητο ποσό πληροφορίας από τα δεδομένα εισόδου, ούτως ώστε η επιθυμητή εργασία να μπορεί να εκτελεστεί χρησιμοποιώντας αυτήν τη μειωμένη αναπαράσταση αντί για τα πλήρη αρχικά δεδομένα εισόδου.

Γενικά[Επεξεργασία | επεξεργασία κώδικα]

Η εξαγωγή χαρακτηριστικών περιλαμβάνει τη μείωση του αριθμού των πόρων πληροφορίας που απαιτούνται για την περιγραφή ενός μεγάλου συνόλου δεδομένων. Κατά την εκτέλεση ανάλυσης πολύπλοκων δεδομένων, ένα από τα κύρια προβλήματα πηγάζει από τον αριθμό των μεταβλητών που εμπλέκονται. Η ανάλυση με μεγάλο αριθμό μεταβλητών απαιτεί γενικά μεγάλη ποσότητα μνήμης και υπολογιστικής ισχύος, καθώς επίσης μπορεί να προκαλέσει και την υπερπροσαρμογή ενός αλγόριθμου ταξινόμησης ή καιπαλινδρόμησης σε δείγματα εκπαίδευσης και τη γενίκευση του σε νέα δείγματα με λάθος τρόπο. Η εξαγωγή χαρακτηριστικών είναι ένας γενικός όρος για μεθόδους κατασκευής συνδυασμών των μεταβλητών για την αντιμετώπιση αυτών των προβλημάτων, ενώ παράλληλα περιγράφουν τα δεδομένα με επαρκή ακρίβεια. Πολλοί ερευνητές κι επαγγελματίες της μηχανικής μάθησης πιστεύουν ότι η ορθά βελτιστοποιημένη εξαγωγή χαρακτηριστικών είναι το κλειδί για την αποτελεσματική κατασκευή μοντέλων μηχανικής μάθησης.[3]

Τα αποτελέσματα μπορούν να βελτιωθούν χρησιμοποιώντας σύνολα χαρακτηριστικών τα οποία εξαρτώνται από την εφαρμογή που εξετάζουμε και συνήθως δημιουργούνται με τη βοήθεια ενόςειδικού. Μια τέτοια διαδικασία ονομάζεται μηχανική χαρακτηριστικών . Εναλλακτικά, χρησιμοποιούνται τεχνικές γενικής μείωσης διαστάσεων όπως:

Επεξεργασία εικόνας[Επεξεργασία | επεξεργασία κώδικα]

Ένας πολύ σημαντικός τομέας εφαρμογής τεχνικών εξαγωγής χαρακτηριστικλων είναι η επεξεργασία εικόνας, στην οποία χρησιμοποιούνται αλγόριθμοι για τον εντοπισμό και την απομόνωση διαφόρων επιθυμητών τμημάτων ή σχημάτων (χαρακτηριστικών) μιας ψηφιοποιημένης ροής εικόνας ή βίντεο. Είναι ιδιαίτερα σημαντικό στον τομέα της οπτικής αναγνώρισης χαρακτήρων .

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. Sarangi, Susanta; Sahidullah, Md; Saha, Goutam (September 2020). «Optimization of data-driven filterbank for automatic speaker verification». Digital Signal Processing 104: 102795. doi:10.1016/j.dsp.2020.102795. 
  2. Alpaydin, Ethem (2010). Introduction to Machine Learning. London: The MIT Press. σελ. 110. ISBN 978-0-262-01243-0. Ανακτήθηκε στις 4 Φεβρουαρίου 2017. 
  3. «Its all about the features». Reality AI Blog. Σεπτεμβρίου 2017. Αρχειοθετήθηκε από το πρωτότυπο στις 18 Αυγούστου 2019. Ανακτήθηκε στις 17 Απριλίου 2022.