Αυτόματη Ανάκτηση Εικόνων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση

Η Αυτόματη Ανάκτηση Εικόνων (ΑΑΕ) (αγγλ.: Content-based image retrieval (CBIR)) είναι η εφαρμογή τεχνικών υπολογιστικής όρασης με σκοπό την επίλυση του προβλήματος της ανάκτησης εικόνων, δηλαδή την αναζήτηση ψηφιακών εικόνων σε μεγάλες βάσεις δεδομένων.

Ιστορικό[Επεξεργασία | επεξεργασία κώδικα]

Η πρώτη χρήση του όρου Αυτόματη Ανάκτηση Εικόνων έγινε από τον Kato [1992] για να περιγράψει τα πειράματά του πάνω στην αυτόματη ανάκτηση εικόνων βάσει χρώματος και σχήματος από μία βάση δεδομένων. Ο όρος χρησιμοποιείται ευρέως από τότε για να περιγράψει τη διαδικασία της ανάκτησης επιθυμητών εικόνων από μία μεγάλη συλλογή βάσει συγκεκριμένων χαρακτηριστικών τα οποία εξάγονται αυτόματα από τις ίδιες τις εικόνες[1].

Τεχνική Περιγραφή[Επεξεργασία | επεξεργασία κώδικα]

Υπάρχει ένα αυξανόμενο ενδιαφέρον στην ΑΑΕ εξαιτίας των περιορισμών που ενυπάρχουν σε συστήματα που βασίζονται σε μεταδεδομένα καθώς και στο μεγάλο εύρος πιθανών χρήσεων στην αποτελεσματική ανάκτηση εικόνων. Πληροφορίες σε κείμενο μπορούν εύκολα να αναζητηθούν με την υπάρχουσα τεχνολογία, αλλά απαιτούν ανθρώπινη παρέμβαση για την περιγραφή κάθε εικόνας στη συλλογή. Αυτό δεν είναι πρακτικό σε πολύ μεγάλες βάσεις δεδομένων ή σε εικόνες που έχουν παραχθεί αυτόματα π.χ. από κάμερες παρακολούθησης. Επίσης, είναι δυνατόν να αγνοηθούν εικόνες που χρησιμοποιούν διαφορετικά συνώνυμα στην περιγραφή τους. Τα συστήματα που βασίζονται στην κατηγοριοποίηση των εικόνων σε σημασιολογικές κλάσεις όπως «cat» σαν υποκλάση του «animal» δεν παρουσιάζουν αυτό το πρόβλημα αλλά συνεχίζουν να μην είναι πρακτικά όσο μεγαλώνει η βάση δεδομένων.

Πιθανές εφαρμογές της ΑΑΕ περιλαμβάνουν:

  • Συλλογές έργων τέχνης
  • Φωτογραφικά αρχεία
  • Καταλόγους λιανικής
  • Ιατρική διάγνωση
  • Πρόληψη εγκληματικότητας
  • Στρατιωτικές εφαρμογές
  • Πνευματική ιδιοκτησία
  • Αρχιτεκτονική και τεχνική σχεδίαση
  • Σύστημα Γεωγραφικών Πληροφοριών και συστήματα τηλεπισκόπησης

Υπολογιστικά Συστήματα ΑΑΕ[Επεξεργασία | επεξεργασία κώδικα]

  • University of Washington FIDS Demo[2]
  • CIRES: Content Based Image Retrieval System[3]
  • isk-daemon: Ένας εξυπηρετητής βασισμένος σε λογισμικό ανοιχτού κώδικα με δυνατότητα προσθήκης αναζήτησης εικόνας με βάση το περιεχόμενο σε ιστοσελίδες ή λογισμικό που σχετίζονται με τη φωτογραφία.[4]
  • Impezzeo Image Suite Visual Search http://www.imprezzeo.com
  • LTU-Corbis Visual Search[5]
  • TinEye[6]
  • Cortina [7]
  • Octagon[8]
  • Windsurf[9]
  • Visual recognition factory [10]
  • IMMENSELAB http://www.immenselab.com[11]

Τεχνικές ΑΑΕ[Επεξεργασία | επεξεργασία κώδικα]

Παρότι έχει αναπτυχθεί μεγάλος αριθμός συστημάτων ΑΑΕ, το πρόβλημα της ανάκτησης εικόνας βάσει του περιεχόμενού της παραμένει. Παρακάτω αναφέρονται οι κύριες τεχνικές που τα συστήματα ΑΑΕ χρησιμοποιούν.

Τεχνικές Αναζήτησης[Επεξεργασία | επεξεργασία κώδικα]

Αναζήτηση εικόνων σε συστήματα ΑΑΕ παραδοσιακά πραγματοποιείται χρησιμοποιώντας μία εικόνα ως δείγμα. Σκοπός τότε του συστήματος είναι να καθορίσει ποιες εικόνες ταιριάζουν περισσότερο στο δείγμα. Αυτή η προσέγγιση γενικά είναι γνωστή ως "αναζήτηση βάση παραδείγματος"[12].

Το σημασιολογικό κενό[Επεξεργασία | επεξεργασία κώδικα]

Οι άνθρωποι τείνουν να χρησιμοποιούν υψηλού επιπέδου χαρακτηριστικά ή έννοιες όπως λέξεις κλειδιά, κείμενα περιγραφής για να περιγράψουν εικόνες και να μετρήσουν την ομοιότητα μεταξύ τους. Από την άλλη μεριά τα χαρακτηριστικά που εξάγονται αυτόματα με τη χρήση τεχνικών υπολογιστικής όρασης είναι κυρίως χαμηλού επιπέδου (χρώμα, υφή, σχήμα κ.α.). Γενικά δεν υπάρχει απευθείας σύνδεση μεταξύ των υψηλού επιπέδου εννοιών και των χαμηλού επιπέδου χαρακτηριστικών. Τα σημερινά συστήματα ΑΑΕ χρησιμοποιούν κυρίως χαμηλού επιπέδου χαρακτηριστικά αν και υπάρχουν συστήματα που είναι εξειδικευμένα π.χ. για αναγνώριση προσώπου[13].

Σύγκριση του περιεχομένου μέσω απόστασης των εικόνων[Επεξεργασία | επεξεργασία κώδικα]

Όταν προσπαθούμε να συγκρίνουμε μία εικόνα από τη βάση δεδομένων με μία εικόνα που χρησιμοποιείται ως δείγμα, χρησιμοποιούμε διάφορα χαρακτηριστικά των εικόνων για τον υπολογισμό μίας απόστασης μεταξύ τους. Μία απόσταση κοντά στο 0 υποδεικνύει μεγάλη ομοιότητα μεταξύ των εικόνων όσων αφορά τα χαρακτηριστικά που επιλέχθηκαν. Όσο απομακρυνόμαστε από το 0 τόσο η ομοιότητα μειώνεται.

Χρώμα[Επεξεργασία | επεξεργασία κώδικα]

Η πιο απλή μέτρηση της απόστασης βάσει του χρώματος αφορά τον υπολογισμό του ποσοστού των pixel μίας εικόνας που έχουν ένα συγκεκριμένο χρώμα. Αυτό γίνεται με τη βοήθεια του χρωματικού ιστογράμματος της εικόνας. Αυτή η μέθοδος βέβαια δεν λαμβάνει υπόψη τη θέση των pixel αυτών στην εικόνα. Είναι αυτονόητο ότι δύο εικόνες μπορεί να μοιάζουν βάσει χρωματικού ιστογράμματος αλλά να έχουν τελείως διαφορετική κατανομή των χρωμάτων και να πρόκειται τελικά για δύο τελείως διαφορετικές εικόνες. Σύγχρονη έρευνα προσπαθεί να χωρίσει την εικόνα σε περιοχές και να συγκρίνει επιμέρους ιστογράμματα. Η σύγκριση βάσει χρώματος πάντως είναι από τις πιο διαδεδομένες τεχνικές γιατί δεν εξαρτάται από το μέγεθος ή τον προσανατολισμό της εικόνας.

Υφή[Επεξεργασία | επεξεργασία κώδικα]

Η έννοια της υφής αναφέρεται σε ιδιότητες που αναπαριστούν την επιφάνεια ή την δομή ενός αντικειμένου. Η υφή αποτελείται από στοιχεία ή αρχέγονα υφής, τα οποία αναφέρονται και ως texels. Οι μέθοδοι που συγκρίνουν δύο εικόνες βάσει της υφής, αναζητούν οπτικά πρότυπα καθώς και το που βρίσκονται στο χώρο. Για την περιγραφή τις υφής υπάρχουν δύο κυρίαρχες προσεγγίσεις, η στατιστική και η συντακτική. Οι στατιστικές μέθοδοι υπολογίζουν διάφορες ιδιότητες και είναι κατάλληλες για τις περιπτώσεις που τα μεγέθη των στοιχείων υφής είναι συγκρίσιμα με το μέγεθος των pixel. Οι συντακτικές αλλά και οι υβριδικές μέθοδοι (συνδυασμός στατιστικών και συντακτικών), είναι περισσότερο κατάλληλες για υφές στις οποίες τα στοιχεία τους μπορούν να χαρακτηριστούν από μια ετικέτα, που είναι ο τύπος του στοιχείου. Αυτό σημαίνει ότι τα στοιχεία μπορεί να περιγραφούν με μια μεγαλύτερη ποικιλία ιδιοτήτων από απλώς μόνο τις τονικές ιδιότητες, όπως για παράδειγμα την περιγραφή σχήματος[14].

Σχήμα[Επεξεργασία | επεξεργασία κώδικα]

Η χρήση του σχήματος των αντικειμένων είναι ένα από τα πιο δύσκολα προβλήματα στην δημιουργία αποτελεσματικών συστημάτων ΑΑΕ. Το σχήμα του αντικειμένου παίζει ένα πολύ σημαντικό ρόλο στην αναζήτηση παρόμοιων αντικειμένων όπως π.χ. στόχοι αντικείμενα σε αεροφωτογραφίες η δορυφορικές φωτογραφίες. Η περιγραφή των αντικειμένων αυτών πρέπει να είναι ανεξάρτητη από τη μεγέθυνση ή τον προσανατολισμό του αντικειμένου. Η εκμετάλλευση των σχημάτων δεν είναι τόσο ανεπτυγμένη όσο του χρώματος και της υφής στα συστήματα ΑΑΕ εξαιτίας της εγγενούς πολυπλοκότητας στην αναπαράσταση των σχημάτων. Συγκεκριμένα, οι περιοχές μίας εικόνας που καταλαμβάνονται από το σχήμα πρέπει να βρεθούν και στη συνέχεια πρέπει να εφαρμοστεί μία μέθοδος κατάτμησης ή εντοπισμού ακμών[15].

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. Content-based Image Retrieval, John Eakins and Margaret Graham, University of Northumbria at Newcastle
  2. University of Washington FIDS Demo
  3. CIRES: Content Based Image Retrieval System
  4. isk-daemon, open source visual content image search.
  5. LTU Technologies Corbis Visual Search
  6. Idée Inc. TinEye Reverse Image Search Engine.
  7. Vision Research Lab, UCSB
  8. Octagon by Viitala
  9. Windsurf (University of Bologna, Italy)
  10. Visual recognition factory
  11. KBK Group LCC, Russia. Content Image Search Engine.
  12. Content-based image retrieval: a comparison between query by example and image browsing map approaches, Christopher C. Yang
  13. A survey of content-based image retrieval with high-level semantics, Ying Liua, Dengsheng Zhanga, Guojun Lua,Wei-Ying Mab
  14. ΑΝΑΚΤΗΣΗ ΕΙΚΟΝΩΝ ΜΕ ΤΗΝ ΧΡΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ ΧΡΩΜΑΤΟΣ ΚΑΙ ΥΦΗΣ, ΠΑΝΑΓΙΩΤΗΣ ΖΑΦΕΙΡΙΔΗΣ, ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ, ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
  15. CBIR: Indexing and Retrieval