Σύστημα Αναγνώρισης Προσώπου

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση

Ένα Σύστημα Αναγνώρισης Προσώπου είναι μια εφαρμογή των Συστημάτων Αναγνώρισης Προτύπων, που χρησιμοποιείται για αυτοματοποιημένη αναγνώριση ή επιβεβαίωση της ταυτότητας ενός ατόμου από μία ψηφιακή εικόνα ή ένα καρέ από βίντεο. Ένας τρόπος για να γίνει αυτό, είναι η σύγκριση χαρακτηριστικών προσώπου μεταξύ της εισόδου στο σύστημα (στατική εικόνα) και μιας βάσης δεδομένων χαρακτηριστικών.

Συνηθίζεται να χρησιμοποιείται σε συστήματα ασφαλείας και μπορεί να συγκριθεί με άλλες βιομετρικές μεθόδους όπως η αναγνώριση δαχτυλικών αποτυπωμάτων ή αναγνώριση αμφιβληστροειδούς χειτώνα.[1]

Τεχνικές[Επεξεργασία | επεξεργασία κώδικα]

Τα Συστήματα Αναγνώρισης Προτύπων, μεταξύ των οποίων και το Σύστημα Αναγνώρισης Προσώπου, ακολουθούν μια τυπική αρχιτεκτονική που περιλαμβάνει τέσσερα βασικά στάδια επεξεργασίας:

Λειτουργία Συστήματος Αναγνώρισης Προσώπου
Βήματα της διαδικασίας που ακολουθεί ένα Σύστημα Αναγνώρισης Προσώπου.
  1. Λήψη μετρήσεων για κάποιες από τις ιδιότητες του αντικειμένου που μας αφορούν
  2. Προεπεξεργασία των μετρήσεων για τη μείωση θορύβου και/ή κανονικοποίηση των μετρήσεων
  3. Εξαγωγή χαρακτηριστικών με τα οποία γίνεται η διάκριση των προτύπων
  4. Ταξινόμηση, που περιλαμβάνει τη σύγκριση των χαρακτηριστικών του αντικειμένου με κάποια χαρακτηριστικά που το σύστημα ήδη γνωρίζει που ανήκουν, ώστε να το αντιστοιχίσει σε κάποια κλάση.

Υπάρχουν δύο βασικές διαδεδομένες μέθοδοι για την αναγνώριση προσώπου, η γεωμετρική, που στηρίζεται σε χαρακτηριστικά του πρόσωπο, και η φωτομετρική που στηρίζεται στην όψη του.[2]

Στο σχήμα δεξιά φαίνεται η διαδικασία που ακολουθεί συγκεκριμένα ένα σύστημα αναγνώρισης προσώπου, και τα βήματα από τη στιγμή που θα δεχθεί κάποιο στιγμιότυπο - εικόνα ως είσοδο, μέχρι την απάντηση για την ταυτότητα του προσώπου.

2D - Δύο Διαστάσεων[Επεξεργασία | επεξεργασία κώδικα]

Κάποιοι αλγόριθμοι αναγνώρισης προσώπου, αναγνωρίζουν τα πρόσωπα εξάγωντας χαρακτηριστικά από την εικόνα του προσώπου του ατόμου. Η εταιρία Identix® που εδρεύει στη Μινεσότα, είναι μια από τις πολυάριθμες εταιρίες που ασχολούνται στο χώρο και το λογισμικό της (Facelt®) μπορεί να αποτυπώσει το πρόσωπο κάποιου ατόμου από ένα πλήθος, νο το αποκόψει και στη συνέχεια να διασταυρώσει συγκεκριμένα χαρακτηριστικά που έχει στη βάση δεδομένων του. Κάθε πρόσωπο έχει πολυάριθμα ξεχωριστά διακριτικά στοιχεία από άλλα, με διαφορετικές κορυφές και κοιλάδες, που μπορούν να αποτελέσουν χαρακτηριστικά για το συγκεκριμένο πρόσωπο. Τέτοια μπορεί να είναι:

  • Η απόσταση μεταξύ ματιών.
  • Το πλάτος της μύτης.
  • Το βάθος των ματιών.
  • Το σχήμα των ζυγωματικών.
  • Το μήκος του σαγονιού.

Το ανθρώπινο πρόσωπο έχει περίπου 80 τέτοια χαρακτηριστικά, που καθορίζουν τις διαφορές μεταξύ προσώπουν και αποκαλούνται κομβικά σημεία (nodal points). Άλλου είδους αλγόριθμοι, κανονικοποιούν (normalize) μια σειρά δεδομένων που απαιτούν για την αναγνώριση προσώπου από ένα σύνολο προσώπων και στη συνέχεια συμπιέζουν τα χαρακτηριστικά που απαιτούν, καταλλήγοντας στην πιο μικρή ικανοποιητική διάσταση διανύσματος χαρακτηριστικών. Η μέθοδος αυτή χρησιμοποιεί τον αλγόριθμο PCA (Principal Components Analysis) και πρωτοπόρος της ήταν οι Kirby και Sirivich το 1988 (η μέθοδος αυτή πολλές φορές αποκαλείται σαν χρήση eigenfaces). Μια άλλη πολύ διαδεδομένη μέθοδος, συμπεριλαμβάνει την κατηγοριοποίηση προσώπων κατά την εκπαίδευση του συστήματος και στη συνέχεια τη χρήση του αλγόριθμου LDA (Linear Discriminant Analysis), ώστε να μεγιστοποιηθεί η πυκνότητα ομοίων στοιχείων εντός της ίδιας κλάσης (ίδιο πρόσωπο) και παράλληλα να αυξηθούν οι διαφορές που έχουν οι ίδιες οι κλάσεις.[3]

Άλλοι παρόμοιοι αλγόριθμοι είναι οι Elastic Bunch Graph Matching που χρησιμοποιεί τον αλγόριθμο Fisherface, ο Hidden Markov model και ο νευρωνικός Dynamic Link Matching.

3D - Τριών Διαστάσεων[Επεξεργασία | επεξεργασία κώδικα]

Η τρισδιάστατη μέθοδος αναγνώρισης προσώπου αποτελεί μια παραλλαγή της κλασικής δισδιάστατης αναγνώρισης, όπου χρησιμοποιείται η τρισδιάστατη γεωμετρική αναπαράσταση του ανθρώπινου προσώπου. Είναι γνωστό ότι η τρισδιάστατη αναγνώριση προσώπου μπορεί να επιτύχει σαφέστατα καλύτερα αποτελέσματα από τη δισδιάστατη, πλησιάζοντας την ταυτοποίηση δαχτυλικού αποτυπώματος.

Στην τρισδιάστατη μέθοδο, επιτυγχάνονται καλύτερα αποτελέσματα εξετάζοντας τη γεωμετρία συμπαγών στοιχείων του προσώπου. Έτσι αποφεύγονται προβλήματα που προέκυπταν με τη δισδιάστατη μελέτη και αφορούσαν αλλαγές στο φωτισμό, αλλαγές στην έκφραση των προσώπων, make up, διαφοροποίηση στον προσανατολισμό του προσώπου κατά τη λήψη του στιγμιοτύπου κλπ.

Το σημαντικότερο μειονέκτημα της τρισδιάστατης αναγνώρισης προσώπων, είναι η ανάγκη για τρισδιάστατα μοντέλα, που απαιτούν τη χρήση ειδικών τύπων συστήματα λήψης. Βέβαια, εξίσου ικανοποιητικές είναι πλέον πολλαπλές λήψεις του ίδιου αντικειμένου από διαφορετικές οπτικές γωνίες, που με κατάλληλη επεξεργασία, μπορεί να αποδώσει τις μεταβλητές που ενδιαφέρουν το σύστημα.[4]

Ελβετικό Ευρωπαϊκό Σύστημα Παρακολούθησης
Ελβετικό Ευρωπαϊκό Σύστημα Παρακολούθησης: Αναγνώριση προσώπου και οχημάτων, μοντέλου οχήματος, χρώμα και αριθμό πινακίδων.

Η έρευνα στον τομέα της τρισδιάστατης αναγνώρισης προσώπου, ενισχύεται από την ανάπτυξη αισθητήρων που μπορούν να κάνουν καλύτερη δουλειά από τις απλές 3D μηχανές λήψης. Οι αισθητήρες αυτοί λειτουργούν προβάλλοντας δομημένο φως στο υπό εξέταση πρόσωπο, ενώ μπορούν να συνδεθούν παράλληλα περίπου 12 πάνω σε ένα CMOS Chip, καθένας λαμβάνοντας διαφορετικό τμήμα του οπτιοκού φάσματος. Άλλες μέθοδοι, συμπεριλαμβάνουν τη χρήση αόρατων δομών φωτός για τη λήψη των δεδομένων, καθώς δεν θα απαιτούσαν την ύπαρξη (ή όχι) φωτός στο χώρο που βρίσκεται το πρόσωπο. [5]

Βιομετρική αναγνώριση[Επεξεργασία | επεξεργασία κώδικα]

Για την επίτευξη ακόμα καλύτερων αποτελεσμάτων, με μεγαλύτερη εγκυρότητα, χρησιμοποιείται μια επιπλέον διαδικασία που ονομαζεται Surface Texture Analsis (ανάλυση υφής επιφάνειας). Με τη χρήση αλγορίθμων για τη μετατροπή ενός τμήματος της επιφάνειας του προσώπου, σε μαθηματικές ακολουθίες, μετρήσιμες στο χώρο, το σύστημα μπορεί να αναγνωρίσει γραμμές και πόρρους στο δέρμα, που έχει στην πραγματικότητα το πρόσωπο. Η εταιρία Identix® ισχυρίζεται ότι αυτού του είδους η ανάλυση, δίνει μια ώθηση 20 έως 25% στην επιτυχή αναγνώριση προσώπου.[6]

Λογισμικό[Επεξεργασία | επεξεργασία κώδικα]

Η τεχνολογία αναγνώρισης προσώπου, δεν χρησιμοποιείται μόνο για την αναγνώριση εγκληματιών από τις αστυνομικές αρχές. Πολλά προγράμματα διαχείρισης φωτογραφικών άλμπουμ, χρησιμοποιούν μεθόδους για να αναγνωρίσουν αυτόματα πρόσωπα και να τα ομαδοποιήσουν για λογαριασμό του χρήστη:

  • Το iPhoto της Apple οργανώνει τις φωτογραφίες του χρήστη αυτόματα ανάλογα με τα πρόσωπα που εικονίζονται και είναι διαθέσιμα στο χρήστη ανάμεσα σε πολλαπλές εφαρμογές.
  • Το Picassa της Google δίνει τη δυνατότητα στο χρήστη να επιλέξει την προβολή φωτογραφιών με συγκεκριμένο πρόσωπο και το ιδιο το πρόγραμμα διασυνδέει τις φωτογραφίες με το πρόσωπο και τις προβάλλει.
  • Το Picture Motion Browser (PMB) της Sony, αναλύει τις φωτογραφίες και τις ομαδοποιεί ανάλογα με τα πρόσωπα που εμφανίζονται.
  • Το Facebook χρησιμποιεί πλέον σύστημα αναγνώρισης προσώπου, κάνοντας αυτόματα επισήμανση (tagging) στα πρόσωπα που υπάρχουν.
  • To Windows Live Photo Gallery στην τελευταία έκδοση χρησιμοποιεί επίσης τέτοιο σύστημα.
  • Το fotobounce έδινε τη δυνατότητα διαχείρισης των φωτογραφιών του χρήστη ανάλογα με τους εικονιζόμενους ανθρώπους.
  • Το face.com δίνει έτοιμο API για τους χρήστες που θέλουν να εισάγουν τεχνολογία αναγνώρισης προσώπου, μετρώντας 35,000,000,000+ πρόσωπα στη βάση δεδομένων του (κατά την 30η/11/2011). Τώρα το έχει αποκτήσει το facebook.com.

Συμπεράσματα[Επεξεργασία | επεξεργασία κώδικα]

Αδυναμίες[Επεξεργασία | επεξεργασία κώδικα]

Συμπεριλαμβανομένων των προαναφερθέντων, τα συστήματα αναγνώρισης προτύπων είναι ακόμα σε πολύ χαμηλό επίπεδο, σχετικά με αυτό που έχει στο μυαλό του κάποιος που ακούει το όνομά τους. Παρόλο που τα αποτελέσματά τους είναι έγκυρα και με πολύ μικρά ποσοστά σφάλματος υπό ιδανικές συνθήκες, δυσκολεύονται ιδιαίτερα όταν αυτές δεν πληρούνται. Για παράδειγμα, ο ερευνητής Ralph Gross του Ινστιτούτου Carnegie Mellon Robotics στο Pittsburgh, δηλώνει (-σε ελεύθερη μετάφραση-) "Η αναγνώριση προσώπου πηγαίνει πολύ καλά με πρόσωπα στραμμένα στο φακό έως και 20 μοίρες διαφορετικά, αλλά όσο μετακινείσαι προς το προφίλ, υπάρχουν προβλήματα" [7]

Παρόμοια προβλήματα εμφανίζονται όταν δεν υπάρχει επαρκής φωτισμός, όταν τα πρόσωπα φέρουν γυαλιά ηλίου, όταν τα μαλλιά του προσώπου εμπλέκονται στο πρόσωπο και γενικά οτιδήποτε μπορεί να ελαττώσει τα χαρακτηριστικά που αντιλαμβάνεται το πληροφοριακό σύστημα για το πρόσωπο. Μειώνοντας τα χαρακτηριστικά, το σύστημα χάνει την ευστάθειά του και δεν μπορεί να λάβει απόφαση με την ίδια σιγουριά, όπως αν είχε όλες τις παραμέτρους.

Αποτελεσματικότητα[Επεξεργασία | επεξεργασία κώδικα]

Όταν θέλουμε να αποφασίσουμε για την αποτελεσματικότητα ενός πληροφοριακού συστήματος, πρώτα απ' όλα ελέγχουμε αν καλύπτει τις λειτουργικές απαιτήσεις, τις οποίες καλείται να πληρεί. Στην προκειμένη περίπτωση, όταν αναφερόμαστε στα συστήματα αναγνώρισης προτύπων, θα πρέπει πρώτα να δούμε τον σκοπό τον οποίο εξυπηρετεί.

Σχετικά με τα συστήματα που χρησιμοποιούνται σε καθημερινές εφαρμογές, τα αποτελέσματα τα βλέπουμε εμείς οι ίδιοι οι χρήστες συνέχεια. Το Facebook μας κάνει "tag" χωρίς να το περιμένουμε, το smart phone μας μας δείχνει τη φωτογραφία του προσώπου που μας καλεί (ίσως και διαφορετική κάθε φορά), χωρίς να του έχουμε πει ποιος είναι και στα email που λαμβάνουμε, βλέπουμε τη φωτογραφία της επαφής που μας τη στέλνει, χωρίς να χρειαστεί να αναζητήσουμε το όνομά του σε φακέλους και υποφακέλους του ηλεκτρονικού μας υπολογιστή. Εμπειρικά, μπορεί κανεις να ισχυριστεί ότι τα προγράμματα αυτά κάνουν τη δουλειά τους καλά και πολλές φορές σωστά! Ίσως να μην έχουν 100% επιτυχία, αλλά σίγουρα δεν κάνουν τη ζωή μας πιο δύσκολη.

Σε αντίθεση, τα συστήματα που χρηματοδοτούνται για να προστατεύουν τους πολίτες και την πολιτεία, δεν επαρκούν και δεν έχουν φτάσει στο επίπεδο που θα έπρεπε. Σε δημοσίευση της βρετανικής The Guardian, που αναφέρεται σε σύστημα στο London Borough of Newham, το οποίο λειτουργεί από το 2004, δηλώνεται πως δεν έχει αναγνωριστεί ποτέ κανένας εγκληματίας, παρόλο που ζουν αρκετοί εκεί και υπάρχουν τα στοιχεία τους στη βάση δεδομένων του. Απάντηση σε αυτό βέβαια, θα μπορούσε να δοθεί από τον ισχυρισμό και μόνο ότι όταν οι άνθρωποι νιώθουν ότι βρίσκονται υπό τη διαρκή απειλή της εικοσιτετράωρης παρακολούθησης, από μόνοι τους θα κάνουν ό,τι μπορούν για να κρύψουν την ταυτότητά τους. Μεταξύ αυτών και οι κακοποιοί, που για το σύστημα αποτελούν άγνωστους μεταξύ αγνώστων.[8]

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. Biometric and Facial Recognition
  2. Face Recognition Vendor Test 2002, P. Phillips, P. Grother, R. Micheals, D. Blackburn, E. Tabassi, and J. Bone.
  3. Face Recognition, National Science and Technology Council (NSTC), Committee on Technology, Committee on Homeland and National Security, Subcommittee on Biometrics.
  4. Three-dimensional face recognition, en.Wikipedia.org.
  5. Facial recognition progress report, Mark Crawford 28 Septemper 2011.
  6. How stuff works
  7. Better Face-Recognition Software, Computer outperform humans at recognizing faces in recent tests.
  8. Robo cop, The Guardian.

Εξωτερικοί Σύνδεσμοι[Επεξεργασία | επεξεργασία κώδικα]