Αναγνώριση ομιλίας: Διαφορά μεταξύ των αναθεωρήσεων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Χωρίς σύνοψη επεξεργασίας
Χωρίς σύνοψη επεξεργασίας
Γραμμή 3: Γραμμή 3:
Κάποια [[Σύστημα|συστήματα]] αναγνώρισης ομιλίας χρησιμοποιούν "αναγνώριση ομιλίας ανεξάρτητη από τον ομιλήτη"<ref>"Speaker Independent Connected Speech Recognition- Fifth Generation Computer Corporation". Fifthgen.com. Retrieved 2013-06-15.</ref>, ενώ άλλα χρησιμοποιούν "εξάσκηση", όπου ένα άτομο διαβάζει κομμάτια κειμένου σε ένα σύστημα αναγνώρισης ομιλίας. Τότε, αυτού του είδους τα συστήματα αναλύουν τη φωνή ενός ομιλητή και την χρησιμοποιούν για να προσαρμόσουν την αναγνώριση της ομιλίας του συγκεκριμένου ατόμου από τον υπολογιστή, με αποτέλεσμα την πιο ακριβή καταγραφή της. Συστήματα που δεν χρησιμοποιούν εξάσκηση ονομάζονται συστήματα "ανεξάρτητα από τον ομιλητή".
Κάποια [[Σύστημα|συστήματα]] αναγνώρισης ομιλίας χρησιμοποιούν "αναγνώριση ομιλίας ανεξάρτητη από τον ομιλήτη"<ref>"Speaker Independent Connected Speech Recognition- Fifth Generation Computer Corporation". Fifthgen.com. Retrieved 2013-06-15.</ref>, ενώ άλλα χρησιμοποιούν "εξάσκηση", όπου ένα άτομο διαβάζει κομμάτια κειμένου σε ένα σύστημα αναγνώρισης ομιλίας. Τότε, αυτού του είδους τα συστήματα αναλύουν τη φωνή ενός ομιλητή και την χρησιμοποιούν για να προσαρμόσουν την αναγνώριση της ομιλίας του συγκεκριμένου ατόμου από τον υπολογιστή, με αποτέλεσμα την πιο ακριβή καταγραφή της. Συστήματα που δεν χρησιμοποιούν εξάσκηση ονομάζονται συστήματα "ανεξάρτητα από τον ομιλητή".


Οι εφαρμογές αναγνώρισης ομιλίας περιλαμβάνουν τα Φωνητικά Περιβάλλοντα Χρήστη (Voice User Interfaces) όπως η φωνητική πληκτρολόγιση (π.χ. "Κάλεσε σπίτι"), ο έλεγχος των οικιακών ηλεκτρονικών συσκευών και συστημάτων, η διαδικτυακή αναζήτηση, η απλή τοποθέτηση δεδομένων, η προετοιμασία δοδμημένων εγγράφων, η επεξεργασία "από-ομιλία-σε-κείμενο" και τα αεροσκάφη.
Οι εφαρμογές αναγνώρισης ομιλίας συμπεριλαμβάνουν τα [[Φωνητικά Περιβάλλοντα Χρήστη]] (Voice User Interfaces) όπως η φωνητική πληκτρολόγιση (π.χ. "Κάλεσε σπίτι"), ο έλεγχος των οικιακών ηλεκτρονικών συσκευών και συστημάτων (π.χ. "Άναψε φως") , η [[Διαδίκτυο|διαδικτυακή]] [[Μηχανή αναζήτησης|αναζήτηση]], η απλή τοποθέτηση [[Δεδομένα (αποσαφήνιση)|δεδομένων]], η προετοιμασία δομημένων εγγράφων (π.χ. μία αναφορά ραδιολογίας), η επεξεργασία "από-ομιλία-σε-κείμενο" και τα [[αεροσκάφη]].


Ο όρος αναγνώριση ομιλίας αναφέρεται στο "ποιος" μιλάει, παρά στο "τι" λέει<ref> "British English definition of voice recognition". Macmillan Publishers Limited. Retrieved February 21, 2012.</ref><ref>"voice recognition, definition of". WebFinance, Inc. Retrieved February 21, 2012.</ref><ref>"The Mailbag LG #114". Linuxgazette.net. Retrieved 2013-06-15.</ref>. Αναγνωρίζοντας την ταυτότητα του ομιλητή είναι δυνατόν να διευκολυνθεί η διεργασία της μετάφρασης της ομιλίας σε συστήματα που έχουν προηγουμένως εξασκηθεί στην φωνή του συγκεκριμένου ατόμου ή ακόμη είναι δυνατόν να χρησιμοποιηθεί στην πιστοποίηση ή επαλήθευση της ταυτότητας του ομιλητή σε συστήματα ασφαλείας.
Ο όρος αναγνώριση ομιλίας αναφέρεται στο "ποιος" μιλάει, παρά στο "τι" λέει<ref> "British English definition of voice recognition". Macmillan Publishers Limited. Retrieved February 21, 2012.</ref><ref>"voice recognition, definition of". WebFinance, Inc. Retrieved February 21, 2012.</ref><ref>"The Mailbag LG #114". Linuxgazette.net. Retrieved 2013-06-15.</ref>. Αναγνωρίζοντας την ταυτότητα του ομιλητή είναι δυνατόν να διευκολυνθεί η διαδικασία της μετάφρασης της ομιλίας του σε συστήματα που έχουν προηγουμένως εξασκηθεί στην φωνή του συγκεκριμένου ατόμου ή ακόμη είναι δυνατόν να χρησιμοποιηθεί στην πιστοποίηση ή επαλήθευση της ταυτότητας του ομιλητή σε συστήματα ασφαλείας.


== Παραπομπές ==
== Παραπομπές ==

Έκδοση από την 16:42, 14 Οκτωβρίου 2013

Στην επιστήμη της πληροφορικής, η αναγνώριση ομιλίας αναφέρεται στην μετάφραση προφερόμενων λέξεων σε κείμενο. Είναι επίσης αλλιώς γνωστή και ως "αυτόματη αναγνώριση ομιλίας", "υπολογιστική αναγνώριση ομιλίας" ή "speech-to-text" (STT), δηλαδή (μετατροπή) "από-ομιλία-σε-κείμενο".

Κάποια συστήματα αναγνώρισης ομιλίας χρησιμοποιούν "αναγνώριση ομιλίας ανεξάρτητη από τον ομιλήτη"[1], ενώ άλλα χρησιμοποιούν "εξάσκηση", όπου ένα άτομο διαβάζει κομμάτια κειμένου σε ένα σύστημα αναγνώρισης ομιλίας. Τότε, αυτού του είδους τα συστήματα αναλύουν τη φωνή ενός ομιλητή και την χρησιμοποιούν για να προσαρμόσουν την αναγνώριση της ομιλίας του συγκεκριμένου ατόμου από τον υπολογιστή, με αποτέλεσμα την πιο ακριβή καταγραφή της. Συστήματα που δεν χρησιμοποιούν εξάσκηση ονομάζονται συστήματα "ανεξάρτητα από τον ομιλητή".

Οι εφαρμογές αναγνώρισης ομιλίας συμπεριλαμβάνουν τα Φωνητικά Περιβάλλοντα Χρήστη (Voice User Interfaces) όπως η φωνητική πληκτρολόγιση (π.χ. "Κάλεσε σπίτι"), ο έλεγχος των οικιακών ηλεκτρονικών συσκευών και συστημάτων (π.χ. "Άναψε φως") , η διαδικτυακή αναζήτηση, η απλή τοποθέτηση δεδομένων, η προετοιμασία δομημένων εγγράφων (π.χ. μία αναφορά ραδιολογίας), η επεξεργασία "από-ομιλία-σε-κείμενο" και τα αεροσκάφη.

Ο όρος αναγνώριση ομιλίας αναφέρεται στο "ποιος" μιλάει, παρά στο "τι" λέει[2][3][4]. Αναγνωρίζοντας την ταυτότητα του ομιλητή είναι δυνατόν να διευκολυνθεί η διαδικασία της μετάφρασης της ομιλίας του σε συστήματα που έχουν προηγουμένως εξασκηθεί στην φωνή του συγκεκριμένου ατόμου ή ακόμη είναι δυνατόν να χρησιμοποιηθεί στην πιστοποίηση ή επαλήθευση της ταυτότητας του ομιλητή σε συστήματα ασφαλείας.

Παραπομπές

  1. "Speaker Independent Connected Speech Recognition- Fifth Generation Computer Corporation". Fifthgen.com. Retrieved 2013-06-15.
  2. "British English definition of voice recognition". Macmillan Publishers Limited. Retrieved February 21, 2012.
  3. "voice recognition, definition of". WebFinance, Inc. Retrieved February 21, 2012.
  4. "The Mailbag LG #114". Linuxgazette.net. Retrieved 2013-06-15.