Μηχανική μάθηση

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση

Η μηχανική μάθηση (machine learning) είναι μια περιοχή της τεχνητής νοημοσύνης η οποία αφορά αλγορίθμους και μεθόδους που επιτρέπουν στους υπολογιστές να «μαθαίνουν». Με τη μηχανική μάθηση καθίσταται εφικτή η κατασκευή προσαρμόσιμων (adaptable) προγραμμάτων υπολογιστών τα οποία λειτουργούν με βάση την αυτοματοποιημένη ανάλυση συνόλων δεδομένων και όχι τη διαίσθηση των μηχανικών που τα προγραμμάτισαν. Η μηχανική μάθηση εφαρμόζεται σε μια σειρά από μηχανογραφικών εργασιών όπου η χρήση αλγορίθμων, τόσο κατά το σχεδιασμό όσο και κατά τον προγραμματισμό τους είναι απαραίτητη. Παραδείγματα εφαρμογών αποτελούν το spam filtering[1], η οπτική αναγνώριση χαρακτήρων[2] (OCR), οι μηχανές αναζήτησης[3] και η υπολογιστική όραση[4]. Η μηχανική μάθηση επικαλύπτεται σημαντικά με τη στατιστική, αφού και τα δύο πεδία μελετούν την ανάλυση δεδομένων,όπως επίσης και με τη εξόρυξη δεδομένων[5] (data mining), ωστόσο η δεύτερη εστιάζει περισσότερο στη διερευνητική ανάλυση δεδομένων. Η Μηχανική Μάθηση και η αναγνώριση προτύπων ,μπορούν να θεωρηθούν ως "οι δυο όψεις του ίδιου τομέα".[6]

Ορισμός[Επεξεργασία | επεξεργασία κώδικα]

Το 1959, ο πρωτοπόρος σχεδιαστής παιχνιδιών Άρθρουρ Σάμουελ (Arthur Samuel) όρισε ως μηχανική μάθηση "Το πεδίο μελέτης που δίνει στους υπολογιστές την δυνατότητα να μαθαίνουν χωρίς να έχουν προγραμματιστεί ρητά γι' αυτό το σκοπό" (Στα Αγγλικά: "Field of study that gives computers the ability to learn without being explicitly programmed."). [7]

To 1997 o Τομ Μ. Μιτσέλ (Tom M. Mitchell) έδωσε ένα πιο επίσημο ορισμό ο οποίος χρησιμοποιείται ευρέως: "Ένα πρόγραμμα υπολογιστή λέγεται ότι μαθαίνει από εμπειρία E ως προς μια κλάση εργασιών T και ένα μέτρο επίδοσης P, αν η επίδοσή του σε εργασίες της κλάσης Τ, όπως αποτιμάται από το μέτρο Ρ, βελτιώνεται με την εμπειρία Ε" (Στα Αγγλικά: "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."). [8] [9]

Κατηγορίες[Επεξεργασία | επεξεργασία κώδικα]

Οι αλγόριθμοι μηχανικής μάθησης κατηγοριοποιούνται ανάλογα με το επιθυμητό αποτέλεσμα του αλγορίθμου. Οι συνηθέστερες κατηγορίες είναι οι εξής:

  • Επιτηρούμενη μάθηση, επιβλεπόμενη μάθηση ή μάθηση με επίβλεψη (supervised learning), όπου ο αλγόριθμος κατασκευάζει μια συνάρτηση που απεικονίζει δεδομένες εισόδους σε γνωστές, επιθυμητές εξόδους (σύνολο εκπαίδευσης), με απώτερο στόχο τη γενίκευση της συνάρτησης αυτής και για εισόδους με άγνωστη έξοδο (σύνολο ελέγχου).
  • Μη επιτηρούμενη μάθηση, ανεπίβλεπτη μάθηση ή μάθηση χωρίς επίβλεψη (unsupervised learning), όπου ο αλγόριθμος κατασκευάζει ένα μοντέλο για κάποιο σύνολο εισόδων χωρίς να γνωρίζει επιθυμητές εξόδους για το σύνολο εκπαίδευσης.
  • Ενισχυτική μάθηση (reinforcement learning), όπου ο αλγόριθμος μαθαίνει μια στρατηγική ενεργειών για μια δεδομένη παρατήρηση.

Η ανάλυση των αλγόριθμων μηχανικής μάθησης είναι ένας κλάδος της στατιστικής που ονομάζεται θεωρία μάθησης.

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. «Email filtering». https://en.wikipedia.org/wiki/Email_filtering. 
  2. «Οπτική Αναγνώριση Χαρακτήρων». https://el.wikipedia.org/wiki/%CE%9F%CF%80%CF%84%CE%B9%CE%BA%CE%AE_%CE%91%CE%BD%CE%B1%CE%B3%CE%BD%CF%8E%CF%81%CE%B9%CF%83%CE%B7_%CE%A7%CE%B1%CF%81%CE%B1%CE%BA%CF%84%CE%AE%CF%81%CF%89%CE%BD. 
  3. «Μηχανή Αναζήτησης». https://el.wikipedia.org/wiki/%CE%9C%CE%B7%CF%87%CE%B1%CE%BD%CE%AE_%CE%B1%CE%BD%CE%B1%CE%B6%CE%AE%CF%84%CE%B7%CF%83%CE%B7%CF%82. 
  4. «Μηχανική όραση». https://el.wikipedia.org/wiki/%CE%9C%CE%B7%CF%87%CE%B1%CE%BD%CE%B9%CE%BA%CE%AE_%CF%8C%CF%81%CE%B1%CF%83%CE%B7. 
  5. «Εξόρυξη δεδομένων». https://el.wikipedia.org/wiki/%CE%95%CE%BE%CF%8C%CF%81%CF%85%CE%BE%CE%B7_%CE%B4%CE%B5%CE%B4%CE%BF%CE%BC%CE%AD%CE%BD%CF%89%CE%BD. 
  6. «C. M. Bishop (2006). Pattern Recognition and Machine Learning. Springer. ISBN 0-387-31073-8.». http://www.rmki.kfki.hu/~banmi/elte/Bishop%20-%20Pattern%20Recognition%20and%20Machine%20Learning.pdf. 
  7. Phil Simon (March 18, 2013). Too Big to Ignore: The Business Case for Big Data. Wiley, σελ. 89. ISBN 978-1118638170. http://books.google.gr/books?id=Dn-Gdoh66sgC&pg=PA89#v=onepage&q&f=false. 
  8. Tom M. Mitchell (1997). Machine Learning, σελ. 2. ISBN 0-07-042807-7. 
  9. John Wang (2003). Data mining: opportunities and challenges. Idea Group Pub, σελ. 261. ISBN 978-1591400516. http://books.google.gr/books?id=Nyvaaq9pI40C&pg=PA261#v=onepage&q&f=false. 

Βιβλιογραφία[Επεξεργασία | επεξεργασία κώδικα]

Commons logo
Τα Wikimedia Commons έχουν πολυμέσα σχετικά με το θέμα