Βάση γνώσεων
Mεταφρασμένο απο το αρθρο knowledge base
Στην επιστήμη των υπολογιστών, μια βάση γνώσεων (Knowledge Base - KB) είναι ένα σύνολο προτάσεων, με κάθε πρόταση να δίνεται σε μια γλώσσα αναπαράστασης γνώσης, με διεπαφές για την εισαγωγή νέων προτάσεων και την υποβολή ερωτήσεων σχετικά με το γνωστό περιεχόμενο, όπου οποιαδήποτε από αυτές τις διεπαφές μπορεί να χρησιμοποιεί συλλογιστική. Πρόκειται για μια τεχνολογία που χρησιμοποιείται για την αποθήκευση σύνθετων δομημένων δεδομένων που χρησιμοποιεί ένα σύστημα υπολογιστή. Η αρχική χρήση του όρου αφορούσε τα συστήματα ειδικών, τα οποία ήταν τα πρώτα συστήματα βασισμένα στη γνώση.
Αρχική χρήση του όρου
[Επεξεργασία | επεξεργασία κώδικα]Η αρχική χρήση του όρου "βάση γνώσεων" ήταν για να περιγράψει ένα από τα δύο υποσυστήματα ενός συστήματος ειδικών. Ένα σύστημα βασισμένο στη γνώση αποτελείται από μια βάση γνώσεων που αναπαριστά γεγονότα για τον κόσμο και από μεθόδους συλλογιστικής για αυτά τα γεγονότα, ώστε να εξάγονται νέα γεγονότα ή να εντοπίζονται ασυνέπειες.
Ιδιότητες
[Επεξεργασία | επεξεργασία κώδικα]Ο όρος "βάση γνώσεων" εισήχθη για να διαχωρίσει αυτή τη μορφή αποθήκευσης γνώσης από τον πιο κοινό και ευρέως χρησιμοποιούμενο όρο "βάση δεδομένων". Τη δεκαετία του 1970, σχεδόν όλα τα μεγάλα συστήματα πληροφορικής αποθήκευαν τα δεδομένα τους σε ιεραρχικές ή σχεσιακές βάσεις δεδομένων. Στο σημείο αυτό της ιστορίας της πληροφορικής, η διαφορά μεταξύ μιας βάσης δεδομένων και μιας βάσης γνώσεων ήταν σαφής και αδιαμφισβήτητη.
- Επίπεδα δεδομένα: Τα δεδομένα αναπαριστώνταν συνήθως σε μορφή πίνακα με αλφαριθμητικά ή αριθμητικά πεδία.
- Πολλαπλοί χρήστες: Μια συμβατική βάση δεδομένων έπρεπε να υποστηρίζει ταυτόχρονα περισσότερους από έναν χρήστες ή συστήματα.
- Συναλλαγές: Απαιτούμενο χαρακτηριστικό για τις βάσεις δεδομένων ήταν η διατήρηση της ακεραιότητας και συνέπειας των δεδομένων όταν αυτά προσπελάζονταν ταυτόχρονα από πολλούς χρήστες. Οι ιδιότητες αυτές είναι : Ατομικότητα, Συνέπεια, Απομόνωση και Διατηρησιμότητα.
- Μεγάλα, μακροχρόνια δεδομένα: Μια εταιρική βάση δεδομένων έπρεπε να υποστηρίζει εκατοντάδες χιλιάδες ή περισσότερες εγγραφές και να παραμένει χρήσιμη για δεκαετίες, όχι μόνο για την περίοδο χρήσης ενός προγράμματος.
Τα πρώτα συστήματα βασισμένα στη γνώση είχαν ανάγκες αποθήκευσης δεδομένων που αντίκεινται στις απαιτήσεις των βάσεων δεδομένων. Ένα σύστημα ειδικών απαιτούσε δομημένα δεδομένα, όχι μόνο πίνακες με αριθμούς και αλφαριθμητικά, αλλά και δείκτες προς άλλα αντικείμενα, τα οποία είχαν και άλλα επίπεδα συσχέτισης. Η ιδανική αναπαράσταση για μια βάση γνώσεων είναι ένα μοντέλο αντικειμένων (συχνά αποκαλούμενο οντολογία στη βιβλιογραφία της τεχνητής νοημοσύνης) με κλάσεις, υποκλάσεις και στιγμιότυπα.
Επίσης, τα πρώτα συστήματα ειδικών δεν είχαν την ανάγκη για πολλούς χρήστες ή τη συνθετότητα των συναλλακτικών χαρακτηριστικών. Τα δεδομένα στα πρώτα αυτά συστήματα χρησιμοποιούνταν για την εξαγωγή συγκεκριμένων απαντήσεων, όπως μιας ιατρικής διάγνωσης, ενός σχεδιασμού μορίου ή μιας ανταπόκρισης σε μια έκτακτη ανάγκη. Μόλις λυνόταν το πρόβλημα, δεν υπήρχε επιτακτική ανάγκη να αποθηκευτούν μεγάλα δεδομένα σε μόνιμη μνήμη. Οι ερευνητές συνειδητοποίησαν ότι μπορούσαν να προσφέρουν χρήσιμες λύσεις χωρίς αυτές τις δυνατότητες και να αντιμετωπίσουν μη τετριμμένα προβλήματα. Από την αρχή, οι πιο διορατικοί ερευνητές αντιλήφθηκαν τα οφέλη της δυνατότητας αποθήκευσης, ανάλυσης και επαναχρησιμοποίησης της γνώσης, όπως φαίνεται από τη συζήτηση για την Εταιρική Μνήμη (Corporate Memory) στην πρωτοποριακή εργασία του Knowledge-Based Software Assistant από τους Cordell Green και άλλους.
Οι απαιτήσεις σε όγκο επίσης διέφεραν σημαντικά για μια βάση γνώσεων σε σύγκριση με μια συμβατική βάση δεδομένων. Η βάση γνώσεων έπρεπε να αποθηκεύει γενικά γεγονότα για τον κόσμο, όπως το ότι "Όλοι οι άνθρωποι είναι θνητοί". Μια συμβατική βάση δεδομένων δεν μπορούσε να αναπαραστήσει αυτή τη γενική γνώση και χρειαζόταν να αποθηκεύει πληροφορίες για χιλιάδες πίνακες με συγκεκριμένες πληροφορίες για ανθρώπους. Η αναπαράσταση της γνώσης αυτής και η δυνατότητα εξαγωγής συμπερασμάτων όπως το ότι ένας συγκεκριμένος άνθρωπος είναι θνητός, είναι ο ρόλος μιας βάσης γνώσεων, ενώ η αποθήκευση πληροφοριών για εκατοντάδες χιλιάδες πελάτες είναι ο ρόλος μιας βάσης δεδομένων.
Καθώς τα συστήματα ειδικών πέρασαν από πρωτότυπα σε εταιρικά συστήματα, οι απαιτήσεις για αποθήκευση δεδομένων άρχισαν να αλληλεπικαλύπτονται με τις τυπικές απαιτήσεις βάσεων δεδομένων για πολλαπλούς, διανεμημένους χρήστες και υποστήριξη συναλλαγών. Αυτή η ζήτηση εμφανίστηκε σε δύο ανταγωνιστικές αγορές: από την κοινότητα της Τεχνητής Νοημοσύνης και του αντικειμενοστραφούς προγραμματισμού προέκυψαν βάσεις δεδομένων όπως η Versant, οι οποίες σχεδιάστηκαν με υποστήριξη αντικειμενοστραφών λειτουργιών και τυπικών υπηρεσιών βάσεων δεδομένων. Παράλληλα, οι μεγάλοι πάροχοι βάσεων δεδομένων, όπως η Oracle, πρόσθεσαν δυνατότητες για υποστήριξη των απαιτήσεων βάσεων γνώσεων, όπως οι σχέσεις κλάσης-υποκλάσης και οι κανόνες.
Το Διαδίκτυο ως βάση γνώσεων
[Επεξεργασία | επεξεργασία κώδικα]Η επόμενη εξέλιξη για τον όρο "βάση γνώσεων" ήταν το Διαδίκτυο. Με την άνοδο του Διαδικτύου, τα έγγραφα, το υπερκείμενο και η υποστήριξη πολυμέσων έγιναν κρίσιμα στοιχεία για οποιαδήποτε εταιρική βάση δεδομένων. Δεν ήταν πλέον αρκετό να υποστηρίζονται μεγάλοι πίνακες δεδομένων ή σχετικά μικρά αντικείμενα που αποθηκεύονταν κυρίως στη μνήμη του υπολογιστή. Η υποστήριξη εταιρικών ιστοσελίδων απαιτούσε επίμονη αποθήκευση και συναλλαγές για έγγραφα, δημιουργώντας έναν νέο κλάδο γνωστό ως Διαχείριση Περιεχομένου Ιστού (Web Content Management).
Ένας ακόμα παράγοντας που οδήγησε στην υποστήριξη εγγράφων ήταν η άνοδος των εταιρειών διαχείρισης γνώσης, όπως η HCL Notes (πρώην Lotus Notes). Η διαχείριση γνώσης προηγήθηκε του Διαδικτύου, αλλά το Διαδίκτυο δημιούργησε μεγάλη συνέργεια μεταξύ των δύο περιοχών. Τα προϊόντα διαχείρισης γνώσης υιοθέτησαν τον όρο "βάση γνώσεων" για να περιγράψουν τα αποθετήριά τους, αλλά η έννοια είχε μια σημαντική διαφορά. Στα προηγούμενα συστήματα βασισμένα στη γνώση, η γνώση χρησιμοποιούνταν κυρίως από αυτοματοποιημένα συστήματα για να συλλογίζονται και να εξάγουν συμπεράσματα για τον κόσμο. Στα προϊόντα διαχείρισης γνώσης, η γνώση προοριζόταν κυρίως για ανθρώπους, ως αποθετήριο εγχειριδίων, διαδικασιών, πολιτικών, βέλτιστων πρακτικών, επαναχρησιμοποιήσιμων σχεδίων και κώδικα κ.ά.
Στις δύο περιπτώσεις, οι διακρίσεις μεταξύ των χρήσεων και των τύπων συστημάτων ήταν ασαφείς. Καθώς η τεχνολογία εξελισσόταν, ήταν σπάνιο να βρεθεί ένα σύστημα που θα μπορούσε να καταταχθεί καθαρά ως σύστημα βασισμένο στη γνώση με την έννοια ενός συστήματος ειδικών που πραγματοποιεί αυτόματη συλλογιστική ή ως σύστημα διαχείρισης γνώσης που παρέχει γνώση με τη μορφή εγγράφων και πολυμέσων που θα μπορούσαν να αξιοποιηθούν από τους ανθρώπους.