Ιεραρχία Τσόμσκι: Διαφορά μεταξύ των αναθεωρήσεων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Vevek (συζήτηση | συνεισφορές)
Vevek (συζήτηση | συνεισφορές)
Γραμμή 35: Γραμμή 35:
Στις γραμματικές '''τύπου 2''' ανήκουν οι [[Γραμματική χωρίς συμφραζόμενα|γραμματικές χωρίς συμφραζόμενα]] (context free grammar) και η μορφή των κανόνων παραγωγής τους είναι
Στις γραμματικές '''τύπου 2''' ανήκουν οι [[Γραμματική χωρίς συμφραζόμενα|γραμματικές χωρίς συμφραζόμενα]] (context free grammar) και η μορφή των κανόνων παραγωγής τους είναι
:<math>A \to a</math>, όπου <math>A \in V</math> και <math>a \in (V \cup T)^*</math>.
:<math>A \to a</math>, όπου <math>A \in V</math> και <math>a \in (V \cup T)^*</math>.
Εδώ, το Α δεν είναι συμβολοσειρά, αλλά ένα μη τερματικό σύμβολο, ενώ το α είναι συμβολοσειρά αποτελούμενη από οποιαδήποτε σύμβολα της αλφαβήτου της γλώσσας. Από ένα μη τερματικό σύμβολο παράγεται οποιαδήποτε συμβολοσειρά.
Εδώ, η συμβολοσειρά Α δεν επιτρέπεται να περιέχει τερματικά σύμβολα, ενώ η α μπορεί να έχει οποιαδήποτε σύμβολα.


Τα αυτόματα που αναγνωρίζουν γραμματικές χωρις συμφαζόμενα είναι τα [[Αυτόματο Στοίβας|Αυτόματα Στοίβας]] (Push Down Automata).
Τα αυτόματα που αναγνωρίζουν γραμματικές χωρις συμφαζόμενα είναι τα [[Αυτόματο Στοίβας|Αυτόματα Στοίβας]] (Push Down Automata).

Έκδοση από την 13:42, 18 Απριλίου 2009

To 1956 ο Νόαμ Τσόμσκι ταξινόμησε τις τυπικές γραμματικές σε ιεραρχία με κριτήριο τους τύπους των κανόνων παραγωγής τους. Η ιεραρχία Τσόμσκι, όπως ονομάστηκε, θεωρείται πολύ χρήσιμη στο πεδίο της Επιστήμης των υπολογιστών.

Τυπική γραμματική

Κύριο λήμμα: Τυπική γραμματική

Μια τυπική γλώσσα G αποτελείται από

  • Ένα πεπερασμένο σύνολο V από μη τερματικά σύμβολα
  • Ένα πεπερασμένο σύνολο Τ από τερματικά σύμβολα
  • Ένα πεπερασμένο σύνολο P από κανόνες παραγωγής
  • Ένα αρχικό σύμβολο S

όπου,

  • .

Έτσι, μια τυπική γραμματική συμβολίζεται G(V,T,P,S).

Ιεραρχία Τσόμσκι

Το επίπεδο ιεραρχίας των γραμματικών χαμηλώνει καθώς προχωράμε από τον τύπο 0 ως 3. Σύμφωνα με την ιεραρχία του Τσόμσκι:

Γενικές Γραμματικές

Στις γραμματικές τύπου 0 ανήκουν οι γενικές γραμματικές. Η μορφή των κανόνων παραγωγής είναι

, όπου .

Σε αυτήν την περίπτωση, οι συμβολοσειρές των κανόνων παραγωγής μπορούν να αποτελούνται από οποιαδήποτε σύμβολα της αλφαβήτου της γλώσσας. Από μια οποιαδήποτε συμβολοσειρά (εκτός της κενής) μπορεί να παραχθεί οποιαδήποτε άλλη (ή και η ίδια) συμβολοσειρά. Οι γενικές γραμματικές είναι γραμματικές με μόνο περιορισμό ότι από το κενό σύμβολο δεν παράγεται συμβολοσειρά. Επειδή δεν υπάρχουν άλλοι περιορισμοί, το σύνολο των γλωσσών που ανήκουν στις γενικές γραμματικές είναι το πιο ευρύ (συγκριτικά με τις υπόλοιπες γραμματικές της Ιεραρχίας Τσόμσκι) και μέσα σε αυτό εμπεριέχονται τα σύνολα των γλωσσών που ανήκουν στις γραμματικές χαμηλότερης ιεραρχίας.

Οι γενικές γραμματικές αναγνωρίζονται από τις Μηχανές Τούρινγκ (Turing Machines).

Γραμματικές Με Συμφραζόμενα

Στις γραμματικές τύπου 1 ανήκουν οι γραμματικές με συμφραζόμενα (context sensitive grammar) ή μονοτονικές γραμματικές (monotonic grammar). Η μορφή των κανόνων παραγωγής είναι

, με , όπου και επιτρέπεται .

Και πάλι οι συμβολοσειρές α και β μπορούν να αποτελούνται από οποιαδήποτε σύμβολα της αλφαβήτου, αλλά πρέπει το μήκος της συμβολοσειράς α να είναι μικρότερο ή ίσο από αυτό της β. Παράγονται, έτσι, συμβολοσειρές μικρότερου μήκους από αυτό της αρχικής συμβολοσειράς. Γι'αυτό άλλωστε οι γλώσσες αυτές ονομάζονται μονοτονικές.

Τα αυτόματα που αναγνωρίζουν γραμματικές χωρίς συμφραζόμενα είναι τα Γραμμικά Περιορισμένα Αυτόματα (Linearly Bounded Automata).

Γραμματικές Χωρίς Συμφραζόμενα

Στις γραμματικές τύπου 2 ανήκουν οι γραμματικές χωρίς συμφραζόμενα (context free grammar) και η μορφή των κανόνων παραγωγής τους είναι

, όπου και .

Εδώ, το Α δεν είναι συμβολοσειρά, αλλά ένα μη τερματικό σύμβολο, ενώ το α είναι συμβολοσειρά αποτελούμενη από οποιαδήποτε σύμβολα της αλφαβήτου της γλώσσας. Από ένα μη τερματικό σύμβολο παράγεται οποιαδήποτε συμβολοσειρά.

Τα αυτόματα που αναγνωρίζουν γραμματικές χωρις συμφαζόμενα είναι τα Αυτόματα Στοίβας (Push Down Automata).

Κανονικές Γραμματικές

Στις γραμματικές τύπου 3 ανήκουν οι κανονικές γραμματικές και η μορφή των κανόνων παραγωγής τους είναι δεξιογραμμικές (right-linear) ή αριστερογραμμικές (left-linear). Αν είναι δεξιογραμμικές, τότε

Ενώ, αν είναι αριστερογραμμική, τότε

, όπου και .

Στις τύπου 3 γραμματικές, το πρώτο μέλος του κανόνα παραγωγής αποτελείται μόνο από μη τερματικά σύμβολα, ενώ το δεύτερο μέλος πρέπει να περιέχει και τερματικά σύμβολα.

Τις κανονικές γραμματικές αναγνωρίζουν τα Πεπερασμένα Αυτόματα ή Αναγνωριστές Πεπερασμένων Καταστάσεων (Finite State Acceptors).