Λεξικό-γραμματική

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Πήδηση στην πλοήγηση Πήδηση στην αναζήτηση

Το λεξικό-γραμματική αποτελεί συγχρόνως μια ισχυρή μέθοδο όσο και μια πρακτική προσέγγιση που συνυπάρχουν, με στόχο την τυπική περιγραφή των γλωσσών[1]. Αναπτύχθηκε από τον Maurice Gross στα τέλη της δεκαετίας του 1960 [2].

Το θεωρητικό πλαίσιο του λεξικού-γραμματικής βασίζεται στον κατανεμητισμό του Zellig S. Harris [3][4] και κυρίως στις αρχές του μετασχηματισμού. Η παρουσίαση των γραμματικών πληροφοριών γίνεται αρκετά απλά και με όσο το δυνατόν πιο διαφανή τρόπο.

Οι πειραματικές επιστήμες [5] ενέπνευσαν τη μέθοδο του λεξικού-γραμματικής που ενδιαφέρεται για τη συλλογή των δεδομένων, δηλαδή για την πραγματική διάσταση της γλωσσικής χρήσης τόσο από ποσοτική (συστηματική περιγραφή του λεξικού) όσο και από ποιοτική (μεθοδολογικές προφυλάξεις) άποψη.

Το λεξικό-γραμματική απαιτεί επίσης τυποποίηση. Τα αποτελέσματα της περιγραφής πρέπει να είναι τυποποιημένα σε ικανοποιητικό βαθμό, ώστε να μπορούν να εφαρμοστούν στην αυτόματη επεξεργασία των γλωσσών, κυρίως μέσω της δημιουργίας συντακτικών αναλυτών από ειδικούς επιστήμονες τη πληροφορικής [6][7]. Σύμφωνα με το τυπικό μοντέλο, τα αποτελέσματα της περιγραφής, που ονομάζονται πίνακες, έχουν μορφή πινάκων διπλής εισόδου, όπου διασταυρώνονται τα λήμματα με τις συντακτικο-σημασιολογικές τους ιδιότητες [8]. Το αποτέλεσμα είναι η δημιουργία μιας βάσης συντακτικο-σημασιολογικών πληροφοριών.

Έχει αποδειχτεί έμπρακτα ότι μπορεί να υπάρξει συσσώρευση των περιγραφών πολλών ατόμων ή ομάδων.


Θεωρητικό πλαίσιο[Επεξεργασία | επεξεργασία κώδικα]

Το θεωρητικό πλαίσιο στο οποίο βασίζεται το λεξικό-γραμματική είναι ο κατανεμητισμός του Zellig Harris [3][4], και κυρίως η έννοια του μετασχηματισμού σύμφωνα με τον Zellig Harris. O Maurice Gross υπήρξε μαθητής του Zellig Harris. Η παρουσίαση των γραμματικών πληροφοριών γίνεται αρκετά απλά και με όσο το δυνατόν πιο διαφανή τρόπο. Τα παραπάνω απασχόλησαν και τον Zellig Harris του οποίου η θεωρία προσανατολίζεται προς την άμεσα παρατηρήσιμη επιφάνεια, σε αντίθεση με τη γενετική γραμματική που συνηθίζει να προστρέχει σε αφηρημένες δομές όπως είναι οι βαθιές δομές.

Συλλογή δεδομένων[Επεξεργασία | επεξεργασία κώδικα]

Οι πειραματικές επιστήμες[5] ενέπνευσαν τη μέθοδο του λεξικού-γραμματικής η οποία δίνει έμφαση στη συλλογή δεδομένων, δηλαδή στην πραγματική διάσταση της γλωσσικής χρήσης τόσο από ποσοτική όσο και ποιοτική άποψη.

Ποσοτικά: το λεξικό-γραμματική προβλέπει πρόγραμμα συστηματικής περιγραφής του λεξικού. Αυτό προϋποθέτει έρευνα ευρείας κλίμακας, που υλοποιείται από ομάδες και όχι από επιστήμονες που εργάζονται μεμονωμένα. Η αποκλειστική έρευνα γενικών συντακτικών κανόνων, ανεξάρτητων από το λεξιλογικό υλικό με το οποίο σχετίζονται, έχει χαρακτηριστεί αδιέξοδη [9]. Αυτή είναι η διαφορά με τη γενετική γραμματική που ενστερνίζεται την ιδέα της γενίκευσης.

Ποιοτικά: μεθοδολογικές προφυλάξεις λαμβάνονται για την εξασφάλιση της αναπαραγωγικότητας των παρατηρήσεων, και κυρίως για την προστασία από τους κινδύνους που προκύπτουν από τα κατασκευασμένα παραδείγματα. [10]. Το να θεωρήσουμε την στοιχειώδη πρόταση ως ελάχιστη νοηματική μονάδα [11] αποτελεί προφύλαξη τέτοιου είδους. Πράγματι, μια λέξη αποκτά συγκεκριμένη σημασία όταν εντάσσεται σε ένα συγκείμενο. Επίσης, το πλεονέκτημα της εισαγωγής μιας λέξης σε μια πρόταση είναι ότι μας δίνεται η δυνατότητα να χειριστούμε ανάλογα μια ακολουθία που μπορεί να θεωρηθεί αποδεκτή ή μη αποδεκτή. Για το λόγο αυτό οι συντακτικο-σημασιολογικές ιδιότητες ορίστηκαν με αρκετή ακρίβεια ώστε να έχει νόημα ο συσχετισμός τους με το σύνολο του λεξικού. Οι προφυλάξεις αυτές εξελίχθηκαν σύμφωνα με τις ανάγκες που προέκυψαν και την πρόοδο των τεχνολογικών μέσων. Από τις αρχές λοιπόν της δεκαετίας του 1990, οι ερευνητές που ασχολούνταν με τη δημιουργία του λεξικού-γραμματικής μπόρεσαν να έχουν ολοένα και πιο εύκολη πρόσβαση σε παραδείγματα που εντοπίστηκαν μέσα σε σώματα κειμένων [12]. Το νέο αυτό μέτρο προφύλαξης απλά προστέθηκε στα προϋπάρχοντα με αποτέλεσμα το λεξικό-γραμματική να είναι μια μέθοδος με καταβολές στην ενδοσκοπική γλωσσολογία και στη γλωσσολογία των σωμάτων κειμένων [13], συμφωνώντας κατά κάποιο τρόπο με τις θέσεις του Fillmore [14]. Εξάλλου, οι στόχοι των αμερικανικών προγραμμάτων FrameNet [15] και VerbNet [16]συγκλίνουν σε κάποιο βαθμό με εκείνους του λεξικού-γραμματικής.

Τυποποίηση[Επεξεργασία | επεξεργασία κώδικα]

Το λεξικό-γραμματική απαιτεί εκτός των άλλων τυποποίηση. Τα αποτελέσματα της περιγραφής πρέπει να είναι τυποποιημένα σε ικανοποιητικό βαθμό ώστε να είναι δυνατή:

- η επαλήθευση σε πραγματικές συνθήκες εκφώνησης,

- η εφαρμογή στην αυτόματη επεξεργασία των γλωσσών, κυρίως μέσω της δημιουργίας συντακτικών αναλυτών από τους επιστήμονες της Πληροφορικής [6][7].

Η προϋπόθεση της τυποποίησης εκπληρώνεται με την υιοθέτηση ενός διακριτοποιημένου συντακτικού και σημασιολογικού μοντέλου. Η αποδεκτότητα μοντελοποιείται μέσω μιας διττής ιδιότητας: για τις ανάγκες της περιγραφής, μια πρόταση θεωρείται αποδεκτή ή μη αποδεκτή, όπως συμβαίνει και στην περίπτωση της γενετικής γραμματικής, και για τους ίδιους λόγους.

Επίσης, η λεξιλογική αμφισημία αναπαρίσταται διαχωρίζοντας με επιμέλεια μια λέξη σε ακέραιο αριθμό λημμάτων, τα οποία διακρίνονται μεταξύ τους σαν να επρόκειτο για λήμματα με διαφορετική μορφολογία (π.χ. οι διαφορετικές σημασίες του λείπω αντιστοιχούν σε διαφορετικά λήμματα).

Αναπαρίστανται συστηματικά οι συντακτικο-σημασιολογικές ιδιότητες κάθε λήμματος (π.χ. οι προτασιακές δομές στις οποίες μπορεί να εμφανίζεται ένα ρήμα ή η κατανομή του υποκειμένου). Πληροφορίες σαν αυτές που ακολουθούν χρησιμοποιούνται για να τις χαρακτηρίσουν. Π.χ. το αναπαριστά έναν μετασχηματισμό μεταξύ δύο προτασιακών δομών (ή συντακτικών δομών) που αφορά το ίδιο λήμμα.

Η έννοια του λήμματος συνεπώς δεν πρέπει να συγχέεται με εκείνη της συντακτικής δομής. Για το λόγο αυτό αποφεύγουμε να χρησιμοποιούμε τον όρο "πλαίσιο υποκατηγοριοποίησης (en)", όρος που χρησιμοποιείται συχνά στο πλαίσιο μοντέλων που τείνουν να θεωρούν ότι οι δύο έννοιες βρίσκονται σε αμφιμονοσήμαντη αντιστοιχία. Στο πλαίσιο του λεξικού-γραμματικής οι αποφάσεις όσον αφορά την ταξινόμηση ("υποκατηγοριοποίηση") ενός λήμματος βασίζονται αδιαμφισβήτητα στο σύνολο των συντακτικών δομών που αφορούν το λήμμα, όχι σε μια μόνο δομή ("πλαίσιο").

Τέλος, γίνονται αποδεκτές μόνο οι ιδιότητες για τις οποίες υπάρχει διαδικασία που επιτρέπει να καθορίσουμε με αξιόπιστο τρόπο αν ένα λήμμα τις διαθέτει ή όχι, π.χ. εμπειρικά, ελέγχοντας την αναπαραγωγικότητα σε ένα ευρύ λεξιλόγιο με βάση τη διαίσθηση του φυσικού ομιλητή. Οι ιδιότητες μοντελοποιούνται ως διπολικές και όχι ως συνεχές.

Δεδομένου του τυπικού μοντέλου, ο καθορισμός των ιδιοτήτων των λημμάτων αποτελεί το ουσιαστικό μέρος της περιγραφής μιας γλώσσας. Τα αποτελέσματα της περιγραφής αναπαριστώνται σε πίνακες διπλής εισόδου που ονομάζονται πίνακες ή μήτρες. Στη διατομή τους συναντώνται τα λήμματα με τις συντακτικο-σημασιολογικές ιδιότητες [8].

Η περιγραφή της δομής των προτάσεων προϋποθέτει την εξακρίβωση ενός συνόλου ορισμάτων, χαρακτηριστικού για κάθε λήμμα. Πιο συγκεκριμένα, χρησιμοποιούμε κριτήρια για να διακρίνουμε τα ορίσματα (υποκείμενα και αντικείμενα ή κύρια συμπληρώματα) από τα δευτερεύοντα συμπληρώματα (επιρρηματικοί προσδιορισμοί ή περιστασιακά συμπληρώματα).

Αποτελέσματα[Επεξεργασία | επεξεργασία κώδικα]

Τα αποτελέσματα που προέκυψαν από την πολυετή έρευνα δεκάδων γλωσσολόγων ύστερα από την εφαρμογή των μεθοδολογικών αυτών κριτηρίων αποτελούν βάση συντακτικο-σημασιολογικών πληροφοριών για την επεξεργασία των γλωσσών, της οποίας την ποιότητα μπορούμε να κρίνουμε αν λάβουμε υπόψη μας τα εξής:

- τον όγκο της που μπορεί να αξιολογηθεί με βάση τον αριθμό των λημμάτων,

- τον πλούτο των γλωσσικών φαινομένων που λαμβάνει υπόψη της και που μπορεί να αξιολογηθεί με βάση τον αριθμό των ιδιοτήτων,

- και το βαθμό τυποποίησης.

Για τα γαλλικά, περισσότερα από 75.000 λήμματα έχουν καταχωριστεί [17]. Υπάρχουν επίσης, σύμφωνα πάντα με το ίδιο μοντέλο, λιγότερο ή περισσότερο αξιόλογες περιγραφές που αφορούν άλλες γλώσσες, τα νέα ελληνικά [18], τα ιταλικά [19], τα πορτογαλικά [20] και τα κορεάτικα [21]αποτελούν τους καλύτερους εκπροσώπους).

Έρευνες από τη δεκαετία του 1970 σχετικά με τα κατηγορηματικά ονόματα [22] και από τη δεκαετία του 1980 σχετικά με τις παγιωμένες εκφράσεις πραγματοποιήθηκαν και δημοσιεύτηκαν [23] στο πλαίσιο του λεξικού-γραμματικής.

Η έννοια του κατηγορηματικού ονόματος συναντάται στο έργο του Zellig Harris [24]. Έχει ως αφετηρία την ιδέα ότι, αν, π.χ. το ρήμα επιτίθεμαι, αναλυθεί ως το κατηγόρημα στην πρόταση Ο εχθρός επιτίθεται στην πόλη, περιμένουμε ότι το ουσιαστικό επίθεση (ή η ακολουθία κάνω επίθεση) θα αναλυθεί ως κατηγόρημα στην πρόταση Ο εχθρός κάνει επίθεση στην πόλη. Στην περίπτωση αυτή το ουσιαστικό ονομάζεται κατηγορηματικό ουσιαστικό. Το ρηματικό στοιχείο που το συνοδεύει ονομάζεται υποστηρικτικό ρήμα. Η παραπάνω θέση βρήκε συστηματική εφαρμογή στο πλαίσιο του λεξικού-γραμματικής από τη δεκαετία του 1970 [22][25][26][27].

Με τον όρο παγιωμένη έκφραση, οι συντελεστές του λεξικού-γραμματικής, εννοούν μια έκφραση (π.χ. ήλιος του μεσονυκτίου) που χαρακτηρίζεται από ειδικά κριτήρια (στην παραπάνω περίπτωση, τη σημασία) που δικαιολογούν την ύπαρξη ξεχωριστού λήμματος, παρόλο που η έκφραση αποτελείται από περισσότερα από ένα στοιχεία, που, με τον έναν ή τον άλλο τρόπο, μπορούν να θεωρηθούν λέξεις [23]. Τη δεκαετία του 1980 ξεκίνησε συστηματικό πρόγραμμα περιγραφής των εκφράσεων αυτών στο πλαίσιο του λεξικού-γραμματικής [28][29][30].

Συσσώρευση[Επεξεργασία | επεξεργασία κώδικα]

Οι έρευνες απέδειξαν ότι πολλά άτομα ή ομάδες μπορούν να καταλήξουν σε παρόμοια αποτελέσματα. Η αναπαραγωγικότητα αυτή εξασφαλίζει την συσσώρευση των περιγραφών. Το αποτέλεσμα είναι σημαντικό για το μέλλον της επεξεργασίας των γλωσσών. Η ποιότητα των δεδομένων που πρέπει να συγκεντρώνεται και να αναπαρίσταται στο πλαίσιο ενός μοντέλου που χαρακτηρίζεται από συνοχή είναι τέτοια ώστε να απαιτείται η συνεργασία πολλών ερευνητικών ομάδων που πρέπει να μπορούν να συνδέουν τα αποτελέσματά τους χωρίς να χρειάζεται να επανασυντάσσουν τα κύρια μέρη της γραμματικής και του λεξικού κάθε γλώσσας. Οι απαιτήσεις είναι μεγάλες και δεν είναι καθόλου εύκολο να ικανοποιηθούν πλήρως γιατί γνωρίζουμε λίγα παραδείγματα ευμεγεθών γραμματικών που να μην αποτελούν έργο ενός μόνο ειδικού.

Αναφορές[Επεξεργασία | επεξεργασία κώδικα]

  1. Ibrahim, Amr Helmy (2003). «Le cadre du lexique-grammaire». Linx 48: 101-122. http://linx.revues.org/219. 
  2. Gross, Maurice. 1968. Grammaire transformationnelle du français. Vol. 1, Syntaxe du verbe, εκδ. Larousse, Paris (επανεκδόθηκε με τον ίδιο τίτλο, Paris: Cantilène, 1986).
  3. 3,0 3,1 Harris, Zellig (1964). «Transformations in Linguistic Structure». Proceedings of the American Philosophical Society 108 (5): 418-122. 
  4. 4,0 4,1 Harris, Zellig. 1976. Notes du cours de syntaxe, εκδ. Seuil, Paris.
  5. 5,0 5,1 Lamiroy, Béatrice (2003). «In memoriam Maurice Gross». Travaux de linguistique 46 (1): 145-158. http://www.cairn.info/article.php?ID_ARTICLE=TL_046_0145. 
  6. 6,0 6,1 Michel Delamar, Maurice Gross.
  7. 7,0 7,1 Roche, Emmanuel, 1997, "Parsing with Finite-State Transducers", in Finite-State Language Processing, εκδ. MIT Press, Cambridge, Mass./London.
  8. 8,0 8,1 Gross, Maurice. 1975. Méthodes en syntaxe. Le régime des constructions complétives, εκδ. Hermann, Paris.
  9. Gross, Maurice (1979). «On the failure of generative grammar». Language 55 (4): 859-885. 
  10. Gross, Maurice, A linguistic environment for comparative Romance syntax, Papers from the XIIth Linguistic Symposium on Romance Languages, 1984, pp. 373-446, εκδ. John Benjamins, Amsterdam/Philadelphia.
  11. Gross, Maurice. 1988. Methods and Tactics in the Construction of a Lexicon-Grammar. In Linguistics in the Morning Calm 2, Selected Papers from SICOL 1986, pp. 177-197, εκδ. Hanshin Pub. Co., Seoul.
  12. Κυρίως χάρη στο λογισμικό Intex που ανέπτυξε ο Max Silberztein.
  13. Laporte, Éric. 2008. Exemples attestés et exemples construits dans la pratique du lexique-grammaire. Observations et manipulations en linguistique: entre concurrence et complémentarité, sous la direction de Jacques François, εκδ. Peeters, Louvain/Paris/Dudley. Mémoires de la Société de linguistique de Paris. Nouvelle Série. Vol. 16, pp. 11–32.
  14. Fillmore, Charles. 1992. "'Corpus linguistics' vs. 'Computer-aided armchair linguistics'". Directions in Corpus Linguistics, εκδ. Mouton de Gruyter, pp. 35-60. (Proceedings from a 1992 Nobel Symposium on Corpus Linguistics, Stockholm.)
  15. Baker, Collin F.; Charles J. Fillmore, Beau Cronin (2003). «The Structure of the Framenet Database». International Journal of Lexicography 16 (3): 281-296. 
  16. Kipper-Schuler, Karin, Anna Korhonen, Neville Ryant, Martha Palmer. 2006. "Extending VerbNet with Novel Verb Classes". Proceedings of the International Conference on Language Resources and Evaluation (LREC), Genoa.
  17. Gross, Maurice. 2006. État du lexique-grammaire du français et perspectives d'extension. History of the Language Sciences, tome 3, Sylvain Auroux et al. (eds.), εκδ. Walter de Gruyter, Berlin-New York, pp. 2122-2129.
  18. Kyriacopoulou, Tita. 2004. Analyse automatique des textes écrits : le cas du grec moderne. Thessaloniki : University Press.
  19. D'Agostino, Emilio, Annibale Elia, & Simonetta Vietri. 2004. "Lexicon-Grammar, Electronic Dictionaries and Local Grammars of Italian", Lexique, syntaxe et lexique-grammaire. Papers in honour of Maurice Gross, Coll. Lingvisticae Investigationes Supplementa, 24, εκδ. Benjamins, Amsterdam/Philadelphia, pp. 125–136.
  20. Ranchhod, Elisabete; P. Carvalho; C. Mota; A. Barreiro, "Portuguese Large-scale Language Resources for NLP Applications". In Proceedings of the 4th LREC, pp. 1755-1758, Lisbon.
  21. Nam, Jee-sun (1997). «Lexique grammaire des adjectifs coréens et analyse syntaxique automatique». Langages 126: 105-123. http://www.persee.fr/articleAsPDF/lgge_0458-726x_1997_num_31_126_1779/article_lgge_0458-726x_1997_num_31_126_1779.pdf?mode=light. 
  22. 22,0 22,1 Labelle, Jacques (1974). «Le substantif symétrique». Cahiers de Linguistique (UQAM) 5: 17-49. 
  23. 23,0 23,1 Gross, Maurice (1982). «Une classification des phrases "figées" du français». Revue québécoise de linguistique (UQAM) 11 (2): 151-185. 
  24. Harris, Zellig, 1964. "The Elementary transformations", Transformations and Discourse Analysis Papers, 54, Philadelphia, University of Pennsylvania (επαναδημοσιεύτηκε στο Papers in Structural and Transformational Linguistics, 1970, εκδ. Reidel, Dordrecht).
  25. Giry-Schneider, Jacqueline. 1978. Les nominalisations en français. L'opérateur faire dans le lexique, εκδ. Droz, Genève.
  26. Giry-Schneider, Jacqueline. 1987. Les prédicats nominaux en français. Les phrases simples à verbe support, εκδ. Droz, Genève.
  27. Gross, Gaston. 1989. Les constructions converses du français, εκδ. Droz, Genève.
  28. Danlos, Laurence (1981). pdf «La morphosyntaxe des expressions figées». Langages 63: 53-74. http://www.persee.fr/articleAsPDF/lgge_0458-726x_1981_num_15_63_1876/article_lgge_0458-726x_1981_num_15_63_1876.pdf?mode=light pdf. 
  29. Gross, Maurice. 1986. "Lexicon-Grammar. The Representation of Compound Words". In COLING-1986 Proceedings, Bonn, pp. 1-6.
  30. Ranchhod, Elisabete. 1990. Sintaxe dos Predicados Nominais com Estar. Linguistica 1-2, Lisboa: Instituto Nacional de Investigaçao Cientifica.

Δείτε ακόμη[Επεξεργασία | επεξεργασία κώδικα]

Εξωτερικοί σύνδεσμοι[Επεξεργασία | επεξεργασία κώδικα]

Οπτικοποίηση πινάκων λεξικού-γραμματικής (επιλέξτε γλωσσικά δεδομένα, Λεξικό-Γραμματική).

Βιβλιογραφία[Επεξεργασία | επεξεργασία κώδικα]