Μετάβαση στο περιεχόμενο

Σλοβενική Εθνική Συλλογή

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Η Σλοβενική Εθνική Συλλογή FidaPLUS είναι η συλλογή 621 εκατομμυρίων λέξεων της σλοβενικής γλώσσας, που συγκεντρώθηκαν από επιλεγμένα κείμενα γραμμένα στα Σλοβενικά διαφορετικά είδη και στυλ, κυρίως από βιβλία και εφημερίδες.[1]

Η βάση δεδομένων FidaPLUS από την παλαιότερη συλλογή (FIDA), το οποίο αναπτύχθηκε μεταξύ του 1997 και του 2000, με την προσθήκη κειμένων που δημοσιεύτηκαν μέχρι το 2006 και ήταν το αποτέλεσμα του εφαρμοσμένου ερευνητικού έργου της Σχολής των Τεχνών, της Σχολής Κοινωνικών Επιστημών, τόσο στο Πανεπιστήμιο της Λιουμπλιάνα, και το Τμήμα Τεχνολογιών Γνώσης του Ινστιτούτο Γιόζεφ Στεφάν.[2]

Η Συλλογή είναι διαθέσιμη μέσω ενός διαχειριστή συλλογών Sketch Engine.[3] Αυτή η έκδοση της συλλογής FidaPLUS περιέχει σκίτσα λέξεων, μια αυτόματη επισκόπηση της γραμματικής και συνεργατικής συμπεριφοράς συμπεριφοράς της λέξης προερχόμενος από συλλογή.

Έτος έκδοσης Αριθμός λέξεων Ποσοστό
1979 - 1990 262.708 0.04%
1991 1.487.895 0.24%
1992 2.256.692 0.36%
1993 3.208.687 0.52%
1994 7.534.689 1.21%
1995 7.433.897 1.2%
1996 16.913.916 2.27%
1997 31.589.250 5.09%
1998 43.512.041 7.01%
1999 54.711.630 8.81%
2000 57.677.534 9.29%
2001 74.720.532 12.03%
2002 72.802.484 11.72%
2003 82.897.097 13.35%
2004 67.041.167 10.79%
2005 39.086.695 6.29%
2006 44.526.825 7.17%
N/A 13.486.261 2,17%
  1. «Archived copy». Αρχειοθετήθηκε από το πρωτότυπο στις 14 Νοεμβρίου 2010. Ανακτήθηκε στις 15 Μαρτίου 2012.  The FidaPLUS number of words by date of publication
  2. «Archived copy». Αρχειοθετήθηκε από το πρωτότυπο στις 21 Μαρτίου 2012. Ανακτήθηκε στις 22 Μαρτίου 2011.  The FidaPLUS team list and institutional affiliations
  3. FidaPLUS corpus in Sketch Engine

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]