Μετάβαση στο περιεχόμενο

Θέμα στο Συζήτηση χρήστη:Geraki/Structured Discussions Archive 1

Gts-tg (συζήτησησυνεισφορές)

Στο Χρήστης:Gts-tg/εκζ/ευρετήριο, 33 χιλιάδες λήμματα. Τα ονοματεπώνυμα είναι στη σωστή σειρά, οι γραμμές με ή έχουν σπάσει σε ξεχωριστούς συνδέσμους, και άλλες μικροδιορθώσεις. Υπάρχουν ακόμα κάποιες ατέλειες αλλά είναι αρκετά μικρές.

Gts-tg (συζήτησησυνεισφορές)

Νομίζεις ότι μπορούμε να το μεταφέρουμε σε κάποια Βικισελίδα (κάτω από τον ονοματοχώρο Βικιπαίδεια;)

Geraki (συζήτησησυνεισφορές)

Διόρθωσα μερικά στο γράμμα Ν, γενικά υπάρχουν αρκετά που έχει αλλάξει η σειρά των λέξεων χωρίς να είναι ονοματεπώνυμα.

Νομίζω ότι είναι καλύτερα να μείνουν στο ονοματοχώρο Χρήστη, αλλά να δημιουργήσουμε ένα index σε στυλ Βικιεπιχείρηση Εγκυκλοπαιδική Πληρότητα που να συγκεντρώνει αυτή και παρόμοιες λίστες (όπως των ζωτικών λημμάτων, τις λίστες ΧΧΧ σημαντικότερων στον τομέα τους κλπ.)

Gts-tg (συζήτησησυνεισφορές)

Τελικά υπάρχουν και πληροφορίες από το API για κόκκινους συνδέσμους, π.χ. https://el.wikipedia.org/w/api.php?action=query&format=json&pageids=498191&generator=links&gpllimit=max όπου οι καταχωρήσεις με αρνητικά id είναι κόκκινοι σύνδεσμοι. Το pageid είναι το wgetArticleID στον πηγαίο κώδικα (view source) της σελίδας (π.χ. το https://el.wikipedia.org/w/?curid=498191 πηγαίνει επίσης στην σελίδα). Ίσως μπορεί να χρησιμοποιηθεί κάποιο από τα γραφήματα με υποστήριξη JSON που ανέφερες πρόσφατα, αν και το να έχουμε την δυνατότητα να χρησιμοποιήσουμε πρότυπο για να μας φέρει το σύνολο των συνδέσμων που λείπουν είναι επίσης πολύ χρήσιμο.

Geraki (συζήτησησυνεισφορές)

Έχω ήδη φτιάξει ένα script που μετράει τους κόκκινους συνδέσμους στις 24 σελίδες, τους αθροίζει, και δημιουργεί ένα πρότυπο με 25 παραμέτρους. Αυτή τη στιγμή σκάει σε κάτι που έχει σχέση με το encoding, ενώ παλιότερα κάτι παρόμοιο δεν μου έκανε τέτοια προβλήματα. Θα προσπαθήσω να το διορθώσω. Για να εκμεταλλευτούμε το API θα πρέπει να γίνει με lua module και είναι πέρα από τις δυνάμεις και το χρόνο μου.

Geraki (συζήτησησυνεισφορές)

@Gts-tg, μάλλον τα κατάφερα. Προς το παρόν Χρήστης:Geraki/EKZ ενημερώνεται αυτόματα, για σήμερα το έβαλα κάθε μια ώρα για να δούμε πως πάει. Μετά μπορούμε να το κάνουμε 24ωρο. Το τι ακριβώς θα κάνει το πρότυπο, είναι από και πέρα δική μας δουλειά.

Gts-tg (συζήτησησυνεισφορές)

Οκ, σε σχέση με την ΕΚΖ αυτό που ανανεώνεται αυτόματα είναι η σελίδα στο Χρήστης:Geraki/EKZ έτσι; Είναι χρήσιμο αλλά η αλήθεια είναι πως είχα την εντύπωση πως θα έχουμε ένα πρότυπο το οποίο θα επιστρέφει σύνολο κόκκινων για το κάθε γράμμα, και από εκεί θα μπορούσαμε να κάνουμε διάφορους συνδυασμούς (π.χ. θα μπορούσαμε να έχουμε και το ποσοστό συμπλήρωσης σε κάθε γράμμα ξεχωριστά να ανανεώνεται αυτόματα).

Θα το ψάξω κάποια στιγμή αυτό με το API καλύτερα όταν θα έχω αρκετά περισσότερο χρόνο (από νέο έτος) γιατί έτσι θα μπορούμε να έχουμε και σύνολο κόκκινων για όποιαδηποτε σελίδα στη ΒΚ, αλλά και τίτλους των ίδιων των κόκκινων (ή και μπλε) συνδέσμων, οπότε θα είμαστε σε θέση να κάνουμε πολλά και διάφορα ενδιαφέροντα πράγματα. Ίσως αυτή η ενασχόληση με την ΕΚΖ και με αυτά που δοκιμάζουμε έως τώρα λειτουργεί και ως idea incubator.

Geraki (συζήτησησυνεισφορές)

Βασικά αυτό κάνει. Δες το στο Χρήστης:Gts-tg/εκζ/θ. Στην ουσία περιέχει τις παραμέτρους που δίνει στο Χρήστης:Geraki/EKZ/Ευρετήριο, αντίστοιχο με το Χρήστης:Gts-tg/εκζ/ευρετήριο, αλλά με συμπληρωμένες όλες τις παραμέτρους εκτός από το σύνολο γράμματος (ακόμη και το σε ποιο γράμμα είναι το παίρνει από τον τίτλο). Για διαφορετικές χρήσεις μπορώ να το κάνω να τα αποθηκεύει και σε άλλες σελίδες/πρότυπα.

Βασικά αυτή είναι η ουσία, μέσα από τις διαδικασίες βγαίνουν άλλα ενδιαφέροντα πράγματα, βρίσκουμε τρόπους να λύσουμε προβλήματα σε άλλα, ακόμη και άσχετα θέματα, και βασικά μαθαίνουμε. Ήδη μέσα από αυτό έλυσα πολλές απορίες μου για τη διαχείριση unicode string και αρχείων στην python. Πράγμα που σημαίνει ότι μπορώ πιο άνετα να επανασχεδιάσω την αυτόματη ενημέρωση των αποτιμήσων λημμάτων στις βικιεπιχειρήσεις:

Gts-tg (συζήτησησυνεισφορές)

Για τα unicode εάν έχεις την δυνατότητα χρησιμοποίησε Python 3 και πάνω. Οι παλαιότερες εκδόσεις είναι χρήσιμες γιατί έχουν ευρεία υποστήριξη modules, αλλά η 3 έχει εγγενή υποστήριξη για Unicode.

Gts-tg (συζήτησησυνεισφορές)

Play it again Sam

Geraki (συζήτησησυνεισφορές)

Το έχω βάλει να τρέχει μόνο 4 φορές την ημέρα. Είδα τώρα ότι σήμερα έφαγε και μια φλασιά και έκανε διαδοχικές επεξεργασίες, για κάποια γράμμα, που δεν δικαιολογείται από τον κώδικα, το cron κλπ. και θα το κοιτάξω. Είμαι μλκς, φυσικά και έφταιγε το cron έτσι όπως το έδωσα :-/ Σταδιακά θα περάσει στο Gerakibot.

Απαντήστε στο "Λήμματα ΕΚΖ"