R (γλώσσα προγραμματισμού)

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση
Το λογότυπο της R[1]

Η R είναι μια γλώσσα προγραμματισμού ανοικτού κώδικα και περιβάλλον που παρέχει στον χρήστη τη δυνατότητα να κάνει υπολογιστική στατιστική και γραφήματα. Έχει πολλές ομοιότητες με το περιβάλλον της S, η οποία δημιουργήθηκε στα Εργαστήρια Bell από τον John Chambers[2]. Παρέχει τα απαραίτητα εργαλεία προκειμένου να υλοποιηθεί μια στατιστική ανάλυση. Κάποια από τα εργαλεία αυτά είναι:

  • δημιουργία τυχαίων δειγμάτων
  • διακριτές και συνεχείς μεταβλητές (Poisson, Gamma, Exponential κτλ)
  • έλεγχοι υποθέσεων
  • στατιστικά τεστ (Kolmogorov-Smirnoff)
  • δημιουργία γραφημάτων (ιστόγραμμα, qq plot, pie chart, bar chart κτλ)

Είναι GNU λογισμικό, δηλαδή ο καθένας μπορεί να κάνει βελτιώσεις στον πηγαίο κώδικα της R και να τις δημοσιεύει και επίσης διανέμεται δωρεάν. Λόγω του ότι όλοι έχουν πρόσβαση στον πηγαίο κώδικα της, έχουν γίνει πολλές βελτιώσεις από τότε που δημιουργήθηκε. Οι αρχικοί δημιουργοί ήταν οι Robert Gentleman και Ross Ihaka, αργότερα όμως συνέβαλλαν και άλλοι στην ανάπτυξη της.[3]

Πλεονεκτήματα και Μειονεκτήματα[Επεξεργασία | επεξεργασία κώδικα]

Η R προέρχεται από την S,αλλά η R μπορεί να κάνει τα ίδια πράγματα με την S και με πολύ λιγότερο κώδικα. Είναι open source περιβάλλον, άρα όλοι μπορούν να έχουν πρόσβαση στον κώδικά της και να κάνουν διορθώσεις.Επιπλέον, επιτρέπει στον χρήστη να αλληλεπιδρά και με άλλες γλώσσες (C/C++, Java, Python), με αρχεία δεδομένων(Excel, Access) και με άλλα στατιστικά πακέτα (SAS, Stata, SPSS, Minitab). Τέλος, το περιβάλλον της R παρέχεται δωρεάν.[4] Η R δεν συνιστάται για ανάλυση μεγάλων δεδομένων.Το βασικό μειονέκτημα της R είναι ότι καταναλώνει πολύ μνήμη. Είναι 'αργή' γλώσσα και άρα ως προς τον χρόνο εκτέλεσης των εντολών δεν είναι τόσο αποδοτική.[5]


Εφαρμογές[Επεξεργασία | επεξεργασία κώδικα]

Ιστόγραμμα Εκθετικής(2) κατανομής

Λόγω του ότι η R έχει πάνω από 5000 πακέτα, χρησιμοποιείται σε πολλούς επιστημονικούς τομείς. Κατ'αρχάς χρησιμοποιείται σε εταιρίες όπως οι Google, LinkedIn, Facebook που κάνουν ανάλυση δεδομένων. Επιπλέον χρησιμοποιείται και σε άλλους τομείς, όπως στα οικονομικά, στην αστρονομία, στην χημεία, στην φαρμακευτική, στην ιατρική, στο μάρκετινγκ κτλ.[6]

Παραδείγματα[Επεξεργασία | επεξεργασία κώδικα]

> sample=rexp(10000,rate=2) #παίρνουμε δείγμα 10000 τιμών από την Εκθετική(2) κατανομή
> mean(sample) #δειγματικός μέσος
[1] 0.4960264
> var(sample) #δειγματική διασπορά
[1] 0.2421675
> hist(exp2,ylab="FREQUENCY",main="HISTOGRAM OF EXPONENTIAL(2) FOR n=10000",xlim=c(0,4),ylim=c(0,2000),breaks=50,col="green") #ιστόγραμμα

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]