Περιγραφή
πό τις αρχές του εικοστού αιώνα, παρατηρείται μια συνεχώς αυξανόμενη χρήση της Στατιστικής σ’ όλες τις επιστήμες. Η τάση αυτή ενισχύθηκε περαιτέρω τις τελευταίες δεκαετίες, ως αποτέλεσμα της συνεχούς αύξηση του όγκου των δεδομένων που συλλέγονται και υφίστανται στατιστική επεξεργασία με τη χρήση εφαρμογών λογισμικού. Είναι, λοιπόν, ουσιαστικό για τους φοιτητές των περισσοτέρων τμημάτων να αποκτήσουν κάποιες γνώσεις στις βασικές αρχές και στις τεχνικές της στατιστικής ανάλυσης, καθώς και να εξοικειωθούν με το στατιστικό λογισμικό.
Κύριος στόχος του βιβλίου αυτού είναι να δώσει με μαθηματική αυστηρότητα λύσεις σε στατιστικά προβλήματα, χωρίς όμως ο αναγνώστης να επιβαρυνθεί με εξειδικευμένες θεωρητικές αποδείξεις. Απευθύνεται σε μαθηματικούς και μη μαθηματικούς. Υπάρχουν παράγραφοι και εφαρμογές (που σημειώνονται με *) που η κατανόησή τους απαιτεί μαθηματική σκέψη και άλλες που απευθύνονται κυρίως σε χρήστες στατιστικής.
Τα περισσότερα παραδείγματα είναι αντιπροσωπευτικά πραγματικών προβλημάτων που συναντώνται σε πειραματικές επιστήμες. Η εφαρμογή των τεχνικών της στατιστικής ανάλυσης σε μεγάλα σύνολα δεδομένων προϋποθέτει τη χρήση εξειδικευμένων εφαρμογών λογισμικού.
Η γλώσσα R, ελεύθερο λογισμικό ανοικτού κώδικα για τη στατιστική επεξεργασία θεωρείται σήμερα ένα από τα εργαλεία λογισμικού με την μεγαλύτερη ζήτηση στην αγορά εργασίας. Συνοδεύεται από περισσότερα από 13000 πακέτα επέκτασης και αξιοποιείται σε πολλούς επιστημονικούς τομείς και σε εταιρείες – κολοσσούς. Στην παρούσα έκδοση, υπάρχουν παραδείγματα με πραγματικά δεδομένα, από την Ελληνική Στατιστική Υπηρεσία, κ.α., που επιλύονται χρησιμοποιώντας την γλώσσα ανοικτού κώδικά R.
Με αφορμή τη συγγραφή της τρίτης έκδοσης του βιβλίου, κατασκευάσαμε την βιβλιοθήκη gginference, η οποία είναι η πρώτη βιβλιοθήκη στην επίσημη ιστοσελίδα του CRAN της R (Comprehensive R Archive Network- http://cran.r-project.org) που παρουσιάζει γραφικά τα αποτελέσματα των ελέγχων στατιστικών υποθέσεων στατιστικής συμπερασματολογίας. Περιέχει ακόμα σύνολα δεδομένων που χρησιμοποιούνται στις ασκήσεις του βιβλίου.
Το βιβλίο αυτό αποτελείται από εννέα κεφάλαια που το καθένα περιλαμβάνει θεωρία, εφαρμογές, προτεινόμενες ασκήσεις, παραδείγματα στατιστικής ανάλυσης πραγματικών δεδομένων με χρήση της γλώσσας R, και συνοδεύεται από τυπολόγιο.
Για την επίλυση των ασκήσεων χρησιμοποιήθηκε η 3.5.1 έκδοση της R και 1.1.456 του RStudio, IDE, το οποίο είναι ένα ολοκληρωμένο περιβάλλον ανάπτυξης για καλύτερη διαχείριση και εκτέλεση κώδικα.
Στους ιστοτόπους https://www.r-project.org και https://www.rstudio.com, υπάρχουν σχετικά αρχεία και σαφείς οδηγίες εγκατάστασης της R και του RStudio αντίστοιχα.
Στο τέλος του βιβλίου, υπάρχει μια συλλογή με τίτλο “Γενικές Ασκήσεις” για εξοικείωση του αναγνώστη με απλά θέματα ανάλυσης δεδομένων και μια συλλογή στατιστικών πινάκων που θεωρούνται απαραίτητοι για τη λύση των ασκήσεων, καθώς και δυο σύντομους οδηγούς της γλώσσας R.