Συμπίεση δεδομένων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση

Με τον όρο συμπίεση δεδομένων (data compression) εννοούμε τη μετατροπή ενός ψηφιακού αρχείου (για αποστολή ή αποθήκευση) σε μικρότερο αρχείο (που περιέχει μικρότερο αριθμό μπιτ) με τρόπο ώστε να είναι δυνατή η επαναμετατροπή του συμπιεσμένου αρχείου στο αρχικό. Για το σκοπό αυτό χρησιμοποιούνται πολλές μέθοδοι, οι οποίες χωρίζονται σε δύο μεγάλες κατηγορίες: τις μη απωλεστικές και τις απωλεστικές.

Πολλά αρχεία περιέχουν μεγάλα τμήματα τα οποία επαναλαμβάνονται (όπως ένα αρχείο κειμένου μπορεί να περιέχει πολλές φορές τη λέξη Κωνσταντινούπολη οπότε αρκεί η λέξη να τοποθετηθεί σε έναν πίνακα με λέξεις και να αντικαθίσταται με έναν αριθμό που δείχνει τη θέση της στον πίνακα) ή περιέχουν δεδομένα που η απώλειά τους δεν προκαλεί σοβαρή μεταβολή του περιεχόμενου.

Η συμπίεση μπορεί να μειώσει τον όγκο των δεδομένων που στέλνονται ή αποθηκεύονται, με την ελαχιστοποίηση του ενυπάρχοντος πλεονασμού. Ο πλεονασμός παρουσιάζεται κατά τη δημιουργία των δεδομένων. Με τη διαδικασία της συμπίεσης η μεταφορά και η αποθήκευση γίνονται με πιο αποδοτικό τρόπο, ενώ παράλληλα διατηρείται η ακεραιότητα των δεδομένων.

Κατηγορίες συμπίεσης[Επεξεργασία | επεξεργασία κώδικα]

Μη απωλεστική συμπίεση[Επεξεργασία | επεξεργασία κώδικα]

Στην μη απωλεστική συμπίεση (lossless compression) διατηρείται η ακεραιότητα των δεδομένων. Τα αρχικά δεδομένα και τα δεδομένα μετά τη συμπίεση και την αποσυμπίεση είναι ακριβώς τα ίδια, επειδή σε αυτές τις μεθόδους ο αλγόριθμος συμπίεσης και ο αλγόριθμος αποσυμπίεσης είναι ακριβώς αντίστροφοι. Κατά τη διαδικασία δε χάνεται κανένα μέρος των δεδομένων. Τα πλεονάζοντα δεδομένα κωδικοποιούνται κατά τη συμπίεση και αποκωδικοποιούνται κατά την αποσυμπίεση. Αυτοί οι μέθοδοι χρησιμοποιούνται όταν δεν πρέπει να χαθεί ούτε ένα μπιτ δεδομένων όπως στην περίπτωση ενός αρχείου κειμένου ή ενός προγράμματος.

Τα γνωστά προγράμματα 7z, bz, zip και rar χρησιμοποιούν μη απωλεστική συμπίεση.

Απωλεστική συμπίεση[Επεξεργασία | επεξεργασία κώδικα]

Η απώλεια δεδομένων μπορεί να μην είναι αποδεκτή σε αρχεία κειμένου ή ενός προγράμματα, είναι όμως αποδεκτή σε εικόνες και ταινίες. Ο λόγος είναι ότι τα μάτια μας και τα αφτιά μας δεν μπορούν να διακρίνουν πολύ μικρές αλλαγές. Για τέτοιες περιπτώσεις είναι κατάλληλες οι απωλεστικές μεθόδοι συμπίεσης (lossy data compression). Οι μέθοδοι αυτές είναι οικονομικότερες και απαιτούν λιγότερο χρόνο και χώρο όταν πρέπει να σταλούν εκατομμύρια μπιτ εικόνων και βίντεο το δευτερόλεπτο.

Χαρακτηριστικό παράδειγμα απωλεστικής συμπίεσης εικόνας είναι η μέθοδος JPEG (Joint Photografic Experts Group) για βίντεο η μέθοδος MPEG (Moving Pictures Experts Group) και για ήχο το πρότυπο mp3.

Βιβλιογραφία[Επεξεργασία | επεξεργασία κώδικα]

  • Behrouz A. Forouzan. «Εισαγωγή στην Επιστήμη των Υπολογιστών», Επιμέλεια Γιώργος Στεφανίδης, Αλέξανδρος Χατζηγεωργίου, Εκδόσεις Κλειδάριθμος.