NOW 19

ΣΕΠΤΕΜΒΡΙΟΣ 2020 #15 Επιπλέον, η φύση και η μορφή των δεδομένων μπορεί να απαι- τούν ειδικό χειρισμό πριν από τη χρησιμοποίησή τους. Τα δομημέ- να δεδομένα, τα οποία αποτελούνται από αριθμητικές τιμές, μπο- ρούν εύκολα να αποθηκεύονται και να ταξινομούνται. Ενώ τα μη δομημένα δεδομένα, όπως τα μηνύματα ηλεκτρονικού ταχυδρο- μείου, τα video και τα έγγραφα κειμένου, ενδέχεται να απαιτούν πιο εξελιγμένες τεχνικές πριν χρησιμοποιηθούν. Εργαλεία Big Data Η κλίμακα των δεδομένων που παράγονται από μεγάλες γνωστές εταιρείες, μικρούς οργανισμούς και επιστημονι- κά έργα, αυξάνεται σε πρωτόγνωρα επίπεδα. Από τη μία πλευρά, το βουνό των παραγόμενων δεδομένων παρου- σιάζει τεράστιες προκλήσεις επεξεργασίας, αποθήκευσης και ανάλυσης και θα πρέπει να εξετάζεται προσεκτικά ο τρόπος που θα αντιμετωπιστεί. Από την άλλη πλευρά, τα παραδοσιακά συστήματα διαχείρισης βάσεων δεδομένων και τα εργαλεία επεξεργασίας τους, δεν επαρκούν για την αποτελεσματική διαχείριση αυτής της τεράστιας ποσότη- τάς τους, όταν το μέγεθος φτάνει σε Terabytes ή Petabytes. Τα εργαλεία αυτά δεν έχουν την ικανότητα να χειρίζονται τόσο μεγάλης κλίμακας όγκους δεδομένων με αποτελε- σματικό τρόπο. Υπάρχουν διαφορετικές λύσεις στην αγο- ρά για τη διαχείριση των Big Data που αντιμετωπίζουν με επιτυχία την πρόκλησή τους. Οι δημοφιλέστερες από αυ- τές είναι τα Hadoop και Spark που είναι λογισμικά ανοι- χτού κώδικα και αποτελούν μέρος του project Apache. Το Hadoop είναι μια συλλογή βοηθητικών προγραμμάτων που παρέχει ένα πλαίσιο λογισμικού για κατανεμημένη αποθή- κευση και επεξεργασία μεγάλων δεδομένων με τη χρήση του μοντέλου προγραμματισμού MapReduce, ενώ το Spark θεωρείται η φυσική εξέλιξη των αναλυτικών στοιχείων του Hadoop και προτιμάται από εταιρείες που αναζητούν πιο βελτιστοποιημένα μοντέλα. Παραδείγματα χρήσης Big Data Η χρήση Big Data αποδίδει οφέλη τόσο στον δημόσιο, όσο και στον ιδιωτικό τομέα. Πιο συγκεκριμένα, στον τομέα της Εκπαίδευσης βο- ηθάει στη δημιουργία προσαρμοσμένων και δυναμικών προγραμ- μάτων μάθησης, στην αναδιαμόρφωση του υλικού των μαθημάτων, στα συστήματα βαθμολόγησης και την πρόβλεψη της σταδιοδρο- μίας των μαθητών. Στον ασφαλιστικό κλάδο χρησιμοποιείται για τη συλλογή πληροφοριών, τη βελτίωση της εμπειρίας των πελατών, την ανίχνευση απάτης και τη χαρτογράφηση απειλών. Στον τραπεζι- κό τομέα μπορεί να βοηθήσει στην ανίχνευση κατάχρησης πιστωτι- κών και χρεωστικών καρτών, στη μείωση του πιστωτικού κινδύνου, στην τροποποίηση στατιστικών των πελατών και στη μείωση του κινδύνου για ξέπλυμα μαύρου χρήματος. Χρησιμοποιείται επίσης στην εκτέλεση του κυβερνητικού έργου από κυβερνήσεις που στο- χεύουν στην κατάρτιση σχεδίων προνοίας, καθώς και στον έλεγχο της κυβερνοασφάλειας. Ανακεφαλαιώνοντας Σήμερα, η παραγωγή ποσότητας δεδομένων στην καθημερινή μας ζωή είναι τεράστια και ο όγκος της συνεχίζει να αυξάνεται. Όσο με- γάλο κι αν είναι το μέγεθός τους, τα διαθέσιμα δεδομένα δε βελ- τιώνουν από μόνα τους έναν οργανισμό, χωρίς να αναλυθεί και να κατανοηθεί η αξία τους. Η συλλογή και η επεξεργασία αυτού του βουνού δεδομένων δεν μπορούν να πραγματοποιούνται με παρα- δοσιακές μεθόδους και επομένως, η χρήση ειδικών εργαλείων Big Data βοηθάει στην απορρόφηση, την επεξεργασία, την ανάλυση και την οπτικοποίηση αυτών των τεράστιων ποσοτήτων τους. Veracity: Τα δεδομένα προέρχονται από διάφορες πηγές και θα πρέπει να ελέγχεται η εγκυρότητά τους. 7 Αρχιτεκτονική συστήματος Hadoop. 9 Το Big Data είναι σημαντικό γιατί καλύπτει κρίσιμα ζητήματα των επιχειρήσεων. 8

RkJQdWJsaXNoZXIy NjE3Njcz