nowmag.gr

BIG DATA

Τι είναι τα «Μεγάλα Δεδομένα», ποια τα χαρακτηριστικά τους και πώς λειτουργούν;

Μία από τις πολλές διεθνείς ορολογίες που τα τελευταία χρόνια έχουν αποκτήσει σημαντική δυναμική στον κόσμο της τεχνολογίας είναι αυτή του Big Data, η οποία μάλιστα έχει διπλή έννοια. Αναφέρεται τόσο στην ύπαρξη  μεγάλου όγκου ψηφιακών δεδομένων, όσο και στην τεχνολογία που περιλαμβάνει τα κατάλληλα εργαλεία και διαδικασίες που απαιτούνται από έναν οργανισμό, ώστε να μπορεί αυτός να χειρίζεται μεγάλες ποσότητες δεδομένων και μονάδων αποθήκευσης.

Γράφει ο Χάρης Ματθαίου

Η τεχνολογία Big Data δίνει τη δυνατότητα στις εταιρείες να βελτιώνουν τη λειτουργία τους και να λαμβάνουν ταχύτερες, αλλά και πιο έξυπνες αποφάσεις. Τα δεδομένα μπορούν να παράγονται και να συλλέγονται από διάφορες πηγές, συμπεριλαμβανομένων των μηνυμάτων ηλεκτρονικού ταχυδρομείου, φορητών συσκευών, εφαρμογών, βάσεων δεδομένων, διακομιστών και άλλων ακόμα μέσων. Αυτά λοιπόν τα δεδομένα, όταν συλλεχθούν, μορφοποιηθούν, επεξεργαστούν, αποθηκευτούν και στη συνέχεια αναλυθούν, μπορούν να βοηθήσουν μια εταιρεία να αποκτήσει χρήσιμες πληροφορίες για να αυξήσει τα έσοδα, να κερδίσει ή να διατηρήσει πελάτες και να βελτιώσει τις λειτουργίες της.

Τι σημαίνει ο όρος Big Data;

Ο όρος Big Data περιγράφει τον μεγάλο όγκο δεδομένων που μπορεί να είναι είτε δομημένος (structured), είτε μη δομημένος (unstructured) και κατακλύζει μια επιχείρηση καθημερινά. Τα δεδομένα αυτά που είναι τόσο μεγάλα, γρήγορα ή πολύπλοκα, δεν μπορούν να δεχτούν επεξεργασία με τη χρήση παραδοσιακών μεθόδων. Έτσι, μεγαλύτερη σημασία δεν έχει το μέγεθος της ποσότητας των δεδομένων, αλλά οι ενέργειες που αναλαμβάνουν οι οργανισμοί για να χειρίζονται αυτά τα δεδομένα. «Μεγάλα δεδομένα» μπορούν να αναλύονται για εξαγωγή συμπερασμάτων που οδηγούν σε καλύτερες αποφάσεις και στρατηγικές επιχειρηματικές κινήσεις. Η χρήση Big Data είναι πολύ συνηθισμένη στις μέρες μας από τις εταιρείες που επιθυμούν να σημειώνουν καλύτερες επιδόσεις σε σχέση με άλλες που δραστηριοποιούνται στον ίδιο κλάδο. Στις περισσότερες βιομηχανίες, οι υπάρχοντες ανταγωνιστές και οι νεοεισερχόμενοι οργανισμοί, χρησιμοποιούν τις στρατηγικές εκείνες που προκύπτουν από τα αναλυθέντα δεδομένα, ώστε να ανταγωνιστούν, να καινοτομήσουν και να συλλάβουν την αξία τους. Τα μεγάλα δεδομένα βοηθούν τους οργανισμούς να δημιουργούν νέες ευκαιρίες ανάπτυξης και εντελώς νέες κατηγορίες εταιρειών που μπορούν να συνδυάζουν και να αναλύουν δεδομένα του κλάδου τους. Οι εταιρείες αυτές κατέχουν άφθονες πληροφορίες σχετικά με τα προϊόντα και τις υπηρεσίες, τους αγοραστές και τους προμηθευτές, καθώς και τις προτιμήσεις των καταναλωτών, οι οποίες μπορούν να καταγράφονται και να αναλύονται.

Ιστορία και χαρακτηριστικά του Big Data

Παρόλο που ο όρος Big Data είναι σχετικά νέος, η εκτέλεση συλλογής και αποθήκευσης μεγάλου όγκου πληροφοριών με σκοπό την ανάλυσή τους, υπήρχε εδώ και πολύ καιρό. Όμως, η έννοια των μεγάλων δεδομένων απέκτησε δυναμική στις αρχές της δεκαετίας του 2000, όταν ο αναλυτής του κλάδου Doug Laney διατύπωσε τον σημερινό ορισμό του Big Data που βασίζεται στα πέντε V, Volume, Velocity, Variety, Value και Veracity, τα οποία αποτελούν και τα χαρακτηριστικά αυτής της τεχνολογίας.

Volume (Όγκος): Οι οργανισμοί συλλέγουν δεδομένα από μια ποικιλία διαφορετικών πηγών, συμπεριλαμβανομένων επιχειρηματικών συναλλαγών, έξυπνων συσκευών (IoT), βιομηχανικού εξοπλισμού, video, social media και άλλων ακόμα μέσων. Κατά το παρελθόν, η αποθήκευση τέτοιων δεδομένων θα ήταν πρόβλημα, όμως οι νέες τεχνολογίες (όπως το ανοιχτού κώδικα λογισμικό Hadoop) έχουν μειώσει το φορτίο τους. Επιπλέον, για να μπορεί πραγματικά να θεωρηθεί ως Big Data ή όχι ένα συγκεκριμένο σύνολο δεδομένων, λαμβάνεται υπόψη ο όγκος που διαθέτει.

Velocity (Ταχύτητα): Με την ανάπτυξη του Διαδικτύου των Πραγμάτων (IoT), οι ροές δεδομένων προς τις επιχειρήσεις διοχετεύονται με πρωτοφανή ταχύτητα κι έτσι πρέπει να αντιμετωπίζονται έγκαιρα. Ο όρος velocity αναφέρεται στην ταχύτητα παραγωγής δεδομένων, καθώς η ροή τους είναι τεράστια και συνεχής. Το πόσο γρήγορα δημιουργούνται τα δεδομένα και υποβάλλονται σε επεξεργασία για την ικανοποίηση των εκάστοτε απαιτήσεων, καθορίζει το πραγματικό δυναμικό τους. Το velocity ασχολείται με την ταχύτητα ροής δεδομένων από διάφορες πηγές, όπως επιχειρηματικές διαδικασίες, αρχεία καταγραφής εφαρμογών, δίκτυα και ιστότοπους των social media, αισθητήρες, φορητές συσκευές και άλλα ακόμα μέσα.

Variety (Ποικιλία): Τα δεδομένα διατίθενται σε όλους τους τύπους μορφών, από δομημένα σύνολα δεδομένων και αριθμητικά δεδομένα σε παραδοσιακές βάσεις δεδομένων, έως μη δομημένα έγγραφα κειμένου, email, video, ήχους, δεδομένα μετοχών και χρηματοοικονομικές συναλλαγές. Γενικά, ο όρος variety αναφέρεται σε ετερογενείς πηγές και στη φύση των δεδομένων, τόσο δομημένων όσο και μη δομημένων. Παλαιότερα, τα υπολογιστικά φύλλα και οι βάσεις δεδομένων ήταν οι μόνες πηγές δεδομένων που εξετάζονταν από τις περισσότερες εφαρμογές. Ενώ σήμερα, στις εφαρμογές ανάλυσης εξετάζονται επίσης δεδομένα από μηνύματα ηλεκτρονικού ταχυδρομείου, φωτογραφίες, video, συσκευές παρακολούθησης, αρχεία PDF, ήχου κ.λπ. Αυτή η ποικιλία των μη δομημένων δεδομένων δημιουργεί συγκεκριμένα ζητήματα συλλογής, αποθήκευσης και ανάλυσής τους.

Value (Αξία): Λόγω του τεράστιου όγκου δεδομένων που πρέπει να υποβάλλονται σε επεξεργασία, πρέπει να δίνεται ιδιαίτερη προσοχή στην επιλογή των δεδομένων που είναι ζωτικής σημασίας για την εταιρεία και τις μελλοντικές της δραστηριότητες. Ένας σωστός προσδιορισμός στόχων και στρατηγικής πριν από την αποθήκευση δεδομένων, θα εξοικονομήσει αρκετό από τον υπολογιστικό χρόνο και θα διευκολύνει τη μακροπρόθεσμη διαχείρισή τους.

Veracity (Εγκυρότητα): Ο όρος veracity αναφέρεται στην εγκυρότητα των δεδομένων και η τροφοδοσία των Big Data πρέπει να προέρχεται από σχετικές και αληθείς πηγές. Επειδή τα δεδομένα αυτά μπορούν να προέρχονται από τόσες πολλές διαφορετικές πηγές, είναι δύσκολο να συσχετίζονται, να αντιστοιχίζονται, να καθαρίζονται και να μεταφορτώνονται σε όλα τα συστήματα. Έτσι, οι επιχειρήσεις πρέπει να είναι σε θέση να συσχετίζουν και να ιεραρχούν πολλαπλούς συνδέσμους δεδομένων, καθώς σε διαφορετική περίπτωση θα μπορούν αυτά να τίθενται γρήγορα εκτός ελέγχου.

Δομημένα και μη δομημένα δεδομένα

Μεγάλοι όγκοι δεδομένων είναι γενικά διαθέσιμοι είτε σε δομημένη (structured), είτε σε μη δομημένη (unstructured) μορφή. Τα δομημένα δεδομένα αποτελούνται από πληροφορίες που ήδη διαχειρίζεται ένας οργανισμός σε βάσεις δεδομένων και υπολογιστικά φύλλα, ενώ έχουν ένα συγκεκριμένο σχήμα ή μοντέλο. Οι αριθμοί, η ώρα, η ημερομηνία και οι συμβολοσειρές είναι μερικά παραδείγματα δομημένων δεδομένων που μπορεί να αποθηκεύονται σε στήλες βάσης δεδομένων. Από την άλλη μεριά, τα μη δομημένα δεδομένα είναι πληροφορίες που δεν είναι οργανωμένες και δεν εμπίπτουν σε κάποιο προκαθορισμένο μοντέλο ή μορφή. Περιλαμβάνουν δεδομένα που συλλέγονται από αρχεία κειμένου, αρχεία καταγραφής, πηγές κοινωνικών μέσων και δεδομένα κινητής τηλεφωνίας, τα οποία βοηθούν τις επιχειρήσεις να συλλέγουν πληροφορίες σχετικά με τις ανάγκες των πελατών.

Γιατί είναι σημαντικό το Big Data;

Η σημασία του Big Data δεν περιστρέφεται γύρω από την ποσότητα δεδομένων που έχει μια εταιρεία, αλλά στο πώς χρησιμοποιεί τα δεδομένα που συλλέγονται, καθώς καθεμιά ακολουθεί το δικό της τρόπο. Όσο πιο αποτελεσματικά χρησιμοποιεί μια εταιρεία τα δεδομένα που λαμβάνει από διάφορες πηγές, τόσο περισσότερες δυνατότητες αποκτάει που θα της επιτρέπουν να καλύπτει κρίσιμα ζητήματα.

Εξοικονόμηση κόστους: Όταν πρόκειται να αποθηκευτούν μεγάλες ποσότητες δεδομένων, ορισμένα εργαλεία Big Data, όπως το Hadoop και τα λογισμικά στατιστικών αναλύσεων που βασίζονται σε cloud, μπορούν να προσφέρουν μείωση του κόστους στην επιχείρηση και να βοηθούν επίσης στον εντοπισμό πιο αποτελεσματικών τρόπων επιχειρηματικής δραστηριότητας.

Μειώσεις χρόνου: Η υψηλή ταχύτητα εργαλείων, όπως το Hadoop και τα αναλυτικά στοιχεία στη μνήμη (in-memory analytics), κάνει εύκολο τον εντοπισμό νέων πηγών δεδομένων, βοηθώντας τις επιχειρήσεις να τις αναλύουν σε άμεσο χρόνο και να λαμβάνουν γρήγορες αποφάσεις.

Παραγωγή προϊόντων υψηλής ζήτησης: Αναλύοντας μεγάλα δεδομένα, οι επιχειρήσεις μπορούν να κατανοούν καλύτερα τις τρέχουσες συνθήκες της αγοράς. Για παράδειγμα, αναλύοντας τις αγοραστικές συμπεριφορές των πελατών, μια εταιρεία μπορεί να ανακαλύπτει τα προϊόντα που πωλούνται περισσότερο και να παράγει τέτοια σύμφωνα με την τρέχουσα τάση, πράγμα που της δίνει τη δυνατότητα να μπορεί να ξεπερνάει τους ανταγωνιστές της.

Έλεγχος της διαδικτυακής φήμης: Τα εργαλεία του Big Data μπορούν να κάνουν ανάλυση συναισθημάτων, επιτρέποντας στην εταιρεία να ενημερώνεται σχετικά με το ποιος και τι είδους σχόλια κάνει για αυτήν. Έτσι, βοηθούν με αυτόν τον τρόπο στη βελτίωση της παρουσίας της επιχείρησης στο διαδίκτυο.

Ενίσχυση της απόκτησης και διατήρησης πελατών: Ο πελάτης είναι το πιο σημαντικό περιουσιακό στοιχείο, από το οποίο εξαρτάται κάθε επιχείρηση. Δεν υπάρχει καμία επιχείρηση που να μπορεί να διεκδικήσει την επιτυχία χωρίς πρώτα να έχει δημιουργήσει μια σταθερή πελατειακή βάση. Ωστόσο, ακόμη και με υπαρκτή πελατειακή βάση, μια επιχείρηση δεν μπορεί να αγνοεί τον υψηλό ανταγωνισμό που αντιμετωπίζει. Εάν μια επιχείρηση καθυστερεί να μάθει τι ψάχνουν οι πελάτες, τότε είναι πολύ εύκολο να αρχίσει να προσφέρει προϊόντα κακής ποιότητας. Έτσι, στο τέλος θα προκύψει απώλεια πελατείας που δημιουργεί αρνητική συνολική επίδραση στην επιτυχία της. Η χρήση Big Data επιτρέπει στις επιχειρήσεις να παρατηρούν διάφορα πρότυπα και τάσεις που σχετίζονται με τους πελάτες, πράγμα που είναι πολύ σημαντικό για την ενίσχυση της εμπιστοσύνης.

Επίλυση προβλημάτων διαφημιζόμενων και προσφορά πληροφοριών μάρκετινγκ: Τα Big Data Analytics μπορούν να βοηθήσουν στην αλλαγή όλων των επιχειρηματικών λειτουργιών. Αυτό περιλαμβάνει τη δυνατότητα της εταιρείας να μπορεί να ανταποκρίνεται στις προσδοκίες των πελατών, να αλλάζει τη σειρά των προϊόντων της και φυσικά να διασφαλίζει ότι οι καμπάνιες μάρκετινγκ είναι αποτελεσματικές.

Οδηγός καινοτομιών και ανάπτυξης προϊόντων: Μία άλλη τεράστια δυνατότητα του Big Data είναι η ικανότητα του να βοηθάει τις εταιρείες να καινοτομούν και να αναπτύσσουν εκ νέου τα προϊόντα τους.

Πώς λειτουργεί το Big Data;

Για να μπορέσουν οι επιχειρήσεις να θέσουν τα μεγάλα δεδομένα σε λειτουργία για αυτές, θα πρέπει πρώτα να εξετάσουν τον τρόπο με τον οποίο διοχετεύονται μεταξύ πολλαπλών τοποθεσιών, πηγών, συστημάτων, κατόχων και χρηστών. Υπάρχουν πέντε βασικά βήματα για τη διαχείριση αυτού του μεγάλου ιστού δεδομένων που περιλαμβάνει παραδοσιακά, δομημένα δεδομένα, μαζί με μη δομημένα και ημιδομημένα δεδομένα.

1) Ορισμός στρατηγικής: Σε υψηλό επίπεδο, μια στρατηγική Big Data είναι ένα πλάνο σχεδιασμένο για να βοηθάει την επιχείρηση να επιβλέπει και να βελτιώνει τον τρόπο απόκτησης, αποθήκευσης, διαχείρισης, κοινοποίησης και χρήσης δεδομένων εντός και εκτός αυτής. Με λίγα λόγια, θέτει το στάδιο για την επιτυχία της επιχείρησης μέσα από αφθονία διαθέσιμων δεδομένων. Κατά την ανάπτυξη μιας στρατηγικής, είναι σημαντικό να λαμβάνονται υπόψη υπάρχοντες και μελλοντικοί τεχνολογικοί στόχοι και πρωτοβουλίες της επιχείρησης. Αυτό προϋποθέτει ότι τα μεγάλα δεδομένα θα πρέπει να χρησιμοποιούνται ως ένα πολύτιμο επιχειρηματικό στοιχείο και όχι απλώς ως ένα υποπροϊόν εφαρμογών.

2) Επίγνωση των πηγών: Η ροή δεδομένων προέρχεται από IoT και άλλες συνδεδεμένες συσκευές που τροφοδοτούν συστήματα πληροφορικής (IT) από έξυπνα ρολόγια χειρός, έξυπνα αυτοκίνητα, ιατρικές συσκευές, βιομηχανικό εξοπλισμό και άλλες ακόμα συσκευές. Τα δεδομένα αυτά αναλύονται μόλις ληφθούν, ώστε να αποφασιστεί ποια από αυτά θα διατηρηθούν ή όχι και ποια χρειάζονται περαιτέρω ανάλυση. Τα δεδομένα των social media προέρχονται από αλληλεπιδράσεις σε Facebook, YouTube, Instagram και διάφορες άλλες εφαρμογές. Περιλαμβάνουν τεράστιες ποσότητες που έχουν τη μορφή εικόνων, video, φωνής, κειμένου και ήχου, οι οποίες είναι χρήσιμες για λειτουργίες μάρκετινγκ, πωλήσεων και υποστήριξης. Τα δεδομένα αυτά έχουν συχνά μη δομημένες ή ημιδομημένες μορφές, οι οποίες αποτελούν μια μοναδική πρόκληση για ανάλυση. Τα δημόσια διαθέσιμα δεδομένα προέρχονται από τεράστιες ποσότητες ανοιχτών πηγών, όπως το data.gov της κυβέρνησης των ΗΠΑ, το CIA World Factbook ή το Open Data Portal της Ευρωπαϊκής Ένωσης. Άλλα μεγάλα δεδομένα μπορεί να προέρχονται από πηγές δεδομένων cloud, προμηθευτές και πελάτες.

3) Πρόσβαση, διαχείριση και αποθήκευση: Τα σύγχρονα υπολογιστικά συστήματα παρέχουν την ταχύτητα, την ισχύ και την ευελιξία που απαιτούνται για γρήγορη πρόσβαση σε τεράστιες ποσότητες και τύπους μεγάλων δεδομένων. Εκτός από την αξιόπιστη πρόσβαση, οι εταιρείες χρειάζονται επίσης μεθόδους για την ενσωμάτωση των δεδομένων, τη διασφάλιση της ποιότητάς τους, την παροχή διαχείρισης και αποθήκευσής τους και την προετοιμασία τους για δημιουργία αναλυτικών στοιχείων. Ορισμένα δεδομένα ενδέχεται να αποθηκεύονται εσωτερικά σε μια παραδοσιακή μορφή αποθήκευσης, υπάρχουν όμως και ευέλικτες επιλογές χαμηλού κόστους για την αποθήκευση και το χειρισμό μεγάλων δεδομένων, μέσω λύσεων cloud και Hadoop.

4) Ανάλυση: Με τεχνολογίες υψηλής απόδοσης, όπως υπολογισμό πλέγματος ή αναλυτικά στοιχεία στη μνήμη, οι οργανισμοί μπορούν να επιλέγουν να χρησιμοποιούν όλα τα μεγάλα δεδομένα τους για αναλύσεις. Μια άλλη προσέγγιση είναι ο εκ των προτέρων προσδιορισμός των δεδομένων που είναι σχετικά, πριν να αναλυθούν. Σε κάθε περίπτωση, τα αναλυτικά στοιχεία των Big Data αποτελούν τον τρόπο με τον οποίο οι εταιρείες κερδίζουν αξία και πληροφορίες από τα δεδομένα.

5) Λήψη έξυπνων αποφάσεων: Τα σωστά διαχειριζόμενα, αξιόπιστα δεδομένα οδηγούν σε αξιόπιστα αναλυτικά στοιχεία και αξιόπιστες αποφάσεις. Για να παραμένουν ανταγωνιστικές οι επιχειρήσεις, θα πρέπει να εκμεταλλεύονται την πλήρη αξία των μεγάλων δεδομένων και να λειτουργούν με τρόπο που βασίζεται σε αυτά. Δηλαδή, η λήψη αποφάσεων θα πρέπει να βασίζεται σε στοιχεία που προκύπτουν από μεγάλα δεδομένα και όχι στο ένστικτο. Τα οφέλη από τη χρήση δεδομένων είναι σαφή, καθώς οι οργανισμοί που βασίζονται σε αυτά αποδίδουν καλύτερα, είναι λειτουργικά πιο προβλέψιμοι και είναι πιο κερδοφόροι.

Πλεονεκτήματα και μειονεκτήματα του Big Data

Η αύξηση του αριθμού των διαθέσιμων δεδομένων παρουσιάζει τόσο ευκαιρίες, όσο και προβλήματα. Γενικά, η ύπαρξη περισσότερων δεδομένων για τους υπάρχοντες και τους υποψήφιους πελάτες θα πρέπει να δίνει την ευκαιρία στις εταιρείες να προσαρμόζουν καλύτερα τα προϊόντα και τις προσπάθειές τους στο μάρκετινγκ, προκειμένου να δημιουργούν το υψηλότερο επίπεδο ικανοποίησης και να επαναλαμβάνουν τα επιχειρηματικά τους σχέδια. Έτσι, οι εταιρείες που είναι σε θέση να συλλέγουν μεγάλο αριθμό δεδομένων, έχουν την ευκαιρία να πραγματοποιούν βαθύτερη και πλουσιότερη ανάλυση.

Αν και η καλύτερη ανάλυσή τους είναι γεγονός θετικό, τα μεγάλα δεδομένα μπορούν επίσης να δημιουργούν υπερφόρτωση κι ένα μικρό χάος. Οι εταιρείες πρέπει να μπορούν να χειρίζονται μεγαλύτερους όγκους δεδομένων, ενώ ταυτόχρονα να είναι σε θέση να καθορίζουν ποια από τα δεδομένα είναι πραγματικά αξιόπιστα. Επιπλέον, η φύση και η μορφή των δεδομένων μπορεί να απαιτούν ειδικό χειρισμό πριν από τη χρησιμοποίησή τους. Τα δομημένα δεδομένα, τα οποία αποτελούνται από αριθμητικές τιμές, μπορούν εύκολα να αποθηκεύονται και να ταξινομούνται. Ενώ τα μη δομημένα δεδομένα, όπως τα μηνύματα ηλεκτρονικού ταχυδρομείου, τα video και τα έγγραφα κειμένου, ενδέχεται να απαιτούν πιο εξελιγμένες τεχνικές πριν χρησιμοποιηθούν.

Εργαλεία Big Data

Η κλίμακα των δεδομένων που παράγονται από μεγάλες γνωστές εταιρείες, μικρούς οργανισμούς και επιστημονικά έργα, αυξάνεται σε πρωτόγνωρα επίπεδα. Από τη μία πλευρά, το βουνό των παραγόμενων δεδομένων παρουσιάζει τεράστιες προκλήσεις επεξεργασίας, αποθήκευσης και ανάλυσης και θα πρέπει να εξετάζεται προσεκτικά ο τρόπος που θα αντιμετωπιστεί. Από την άλλη πλευρά, τα παραδοσιακά συστήματα διαχείρισης βάσεων δεδομένων και τα εργαλεία επεξεργασίας τους, δεν επαρκούν για την αποτελεσματική διαχείριση αυτής της τεράστιας ποσότητάς τους, όταν το μέγεθος φτάνει σε Terabytes ή Petabytes. Τα εργαλεία αυτά δεν έχουν την ικανότητα να χειρίζονται τόσο μεγάλης κλίμακας όγκους δεδομένων με αποτελεσματικό τρόπο. Υπάρχουν διαφορετικές λύσεις στην αγορά για τη διαχείριση των Big Data που αντιμετωπίζουν με επιτυχία την πρόκλησή τους. Οι δημοφιλέστερες από αυτές είναι τα Hadoop και Spark που είναι λογισμικά ανοιχτού κώδικα και αποτελούν μέρος του project Apache. Το Hadoop είναι μια συλλογή βοηθητικών προγραμμάτων που παρέχει ένα πλαίσιο λογισμικού για κατανεμημένη αποθήκευση και επεξεργασία μεγάλων δεδομένων με τη χρήση του μοντέλου προγραμματισμού MapReduce, ενώ το Spark θεωρείται η φυσική εξέλιξη των αναλυτικών στοιχείων του Hadoop και προτιμάται από εταιρείες που αναζητούν πιο βελτιστοποιημένα μοντέλα.

Παραδείγματα χρήσης Big Data

Η χρήση Big Data αποδίδει οφέλη τόσο στον δημόσιο, όσο και στον ιδιωτικό τομέα. Πιο συγκεκριμένα, στον τομέα της Εκπαίδευσης βοηθάει στη δημιουργία προσαρμοσμένων και δυναμικών προγραμμάτων μάθησης, στην αναδιαμόρφωση του υλικού των μαθημάτων, στα συστήματα βαθμολόγησης και την πρόβλεψη της σταδιοδρομίας των μαθητών. Στον ασφαλιστικό κλάδο χρησιμοποιείται για τη συλλογή πληροφοριών, τη βελτίωση της εμπειρίας των πελατών, την ανίχνευση απάτης και τη χαρτογράφηση απειλών. Στον τραπεζικό τομέα μπορεί να βοηθήσει στην ανίχνευση κατάχρησης πιστωτικών και χρεωστικών καρτών, στη μείωση του πιστωτικού κινδύνου, στην τροποποίηση στατιστικών των πελατών και στη μείωση του κινδύνου για ξέπλυμα μαύρου χρήματος. Χρησιμοποιείται επίσης στην εκτέλεση του κυβερνητικού έργου από κυβερνήσεις που στοχεύουν στην κατάρτιση σχεδίων προνοίας, καθώς και στον έλεγχο της κυβερνοασφάλειας.

Ανακεφαλαιώνοντας

Σήμερα, η παραγωγή ποσότητας δεδομένων στην καθημερινή μας ζωή είναι τεράστια και ο όγκος της συνεχίζει να αυξάνεται. Όσο μεγάλο κι αν είναι το μέγεθός τους, τα διαθέσιμα δεδομένα δε βελτιώνουν από μόνα τους έναν οργανισμό, χωρίς να αναλυθεί και να κατανοηθεί η αξία τους. Η συλλογή και η επεξεργασία αυτού του βουνού δεδομένων δεν μπορούν να πραγματοποιούνται με παραδοσιακές μεθόδους και επομένως, η χρήση ειδικών εργαλείων Big Data βοηθάει στην απορρόφηση, την επεξεργασία, την ανάλυση και την οπτικοποίηση αυτών των τεράστιων ποσοτήτων τους.

 

You May Like This


  1. […] Με αυτόν τον τρόπο λύθηκαν δύο πολύ σημαντικά προβλήματα. Το πρώτο ήταν η πρόσβαση των χρηστών, αφού πλέον μπορούσαν να διασκεδάσουν στα αγαπημένα τους παιχνίδια όποτε ήθελαν, από όποιο σημείο κι αν βρίσκονταν, χωρίς χρονοτριβή. Το δεύτερο ήταν ο χώρος, αφού στο διαδίκτυο οι κατασκευαστές online casino slots μπορούσαν να δημιουργήσουν νέες ιδέες και να προσφέρουν στους παίκτες κυριολεκτικά άπειρες επιλογές. Μετά από όλα αυτά, όμως, χρειαζόταν να λυθεί ένα νέο πρόβλημα: η προσωποποιημένη εμπειρία παιχνιδιού, που θα λάμβανε κάθε επισκέπτης. Σε αυτό, τη λύση έδωσαν τα big data. […]

Comments are closed.