Τι είναι η Μηχανική Μάθηση, ποιοι οι μέθοδοί της, πώς λειτουργεί και πού χρησιμοποιείται;
Τα παλαιότερα χρόνια ο όρος “Μηχανική Μάθηση” φάνταζε στο μυαλό του ανθρώπου ως ένας υπολογιστής του μέλλοντος που παίζει σκάκι, υπολογίζοντας το πλήθος των κινήσεών του και προβλέποντας τις πιθανές αντιδράσεις του αντιπάλου. Όμως, η μηχανική μάθηση είναι σήμερα εδώ, για να διαμορφώνει και να απλοποιεί τον τρόπο που ζούμε, εργαζόμαστε, ταξιδεύουμε και επικοινωνούμε. Στην πραγματικότητα, διαμορφώνει την καθημερινή μας ζωή και τις αποφάσεις που λαμβάνουμε.
Η μηχανική μάθηση δεν είναι μυθοπλασία, αλλά μια σύγχρονη πραγματικότητα. Με τη χρήση εργαλείων τεχνολογίας μηχανικής μάθησης οι άνθρωποι είναι πλέον πιο παραγωγικοί, πιο υγιείς και πιο ευτυχισμένοι σε σχέση με το παρελθόν. Οι ηγέτες της βιομηχανίας ισχυρίζονται ότι η μηχανική μάθηση εισάγει μια άλλη φάση της βιομηχανικής επανάστασης. Σε αντίθεση με την προηγούμενη επανάσταση που αξιοποίησε τη μηχανική και φυσική δύναμη, η επανάσταση της μηχανικής μάθησης που οδηγείται από την τεχνητή νοημοσύνη αξιοποιεί τη γνωστική και διανοητική ικανότητα. Είναι λοιπόν εξαιρετικά ενδιαφέρον να δούμε με ποιους τρόπους μπορεί να επηρεάζει την καθημερινή μας ζωή.
Τι είναι η Μηχανική Μάθηση;
Η μηχανική εκμάθηση, γνωστή διεθνώς ως Machine Learning, είναι μια μέθοδος ανάλυσης δεδομένων που αυτοματοποιεί τη δημιουργία αναλυτικών μοντέλων. Είναι μία περιοχή της τεχνητής νοημοσύνης, αλλά αποτελεί και την κινητήρια δύναμή της, η οποία βασίζεται στην ιδέα ότι τα συστήματα μπορούν να μαθαίνουν από δεδομένα, να προσδιορίζουν πρότυπα και να λαμβάνουν αποφάσεις με ελάχιστη ανθρώπινη παρέμβαση. Ενώ η τεχνητή νοημοσύνη είναι η ευρεία επιστήμη της μίμησης των ανθρώπινων ικανοτήτων, η μηχανική μάθηση είναι ένα συγκεκριμένο υποσύνολό της που εκπαιδεύει μια μηχανή πώς να μαθαίνει. Ουσιαστικά, με τη μηχανική εκμάθηση ο υπολογιστής αναλύει μεγάλα δεδομένα, εξάγει αυτόματα πληροφορίες και τις χρησιμοποιεί για να κάνει προβλέψεις, να αποκρυπτογραφήσει εάν η πρόβλεψη ήταν σωστή και, αν είναι λανθασμένη, να μάθει από αυτήν για να κάνει στο μέλλον μια πιο σωστή πρόβλεψη. Το Google, το Amazon, το Netflix και άλλες διαδικτυακές πλατφόρμες μονολιθικού πυρήνα χρησιμοποιούν τη μηχανική μάθηση για να παρέχουν σημασιολογικά αποτελέσματα βάσει αλγορίθμων που αναλύουν το ιστορικό αναζήτησης, αγορών και προβολής ενός χρήστη, ώστε να προβλέπουν τι είναι αυτό που αναζητούν, ή είναι πιο πιθανό να θέλουν. Τα δεδομένα που έχουν στη διάθεσή τους είναι τεράστια, καθώς τα νούμερα είναι εντυπωσιακά: Ο αριθμός των χρηστών που χρησιμοποιούν το διαδίκτυο για αναζήτηση φτάνει ετησίως τα 4,5 δισεκατομμύρια. Κάθε δευτερόλεπτο υποβάλλονται σε επεξεργασία περίπου 40.000 αναζητήσεις, οι οποίες αντιστοιχούν σε 3,5 δισεκατομμύρια την ημέρα, ή σε 1,2 τρισεκατομμύρια το χρόνο. Συνολικά, κάθε χρόνο η ανθρωπότητα ξοδεύει το ισοδύναμο ενός δισεκατομμυρίου ετών στο διαδίκτυο. Αυτό είναι ένα συγκλονιστικά τεράστιο ποσό δεδομένων που συλλέγονται καθημερινά και θα ήταν αδύνατο να μπορούν να αναλυθούν χωρίς τη βοήθεια της μηχανικής μάθησης. Η μηχανική μάθηση ενσωματώνεται ολοένα και περισσότερο σε όλες τις βιομηχανίες και σε κάθε πτυχή της εργάσιμης ημέρας και του ελεύθερου χρόνου μας, μέσω της αυτοματοποίησης της χειροκίνητης εργασίας, βελτιώνοντας τη συνδεσιμότητα και τον τρόπο που ζούμε, αλλά και διαμορφώνοντας το μέλλον της τεχνητής νοημοσύνης και του διαδικτύου των πραγμάτων (IoT).
Εξέλιξη της μηχανικής μάθησης
Λόγω των νέων υπολογιστικών τεχνολογιών, η μηχανική μάθηση σήμερα δεν μοιάζει με τη μηχανική εκμάθηση του παρελθόντος. Γεννήθηκε από την αναγνώριση προτύπων και τη θεωρία ότι οι υπολογιστές μπορούν να μαθαίνουν χωρίς να προγραμματίζονται για την εκτέλεση συγκεκριμένων εργασιών. Οι ερευνητές που ενδιαφέρονται για την τεχνητή νοημοσύνη ήθελαν να δουν αν οι υπολογιστές θα μπορούσαν να μάθουν αναλύοντας δεδομένα. Η επαναλαμβανόμενη μορφή της μηχανικής μάθησης είναι σημαντική, καθώς όταν οι συσκευές εκτίθενται σε νέα δεδομένα είναι σε θέση να προσαρμόζονται ανεξάρτητα. Μαθαίνουν από προηγούμενους υπολογισμούς, ώστε να παράγουν αξιόπιστες, επαναλαμβανόμενες αποφάσεις και αποτελέσματα. Είναι μια επιστήμη που δεν είναι καινούργια, αλλά έχει αποκτήσει νέα δυναμική. Αν και πολλοί αλγόριθμοι μηχανικής μάθησης υπάρχουν εδώ και αρκετό καιρό, η ικανότητα αυτόματης εφαρμογής πολύπλοκων μαθηματικών υπολογισμών σε μεγάλα δεδομένα, επαναλαμβανόμενα και με όλο και ταχύτερους ρυθμούς, αποτελεί την τελευταία εξέλιξή τους. Μερικά γνωστά παραδείγματα εφαρμογών μηχανικής μάθησης είναι τα εξής:
- Το διαφημιζόμενο αυτο-οδηγούμενο (self-driving) αυτοκίνητο της Google, που αποτελεί την ουσία της μηχανικής μάθησης.
- Οι προτάσεις τηλεοπτικού περιεχομένου από το Amazon και το Netflix, που αποτελούν εφαρμογές μηχανικής μάθησης για την καθημερινή ζωή.
- Το Facebook, όπου η μηχανική εκμάθηση βοηθάει τους ανθρώπους να ανακαλύπτουν νέο περιεχόμενο και να συνδέονται στις σελίδες που τους ενδιαφέρουν περισσότερο.
- Η ανίχνευση απάτης, μια από τις πλέον προφανείς και σημαντικές χρήσεις της μηχανικής μάθησης.
Πώς λειτουργεί η μηχανική μάθηση;
Για να αξιοποιήσει κάποιος στο έπακρο τη μηχανική μάθηση, θα πρέπει να γνωρίζει πώς να συνδυάσει τους καλύτερους αλγόριθμους με τα σωστά εργαλεία και διαδικασίες. Η μηχανική μάθηση συνδυάζει ενισχυμένη επεξεργασία στατιστικών στοιχείων και εξαγόμενων δεδομένων με νέες εξελιγμένες αρχιτεκτονικές, ώστε να διασφαλίζει ότι οι συσκευές θα λειτουργούν όσο το δυνατόν ταχύτερα, ακόμη και σε τεράστια επιχειρηματικά περιβάλλοντα. Η ολοκληρωμένη συλλογή αλγορίθμων βοηθάει στη δημιουργία προτύπων που εφαρμόζουν μια επαναληπτική διαδικασία μηχανικής μάθησης. Δηλαδή, σχεδόν κάθε εργασία που μπορεί να ολοκληρώνεται σύμφωνα με ένα πρότυπο, ή σύνολο κανόνων που καθορίζονται από δεδομένα, μπορεί να αυτοματοποιείται με τη μηχανική εκμάθηση. Το γεγονός αυτό επιτρέπει στις εταιρείες να μετατρέπουν διαδικασίες που στο παρελθόν μπορούσαν να εκτελούνται μόνο από το ανθρώπινο δυναμικό, όπως την ανταπόκριση σε κλήσεις εξυπηρέτησης πελατών, την τήρηση βιβλίων και τον έλεγχο των βιογραφικών.
Ποιες είναι οι δημοφιλέστερες μέθοδοι μηχανικής μάθησης;
Οι πιο διαδεδομένες μέθοδοι μηχανικής μάθησης είναι η επιβλεπόμενη μάθηση και η μη επιβλεπόμενη μάθηση, χωρίς όμως να είναι και οι μοναδικές.
Οι επιβλεπόμενοι αλγόριθμοι μάθησης (Supervised learning) εκπαιδεύονται χρησιμοποιώντας δεδομένα που έχουν επισημανθεί με ετικέτες, όπως μια είσοδο όπου η επιθυμητή έξοδος είναι γνωστή. Για παράδειγμα, ένα κομμάτι εξοπλισμού θα μπορούσε να φέρει ετικέτα δεδομένων “F” (failed) ή “R” (runs). Ο αλγόριθμος εκμάθησης λαμβάνει ένα σύνολο εισόδων μαζί με τις αντίστοιχες σωστές εξόδους και μαθαίνει συγκρίνοντας την πραγματική του έξοδο με τις σωστές εξόδους για να βρει λάθη, ενώ στη συνέχεια τροποποιεί ανάλογα το μοντέλο. Μέσω μεθόδων όπως η ταξινόμηση, η αναδρομή, η πρόβλεψη και η ενίσχυση της κλίσης, η επιβλεπόμενη μάθηση χρησιμοποιεί πρότυπα για να προβλέπει τις τιμές της ετικέτας σε πρόσθετα δεδομένα χωρίς ετικέτα. Η επιβλεπόμενη μάθηση χρησιμοποιείται συνήθως σε εφαρμογές όπου ιστορικά δεδομένα προβλέπουν πιθανά μελλοντικά γεγονότα. Για παράδειγμα, μπορεί να προβλέπει πότε οι συναλλαγές με πιστωτική κάρτα ενδέχεται να είναι δόλιες, ή ποιος ασφαλισμένος πελάτης είναι πιθανό να υποβάλει αξίωση.
Η μη επιβλεπόμενη μάθηση (Unsupervised learning) χρησιμοποιεί δεδομένα που δεν έχουν ετικέτες ιστορικού. Χωρίς να του παρέχεται καμία εμπειρία, ο αλγόριθμος μάθησης πρέπει να βρει την δομή των δεδομένων εισόδου. Η μη επιβλεπόμενη μάθηση λειτουργεί ιδανικά σε δεδομένα συναλλαγών. Για παράδειγμα, μπορεί να προσδιορίζει τμήματα πελατών με παρόμοια χαρακτηριστικά που μπορούν στη συνέχεια να χρησιμοποιούνται με παρόμοιο τρόπο σε καμπάνιες μάρκετινγκ. Μπορεί επίσης να βρίσκει τα κύρια χαρακτηριστικά που διαχωρίζουν τμήματα πελατών μεταξύ τους. Δημοφιλείς τεχνικές που χρησιμοποιεί η μη επιβλεπόμενη μάθηση είναι οι χάρτες αυτο-οργάνωσης, η ομαδοποίηση των δεδομένων σε έναν αριθμό K (K-Means Clustering), η ιεραρχική ομαδοποίηση (Hierarchical Clustering) και η πιθανολογική ομαδοποίηση (Probabilistic Clustering). Οι αλγόριθμοι αυτοί χρησιμοποιούνται για την τμηματοποίηση θεμάτων κειμένου, τη σύσταση στοιχείων και τον εντοπισμό ακραίων δεδομένων.
Η μερικώς επιβλεπόμενη μάθηση (Semisupervised learning) χρησιμοποιείται για τις ίδιες εφαρμογές με την επιβλεπόμενη μάθηση. Χρησιμοποιεί όμως τόσο δεδομένα που έχουν επισημανθεί με ετικέτες (γνωστά), όσο και δεδομένα χωρίς ετικέτες (άγνωστα) για εκπαίδευση. Συνδυάζει συνήθως μια μικρότερη ποσότητα δεδομένων με ετικέτα με μια μεγαλύτερη ποσότητα δεδομένων χωρίς ετικέτα, επειδή τα δεδομένα χωρίς σήμανση είναι λιγότερο ακριβά και μπορούν να αποκτηθούν ευκολότερα. Αυτός ο τύπος μάθησης μπορεί να χρησιμοποιεί μεθόδους ταξινόμησης, αναδρομής και πρόβλεψης, ενώ είναι χρήσιμος όταν το κόστος που σχετίζεται με την επισήμανση είναι πολύ υψηλό. Ένα από τα πιο απλά παραδείγματα μερικώς επιβλεπόμενης μάθησης είναι ο προσδιορισμός του προσώπου ενός ατόμου σε μια web κάμερα.
Η ενισχυτική μάθηση (Reinforcement learning) χρησιμοποιείται συχνά στη ρομποτική, σε παιχνίδια και στην πλοήγηση. Στην ενισχυτική μάθηση ο αλγόριθμος ανακαλύπτει μέσω δοκιμής και σφάλματος ποιες ενέργειες αποδίδουν τα καλύτερα αποτελέσματα. Αυτός ο τύπος μάθησης έχει τρία βασικά συστατικά: τον παράγοντα (τον μαθητή ή τον υπεύθυνο λήψης αποφάσεων), το περιβάλλον (οτιδήποτε αλληλοεπιδράει με τον παράγοντα) και τις ενέργειες (τι μπορεί να κάνει ο παράγοντας). Στόχος είναι ο παράγοντας να επιλέξει τις ενέργειες που θα αποδώσουν το βέλτιστο δυνατό αποτέλεσμα για ένα δεδομένο χρονικό διάστημα, κάτι που θα πετύχει εφόσον ακολουθήσει την καλύτερη δυνατή πολιτική.
Πού χρησιμοποιείται η μηχανική μάθηση;
Οι περισσότερες βιομηχανίες που επεξεργάζονται μεγάλες ποσότητες δεδομένων, αναγνωρίζουν την αξία της τεχνολογίας της μηχανικής μάθησης. Με τη συλλογή πληροφοριών από αυτά τα δεδομένα που πραγματοποιείται συχνά σε πραγματικό χρόνο, οι οργανισμοί μπορούν να εργάζονται πιο αποτελεσματικά, ή να αποκτούν πλεονέκτημα έναντι των ανταγωνιστών τους.
Χρηματοπιστωτικές υπηρεσίες: Οι τράπεζες και άλλες επιχειρήσεις του χρηματοοικονομικού κλάδου χρησιμοποιούν τεχνολογία μηχανικής μάθησης για δύο βασικούς σκοπούς, τον εντοπισμό σημαντικών πληροφοριών σχετικά με τα δεδομένα και την πρόληψη της απάτης. Οι πληροφορίες μπορούν να προσδιορίζουν επενδυτικές ευκαιρίες, ή να βοηθούν τους επενδυτές να γνωρίζουν πότε να κάνουν συναλλαγές. Η συλλογή δεδομένων μπορεί επίσης να αναγνωρίζει πελάτες με προφίλ υψηλού κινδύνου, ή να χρησιμοποιεί την ασφάλεια του κυβερνοχώρου για να εντοπίζει προειδοποιητικά σημάδια απάτης.
Φροντίδα υγείας: Η μηχανική μάθηση είναι μια ταχέως αναπτυσσόμενη τάση στον κλάδο της υγειονομικής περίθαλψης, χάρη στην εμφάνιση φορητών συσκευών και αισθητήρων που μπορούν να χρησιμοποιούν δεδομένα για την αξιολόγηση της υγείας ενός ασθενούς σε πραγματικό χρόνο. Η τεχνολογία μπορεί επίσης να βοηθάει τους ειδικούς της ιατρικής να αναλύουν δεδομένα για τον εντοπισμό τάσεων ή κόκκινων σημείων που μπορεί να οδηγήσουν σε βελτιωμένες διαγνώσεις και θεραπεία.
Πετρέλαιο και φυσικό αέριο: Ο αριθμός των εφαρμογών χρήσης μηχανικής μάθησης για αυτόν τον κλάδο είναι τεράστιος και συνεχίζει να αυξάνεται. Μερικές από τις σημαντικότερες είναι η εύρεση νέων πηγών ενέργειας, η ανάλυση ορυκτών στο έδαφος, η πρόβλεψη αστοχίας αισθητήρα διυλιστηρίου και η βελτιστοποίηση της διανομής λαδιού για να γίνει πιο αποτελεσματική και οικονομικά αποδοτική.
Κυβέρνηση: Κυβερνητικές υπηρεσίες, όπως η δημόσια ασφάλεια και οι υπηρεσίες κοινής ωφέλειας, έχουν ιδιαίτερη ανάγκη τη χρήση της μηχανικής εκμάθησης, καθώς διαθέτουν πολλαπλές πηγές δεδομένων που μπορούν να εξάγονται για πληροφορίες. Για παράδειγμα, η ανάλυση δεδομένων αισθητήρα προσδιορίζει τρόπους για την αύξηση της αποτελεσματικότητας και της εξοικονόμησης χρημάτων. Η μηχανική μάθηση μπορεί επίσης να βοηθάει στον εντοπισμό της απάτης και στην ελαχιστοποίηση της κλοπής προσωπικών δεδομένων.
Λιανεμπόριο: Οι ιστότοποι προτείνουν προϊόντα που μπορεί να αρέσουν στους πελάτες τους βασισμένες σε προηγούμενες προτιμήσεις τους, χρησιμοποιώντας μηχανική μάθηση για να αναλύσουν το ιστορικό των αγορών τους. Οι έμποροι λιανικής βασίζονται στη μηχανική μάθηση για τη συλλογή δεδομένων, την ανάλυσή τους και τη χρήση τους για να εξατομικεύσουν μια εμπειρία αγορών, για να εφαρμόσουν μια καμπάνια μάρκετινγκ, για βελτιστοποίηση τιμών, για σχεδιασμό εφοδιασμού εμπορευμάτων και για πληροφορίες πελατών.
Μεταφορές: Η ανάλυση δεδομένων για τον εντοπισμό προτύπων και τάσεων αποτελεί κλειδί για τη βιομηχανία μεταφορών, το οποίο βασίζεται στη δημιουργία πιο αποτελεσματικών διαδρομών και την πρόβλεψη πιθανών προβλημάτων, με στόχο την αύξηση της κερδοφορίας. Η ανάλυση δεδομένων και οι μορφές μοντέλων της μηχανικής μάθησης αποτελούν σημαντικά εργαλεία για τις εταιρείες παράδοσης, τις δημόσιες συγκοινωνίες και άλλους οργανισμούς μεταφορών.
Ποιες είναι οι διαφορές μεταξύ της εξαγωγής δεδομένων, της μηχανικής μάθησης και της βαθιάς μάθησης;
Αν και όλες αυτές οι μέθοδοι έχουν τον ίδιο στόχο, να εξάγουν δηλαδή ιδέες, σχέδια και σχέσεις που μπορούν να χρησιμοποιηθούν για τη λήψη αποφάσεων, έχουν διαφορετικές προσεγγίσεις και ικανότητες.
Η εξαγωγή δεδομένων μπορεί να θεωρηθεί ένα υπερσύνολο πολλών διαφορετικών μεθόδων για την εξαγωγή πληροφοριών από δεδομένα. Μπορεί να περιλαμβάνει παραδοσιακές στατιστικές μεθόδους και μηχανική μάθηση. Η εξαγωγή δεδομένων εφαρμόζει μεθόδους από πολλές διαφορετικές περιοχές, για να εντοπίζει προηγούμενα άγνωστα πρότυπα από δεδομένα. Αυτό μπορεί να περιλαμβάνει στατιστικούς αλγόριθμους, μηχανική μάθηση, αναλυτικά κείμενα, χρονική ανάλυση και άλλους τομείς ανάλυσης. Η εξαγωγή δεδομένων περιλαμβάνει επίσης τη μελέτη και την πρακτική της αποθήκευσης δεδομένων και του χειρισμού δεδομένων.
Η κύρια διαφορά της μηχανικής μάθησης είναι ότι, όπως σε όλα τα στατιστικά μοντέλα, ο στόχος είναι να κατανοήσουμε τη δομή των δεδομένων. Έτσι, στα στατιστικά μοντέλα υπάρχει μια θεωρία που είναι μαθηματικά αποδεδειγμένη, όμως αυτό απαιτεί ότι τα δεδομένα πρέπει να πληρούν και ορισμένες ισχυρές προϋποθέσεις. Η μηχανική μάθηση έχει αναπτυχθεί με βάση την ικανότητα χρήσης των υπολογιστών να ανιχνεύουν τα δεδομένα για τη δομή, ακόμα και αν δεν έχουμε μια θεωρία για το πώς μοιάζει αυτή η δομή. Επειδή χρησιμοποιεί συχνά μια επαναληπτική προσέγγιση για να μάθει από τα δεδομένα, η μηχανική μάθηση μπορεί εύκολα να αυτοματοποιηθεί και επαναλαμβάνεται έως ότου βρεθεί ένα ισχυρό πρότυπο.
Η βαθιά μάθηση συνδυάζει την πρόοδο της υπολογιστικής ισχύος και των ειδικών τύπων νευρωνικών δικτύων, ώστε να μαθαίνει περίπλοκα πρότυπα σε μεγάλες ποσότητες δεδομένων. Οι τεχνικές βαθιάς μάθησης είναι επί του παρόντος υπερσύγχρονες για την αναγνώριση αντικειμένων σε εικόνες και λέξεων σε ήχους. Οι ερευνητές προσπαθούν τώρα να τις εφαρμόσουν για αναγνώριση προτύπων σε πιο πολύπλοκες εργασίες, όπως αυτόματη μετάφραση γλώσσας, ιατρικές διαγνώσεις και πολλά άλλα σημαντικά κοινωνικά και επιχειρηματικά ζητήματα.
Τελικά, γιατί είναι σημαντική η μηχανική μάθηση;
Ο αυξανόμενος όγκος και οι πολλαπλές κατηγορίες διαθέσιμων δεδομένων, η υπολογιστική επεξεργασία που είναι φθηνότερη και ισχυρότερη, αλλά και η οικονομικά προσιτή αποθήκευση των δεδομένων, αποτελούν παράγοντες που καθιστούν τη μηχανική μάθηση πιο δημοφιλή από ποτέ. Χάρη σε αυτήν μπορούμε να παράγουμε γρήγορα και αυτόματα μοντέλα που μπορούν να αναλύουν μεγαλύτερα και πιο περίπλοκα δεδομένα, αλλά και να παρέχουν ταχύτερα, πιο ακριβή αποτελέσματα, ακόμη και σε πολύ μεγάλη κλίμακα. Και δημιουργώντας μοντέλα ακριβείας, ένας οργανισμός έχει πολύ καλύτερες πιθανότητες να εντοπίζει επικερδείς ευκαιρίες, ή να αποφεύγει άγνωστους κινδύνους.
Γράφει ο Χάρης Ματθαίου
Join the Conversation →