Σήμερα, στην ετήσια εκδήλωση TechXchange της IBM (NYSE: IBM), η εταιρεία ανακοίνωσε την κυκλοφορία της πιο προηγμένης οικογένειας μοντέλων τεχνητής νοημοσύνης που έχει αναπτύξει μέχρι σήμερα, τα Granite 3.0. Τα γλωσσικά μοντέλα Granite τρίτης γενιάς, ναυαρχίδα της IBM, μπορούν να ξεπεράσουν ή να συγκριθούν με μοντέλα παρόμοιου μεγέθους από κορυφαίους παρόχους μοντέλων σύμφωνα με ακαδημαϊκούς και επιχειρηματικούς δείκτες, επιδεικνύοντας ισχυρές επιδόσεις, διαφάνεια και ασφάλεια.
Ακολουθώντας τη δέσμευση της εταιρείας για τεχνητή νοημοσύνη ανοικτού κώδικα, τα μοντέλα Granite κυκλοφορούν με άδεια Apache 2.0, καθιστώντας τα μοναδικά ως προς τον συνδυασμό επιδόσεων, ευελιξίας και αυτονομίας που παρέχουν στους εταιρικούς πελάτες και στην κοινότητα γενικότερα.
Η οικογένεια Granite 3.0 της IBM περιλαμβάνει:
- Γενική Χρήση/Γλώσσα: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- Μέτρα Προστασίας & Ασφάλεια: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- Mixture-of-Experts: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base
Τα νέα γλωσσικά μοντέλα Granite 3.0 8B and 2B έχουν σχεδιαστεί ως «εργαλεία εργασίας» για επιχειρησιακή τεχνητή νοημοσύνη (enterprise AI), παρέχοντας ισχυρές επιδόσεις για εργασίες όπως Retrieval Augmented Generation (RAG), ταξινόμηση, σύνοψη, εξαγωγή δεδομένων και χρήση εργαλείων. Αυτά τα συμπαγή, ευέλικτα μοντέλα είναι σχεδιασμένα για λεπτομερή προσαρμογή με τα δεδομένα της επιχείρησης και απρόσκοπτη ενσωμάτωση σε διαφορετικά επιχειρηματικά περιβάλλοντα ή ροές εργασίας.
Ενώ πολλά μεγάλα γλωσσικά μοντέλα (LLM) εκπαιδεύονται σε δημόσια διαθέσιμα δεδομένα, η συντριπτική πλειοψηφία των εταιρικών δεδομένων παραμένει ανεκμετάλλευτη. Συνδυάζοντας ένα μικρό μοντέλο Granite με εταιρικά δεδομένα, ειδικά μέσω της επαναστατικής τεχνικής προσαρμογής InstructLab – που παρουσιάστηκε από την IBM και τη RedHat τον Μάιο – η IBM πιστεύει ότι οι επιχειρήσεις μπορούν να επιτύχουν επιδόσεις σε εξιδεικευμένες εργασίες που συγκρίνονται με αυτές των μεγαλύτερων μοντέλων, σε ένα κλάσμα του κόστους (με βάση ένα παρατηρούμενο εύρος 3x-23x μικρότερου κόστους σε σύγκριση με τα μεγαλύτερα μοντέλα σε πολλές πρώτες αποδείξεις της ιδέας[1]).
Η έκδοση Granite 3.0 επιβεβαιώνει τη δέσμευση της IBM για την οικοδόμηση διαφάνειας, ασφάλειας και αξιοπιστίας στα προϊόντα τεχνητής νοημοσύνης. Η τεχνική έκθεση Granite 3.0 και ο οδηγός υπεύθυνης χρήσης παρέχουν περιγραφή για τα σύνολα δεδομένων που χρησιμοποιήθηκαν για την εκπαίδευση αυτών των μοντέλων, λεπτομέρειες για τη διαδικασία φιλτραρίσματος, καθαρισμού και επιμέλειας που εφαρμόστηκε, καθώς και αναλυτικά αποτελέσματα των επιδόσεων των μοντέλων με βάση σημαντικούς ακαδημαϊκούς και επιχειρηματικούς δείκτες.
Είναι σημαντικό ότι η IBM παρέχει αποζημίωση πνευματικής ιδιοκτησίας για όλα τα μοντέλα Granite στο watsonx.ai, ενισχύοντας την εμπιστοσύνη των επιχειρηματικών πελατών στη συγχώνευση των δεδομένων τους με τα μοντέλα.
Ανεβάζοντας τον πήχη: Δείκτες αναφοράς Granite
Τα γλωσσικά μοντέλα Granite 3.0 επιδεικνύουν επίσης πολλά υποσχόμενα αποτελέσματα όσον αφορά τις καθαρές επιδόσεις.
Σε βασικούς ακαδημαϊκούς δείκτες αναφοράς που ορίζονται από το OpenLLM Leaderboard του Hugging Face, η συνολική απόδοση του μοντέλου Granite 3.0 8B Instruct προηγείται κατά μέσο όρο έναντι της κορυφαίας επίδοσης μοντέλων ανοιχτού κώδικα παρόμοιου μεγέθους των Meta και Mistral. Στον σύγχρονο δείκτη αξιολόγησης ασφάλειας AttaQ της IBM, το μοντέλο Granite 3.0 8B Instruct ξεχωρίζει στις μετρήσιμες διαστάσεις ασφάλειας, σε σύγκριση με τα μοντέλα των Meta και Mistral[2].
Στις βασικές επιχειρησιακές εργασίες RAG, στη χρήση εργαλείων και στις δραστηριότητες στον τομέα της κυβερνοασφάλειας, το μοντέλο Granite 3.0 8B Instruct παρουσιάζει κορυφαίες συνολικές επιδόσεις κατά μέσο όρο σε σύγκριση με μοντέλα ανοικτού κώδικα παρόμοιου μεγέθους των Mistral και Meta[3].
Τα μοντέλα Granite 3.0 εκπαιδεύτηκαν σε πάνω από 12 τρις. tokens σε δεδομένα που προέρχονται από 12 διαφορετικές φυσικές γλώσσες και 116 διαφορετικές γλώσσες προγραμματισμού, χρησιμοποιώντας μια νέα μέθοδο εκπαίδευσης δύο φάσεων, αξιοποιώντας τα αποτελέσματα πολλών χιλιάδων πειραμάτων που σχεδιάστηκαν για τη βελτιστοποίηση της ποιότητας των δεδομένων, της επιλογής των δεδομένων και των παραμέτρων εκπαίδευσης. Μέχρι το τέλος του έτους, τα γλωσσικά μοντέλα 3.0 8B και 2B αναμένεται να περιλαμβάνουν υποστήριξη για εκτεταμένο μήκος πλαισίου 128K και δυνατότητες κατανόησης πολυτροπικών εγγράφων.
Επιδεικνύοντας μια εξαιρετική ισορροπία μεταξύ απόδοσης και κόστους υπολογισμού η IBM προσφέρει τα μοντέλα Granite Mixture of Experts (MoE) Architecture, Granite 3.0 1B-A400M και Granite 3.0 3B-A800M, ως μικρότερα, ελαφριά μοντέλα που μπορούν να αναπτυχθούν τόσο για εφαρμογές με χαμηλή καθυστέρηση όσο και για εφαρμογές που βασίζονται σε κεντρικές μονάδες επεξεργασίας (CPU).
Η IBM ανακοινώνει επίσης μια ενημερωμένη έκδοση των προ-εκπαιδευμένων μοντέλων Granite Time Series, με τις πρώτες εκδόσεις να έχουν κυκλοφορήσει νωρίτερα φέτος. Τα νέα αυτά μοντέλα εκπαιδεύονται σε τριπλάσιο όγκο δεδομένων και παρέχουν ισχυρές επιδόσεις σε σημαντικούς δείκτες ανάλυσης χρονικών δεδομένων, με μέση απόδοση καλύτερη από μοντέλα που είναι 10 φορές μεγαλύτερα από αυτά της Google και της Alibaba. Τα ενημερωμένα μοντέλα παρέχουν επίσης μεγαλύτερη ευελιξία μοντελοποίησης, υποστηρίζοντας εξωτερικές μεταβλητές και κυλιόμενες προβλέψεις[4].
Παρουσιάζοντας τα Granite Guardian 3.0: εισάγοντας την επόμενη εποχή της υπεύθυνης τεχνητής νοημοσύνης
Στο πλαίσιο αυτής της έκδοσης, η IBM παρουσιάζει επίσης μια νέα οικογένεια μοντέλων Granite Guardian που επιτρέπουν στους προγραμματιστές εφαρμογών να εφαρμόζουν μέτρα ασφαλείας ελέγχοντας τα αιτήματα των χρηστών και τις απαντήσεις των LLM αναφορικά με διάφορους κινδύνους. Τα μοντέλα Granite Guardian 3.0 8B και 2B παρέχουν το πιο ολοκληρωμένο σύνολο δυνατοτήτων εντοπισμού κινδύνων και σφαλμάτων που διατίθενται σήμερα στην αγορά.
Εκτός από τις διαστάσεις των επιπτώσεων, όπως η κοινωνική προκατάληψη, το μίσος, η τοξικότητα, η βωμολοχία, η βία και η παράκαμψη περιορισμών (jailbreaking), τα μοντέλα αυτά παρέχουν επίσης μια σειρά από μοναδικούς ελέγχους ειδικά για τις RAG, όπως η τεκμηρίωση, η συνάφεια με το πλαίσιο και η σχετικότητα της απάντησης. Σε εκτενείς δοκιμές σε πάνω από 19 δείκτες αναφοράς ασφάλειας και RAG, το μοντέλο Granite Guardian 3.0 8B παρουσιάζει υψηλότερη συνολική ακρίβεια στην ανίχνευση κινδύνου κατά μέσο όρο σε σχέση με τις τρεις γενιές μοντέλων Llama Guard της Meta. Παρουσίασε επίσης ισοδύναμες συνολικές επιδόσεις στην ανίχνευση ψευδών πληροφορίων κατά μέσο όρο σε σύγκριση με τα εξειδικευμένα μοντέλα ανίχνευσης ψευδών πληροφορίων WeCheck και MiniCheck[5].
Παρόλο που τα μοντέλα Granite Guardian προέρχονται από τα αντίστοιχα γλωσσικά μοντέλα Granite, μπορούν να χρησιμοποιηθούν για την εφαρμογή μέτρων ασφαλείας παράλληλα με οποιαδήποτε ανοικτά ή ιδιωτικά μοντέλα τεχνητής νοημοσύνης.
Διαθεσιμότητα των μοντέλων Granite 3.0
Η πλήρης σουίτα των μοντέλων Granite 3.0 και τα ενημερωμένα μοντέλα Time Series είναι διαθέσιμα για λήψη στο HuggingFace με άδεια Apache 2.0. Οι παραλλαγές εντολών των νέων γλωσσικών μοντέλων Granite 3.0 8B και 2B, καθώς και των μοντέλων Granite Guardian 3.0 8B και 3B, είναι σήμερα διαθέσιμες για εμπορική χρήση στην πλατφόρμα watsonx της IBM. Επίσης μια επιλεγμένη σειρά από τα μοντέλα Granite 3.0 θα διατίθεται ως μικροϋπηρεσίες NIM της NVIDIA και μέσω των ενοποιήσεων του Google Cloud’s Vertex AI Model Garden με το HuggingFace.
Για να διευκολυνθούν οι επιλογές και η χρήση από τους προγραμματιστές και να υποστηριχθούν τοπικές και edge υλοποιήσεις, ένα επιλεγμένο σύνολο μοντέλων Granite 3.0 είναι διαθέσιμο στις πλατφόρμες Ollama και Replicate.
Η τελευταία γενιά των μοντέλων Granite εμπλουτίζει τον πλούσιο κατάλογο ισχυρών LLMs ανοικτού κώδικα της IBM. Η IBM έχει συνεργαστεί με μέλη του οικοσυστήματος όπως οι AWS, Docker, Domo, Qualcomm Technologies, Inc. μέσω του Qualcomm® AI Hub, Salesforce, SAP κ.α. για να ενσωματώσει μια ποικιλία μοντέλων Granite στις προσφορές αυτών των συνεργατών ή να καταστήσει τα μοντέλα Granite διαθέσιμα στις πλατφόρμες τους, προσφέροντας μεγαλύτερες επιλογές στις επιχειρήσεις σε όλο τον κόσμο.
Από Βοηθούς σε Πράκτορες: συνειδητοποιώντας το μέλλον της επιχειρησιακής τεχνητής νοημοσύνης (enterprise AI)
Η IBM προωθεί την επιχειρησιακή τεχνητή νοημοσύνη μέσω ενός φάσματος τεχνολογιών — από μοντέλα και βοηθούς μέχρι τα εργαλεία που απαιτούνται για τη ρύθμιση και την ανάπτυξή της, ειδικά προσαρμοσμένα στα μοναδικά δεδομένα και τις περιπτώσεις χρήσης των εταιρειών. Η IBM ανοίγει επίσης τον δρόμο για τους πράκτορες τεχνητής νοημοσύνης που μπορούν να αυτοκατευθύνονται, να σκέφτονται και να εκτελούν σύνθετες εργασίες σε δυναμικά επιχειρηματικά περιβάλλοντα.
Η IBM συνεχίζει να εξελίσσει το χαρτοφυλάκιο των τεχνολογιών βοηθών τεχνητής νοημοσύνης-από το watsonx Orchestrate που επιτρέπει στις εταιρείες να δημιουργούν τους δικούς τους βοηθούς μέσω εργαλείων χαμηλού κώδικα και αυτοματοποίησης, έως μια ευρεία γκάμα προ-σχεδιασμένων βοηθών για συγκεκριμένες εργασίες και τομείς όπως η εξυπηρέτηση πελατών, το ανθρώπινο δυναμικό, οι πωλήσεις και το μάρκετινγκ. Οργανισμοί σε όλο τον κόσμο έχουν χρησιμοποιήσει το watsonx Assistant για να δημιουργήσουν βοηθούς AI για εργασίες όπως η απάντηση σε ερωτήσεις ρουτίνας από πελάτες ή εργαζόμενους, ο εκσυγχρονισμός των mainframes και των παρωχημένων εφαρμογών πληροφορικής, η υποστήριξη φοιτητών στη διερεύνηση πιθανής επαγγελματικής πορείας ή η παροχή ψηφιακής υποστήριξης για υποθήκες σε αγοραστές κατοικιών.
Σήμερα η IBM παρουσίασε επίσης την επερχόμενη έκδοση της επόμενης γενιάς του watsonx Code Assistant, που βασίζεται σε μοντέλα κώδικα Granite, για να προσφέρει βοήθεια κωδικοποίησης γενικής χρήσης σε γλώσσες όπως C, C++, Go, Java και Python, με προηγμένες δυνατότητες εκσυγχρονισμού εφαρμογών για Enterprise Java Applications[6]. Οι δυνατότητες κώδικα του Granite είναι πλέον διαθέσιμες και μέσω μιας επέκτασης για το Visual Studio Code, της IBM Granite.Code.
Η IBM σχεδιάζει επίσης να κυκλοφορήσει νέα εργαλεία που θα βοηθήσουν τους προγραμματιστές να δημιουργήσουν, να προσαρμόσουν και να αναπτύξουν την τεχνητή νοημοσύνη πιο αποτελεσματικά μέσω του watsonx.ai. Αυτά περιλαμβάνουν agentic frameworks, ενοποιήσεις με υπάρχοντα περιβάλλοντα και αυτοματισμούς χαμηλού κώδικα για κοινές περιπτώσεις χρήσης, όπως το RAG και οι πράκτορες[7].
Η IBM εστιάζει στην ανάπτυξη τεχνολογιών πρακτόρων τεχνητής νοημοσύνης (ΑΙ agents) που προσφέρουν μεγαλύτερη αυτονομία, προηγμένη συλλογιστική και πολυδιάστατη επίλυση προβλημάτων. Η αρχική έκδοση του μοντέλου Granite 3.0 8B διαθέτει υποστήριξη για βασικές δυνατότητες πρακτόρων, όπως προηγμένη συλλογιστική και ένα εξαιρετικά δομημένο πρότυπο συνομιλίας και στυλ προτροπής για την υλοποίηση ροών εργασίας με τη χρήση εργαλείων. Η IBM σχεδιάζει επίσης να εισάγει μια νέα λειτουργία συνομιλίας με AI agents στο IBM watsonx Orchestrate, το οποίο χρησιμοποιεί τις δυνατότητες των agents για τον συντονισμό βοηθών τεχνητής νοημοσύνης, δεξιοτήτων και αυτοματισμών που βοηθούν τους χρήστες να αυξήσουν την παραγωγικότητα στις ομάδες τους[8]. Η IBM σχεδιάζει να συνεχίσει να αναπτύσσει δυνατότητες πρακτόρων σε όλο το χαρτοφυλάκιό της το 2025, συμπεριλαμβανομένων έτοιμων πρακτόρων για συγκεκριμένους τομείς και περιπτώσεις χρήσης.
Διευρυμένη πλατφόρμα παροχής υπηρεσιών που βασίζεται στην τεχνητή νοημοσύνη για την ενίσχυση των συμβούλων της IBM
Η IBM ανακοινώνει επίσης μια σημαντική επέκταση της πλατφόρμας για την παροχή υπηρεσιών με βάση την τεχνητή νοημοσύνη, IBM Consulting Advantage. Η πλατφόρμα πολλαπλών μοντέλων περιλαμβάνει πράκτορες τεχνητής νοημοσύνης (AI agents), εφαρμογές και μεθόδους, όπως επαναλαμβανόμενα πλαίσια, που δίνουν τη δυνατότητα σε 160.000 συμβούλους της IBM να προσφέρουν καλύτερη και άμεση αξία στους πελάτες με χαμηλότερο κόστος.
Στο πλαίσιο της επέκτασης, τα γλωσσικά μοντέλα Granite 3.0 θα γίνουν το προεπιλεγμένο μοντέλο στην πλατφόρμα Consulting Advantage. Αξιοποιώντας τις επιδόσεις και την αποδοτικότητα του Granite, η πλατφόρμα IBM Consulting θα μπορέσει να μεγιστοποιήσει την απόδοση της επένδυσης για τα έργα GenAI των πελατών της IBM.
Ένα άλλο βασικό στοιχείο της επέκτασης είναι η εισαγωγή των IBM Consulting Advantage για Cloud Transformation και Management και IBM Consulting Advantage για Business Operations. Κάθε μία από αυτές τις πλατφόρμες περιλαμβάνει ειδικούς πράκτορες τεχνητής νοημοσύνης (AI agents), εφαρμογές και μεθόδους, εμπλουτισμένες με τις βέλτιστες πρακτικές της IBM ώστε οι σύμβουλοι της ΙΒΜ να μπορούν να επιταχύνουν τη μετάβαση του πελάτη σε λύσεις cloud και τεχνητής νοημοσύνης, εστιάζοντας σε εργασίες όπως ο εκσυγχρονισμός του κώδικα, η διασφάλιση ποιότητας και η βελτιστοποίηση των λειτουργιών σε τομείς όπως τα οικονομικά, το ανθρώπινο δυναμικό και οι προμήθειες.
Περισσότερα για τα Μοντέλα Granite και τη στρατηγική AI for Business της IBM στο https://www.ibm.com/granite.
[1] Cost calculations are based on API cost per million tokens pricing of IBM watsonx for open models and openAI for GPT4 models (assuming blend of 80% inout, 20% output) for customer proofs-of-concept.
[2] IBM Research technical paper: Granite 3.0 Language Models
[3] IBM Research technical paper: Granite 3.0 Language Models
[4] The Tiny Time Mixer: Fast Pre-Trained Models for Enhanced Zero/Few Shot Forecasting on Multivariate Time Series
[5] Evaluation results published in Granite Guardian GitHub Repo
[6] Προγραμματισμένη διαθεσιμότητα για το Q4 2024
[7] Προγραμματισμένη διαθεσιμότητα για το Q4 2024
[8] Προγραμματισμένη διαθεσιμότητα για το Q1 2025
Join the Conversation →