Μεταξύ των ανακοινώσεων της Google που ξεχωρίζουν στο φετινό συνέδριο Google I/O, είναι το Gemini Omni, νέα οικογένεια πολυτροπικών μοντέλων που δημιουργούν και επεξεργάζονται βίντεο από κείμενο, εικόνες και ήχο.
Η διάθεση ξεκινά άμεσα σε παγκόσμιο επίπεδο με το Gemini Omni Flash για όλους τους συνδρομητές των πακέτων Google AI Plus, Pro και Ultra μέσω της εφαρμογής Gemini, των YouTube Shorts και του Google Flow με στόχο να κάνει τη δημιουργία βίντεο προσιτή σε ευρύ κοινό.
Ο Sundar Pichai περιέγραψε το Omni ως επόμενο βήμα προς συστήματα που δεν προβλέπουν μόνο κείμενο, αλλά προσομοιώνουν την πραγματικότητα. Ο στόχος είναι ένα μοντέλο που μπορεί να δημιουργήσει οτιδήποτε από οποιαδήποτε περιεχόμενο εισάγει ο χρήστης, εξελίσσοντας την αρχική ιδέα του Gemini ως εγγενώς πολυτροπικού συστήματος.
Το Omni ξεκινά με έμφαση στο βίντεο. Οι χρήστες μπορούν να συνδυάζουν εικόνες, ήχο, βίντεο και κείμενο, ενώ το μοντέλο δεν απλώς τα «ράβει» μεταξύ τους, αλλά συλλογιστικά τα ενοποιεί σε ένα συνεπές αποτέλεσμα. Η Google περιγράφει βίντεο υψηλής ποιότητας που αποτυπώνουν κατανόηση εννοιών φυσικής, κουλτούρας, ιστορίας και επιστήμης.
Στο πλαίσιο αυτό, το Omni δίνει και δυνατότητες επεξεργασίας φωτογραφιών με απλές εντολές κειμένου, κάτι αντίστοιχο με όσα έχει δείξει το Nano Banana. Παράλληλα, η Nicole Brichtova από το DeepMind τόνισε ότι η σημερινή κυκλοφορία αποτελεί βήμα ενοποίησης της «νοημοσύνης» του Gemini με τις δυνατότητες απόδοσης των μοντέλων μέσων, πέρα από μια απλή αναβάθμιση του Veo.
Κατά τη διάρκεια ενημέρωσης, ο Koray Kavukcuoglu ανέφερε ως παράδειγμα την παραγωγή βίντεο με ένα απλό αίτημα, ζητώντας μια εξήγηση της αναδίπλωσης πρωτεϊνών σε μορφή animation με φιγούρες τύπου πλαστελίνης. Το Omni παρήγαγε stop motion αφήγηση με ηχητικό σχολιασμό που περιέγραφε τις βασικές δομές και το τρισδιάστατο σχήμα των πρωτεϊνών, δείχνοντας τον τρόπο με τον οποίο αντιλαμβάνεται και αποδίδει πολύπλοκες έννοιες.
Η πρώτη έκδοση, Omni Flash, αποδίδει βίντεο διάρκειας έως 10 δευτερολέπτων. Η Brichtova διευκρίνισε ότι αυτό δεν είναι τεχνικός περιορισμός του μοντέλου, αλλά επιλογή για ταχύτερη διάθεση και επειδή εκτιμάται ότι οι περισσότεροι χρήστες δεν χρειάζονται ακόμη βίντεο με μεγαλύτερη διάρκεια. Πιο μεγάλα σε διάρκεια βίντεο έρχονται το επόμενο διάστημα.
Ως μέρος της κυκλοφορίας, οι χρήστες μπορούν να δημιουργούν βίντεο με τα δικά τους ψηφιακά avatars. Για την αποτροπή deepfakes απαιτείται ειδική διαδικασία εισαγωγής, όπου ο χρήστης ηχογραφεί τον εαυτό του και προφέρει μια σειρά αριθμών. Το avatar αποθηκεύεται για μελλοντική χρήση και το εργαλείο δημιουργίας avatars είναι διαθέσιμο σήμερα στο YouTube Shorts.
Όλα τα βίντεο που δημιουργούνται με το Omni φέρουν το ψηφιακό υδατογράφημα SynthID της Google, ώστε να είναι εφικτή η επαλήθευση προέλευσης μέσα από τα προϊόντα Gemini. Μάλιστα ξεχώρισε η ανακοίνωση ότι το SynthID θα υποστηρίζεται και από την OpenAI. Σύμφωνα με τον Gabe Barth-Maron, οι προσωπικές χρήσεις όπως σκηνές βίντεο με εσάς να κερδίζετε βραβείο, να «πηγαίνετε» στο φεγγάρι ή η αφαίρεση διερχόμενων από φόντο ταξιδιωτικών πλάνων, τοποθετούν το Omni Flash ως εργαλείο καθημερινής δημιουργικότητας, «σαν προσωποποιημένα memes».
Η ευχρηστία συνοδεύεται από έναν περιορισμό. Οι εντολές επεξεργασίας πρέπει να είναι ιδιαίτερα συγκεκριμένες, αλλιώς το Omni μπορεί να επεξεργαστεί με μεγάλη ανάλυση ή να αλλάξει στοιχεία που ο χρήστης ήθελε να διατηρήσει, ζήτημα που έχουν αντιμετωπίσει και χρήστες του Nano Banana.
Παρότι το επίκεντρο είναι καταναλωτικό, οι επιχειρηματικές και δημιουργικές εφαρμογές είναι προφανείς. Η Google θα διαθέσει το Omni μέσω API τις επόμενες εβδομάδες, ενώ η ενοποιημένη πολυτροπική ροή εργασίας μπορεί να αποδειχθεί καθοριστική για διαφημιστές και δημιουργούς περιεχομένου. Η Brichtova υπογράμμισε την ικανότητα ακριβούς απόδοσης κειμένου μέσα στο βίντεο, χρήσιμη για προϊόντα ή συνθήματα σε διαφημίσεις.
Για πιο απαιτητικές ανάγκες προορίζεται το Omni Pro, το οποίο αναμένεται να αποδίδει καλύτερα σε όλα τα καθήκοντα του Omni. Η διάθεσή του σύμφωνα με τη Google θα γίνει όταν υπάρξει σαφές άλμα έναντι του Flash.
Πηγή: https://www.insomnia.gr/
(Κώστας Παπαζαχαρίου, αναδημοσίευση 21/5/2026)











Join the Conversation →