Η Apple έκανε άλλη μια προσθήκη στο αυξανόμενο ρεπερτόριο τεχνητής νοημοσύνης της με τη δημιουργία ενός εργαλείου που αξιοποιεί μεγάλα γλωσσικά μοντέλα (LLM) για την κίνηση στατικών εικόνων με βάση τα μηνύματα κειμένου του χρήστη.
Η Apple περιγράφει την καινοτομία σε μια νέα ερευνητική εργασία με τίτλο “Keyframer: Empowering Animation Design Using Large Language Models”.
“Ενώ οι διεπαφές προτροπής μίας λήψης είναι κοινές σε εμπορικά συστήματα κειμένου σε εικόνα όπως το Dall·E και το Midjourney, υποστηρίζουμε ότι τα animations απαιτούν ένα πιο περίπλοκο σύνολο θεμάτων χρήστη, όπως ο χρόνος και ο συντονισμός, που είναι δύσκολο να προσδιοριστούν πλήρως μια ενιαία προτροπή — επομένως, εναλλακτικές προσεγγίσεις που επιτρέπουν στους χρήστες να κατασκευάζουν και να τελειοποιούν επαναληπτικά τα σχέδια που δημιουργούνται μπορεί να χρειαστούν ειδικά για animations. “Συνδυάσαμε αναδυόμενες αρχές σχεδίασης για γλωσσικές προτροπές σχεδιαστικών τεχνουργημάτων με δυνατότητες δημιουργίας κώδικα LLM για να δημιουργήσουμε ένα νέο εργαλείο animations με τεχνητή νοημοσύνη που ονομάζεται Keyframer. Με το Keyframer, οι χρήστες μπορούν να δημιουργούν animations από στατικές 2D εικόνες μέσω προτροπής φυσικής γλώσσας. Χρησιμοποιώντας το GPT-4 3, το Keyframer δημιουργεί κώδικα κινούμενων εικόνων CSS για να κινήσει μια είσοδο Scalable Vector Graphic (SVG).”
Για να δημιουργήσει ένα κινούμενο σχέδιο, ο χρήστης ανεβάζει μια εικόνα SVG – ας πούμε, ενός διαστημικού πυραύλου – και στη συνέχεια πληκτρολογεί μια προτροπή όπως «δημιουργήστε τρία σχέδια όπου ο ουρανός ξεθωριάζει σε διαφορετικά χρώματα και τα αστέρια λάμπουν».
Στη συνέχεια, το Keyframer δημιουργεί κώδικα CSS για την κινούμενη εικόνα και ο χρήστης μπορεί στη συνέχεια να τον βελτιώσει επεξεργάζοντας τον κώδικα απευθείας ή εισάγοντας πρόσθετες προτροπές κειμένου.
«Το Keyframer επέτρεψε στους χρήστες να βελτιώσουν επαναληπτικά τα σχέδιά τους μέσω διαδοχικών προτροπών, αντί να πρέπει να εξετάσουν ολόκληρο το σχέδιό τους εκ των προτέρων», εξηγούν οι συγγραφείς. «Μέσα από αυτήν την εργασία, ελπίζουμε να εμπνεύσουμε μελλοντικά εργαλεία σχεδίασης animations που συνδυάζουν τις ισχυρές δυνατότητες δημιουργίας των LLM για να επιταχύνουν τη δημιουργία πρωτοτύπων σχεδίασης με δυναμικούς επεξεργαστές που επιτρέπουν στους δημιουργούς να διατηρούν δημιουργικό έλεγχο».
Σύμφωνα με το άρθρο, η έρευνα έγινε με συνεντεύξεις με επαγγελματίες σχεδιαστές και μηχανικούς animations. «Νομίζω ότι αυτό ήταν πολύ πιο γρήγορο από πολλά πράγματα που έχω κάνει», είπε ένας από τους συμμετέχοντες στη μελέτη που αναφέρεται στην εφημερίδα. «Νομίζω ότι για να κάνω κάτι τέτοιο πριν θα χρειάζονταν ώρες».
Πηγή: https://appleworldhellas.com/
(Κώστας Παπαζαχαρίου, αναδημοσίευση 16/2/2024)
Join the Conversation →