nowmag.gr

Μια ακόμη πολύ εντυπωσιακή και αμφιλεγόμενη αξιοποίηση των δυνατοτήτων της Τεχνητής Νοημοσύνης (ή καλύτερα της Μηχανικής Μάθησης) ήρθε στη δημοσιότητα από ερευνητές της Microsoft. Ο λόγος για το VALL-E, ένα εργαλείο AI που μπορεί να παράγει ρεαλιστικές αντιγραφές της ανθρώπινης φωνής βασισμένη σε δείγμα διάρκειας μόλις 3 δευτερολέπτων!

Αυτό σημαίνει ότι μπορείς να μιλήσεις για 3 δευτερόλεπτα και έπειτα το εργαλείο θα ξεκινήσει να μιλά με τη δική σου φωνή με τρομερά μεγάλη ακρίβεια, τροφοδοτώντας το με γραπτό κείμενο (text to speech). Η πιστότητα του ηχητικού δεν αφορά μόνο την χροιά της φωνής του χρήστη, αλλά και την έκφραση συναισθημάτων μαζί με τις αλλαγές που μπορεί να οφείλονται στην ακουστική του χώρου.

Οι ερευνητές χαρακτηρίζουν το VALL-E ως ένα νευρωνικό γλωσσικό μοντέλο που έχει εκπαιδευτεί με 60.000+ ώρες ομιλίας και γι’ αυτό το τελικό αποτέλεσμα είναι αδιανόητα φυσικό σε σύγκριση με αντίστοιχα συστήματα που ακούγονται σαν ρομποτικές φωνές. Παρόλα αυτά, τονίζουν ότι τουλάχιστον για την ώρα δεν κινδυνεύουν οι δουλειές των voice actors, ούτε είναι τόσο μεγάλος ο κίνδυνος για ενδεχόμενες απάτες.

Μπορείτε να δοκιμάσετε το VALL-E από εδώ.

Εξάλλου, η Microsoft εξετάζει το ενδεχόμενο να ενσωματώσει το περίφημο Chat-GPT στις εφαρμογές του Office (π.χ. Word).

Πηγή: https://www.techgear.gr/
(Κώστας Παπαζαχαρίου, αναδημοσίευση 12/1/2023)

You May Like This